Poste MCF , Toulouse 3 (IRIT)

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Toulouse 3 IRIT
Durée : permanent
Contact : morvan@irit.fr
Date limite de publication : 2023-02-28

Contexte :
La personne recrutée sera rattachée à la FSI de l’Université Paul Sabatier et effectuera ses recherches au sein du laboratoire IRIT

Sujet :
Systèmes de gestion de données efficaces dans des environnements Clouds

Profil du candidat :
Le laboratoire a comme objectif de recruter des personnes ayant un dossier scientifique de grande qualité, qui
l’enrichissent par une ouverture et une indépendance scientifiques, et un réseau national et international.
Le (la) candidat(e) devra démontrer une autonomie scientifique qui s’exprimera au travers de son parcours,
d’un programme de recherche pour les 3 à 5 ans à venir, et d’un projet d’intégration à l’IRIT.
Une mobilité thématique ou géographique sera un plus pour le (la) candidat(e). Il est souhaitable qu’un(e)
candidat(e) ait une expérience de recherche avérée avec des collègues autres que ses encadrant(e)s de thèse.

Formation et compétences requises :
https://www.irit.fr/wp-content/uploads/2022/11/UT3-FSI-MCF27-Gestion-donne%CC%81es.pdf

Adresse d’emploi :
Université Paul Sabatier, Toulouse 3
Laboratoire IRIT

Enhancing earthquake location with domain adaptation

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de Physique du Globe de Paris, Université
Durée : 6 mois
Contact : seydoux@ipgp.fr
Date limite de publication : 2023-01-30

Contexte :
Earthquakes express stress release in active geological objects and provide information about the underlying physical processes, such as fluid migrations and stress perturbations [1]. Therefore, our primary motivation is to form accurate seismic catalogs to enable precise monitoring of such active systems. The quality of seismic catalogs involves detection capabilities and location accuracy and depends on the geometry of the seismic station arrays [2] and the background seismic noise [3]. Since the 2000s, seismologists have densified and extended seismic networks in different seismically active areas to build high-quality catalogs [4]. This is the case of the eruption in Mayotte that triggered the deployment of ocean-bottom seismometers and land seismic sensors in the area [5]. The earthquake catalogs inferred in those areas prove of high quality, providing a better understanding of the region’s dynamics thanks to high-resolution seismic catalogs illuminating the geophysical features. But ocean- bottom seismometers are often deployed temporarily because of their maintenance cost, providing time-limited, high-quality data.

References:
1. Namiki, A. et al. Volcanic activities triggered or inhibited by resonance of volcanic edifices to large earth- quakes. Geology 47, 67–70 (2019).
2. Poiata, N., Satriano, C., Vilotte, J.-P., Bernard, P. & Obara, K. Multiband array detection and location of seismic sources recorded by dense seismic networks. Geophys. J. Int. 205, 1548–1573 (2016).
3. Longuet-Higgins, M. S. A theory of the origin of microseisms. Philosophical Transactions of the Royal Society of London. Series A, Mathematical and Physical Sciences 243, 1–35 (1950).
4. Rost, S. & Thomas, C. Array seismology: Methods and applications. Reviews of geophysics 40, 2–1 (2002).
5. Saurel, J.-M. et al. Mayotte seismic crisis: building knowledge in near real-time by combining land and
ocean-bottom seismometers, first results. Geophysical Journal International 228, 1281–1293 (2022).

Sujet :
This work aims to correct the systematically biased hypocenters obtained with a permanent seismic array from the hypocenters inferred with a temporary array with an adequate geometry, as illustrated in the figure below. We consider the case of Mayotte to develop the method and show the potential outcomes on other datasets of interest. We will learn the catalog bias from the events detected with the trusted array over five weeks and test the prediction quality over one week. Once successful, we will deploy the technique over several years of continuous data at Mayotte and other contexts.

Profil du candidat :
We seek candidates with a strong taste for programming, physics, and inverse problem-solving. A motivated candidate for learning about and applying artificial intelligence techniques is strongly preferred. The target programming language is Python, although we are open to other suggestions. We plan to use the Scikit-Learn library or the PyTorch framework to develop the strategy, or equivalent in other languages.

Formation et compétences requises :
Data science
Programming
Signal processing
Physics/Seismology

Adresse d’emploi :
Institut de Physique du Globe de Paris
1, Rue Jussieu, 75005 Paris

Document attaché : 202212131255_DiiP_Master_2023.pdf

FSEP IR à la Plateforme CorTexT, Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS), Champs sur Marne, Paris

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIS / Plateforme CorTexT
Durée : FSEP
Contact : lionel.villard@esiee.fr
Date limite de publication : 2023-01-15

Contexte :
La plateforme CorTexT est localisée sur le campus de l’Université Gustave Eiffel, dans l’Est Parisien, au sein du Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS). Fondée en 2009, elle est une infrastructure de recherche expérimentale pour les sciences sociales. La plateforme CorTexT est un instrument essentiel, par exemple, pour analyser la structuration des communautés d€experts dans différents secteurs de politique internationale, la transformation des réseaux d’innovation industrielle, ou encore la compréhension de la structure des discours et des modes d’action collective dans les controverses politiques en ligne.
Une partie importante des méthodes originales produites sont mises à disposition au sein de l’application web collaborative CorTexT Manager (https://www.cortext.net/anf-tdm-2021-focus-cortext-manager/). En 2021, 1313 utilisateurs actifs provenant de 550 institutions ou villes identifiées ont eu une activité avec les services de la plateforme CorTexT, générant 66 000 calculs traités par son infrastructure. 10% de cette communauté d€utilisateurs est académique (https://www.cortext.net/publications/). Ces auteurs ont publié depuis 2012 plus de 275 documents (articles scientifiques, actes de conférence, thèse…).
Le pilotage de la plateforme CorTexT est assuré par son directeur technique, Philippe Breucker, et son directeur scientifique, Lionel Villard, et est composé de quinze membres aux compétences et profils très variés : ingénieur.e.s (systèmes, backend, front-end et données), ingénieur.e.s d’étude et enseignants-chercheurs. L’ingénieur-e de recherche s’intégrera à cette équipe, échangera avec ces différents profils, et participera à l’avancement des travaux de la plateforme.

Sujet :
A cheval entre la BAP D et la BAP E, la mission de l’ingénieur-e de recherche est de concevoir et mettre en œuvre des développements informatiques pour l’analyse de données en sciences sociales au sein de la plateforme CorText, l€infrastructure de recherche pour les sciences sociales computationnelles du Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS).

Profil du candidat :
-Contribuer à la réflexion sur les techniques et les méthodes de la plateforme CorTexT et du LISIS
-Effectuer une veille sur les méthodes en émergence dans le champ des sciences sociales computationnelles (Social Network Analysis/SNA, Natural Language Processing/NLP, Complex Systems€)
-Etre force de proposition par une production scientifique originale dans ce champ, soutenue par une production logicielle
-Participer aux accompagnements de projets de recherche réalisés avec la plateforme sur les sciences, les techniques et l’innovation en société (domaine d’ancrage du laboratoire)
-Travailler à l’interface entre l’équipe technique de la plateforme (et sa direction) et les chercheurs du laboratoire
-Participer aux actions de valorisation et de dissémination (présentation de travaux en conférence, communication externe, formations à l’outil CorTexT Manager, animation du forum de questions/réponses des utilisateurs, …)
-Participer aux transformations de la ferme de serveurs de la plateforme et de la production logicielle (essentiellement autour de la construction de services web) de la plateforme en relation avec ses ingénieur.e.s
-Poursuivre le développement des derniers ensembles de méthodes travaillés au sein de la plateforme (e.g., analyse de réseaux géographiques, modèle à blocs stochastiques)
-Développer et formaliser des méthodes permettant la production, le recueil ou l’analyse des données ou de corpus

Formation et compétences requises :
Savoirs :
-Compétences poussées en statistiques (voire mathématiques) et informatique
-Compréhension de la diversité de méthodes quali-quanti en sciences sociales et de leurs enjeux et applications est souhaitable
-Connaissance des enjeux méthodologiques autour des techniques d’enquête en ligne en SHS, et sur les sources de données du web
-Connaissances en inférence statistique, éventuellement de la modélisation stochastique et de la comparaison de modèles
-Connaissances en ergonomie et interfaces humain-machine est un plus
-Capacité à mobiliser à la fois les référentiels du traitement automatique de la langue ainsi que celui de la modélisation et de l’analyse des réseaux et, à défaut, avoir une connaissance fine de l’un de ces deux champs serait appréciée

Savoirs faire :
-Maîtrise des démarches classiques en NLP : collecte de données, structuration, pré-traitement (lemmatisation, tokenisation), traitements et visualisation
-Maîtrise des démarches classiques en SNA : collecte de données, structuration, choix de représentation (projections, hypergraphes), traitements et visualisation
-Maitrise fine d€au moins un langage serveur
-Maîtrise d’outils de manipulation, analyse, modélisation statistique et visualisation de réseaux
-Maîtrise d’outils d’analyse automatique de la langue
-Maitrise d’outils d€interrogation et manipulation de données
-Maitrise des outils et méthodes de développement collaboratif
-Maîtrise de bibliothèques de visualisation de données
-Connaissance des formats de stockage de données

Savoirs-être :
-Travail en équipe et sens du collectif
-Sens de la communication, notamment dans l’organisation du dialogue entre savoirs «ingénieuriques» et sciences sociales
-Adaptabilité
-Curiosité
-Autonomie
-Rigueur

Adresse d’emploi :
CorText Platform,
Laboratoire Interdisciplinaire Sciences Innovations Sociétés
2 Allée Jean Renoir
93 160 Noisy-le-Grand
France

SimPa : Similarité entre Patients

Date : 2023-03-13
Lieu : Paris Santé Campus
2 – 10 Rue d’Oradour-sur-Glane
75015 Paris
France

L’objectif de la journée SimPa est double :

  • documenter les cas pratiques en santé dans lesquels les méthodes de calcul de similarité entre patients sont utiles;
  • documenter les solutions existantes, par exemple, mais sans y être limité, pour les systèmes fondées sur des méthodes d’apprentissage automatique.

En bref, nous espérons que cette journée permettra une rencontre des communautés d’informatique médicale,  santé publique et traitement
automatique de la langue et d’échanger sur la recherche de contenus textuels « similaires » en TAL.

Les communications sollicitées concernent les thématiques suivantes, sans y être limitées pour autant :

  • Définition et identification des phénomènes de similarité textuelle en santé, explorant un continuum allant de l’identité des chaînes de caractères à la similarité sémantique et thématique entre documents ;
  • Retours d’expérience sur l’utilisation de systèmes de TAL pour la détection de similarité en santé ;
  • Identification de « cas similaires » : cohortes de patients, inclusion dans des essais cliniques, dossiers patients dupliqués,…
  • Représentation de patients, modèles “deep patient”
  • Similarité multimodale incluant le texte création de jumeaux numériques à partir de compte-rendus textuels, génération de données patient synthétiques (notamment des textes).

Les travaux portant sur d’autres langues que le français sont les bienvenus.

Les communications pourront sans restriction concerner des travaux déjà publiés, des résultats préliminaires non publiés, ou être des points de vue sur le domaine. Les propositions de communications orales sont attendues avant le 20 janvier 2023 sous la forme d’un résumé de 2 pages maximum (hors référence). Le style des soumissions doivent suivre le style TALN disponible ici. Les soumissions se feront sur https://easychair.org/conferences/?conf=simpa2023.

Présentations invitées :

  • Nicolas Fiorini (R&D, Algolia, Paris)
  • Nigam Shah (Stanford, à distance)

Dates importantes :

– Soumission des résumés : 20 Janvier 2022
– Notification aux auteurs et autrices : mi ou fin février 2023
– Date de la journée  : lundi 13 mars 2023

Organisation :

  • Adrien Coulet, équipe HeKA, Inria, Inserm, UPCité
  • Christel Gérardin, APHP, IPLESP
  • Aurélie Névéol, Université Paris Saclay, CNRS, LISN
  • Xavier Tannier, Sorbonne Université, LIMICS

Comité scientifique :

  • François Antonini, Assistance Publique Hôpitaux de Marseille
  • Sandra Bringay, Université Paul Valery, Montpellier 3, LIRMM
  • Vincent Claveau, CNRS, IRISA
  • Natalia Grabar, CNRS, STL
  • Thomas Guyet, Inria Lyon 
  • Vianney Jouhet, CHU de Bordeaux, BPH
  • Lina Soualmia, Université de Rouen Normandie, LITIS
  • les membres du comité d’organisation

 

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

apprentissage automatique pour la prévision météorologique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR SPE
Durée : 5 à 6 mois
Contact : paoli_c@univ-corse.fr
Date limite de publication : 2023-01-30

Contexte :
Ce stage s’inscrit dans le cadre du projet ANR SAPHiR1 (“Sensor Augmented weather Prediction at HIgh Resolution”) coordonné par le laboratoire Sciences Pour l’Environnement (SPE) UMR CNRS 6134. Ce programme scientifique consiste à proposer de nouvelles méthodes de prévision d’événements météorologiques rares et extrêmes à haute résolution spatiale et temporelle. Dans ce contexte, deux missions complémentaires sont envisagées, la première orientée analyse de données et Machine Learning (ML), la seconde orientée ingénierie logicielle.

Sujet :
Missions : deux missions complémentaires sont envisagées
1. ML : le stagiaire aura pour mission de développer des codes informatiques permettant de prédire des séries temporelles environnementales, basés sur des techniques et architectures de Deep Learning. Le stagiaire participera également à l’analyse et la gestion des données hétérogènes nécessaire au projet : données météorologiques historiques, données issues de capteurs, données Lidar SAETTA2, images satellites, etc.
2. Ingénierie logicielle : le stagiaire aura pour mission de réaliser une application Web/mobile (multi-plateformes type Flutter) pour la visualisation grand-public des données et résultats de simulation. Le stagiaire participera à la réflexion de l’architecture du SI de SAPHIR : déploiement continu, structuration des codes, etc.

Profil du candidat :
Profil recherché : Bac+5 Informatique – Mathématiques

Modalité de candidature : envoyer un mail à paoli_c@univ-corse.fr en joignant un CV, une lettre de motivation et vos relevés de notes postbac. Un classement en année n-1 serait un plus nous permettant de bien compléter le dossier.

Formation et compétences requises :
Compétences requises : Développement Web/Mobile – Analyse de données – Machine Learning – Python – Gestionnaire de versions – autonomie – intérêt pour la recherche et le travail en équipe.

Adresse d’emploi :
UMR SPE 6134 – Université de Corse – Travail possible en télétravail occasionnel

Document attaché : 202212130946_2022-12-09-cpaoli-offreStageM2-Saphir.pdf

Postdoc position in Machine/Deep Learning/Computer Vision

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CReSTIC lab, University of Reims Champagne-Ardenne
Durée : 18 months, extendabl
Contact : valeriu.vrabie@univ-reims.fr
Date limite de publication : 2023-01-30

Contexte :
Within the framework of a collaboration between the Comité de Champagne, Segula Technologies company, and the University of Reims, we are looking to optimize the detection of the presence of vine diseases by developing and integrating imaging and machine learning concepts. This project includes several axes in which 2 PhD students participate and several master internships together with 3 (associate) professors. In this context we are recruiting a PostDoc for 18 months, extendable to 36 months, to complete the team.

Sujet :
The flavescence dorée, a serious and epidemic disease, is one of the two grapevines yellow diseases that might cause a rapid decay in Champagne and other wine regions, being considered as the new phylloxera of the vineyard. To date, the detection approach of the yellows is to collectively explore the vineyard on foot every year to identify affected vines and to perform biomolecular tests by approved laboratories. As the survey is not precise nor optimal enough for a large-scale monitoring, the development and integration of detection solutions based on imagery appear necessary.
We conducted several acquisition campaigns between 2019 and 2022 under controlled and in situ conditions. New CNN-based hierarchical architectures developed by our lab have proven to be efficient on separate data sets composed of multispectral images. But the generalization capabilities of these models are not sufficient to compensate for the variability induced by endogenous and exogenous factors. The objective is to propose new detection strategies for grapevine yellows that are more robust to this variability. Several tracks could be explored, including, but not limited to:
• Fusion of multispectral images through vegetation indices to be defined and used within adapted Deep Learning architectures
• Fusion of features extracted with heterogeneous Deep Learning models from multispectral images
• Identification of an optimal subset of multispectral images and development of reinforcement or continuous learning approaches
It might also be interesting to design semi-supervised approaches to take advantage of the possibility of acquiring many unlabeled images during new acquisition campaigns to which the Postdoc will be associated.

Profil du candidat :
• Self-motivated scientist seeking to pursue a scientific career, holding a Ph.D. or in the process of completing it, in a relevant field of machine/deep learning or other relevant fields

Formation et compétences requises :
• Excellent knowledge and skills in AI learning, machine learning and data science with hand-on skill and experience
• Excellent experience, knowledge, and skills in programming languages, especially Python (environment Tensorflow, Pytorch, Keras, Pandas, Scikit-learn, etc.)
• Deep understand of digital image processing; prior experience in working with image analysis projects (industrial or academic) will be a plus
• Independent and passionate about data science projects, however good team player, able to undertake research projects together with other team members
• Excellent scientific/technical writing skills and communication capability; ability to present research achievements at internal/external seminars, conferences and journals

Adresse d’emploi :
The PostDoc will be based at the CReSTIC lab of the University of Reims Champagne-Ardenne on the Moulin de la Housse campus in Reims. Within the framework of the project, he/she may be required to intervene to the project partners, the Comité de Champagne in Epernay or Segula Technologies in Reims downtown.

Faculty position (Tenure track professor) at Telecom Paris in Numerical optimization for frugal artificial intelligence

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Télécom Paris, LTCI
Durée : 3 ans
Contact : olivier.fercoq@telecom-paris.fr
Date limite de publication : 2022-03-15

Contexte :
Telecom Paris’s [1] machine learning, statistics and signal processing group (a.k.a S²A group) [2], within the laboratoire de traitement et communication de l’information (LTCI) [4], is inviting applications for a tenure track faculty position at the *Associate Professor* level (Maitre de Conferences) in *Numerical optimization for frugal artificial intelligence*.

Scientific context

Recent advances in computing and widespread access to massive digital information are leading to an unprecedented deployment of optimization algorithms in many domains (e.g. healthmedicine, (cyber-) security, intelligent transport, predictive maintenance, etc.). Most of the algorithmic approaches developed over the last decade have mainly aimed to solve scaling issues, so as to be able to exploit Big Data in an exhaustive way. The objective of the future researcher will be to develop numerical optimization in the service of the mathematics of frugal artificial intelligence. This can be attained by sparse models or online algorithms but also by studying the interplay between artificial intelligence models and the optimization algorithms used to solve them. Moreover, the optimization of neural networks is a central problem for the community and requires to set up various ways of reducing the computation time or memory footprint.

Sujet :
Main missions

The recruit will be expected to:

Research activities
•    Develop groundbreaking research in the field of numerical optimization and frugal artificial intelligence. This includes the design of numerical optimization algorithms, stochastic optimization and artificial intelligence models that are efficiently using data or computing resources. Other expertise of interest include Monte Carlo methods, optimal transport, sequential learning, active learning, sketching methods, non-differentiable functions and statistical learning theory.
•    Develop both academic and industrial collaborations on the same topic, including collaborative activities with other Telecom Paris research departments and teams, and research contracts with industrial players
•    Set up research grants and take part in national and international collaborative research projects
   
Teaching activities
•    Participate in teaching activities at Telecom Paris and its partner academic institutions (as part of joint Master programs), especially in machine learning and Data science, including life-long training programs (e.g. the local Data Scientist certificate)

Impact
•    Publish high quality research work in leading journals and conferences
•    Be an active member of the research community (serving in scientific committees and boards, organizing seminars, workshops, special sessions…)

Profil du candidat :
As a minimum requirement, the successful candidate will have:

•    A PhD degree
•    A track record of research and publication in one or more of the following areas: numerical optimization, stochastic optimization, frugal artificial intelligence
•    Experience in teaching
•    Good command of English

The ideal candidate will also (optionally) have:
•    Experience in Monte Carlo methods, optimal transport, sequential learning, active learning, sketching methods, non-differentiable functions and statistical learning theory.

NOTE:
The candidate does *not* need to speak French to apply, just to be willing to learn the language (teaching will be mostly given in English)
   
Other skills expected include:
•    Capacity to work in a team and develop good relationships with colleagues and peers
•    Good writing and pedagogical skills

Formation et compétences requises :
PhD degree

Adresse d’emploi :
Télécom Paris
19 place Marguerite Perey
91123 Palaiseau
France

Document attaché : 202212091436_tenure_track_telecom_paris_optimization_frugal_AI.pdf

Offre de stage M2 BRGM/Univ.Orléans : Fusion Textes/images sur des tweets de gestion de crise

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : BRGM, LIFO, PRISME
Durée : 5 mois
Contact : guillaume.cleuziou@univ-orleans.fr
Date limite de publication : 2023-01-10

Contexte :
Aujourd’hui, 2/3 des communes françaises sont considérées comme exposées à des catastrophes naturelles (inondations, séismes, etc.). Il est établi que cette situation s’accentuera dans les prochaines décennies, si bien que l’analyse des témoignages diffusés de manière agile et spontanée sur les réseaux sociaux (tels que Twitter) constituera un formidable outil pour qualifier rapidement et automatiquement l’ampleur des catastrophes et ainsi contribuer aux stratégies de gestion de crise.

Des travaux récents menés dans ce domaine exploitent les techniques d’apprentissage de représentations vectorielles dans des espaces sémantiques pour mener une analyse centrée soit sur le contenu textuel des posts, soit sur les images et/ou les vidéos associées. Bien que ces deux niveaux d’analyse soient complémentaires, l’analyse conjointe des images et du texte qui leur est associé reste difficile à mettre en oeuvre dans le contexte de la gestion de crise.

Sujet :
Certaines techniques multimodales exploitant notamment les captions des images au moyen de Transformers (BERT) ont montré des performances prometteuses sur des tâches de classification sur le corpus de tweets en langue anglaise CrisisMMD.

L’objectif du stage est d’adapter ces techniques multimodales au traitement des tweets en langue française. Cette adaptation offrira différents choix dans la chaîne de traitement, dont – en particulier – la possibilité de travailler dans des espaces de représentation mono- ou multilingues. Il s’agira alors de (1) proposer plusieurs architectures d’implémentation et (2) de les évaluer sur (3) un jeu de données préparé pour l’occasion à partir de sources existantes au BRGM.

L’objectif du stage est d’adapter ces techniques multimodales au traitement des tweets en langue française. Cette adaptation offrira différents choix dans la chaîne de traitement, dont – en particulier – la possibilité de travailler dans des espaces de représentation mono- ou multilingues. Il s’agira alors de (1) proposer plusieurs architectures d’implémentation et (2) de les évaluer sur (3) un jeu de données préparé pour l’occasion à partir de sources existantes au BRGM.

Profil du candidat :
Vous disposez d’une culture scientifique en Machine Learning et d’une expérience dans la mise en oeuvre de modèles de Deep Learning (ex. Transformers). Vous manifestez un intérêt pour l’analyse de données textes et/ou images.

Formation et compétences requises :
Vous êtes étudiant·e en master et/ou école d’ingénieur en Mathématiques/Informatique.

Adresse d’emploi :
Merci d’adresser votre candidature (CV + notes + lettre de motivation) avant le 10/01/2023 à badreddine.farah@univ-orleans.fr et guillaume.cleuziou@univ-orleans.fr.

Document attaché : 202212090739_Annonce_StageM2_2023_CrisisMMDeepL_Orleans.pdf

Exploitation de données spatio-temporelles multimodales pour l’études de trajectoires d’activités nautiques de loisirs

Offre en lien avec l’Action/le Réseau : RoCED/– — –

Laboratoire/Entreprise : Exploitation de données spatio-temporelles multimo
Durée : 6 mois
Contact : alain.bouju@univ-lr.fr
Date limite de publication : 2022-12-16

Contexte :
Ce travail s’inscrit dans le programme PLAIZPARC (Plaisance et zostère dans le Parc naturel marin de l’estuaire de la Gironde et de la mer des Pertuis) porté par le Parc naturel marin de l’estuaire de la Gironde et de la mer des Pertuis (PNMEGMP) qui vise à réduire la pression des mouillages des navires de plaisance sur les herbiers de zostère dans le Parc.

Dans ce projet, l’action 2.2 vise à obtenir une meilleure connaissance des dynamiques spatio-temporelles des pratiques de plaisance. Pour cela, le projet « Développement d’un système automatisé d’évaluation des fréquentations de plaisance à partir de données multimodales (2021-2023) » a été lancé en novembre 2021 et regroupe le PNM EGMP, La Rochelle Université (LRU) et la société IKOMIA. Il

Il vise à mettre au point de nouvelles solutions basée sur les technologies de machine learning et de fouille de données, pour l’évaluation des fréquentations des ports et des zones de mouillage à partir de données multimodales issues d’images vidéo et de données de suivi des embarcations de plaisance.

Ce projet est organisé en quatre volets :
• Volet A : Le portage du système de comptage vers Ikomia Studio ;
• Volet B : le développement d’un système de comptage spécifique aux zones de mouillages ;
• Volet C : Le traitement des données multimodales recueillies par croisements ;
• Volet D : L’amélioration des algorithmes de détection d’embarcations.

Ce stage s’inscrit dans le volet C de ce projet.

Sujet :
Objectif du stage proposé :

– Etat de l’art sur la thématique des croisements de données multimodales pour la spatialisation des activités (Méthodologie et sources fournies)
– Intégration données multimodales de comptages (issue des traitements IA, AIS, GPS, données d’enquêtes, etc. (Outils d’analyse et agrégation, base de données)
– Création outils informatiques intégrables à QGIS permettant de produire des analyses spatiales et cartographiques (Python)

Profil du candidat :
Les mots clefs du profil sont :
Fouille de données, Machine Learning, Ontologie, Acquisition, agrégation, traitement et analyse de données, géospatiale,

Les technologies :
Python, Base de données géospatiale (PostgreSQL,/PostGIS), QGIS, RDF,

Formation et compétences requises :
Formation en Master 2 Informatique en cours (Stage de fin d’étude)

Adresse d’emploi :
Laboratoire Informatique, Images et Interaction (L3i)-La Rochelle Université, Faculté des Sciences et Technologies, Bâtiment Pascal – Avenue Michel Crépeau, 17042 La Rochelle Cedex 1.

Document attaché : 202212081530_Offre de stage de master 2_informatique_AB2023.pdf

Stage de M2 Informatique – projet JOKER: Détection et interprétation des Jeux de Mot avec des méthodes d’Apprentissage Profond

Offre en lien avec l’Action/le Réseau : SimpleText/– — –

Laboratoire/Entreprise : Centre Européen de Réalité Virtuelle (ENIB) / HCTI
Durée : 5-6 mois
Contact : liana.ermakova@univ-brest.fr
Date limite de publication : 2023-02-01

Contexte :
Ce stage participe au projet JOKER qui vise à faire progresser l’automatisation de la traduction des jeux de mots en fournissant un corpus parallèle (c’est à dire multilingue) approprié [1].
Alors que la traduction moderne est fortement aidée par des outils technologiques, pratiquement aucun n’a de support spécifique pour les jeux de mots. En effet, la plupart des outils de traduction basés sur l’IA nécessitent une qualité et une quantité de données d’entraînement (par exemple, des corpus parallèles) qui ont toujours fait défaut pour les jeux de mots. L’objectif du projet JOKER est de construire automatiquement un corpus parallèle de jeux de mots en entraînant un classificateur basé sur l’IA à détecter automatiquement les instances de jeux de mots et à les aligner avec leurs traductions.

Références
[1] L. Ermakova et al., « Overview of JOKER@CLEF 2022: Automatic Wordplay and Humour Translation Workshop », in Experimental IR Meets Multilinguality, Multimodality, and Interaction, Cham, 2022, p. 447‑469.
Version ouverte: https://ceur-ws.org/Vol-3180/

Sujet :
Objectifs du stage (liste indicative):

– Détection des jeux de mots: Une première étape de détection sera de traiter les données de sources électroniques (pdf, html etc) variées sélectionnées pour vous (romans, essais, etc.) pour augmenter les corpus disponibles, avec des méthodes d’intelligence artificielle.
– Alignement des traductions avec les algorithmes traditionnels ou avec les modèles neuronaux
Interprétation des jeux de mots en français et en anglais
– Augmentation des corpus monolingues

Environnement technique (liste indicative):

– Python, Pandas, NLTK, expressions régulières
– bibliothèques pour traiter différents formats de fichiers (pdf, epub,…)
– De grands modèles pré-entraînés:
Google mT5 (https://github.com/google-research/multilingual-t5)
BLOOM (https://huggingface.co/bigscience/bloom)

Profil du candidat :
– M1 informatique ou équivalent;
– intérêt pour les projets de recherche;
– la maîtrise de la langue française et anglaise est souhaitable;
– les connaissances de Python, Pandas, expressions régulières sont souhaitables;
– le sens de l’humour est souhaitable.

Formation et compétences requises :
– M1 informatique ou équivalent;
– la maîtrise de la langue française et anglaise est souhaitable;
– les connaissances de Python, Pandas, expressions régulières sont souhaitables.

Adresse d’emploi :
Centre Européen de Réalité Virtuelle (ENIB), 25 rue Claude Chappe, Plouzané, France

Document attaché : 202212081524_Stage JOKER 2023 (1).pdf