Présentation Générale

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS  


Dec
30
Mon
2024
Assimilation de données de phénotypage numérique par deep learning pour la simulation d’un modèle Structure-Fonction 3D d’arbres fruitiers
Dec 30 – Dec 31 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR AGAP Institut, CIRAD, Montpellier
Durée : 6 mois
Contact : frederic.boudon@cirad.fr
Date limite de publication : 2024-12-30

Contexte :
Pour analyser finement le fonctionnement et la croissance des plantes, les modèles structure-fonction de plantes (FSPM) prennent en compte la structure modulaire des plantes, leur distribution spatiale 3D, leur fonctionnement interne en interaction avec l’environnement (Prusinkiewicz, 2004 ; Fourcaud et al., 2008 ; Louarn et Song 2020). Leur développement est motivé par l’idée que la structure tridimensionnelle des plantes forme son interface avec l’environnement et module sa croissance et sa productivité (Costes et al., 2006). Ils ont notamment été utilisés pour la modélisation d’arbres fruitiers (Costes et al., 2008 ; Allen et al., 2005 ; Lescourret et al., 2011 ; Boudon et al., 2020) chez lesquels la compétition interne pour les ressources entre organes nécessite d’avoir des représentations dynamiques spatialisées. Un verrou majeur de cette approche est la paramétrisation du modèle qui rend difficile son adoption pour construire des outils d’aide à la décision pour la gestion des vergers (DeJong, 2019) et plus généralement qui freine son utilisation dans la communauté scientifique.

La télédétection, couplée au traitement de données par deep learning, ont un potentiel important pour aider à la caractérisation du fonctionnement et de la croissance des plantes et donc paramétrer de tels modèles. En particulier, la disponibilité récente de caméras (RGB, Lidar, thermique, etc.) et vecteurs (drone, phénomobile, etc) permet d’envisager des solutions innovantes pour le phénotypage haut débit et le suivi des cultures. Récemment de nombreuses initiatives visent à automatiser le phénotypage des plantes, mais se concentrent sur un ensemble limité de traits, souvent peu compatible avec la définition d’un FSPM (Streit et al., 2023). L’objectif de ce stage est de rapprocher méthodes de phénotypage haut débit des vergers et construction d’un modèle 3D détaillé d’arbres fruitiers, en prenant comme cas d’application les pommiers.

Sujet :
L’objectif premier de ce stage sera d’extraire des règles de développement et de ramification à partir de reconstructions 3D issues de scans LiDAR en hiver par des méthodes d’assimilation de données, basées sur du machine ou deep learning (i.e. CNNS, RNNs, LSTMs et Transformers). Le second objectif sera de réaliser une première étape de reformulation d’un modèle FSPM d’arbre fruitier, MAppleT (Costes et al., 2008) pour préparer son couplage avec les données numériques issues de différents protocoles d’acquisition (LiDAR, imagerie aéroportée).

• Le stage débutera par une analyse bibliographique des traits accessibles par phénotypage pour la modélisation structure-fonction. Un bilan sera fait des différents traits mesurés par phénotypage LiDAR et imagerie qui seront mis en regard des paramètres des modèles de simulation. En particulier, les aspects de topologie de l’architecture des arbres, notamment leur ramification seront analysés.
• A partir de reconstructions issues de scans LiDAR en hiver, des méthodes d’assimilation de données, basées sur des méthodes de machine ou deep learning, pour permettre de reproduire les séquences d’événements développementaux observées en fonction des génotypes, seront développées. Pour modéliser et simuler ces séquences, différents types d’architecture de réseaux seront testés, (i.e. CNNS, RNNs, LSTMs et Transformers). Les séquences déduites de la reconstruction 3D devront prendre en compte l’incertitude des mesures. Les modèles initiaux de séquences de ramification, construits à partir de modèles de semi chaînes de Markov cachées, seront utilisés pour pré-entraîner les modèles de réseaux. Ceux-ci seront évalués pour leur capacité à prendre en compte les effets génotypiques.
• Le FSPM MappleT sera ensuite modifié pour prendre en compte ce nouveau type de modélisation des paramètres de ramification, basé sur la donnée. Des validations en termes de quantité d’organes reconstruites, de volume de plantes, etc. seront mise en place.

Profil du candidat :

Formation et compétences requises :
– Dernière année de Formation Supérieure BAC + 5
– Connaissances : Master en maths-infos, programmation en langage Python, des connaissances en statistiques seront appréciées
– Compétences opérationnelles : Goût pour le travail en équipe et l’inter-disciplinarité
– Langues : français, anglais

Adresse d’emploi :
Avenue Agropolis TA A-108 / 01
34398 Montpellier Cedex 5, France

Document attaché : 202410090946_stageM2-assimilation-vf.pdf

Dec
31
Tue
2024
Anchor-free small ship detection from Sentinel-2 images
Dec 31 2024 – Jan 1 2025 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA, Université Bretagne Sud
Durée : 6 mois
Contact : minh-tan.pham@univ-ubs.fr
Date limite de publication : 2024-12-31

Contexte :
For information, please consult the offer on this link:
http://www-obelix.irisa.fr/files/2024/10/Master_topic_ship_detection_2024.pdf

Sujet :
Keywords: Deep learning, small object detection, anchor-free detection, ship detection, Sentinel-2

Profil du candidat :
Student Master 2, Ecole d’Ing´enieur or equivalent with excellent academic track;
Ability to communicate in English;

Formation et compétences requises :
Background in computer science and/or machine/statistical learning and/or applied mathematics for signal and image processing;
Excellent programming in Python (familiar with one of deep learning packages is a must,
preferable PyTorch).

Adresse d’emploi :
The expected intern will join the OBELIX research group (www.irisa.fr/obelix) from IRISA (UMR 6074) is located in the UBS (Universit´e Bretagne Sud) campus in Vannes 56000, France.

Document attaché : 202410090849_Master_topic_ship_detection_2024.pdf

Comparative analysis of the molecular pathology of neurodegenerative diseases using new optimal transport methods applied to graphs
Dec 31 2024 – Jan 1 2025 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Sorbonne University/IBPS
Durée : 6 months
Contact : lucile.megret@sorbonne-universite.fr
Date limite de publication : 2024-12-31

Contexte :
The Brain-C team at the Paris-Seine Institute of Biology (IBPS) is developing several original research projects aimed at understanding the dynamics of neuronal compensation mechanisms during the progression of neurodegenerative diseases (ND), such as Huntington’s disease and amyotrophic lateral sclerosis (ALS). The multidisciplinary team is composed of biologists and mathematicians and relies on a network of local and international collaborators for both the production of multi-omic data and their analysis. In this context, the Brain-C team has access to large temporal datasets (RNA-seq, ChIP-seq) obtained from specific neuronal populations, notably in mouse models, which are analyzed for therapeutic innovation purposes (target selection).
See: https://www.ibps.sorbonne-universite.fr/fr/Recherche/umr-8256/brainc

Sujet :
In collaboration with École Polytechnique and Telecom Paris, the objective of this internship is to identify, at a fine-grained level, the similarities and differences in the molecular dynamics underlying these diseases. Genomic deregulation will be modeled using graph-based approaches, and optimal transport will be employed as a metric to compare these objects across different levels of granularity.
Expected outcomes:
Develop a clustering method for comparing neurodegenerative diseases (ND).
Identify and interpret substructures within these graphs that reflect similarities or divergences, and relate them to underlying biological mechanisms.
Compile a comprehensive list of challenges that will be addressed and further explored in the context of a future PhD project.

Profil du candidat :
Students in their second year of a Master’s degree in Mathematics or Computer Science, or students from engineering schools, with a strong interest in AI,
Proficiency in Python or at least one programming language.biology, and translational research.

Formation et compétences requises :

Adresse d’emploi :
7 quai Saint-Bernard 75005 Paris

Extraction de connaissances sur les changements d’occupation et usage des sols à partir de données textuelles
Dec 31 2024 – Jan 1 2025 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2024-12-31

Contexte :
La caractérisation de l’utilisation et de l’occupation des sols (Land Use and Land Cover,
LULC en anglais) et de leurs changements est essentielle pour comprendre les dynamiques
territoriales et gérer durablement les espaces naturels et urbains. La modélisation
spatio-temporelle, qui permet de représenter et projeter ces changements, mobilise des
connaissances expertes, qualitatives ou quantitatives, intégrées dans les modèles sous
forme de règles logiques. L’un des moyens d’obtenir ces connaissances est la sollicitation
d’experts par des entretiens, mais cette approche est coûteuse en temps et présente des
biais.
D’autres sources d’informations peuvent être mobilisées, telles que la littérature scientifique,
les rapports techniques ou encore les articles de presse. La sélection de documents
pertinents et leur analyse est une tâche chronophage pour laquelle des approches
d’extraction automatique peuvent être utilisées. Dans ce contexte, les méthodes de
traitement automatique du langage et d’apprentissage automatique peuvent permettre : (1)
l’extraction automatique d’informations d’intérêt, (2) la normalisation et représentation de ces
informations dans un formalisme adapté, et (3) leur transformation en règles logiques.
L’extraction et représentation des connaissances à partir de données textuelles ont été
étudiées dans le domaine de l’agriculture (Drury et al. 2019; Drury et Roche 2019) et
domaines connexes tels que l’agriculture urbaine (Bhuyan et al. 2024) ou les crises
agrométéorologiques (Zhang et al. 2023). En revanche, peu de travaux ont porté sur le
traitement de données textuelles sur la thématique de l’usage et de l’occupation des sols,
leurs changements, et les drivers associés. Le stage se déroule dans la cadre du projet
ARENA (Automatic Rule Extraction and Network Analysis), financé par le CNES, ayant pour
but d’extraire des informations sur l’usage et l’occupation des sols à partir d’articles
scientifiques et de les combiner avec des réseaux multicouches issus de séries temporelles
d’images satellites. Les recherches les plus proches du projet ARENA sont les travaux de
Kaczmarek (2023) ainsi que les travaux menés dans le cadre du projet Hérelles
(https://herelles-anr-project.cnrs.fr/). Ce stage fait également suite à des travaux menés
précédemment dans le cadre de l’ANR TipHyc (Tipping points in the West African
Hydrological Cycle), sur l’extraction d’information à partir d’articles scientifiques.
Le.a. futur.e stagiaire s’appuiera sur les premiers résultats obtenus pour améliorer les
propositions méthodologiques utilisées et étudiera l’inclusion de nouvelles sources de
données textuelles.

Sujet :
Objectifs du stage
Ce stage a pour objectif de développer une approche pour l’extraction et la formalisation de
connaissances sur l’occupation et usage des sols à partir de sources textuelles, grâce à
l’utilisation de techniques avancées de traitement automatique de la langue et apprentissage
automatique.
Il s’articulera en plusieurs étapes :
1. Identification de sources de données textuelles pertinentes et constitution de corpus
sur une zone d’étude pré-définie,
2. Formalisation de la notion d’information pertinente sur la thématique des
changements d’occupation ou d’utilisation des sols LULC, en collaboration avec des
experts du domaine,
3. Enrichissement d’une nomenclature existante sur l’occupation et usage des sols et
les processus de changement,
3. Comparaison de méthodes d’extraction automatique à partir des corpus d’étude.
Selon les enjeux méthodologiques identifiés, le.a stagiaire sera amené.e à comparer
des approches supervisées, intégrant ou non des règles expertes (Kaczmarek,
2023), et des approches reposant sur des grands modèles de langues (Large
Language Models) (Dagdelen et al. 2024). Le point d’ancrage des connaissances à
extraire sera les changements d’occupation et d’usage des sols et les processus qui
leur sont associés.
4. L’analyse quantitative et qualitative des informations extraites.
Les données d’étude seront en anglais ou en français selon la zone d’étude.
Organisation du stage
Le stage se déroulera sur une période de 6 mois, à compter de février 2025, dans les locaux
de la Maison de la Télédétection à Montpellier.
L’étudiant·e sera accueilli·e au sein de l’équipe MISCA de l’UMR TETIS (Territoire
Environnement Télédétection et Information Spatiale) et sera encadré·e par Sarah Valentin,
chercheuse en fouille de données textuelles au Cirad à l’UMR TETIS et Roberto Interdonato,
chercheur en Intelligence Artificielle, également au Cirad à l’UMR TETIS. Le déroulement du
stage se fera dans un contexte interdisciplinaire, notamment en collaboration avec Simon
Madec, chercheur en télédétection et apprentissage profond au sein de l’UMR TETIS .
En plus de la rédaction d’un mémoire de Master 2 ou de fin d’étude selon les attentes de sa
formation, d’autres modalités de valorisation des résultats seront éventuellement envisagées
avec les encadrants au cours du stage telles que la publication d’un jeu de données (corpus)
et la contribution à un data paper.

Candidature

Envoyer CV, lettre de motivation et relevé de notes M1 (ou 4ème année) avant le 29/11/2024
à Sarah Valentin (sarah.valentin@cirad.fr) et Roberto Interdonato
(roberto.interdonato@cirad.fr), en précisant en objet du mail “CANDIDATURE STAGE
ARENA 2025”.

Profil du candidat :
Compétences recherchées
● Formation en informatique
● Bonne maîtrise du langage de programmation Python
● Connaissances en traitement automatique du langage et/ou apprentissage
automatique
● Maîtrise de l’anglais écrit
● Intérêt pour les applications socio-environnementales et le travail interdisciplinaire.

Formation et compétences requises :
Compétences recherchées
● Formation en informatique
● Bonne maîtrise du langage de programmation Python
● Connaissances en traitement automatique du langage et/ou apprentissage
automatique
● Maîtrise de l’anglais écrit
● Intérêt pour les applications socio-environnementales et le travail interdisciplinaire.

Adresse d’emploi :
Maison de la Télédétection, 500 rue Jean François Breton, 34090, Montpellier

Document attaché : 202411181314_stage_ARENA_2025.pdf

Problèmes de Satisfaction de Contraintes (CSPs) et réseaux de neurones pour une analyse de l’artificialisation des terres à partir de données satellitaires
Dec 31 2024 – Jan 1 2025 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : TETIS
Durée : 6 mois
Contact : zouhaira.ayadi@umontpellier.fr
Date limite de publication : 2024-12-31

Contexte :
L’artificialisation des terres, étroitement liée aux changements environnementaux, représente un enjeu environnemental majeur pour la préservation des écosystèmes et des ressources naturelles (Vidal-beaudet et Rossignol, 2018) (Desrousseaux et al., 2019). Ce phénomène complexe nécessite des outils de surveillance capables de détecter, à partir d’images satellitaires haute résolution, les transformations des sols afin d’anticiper et de gérer leurs impacts environnementaux. Le projet Hérelles (https://anr.fr/Projet-ANR-20-CE23-0022) (Koptelov et al., 2023b) (Koptelov et al., 2023a) vise à développer un cadre d’analyse collaborative et multiparadigme des séries temporelles d’images satellitaires. Un de ses principaux objectifs est de modéliser les dynamiques des changements environnementaux, tels que l’artificialisation des sols et l’urbanisation, dans un contexte où les données sont à la fois volumineuses et complexes. Ce stage, inscrit dans les activités interdisciplinaires du projet, propose une approche novatrice pour extraire des motifs d’artificialisation en combinant les Problèmes de Satisfaction de Contraintes (CSP) et l’apprentissage profond. L’analyse des données satellitaires, bien qu’essentielle pour suivre ces transformations, reste un défi en raison de la diversité des relations spatiales et des contraintes géographiques qui influencent ces processus. Les avancées récentes en apprentissage profond et en CSP (Koptelov et al., 2023c) (Schaus et al., 2017) ouvrent la possibilité de combiner la détection automatisée de motifs complexes avec une modélisation explicite des règles géospatiales. Bien que les réseaux de neurones, largement utilisés en apprentissage profond, offrent des performances remarquables pour la détection des motifs, leur caractère de “boîte noire” complique l’interprétation des décisions. À l’inverse, les méthodes CSP, telles que le Backtracking, la recherche locale, etc. permettent une transparence explicative en intégrant des règles géospatiales explicites, mais requièrent un effort humain considérable. L’approche hybride proposée conjugue la puissance prédictive des réseaux de neurones avec la clarté explicative des CSP pour une analyse robuste et interprétable des processus d’artificialisation. Les motifs d’artificialisation complexes reflètent des schémas spatiaux d’urbanisation et de transformation du territoire, permettant de détecter les zones artificialisées ou en voie d’artificialisation. Parmi ces motifs, on distingue notamment l’expansion urbaine(agrandissement des villes en zones rurales),la conversion des terres agricoles en surfaces construites (transformation des champs en bâtiments), la densification des zones bâties (augmentation de la densité dans les zones urbaines), la conversion de terres agricoles, la fragmentation des espaces naturels (morcellement ou division des zones naturelles (forêts, prairies) en parcelles plus petites et isolées), etc. Cette approche hybride repose sur l’utilisation de l’algorithme AC3 et du Backtracking optimisé pour intégrer des règles géospatiales explicites dans le modèle, tout en exploitant les Graph Neural Networks(GNN) pour identifier des motifs complexes. Les mécanismes d’explication factuelle (pourquoi une région a été artificialisée) et contrefactuelle (ce qui se serait produit dans d’autres circonstances) fourniront aux décideurs des informations interprétables pour une gestion durable des territoires.

Sujet :
L’objectif de ce stage est de développer un modèle hybride CSP-GNN combinant le backtracking optimisé et le GNN pour extraire les motifs d’artificialisation à partir d’images satellitaires haute résolution. Il s’agira de :
1. Définir les motifs sous forme de schémas géospatiaux structurés qui traduisent des configurations particulières d’occupation du sol. Chaque motif sera défini en termes de relations spatiales (topologiques, métriques, etc.), temporelles, ainsi que d’attributs contextuels (tailles , surfaces, NDVI, etc.) spécifiques aux transformations.
2. Implémenter le modèle hybride CSP-GNN, se basant sur :
– Le CSP pour expliciter des règles géospatiales, intégrer des contraintes spatiales (proximité, continuité) et temporelles (évolution sur plusieurs années). Pour cette étape de résolution des CSP, il s’agira d’implémenter l’algorithme AC-3 (Arc Consistency 3) combiné à une résolution avec Backtracking optimisé par des heuristiques de sélection de variables (Minimum Remaining Values, MRV) et/ou de valeurs (Least Constraining Value, LCV).
– L’apprentissage profond via le réseau de neurone graphique (Graph Neural Networks, GNN) pour modéliser les relations complexes entre entités spatiales et identifier automatiquement les motifs non explicitement définis.
Le modèle devra produire des explications factuelles justifiant pourquoi une région a été artificialisée et des explications contrefactuelles qui illustreront ce qui se serait produit avec des conditions différentes.

Profil du candidat :
Le/la candidat(e) doit être en Master 2. Il/elle aura un profil informatique avec des connaissances en apprentissage automatique et/ ou en programmation par contraintes (CSP), avec un intérêt pour le travail interdisciplinaire. Des compétences en traitement des données géospatiales et en explication seraient un atout.

Formation et compétences requises :

Adresse d’emploi :
UMR TETIS, 500 Rue Jean François Breton, 34000 Montpellier
ou
ICube, 300 bd Sébastien Brant, 67400 Illkirch (Strasbourg)

Document attaché : 202411181459_Offre_de_stage_M2___TETIS (1).pdf

Recherche de motifs dans des données archéo-environnementales
Dec 31 2024 – Jan 1 2025 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIP6 (Sorbonne Université / CNRS)
Durée : 4-6 mois
Contact : lionel.tabourier@lip6.fr
Date limite de publication : 2024-12-31

Contexte :
On cherche à reconstituer les changements environnementaux passés à l’aide de données d’abondance de pollens, spores fongiques et autres bioindicateurs. En pratique, des carottages sont effectués dans les sédiments de milieux naturels dont les différentes profondeurs correspondent à différentes époques, que l’on évalue à l’aide de méthodes de datation. Les pollens sont comptés par des spécialistes de la discipline afin d’évaluer quelles espèces étaient présentes à quelle époque.

Du point de vue informatique, on peut étudier les motifs de co-évolution des différents pollens afin d’évaluer quelles espèces sont apparues ou disparues simultanément dans l’environnement. Cela permet par exemple d’identifier des marqueurs attestant de la présence humaine dans une région à une époque donnée. Dans ce contexte, on peut chercher à comprendre quels sont les facteurs qui expliquent les modifications de l’environnement : présence humaine, fluctuations climatiques, etc.

Sujet :
Descriptif détaillé du sujet sur le document pdf.

Profil du candidat :
Le stage est destiné aux étudiants de Licence 3 ou Master (préférentiellement Master).

Formation et compétences requises :
Bonnes capacités de programmation et d’algorithmique. Un goût pour l’interdisciplinarité, en particulier avec les sciences humaines et les sciences de l’environnement, est essentiel pour ce stage.

Adresse d’emploi :
LIP6, 4 Place Jussieu, 75005 Paris

Document attaché : 202403061058_Stage_Palynologie_LIP6.pdf

Jan
10
Fri
2025
Application de méthodes de Natural Language Processing (NLP) pour l’extraction automatisée de données web pour la création d’une base de données des traits phénotypiques des adventices tropicales
Jan 10 – Jan 11 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Cirad
Durée : 6 mois
Contact : gregoire.blanchard@cirad.fr
Date limite de publication : 2025-01-10

Contexte :
L’objectif de ce stage est de définir, extraire et organiser des données de traits phénotypiques et de distribution géographique des adventices tropicales (plantes qui s’établissent spontanément dans les systèmes tropicaux cultivés) afin de construire une base de données complète et exploitable pour décrire et comparer leur caractéristiques et leur diversité. Les plantes adventices des cultures tropicales ont un impact significatif sur la productivité agricole mais aussi sur de multiples services écosystémiques comme le maintien de la fertilité des sols, la réduction de l’érosion, la régulation des bioagresseurs etc. Une meilleure connaissance des traits phénotypiques des adventices tropicales permettrait d’améliorer notre compréhension de leur fonctionnement et de leur écologie, qui déterminent leur développement aux sein des cultures, leur réponse aux facteurs environnementaux et aux pratiques agronomiques, ainsi que leur distribution géographique. C’est donc une étape cruciale pour développer des stratégies de gestion efficaces.

Sujet :
Dans ce contexte, le stage a pour objectif de collecter, de traiter et d’organiser des données pertinentes des traits des plantes en utilisant des techniques de web scraping et le text-mining. La finalité du stage est de construire une base de données relationnelle structurée regroupant les traits des adventices tropicales qui sera un outil précieux pour les
chercheurs, permettant d’effectuer différentes analyses, pour une meilleure compréhension de la réponse des espèces adventices aux facteurs environnementaux et aux pratiques agricoles, ainsi que de leur impact sur le fonctionnement des cultures tropicales. Le/la stagiaire sera responsable du développement des scripts de web scraping en utilisant principalement le langage de programmation Python via des bibliothèques spécialisées. Une première étape sera d’évaluer et de comparer les performances spécifiques de différentes méthodes de text mining (Spacy, GLiNER, UniversalNER) pour l’extraction des entités visées dans le cadre de ce travail. Les méthodes retenues permettront d’extraire des informations spécifiques sur les plantes adventices et leurs traits phénotypiques et éventuellement leur répartition géographique. Les données seront ensuite normalisées et structurées de manière cohérente pour leur intégration dans une base de données relationnelle (PostgreSQL). Enfin, des analyses descriptives des données recueillies pourront être réalisées pour évaluer l’état et le volume des connaissances accumulées dans la base de données, et la distribution des valeurs de traits des espèces en fonction de leur distribution au travers des gradients environnementaux, géographiques et agronomiques.

Profil du candidat :
Formation de niveau Master 2 en cours dans le domaine de l’intelligence artificielle ou de la science des données.

Formation et compétences requises :

Adresse d’emploi :
Stage basé en Guadeloupe (station de Neufchateau, Capesterre-Belle-Eau) avec une mission sur Montpellier pour Digitagora.

Document attaché : 202412021735_Stage_DigitAg_Text_mining.pdf

Réseaux de neurones profonds pour l’analyse de performance et la gestion de microréseaux électriques intelligents
Jan 10 – Jan 11 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISSI/CERTES
Durée : 6 mois
Contact : aurelien.hazan@u-pec.fr
Date limite de publication : 2025-01-10

Contexte :

Sujet :
Le CERTES utilise de nombreuses techniques d’apprentissage machine [Ark21] et dispose d’une plateforme technologique de micro-réseaux modulaires et multifonctionnels. Cette plateforme permet d’étudier différents scenarios d’agrégationde plusieurs sources énergétiques (éolien, solaire, stockage, réseau électrique, charges de consommation variable, …) avec la possibilité de générer différents types de défauts
mais aussi d’utiliser de contrôler certaines sources énergétiques pour fonctionner selon des profils imposés, en plus des sources soumises aux conditions climatiques réelles.

Le but de ce stage est d’évaluer l’intérêt de deux types de réseaux de neurones pour l’analyse des microréseaux électriques :

– Les Graph Neural Networks (GNN) sont spécifiquement adaptés aux données sous forme de graphe [Liao22], et sont donc particulièrement pertinents pour les réseaux électriques.

-Les PINN (Physics-Induced Neural Networks) imposent des contraintes
représentant des lois physiques lors de l’apprentissage afin de réduire la
dimension de l’espace latent des paramètres.

Le LISSI dispose d’une expertise dans l’analyse de données sur graphe et sur plusieurs types de réseaux de neurones profonds [Haz21, Aha24]. Les performances de ces réseaux de neurones seront testées avec plusieurs tâches d’intérêt pour le CERTES [Ark21, Tan24]:

-Prédiction de séries temporelles de charge électrique de micro-réseau avec un graph récurrent neural networks (GRNN), comparaison avec d’autres architectures de type LSTM.

-Prédiction de puissance générée par des panneaux photovoltaïques. Calcul approché de flux de puissance (power-flow) et analyse de scenario lors de l’adjonction d’une flotte de véhicules électriques à un petit réseau de distribution industriel.

Dans chaque cas, le stagiaire comparera les performances obtenues avec celles développées précédemment au CERTES, les performances state-of-the-art dans la littérature, et évaluera les avantages et inconvénients.

Références:

[Ark21] Arkhangelski, “Autoconsommation et optimisation de la gestion énergétique des bâtiments”, thèse, UPEC, 2021.

[Haz22] Hazan, “Production process networks: a trophic analysis”, Journal of Physics:Complexity, 4,1, 2022.

[Aha24] Ahamada, Hazan, Vigneron, “Deep Learning and Tensor Decomposition”, in preparation.

[Tan24] Simarro-García, Villena-Ruiz, Tankari, Honrubia-Escribano, Gómez-Lázaro, Lefebvre, “Fast and Extreme Fast Charging Integration for Electric Vehicles: Impact on an Industrial Distribution Network”, International journal of engineering science and application,Vol.8, No.2, 2024.

[Lia22] Liao et al. “A Review of Graph Neural Networks and Their Applications in Power Systems”, Journal of modern power systems and clean energy, vol. 10, no. 2, 2022.

[Kho21] Khodayar et al. “Deep Learning in Power Systems Research: A Review”, Csee journal of power and energy systems, vol. 7, no. 2, march 2021.

Profil du candidat :
Etudiant.e en M2 sciences de l’ingénieur, génie électrique, énergie, machine learning, deep learning.

Compétences (modélisation systémique (Matlab, PSIM, …), calcul de power flow, ML,programmation Python.

Formation et compétences requises :

Adresse d’emploi :
LISSI: site de Sénart, IUT de Sénart-Fontainebleau, 36-37 rue Georges Charpak,77 567 Lieusaint

CERTES: site de Créteil: Bâtiment L5, 61 Avenue du Général De Gaulle, 94000 CRETEIL

Document attaché : 202412030849_2024_sujet_M2_LISSI_CERTES_DEF.pdf

Jan
15
Wed
2025
Developing a Super-Resolution Benchmark for Remote Sensing Downstream Applications
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRISA
Durée : 4 à 6 mois
Contact : charlotte.pelletier@univ-ubs.fr
Date limite de publication : 2025-01-15

Contexte :
The spatial resolution of freely available multispectral sensors such as Sentinel-2 (10 meter at best) remains a limiting factor for many Earth observation tasks, particularly those involving fine-scale spatial structures such as the delineation of crop boundaries, mapping of urban trees, or identification of individual buildings. Deep learning-based super-resolution (SR) techniques have emerged as an attractive solution to synthetically enhance the spatial detail of such imagery [4]. While numerous SR methods, ranging from convolutional neural networks to transformers and generative models [3], have been proposed, their evaluation typically relies on reconstruction and perceptual metrics. These measures, though common, are tailored for SR models trained on natural images and overlooked challenges cause by cross-sensor SR from satellite images [2]. More importantly, they do not indicate whether the super-resolved data improve the performance, robustness, or interpretability of downstream models used for Earth monitoring [5].

Sujet :
Objectives of this work. This internship aims to bridge this gap by developing a comprehensive benchmark of SR models for downstream learning applications in Earth observation. The goal is to quantify how the reconstruction of fine details in SR imagery impacts the performance of subsequent analysis tasks. The focus will be on Copernicus data, in particular Sentinel-2 imagery, which is freely available and provides global coverage with acquisitions every five days at the equator. The benchmark will include both standard image-based metrics and newly proposed task-aware evaluation criteria tailored to the selected applications.
Work Plan
To address the aforementioned objectives, a tentative work plan is outlined below:
• Literature review: Survey recent SR models and their evaluation in downstream applications using Sentinel-2 or similar optical data.
• Benchmark design: Identify suitable datasets combining Sentinel-2 imagery and higher-resolution references (e.g., PlanetScope, WorldView, or aerial data) for multiple domains such as agriculture, forestry, maritime [1], and urban monitoring.
• Metric development: Explore and propose new metrics that go beyond classical reconstruction or segmentation scores. The objective is to assess how SR influences application-level outcomes, e.g., boundary delineation [6], small-object detection, or vegetation index preservation.
• Experimental benchmarking: Implement and compare several SR models within a unified experimental setup, evaluating their performance using both conventional and newly defined task-aware metrics.
The expected outcomes include a benchmark framework enabling the community to evaluate SR models on a range of downstream applications, as well as a research paper submitted to a top-tier journal.
References
[1] Katerina Kikaki, Ioannis Kakogeorgiou, Paraskevi Mikeli, Dionysios E Raitsos, and Konstantinos Karantzalos. MARIDA: A benchmark for marine debris detection from Sentinel-2 remote sensing data. PloS one, 17(1):e0262247, 2022.
[2] Julien Michel, Ekaterina Kalinicheva, and Jordi Inglada. Revisiting remote sensing cross-sensor single image super-resolution: the overlooked impact of geometric and radiometric distortion. IEEE Transactions on Geoscience and Remote Sensing, 2025.
[3] Aimi Okabayashi, Nicolas Audebert, Simon Donike, and Charlotte Pelletier. Cross-sensor super-resolution of irregularly sampled sentinel-2 time series. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pages 502–511, 2024.
[4] Peijuan Wang, Bulent Bayram, and Elif Sertel. A comprehensive review on deep learning based remote sensing image super-resolution methods. Earth-Science Reviews, 232:104110, 2022.
[5] Piper Wolters, Favyen Bastani, and Aniruddha Kembhavi. Zooming out on zooming in: Advancing super-resolution for remote sensing. arXiv preprint arXiv:2311.18082, 2023.
[6] Quentin Yeche, Dino Ienco, and Raffaele Gaetano. Field by field: moving from area-based metrics to instance-level agricultural parcel assessment. 2025.

Profil du candidat :
We are looking for a candidate:
• enrolled in a Master 2, École d’Ingénieur, or equivalent program in computer science, data science, or geoinformatics;
• with a strong background in data science, and/or computer vision;
• proficient in Python programming and familiar with at least one deep learning framework (preferably PyTorch);
• with experience in remote sensing or a strong motivation to apply AI to Earth observation;
• with excellent communication skills in French or English;
• and a keen interest in research and scientific publication.

Formation et compétences requises :
We are looking for a candidate enrolled in a Master 2, École d’Ingénieur, or equivalent program in computer science, data science, or

Adresse d’emploi :
Université Bretagne Sud
Campus de Tohannic
56000 Vannes

Document attaché : 202511101259__2025__Master_2_SR_downstream_applications.pdf

Le ConText-GAN pour la génération d’images de microscopie électronique : Augmentation de données par approche générative.
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS UMR 7020 : www.lis-lab.fr
Durée : 5 à 6 mois
Contact : marc-emmanuel.bellemare@univ-amu.fr
Date limite de publication : 2025-01-15

Contexte :
Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes (LIS), expert dans l’analyse d’image, et le laboratoire Mephi (IHU Méditerranée Infection), expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité (Habib 2019). L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon (lien). Par une approche innovante par MEB, on a démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux (Hannachi 2020 ; vidéo). Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse.

Sujet :
L’objectif du stage est de développer une méthode à base de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Nous nous proposons d’utiliser une architecture qui permettra à la fois la détection et la segmentation des objets d’intérêt dans l’image. Cependant, l’entrainement de réseaux profonds demande une quantité importante d’images annotées. Le nombre des images disponibles étant actuellement limité, il s’agit alors de mettre en œuvre une stratégie d’augmentation de données qui pourrait profiter d’une architecture générative d’images. Le ConTextGAN (Hostin 2023) que nous avons développé au LIS permet de produire des images dont le contenu est finement contrôlé. Il a montré ses performances dans le cadre de l’IRM. Aussi, dans le cadre de ce stage le ConTextGAN sera entrainé pour la génération de différents types d’images MEB et les performances seront évaluées par l’apport de ces images sur les performances de segmentation d’un réseau du type YOLO ou nnUnet. Une comparaison des performances du ConTextGAN avec celles des méthodes de diffusion sera (e.g. ControlNet) envisagée.
https://huggingface.co/docs/diffusers/using-diffusers/controlnet#guess-mode

Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale.

Formation et compétences requises :
La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées.

Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’) ou dans ceux de l’équipe MEPHI de l’IHU Méditerranée Infection, selon les besoins.

Document attaché : 202410160834_Sujet_Master2_ConTextGAN-AugmentationDL-SEM.pdf

Segmentation d’IRM multiplan par réseaux de neurones profonds
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’Informatique et Systèmes LIS – UMR
Durée : 5 à 6 mois
Contact : marc-emmanuel.bellemare@univ-amu.fr
Date limite de publication : 2025-01-15

Contexte :
Les troubles de la statique pelvienne représentent un enjeu de santé publique. Ils regroupent un ensemble de pathologies associant une perte des rapports anatomiques normaux des organes pelviens, et une altération dramatique de la qualité de vie des malades. Ces pathologies sont handicapantes à des degrés variés mais leur physiopathologie reste encore mal connue ce qui complique leur prise en charge. Dans le cadre d’une collaboration avec le service de chirurgie digestive de l’AP-HM, de nouvelles acquisitions IRM, associées à une reconstruction adaptée, ont permis la visualisation 3D des organes en mouvement. Des résultats probants ont été récemment obtenus et publiés pour l’observation de la vessie et il s’agit de s’intéresser aux autres organes pelviens

Sujet :
Le stagiaire s’attachera à la segmentation des images acquises lors de l’observation par IRM dynamique des déformations des organes pelviens afin de produire des reconstructions 3D des surfaces en mouvement.
Des acquisitions multi-planaires ont été réalisées dans des plans non classiques ce qui complique la reconnaissance des organes. Ainsi la segmentation des principaux organes impliqués est une étape primordiale mais difficile. Les partenaires cliniciens ont réalisé des segmentations manuelles des organes sur ces plans ce qui permet de disposer d’une vérité-terrain. Nous envisageons de proposer un nouveau modèle de réseau, adapté à la configuration des plans d’acquisition.
Les problématiques de recalage, de segmentation et de modèles 3D, au cœur du projet, seront abordées selon les compétences et préférences du stagiaire.

Profil du candidat :
Le candidat ou la candidate sera intéressé(e) par un projet pluridisciplinaire et par l’imagerie médicale. Les domaines abordés concernent les réseaux de neurones profonds, la segmentation d’IRM et la reconstruction 3D.

Formation et compétences requises :
Des compétences en mathématiques appliquées seront particulièrement appréciées. Une expérience de la programmation avec l’environnement python (PyTorch) serait un plus.

Adresse d’emploi :
Le stage se déroulera à Marseille essentiellement au laboratoire d’informatique et des systèmes (LIS) dans l’équipe Images & Modèles sur le campus de St Jérôme

Document attaché : 202410160845_Sujet_Master2_DL&SegmentationMultiPlan.pdf

X-atlas 3D-I, reconstruction automatique d’atlas d’architecture 3D plante entière à partir d’images de micro-tomographie rayons X
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Cirad, Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-01-15

Contexte :
Mots-clés : 3D Image Analysis, X-ray computed tomography, Segmentation, 3D reconstruction, #DataForGood

Les rizières jouent un rôle central dans la sécurité alimentaire mondiale, et un rôle important dans le changement climatique d’origine anthropique en émettant chaque année 50 mégatonnes de méthane. Le projet interdisciplinaire ARIZE vise à relever le double défi de la transition agroécologique et de la sécurité alimentaire en développant des outils innovants pour l’exploration morpho-anatomique du riz en 3D afin de sélectionner des variétés de riz adaptées aux cultures en sol sec. Dans ce cadre, nous explorons l’architecture interne des plantes de riz en 3D via des images inédites par micro-tomographie aux rayons X à une résolution de 10 µm. Chaque image volumétrique, de l’ordre de 1 To, permet de révéler le réseau 3D des aérenchymes, ces “canaux” internes qui transportent l’oxygène. Automatiser l’analyse de ces structures en 3D serait une première mondiale et constitue le cœur de ce stage.

Sujet :
Concevoir un pipeline complet d’analyse 3D pour reconstruire et caractériser automatiquement le réseau des aérenchymes à l’échelle de la plante entière (racines et feuilles). Les principales missions incluent le développement d’algorithmes de reconstruction 3D topologique et géométrique à partir des volumes d’imagerie (segmentation d’instance, déformation non linéaire de volume, etc.) et l’intégration des outils développés dans un démonstrateur open-source via un plugin Python pour le logiciel Napari, facilitant l’exploration des résultats par un atlas probabilistique interactif en 3D. Le stagiaire travaillera en lien étroit avec le deuxième stagiaire X-atlas 3D, dédié à la segmentation des structures anatomiques par deep learning. Une forte collaboration est prévue pour combiner les résultats dans une solution intégrée.

Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en informatique, analyse d’images, ou modélisation mathématique. Le langage de programmation utilisé sera Python, en utilisant des outils de développement communautaire et de maintien logiciel (Github, Intégration Continue).

Formation et compétences requises :
Expérience en traitement d’images 3D, en reconstruction volumique et/ou modélisation géométrique appréciée. Intérêt pour le développement d’outils open-source et la collaboration interdisciplinaire. Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Adresse d’emploi :
a rémunération selon barème légal des stages sera de 600€ mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av. Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202411271214_Offre stage M2 – 2025 – Xray arbo.pdf

X-atlas 3D-II, segmentation 3D automatique à haut-débit de structures anatomiques à partir d’images de micro-tomographie rayons X
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Cirad, Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-01-15

Contexte :
Mots-clés : Deep Learning, 3D Image Analysis, X-ray computed tomography, 3D reconstruction, #DataForGood

Les rizières jouent un rôle central dans la sécurité alimentaire mondiale, et un rôle important dans le changement climatique d’origine anthropique en émettant chaque année 50 mégatonnes de méthane. Le projet interdisciplinaire ARIZE vise à relever le double défi de la transition agroécologique et de la sécurité alimentaire en développant des outils innovants pour l’exploration morpho-anatomique du riz en 3D afin de sélectionner des variétés de riz adaptées aux cultures en sol sec. Dans ce cadre, nous explorons l’architecture interne des plantes de riz en 3D via des images inédites par micro-tomographie aux rayons X à une résolution de 10 µm. Chaque image volumétrique, de l’ordre de 1 To, permet de révéler le réseau 3D des aérenchymes, ces “canaux” internes qui transportent l’oxygène. Automatiser l’analyse de ces structures en 3D serait une première mondiale et constitue le cœur de ce stage.

Sujet :
Concevoir un pipeline complet d’analyse 3D pour la segmentation anatomique et l’estimation de caractéristiques complexes en 3D. Dans ce but, le stagiaire aura la responsabilité de réaliser des expérimentations avec des outils de l’état de l’art (modèles dédiés “plante” et modèles-fondation généralistes), et de concevoir une solution technique open-source qui sera mise à disposition dans un démonstrateur open-source via un plugin Python pour le logiciel Napari. Le stagiaire travaillera en lien étroit avec le deuxième stagiaire X-atlas 3D, dédié à la reconstruction architecturale en 3D. Une forte collaboration est prévue pour combiner les résultats dans une solution intégrée.

Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en informatique, analyse d’images, ou modélisation mathématique. Le langage de programmation utilisé sera Python, en utilisant des outils de développement communautaire et de maintien logiciel (Github, Intégration Continue), et des librairies standards de deep learning (Pytorch/Tensorflow).

Formation et compétences requises :
Expérience en traitement d’images 3D, et/ou modélisation géométrique appréciée. Intérêt pour le développement d’outils open-source et la collaboration interdisciplinaire. Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€ mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av. Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202411271216_Offre stage M2 – 2025 – Deep aerenchimas.pdf

Jan
26
Sun
2025
Classification et comparaison d’images 3D multimodales à l’aide d’architectures GNN et/ou VGAE : application à la détection précoce de la maladie d’Azheimer
Jan 26 – Jan 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire LISTIC – Université Savoie-Mont-Blanc
Durée : 4 à 6 mois
Contact : jean-yves.ramel@univ-smb.fr
Date limite de publication : 2025-01-26

Contexte :
Machine Learning sur Graphes (GNN et VGAE) pour des applications en neurosciences et imagerie multimodales.

L’objectif de ce travail n’est pas seulement de produire un système de classification obtenant de bonnes performances mais aussi de mettre en place des modèles permettant d’expliquer les décisions produites.

Sujet :
Missions :
1. Étude de l’état de l’art sur les représentations graphes adaptées à la représentation d’images 3D multimodales et sur les modèles GNN et VGAE permettant le traitement de telles données.
2. Sélection du mode de construction des graphes en utilisant des techniques de segmentation d’images déjà implémentées appliquées à des IRM cérébrales T1 et TEP. Il s’agira de définir les meilleurs paramètres à utiliser pour intégrer les informations multimodales de manière pertinentes au sein des graphes (mode de segmentation, mode de création des nœuds et arêtes, attributs des nœuds et arêtes du graphes).
3. Mise en place de modèles GNN et/ou VGAE et des procédures d’explicabilité associées. Application à l’analyse de graphes représentant des cerveaux humains sein ou ayant un niveau de pathologie plus ou moins important. L’objectif n’est pas uniquement de classifier mais aussi
d’identifier les bio-marqueurs associés à la tâche étudiée.
4. Les modèles proposés pourront être évalués sur un dataset d’images IRM 3D T1 et TEP de cerveaux humains (détection précoce de la maladie d’Azheimer).
5. Comparaison des performances avec d’autres modèles afin de déterminer la pertinence des solutions proposées dans ce contexte. Évaluation des performances des modèles pour la détection de patterns ou d’anomalies liés à la progression des maladies d’Alzheimer.

Plus d’infos : http://jyramel.free.fr/DATA/stage202425jyr.pdf

Profil du candidat :
• Étudiant(e) en Master 2 ou école d’ingénieurs en Informatique, Machine Learning, Data Science.
• Compétences en Machine Learning (notamment variational autoencoders, GNN, VGAE)
• Maîtrise de Python et des bibliothèques associées (PyTorch, TensorFlow, scikit-learn).
• Esprit analytique, capacité à travailler en équipe

Formation et compétences requises :
Tuteurs / Contacts
jean-yves.ramel@univ-smb.fr – Antoine.bourlier@univ-tours.fr
Merci d’envoyer votre CV et lettre de motivation

Adresse d’emploi :
Laboratoire LISTIC – Bureau 204
Bat 2D – Polytech-Annecy-Chambery
Université Savoie-Mont-Blanc
Campus Savoie-Technolac
73376 Le BOURGET du LAC cedex

Jan
30
Thu
2025
Stage M1/ M2 à l’IRIT- Toulouse: Développement d’Approches d’Apprentissage automatique pour l’Étude du Vieillissement à Travers le Comportement de Nage du Poisson ATK
Jan 30 – Jan 31 all-day

Offre en lien avec l’Action/le Réseau : HELP/– — –

Laboratoire/Entreprise : IRIT, Université Toulouse Capitole
Durée : 6 mois
Contact : moncef.garouani@irit.fr
Date limite de publication : 2025-01-30

Contexte :

Sujet :
I. Contexte général et projet de recherche

Le vieillissement d’une population d’individus est associé à une augmentation de nombreuses maladies chroniques. Trouver des moyens de prévenir et de traiter ces maladies est un enjeu majeur pour la santé publique et la vie socio-économique. Dans le cadre de la recherche sur le vieillissement, notre laboratoire utilise le poisson African Turquoise Killifish (ATK) comme un modèle d’étude très pertinent, puisque sa durée de vie est seulement de 6 à 8 mois et présente un vieillissement holistique multi-organes très rapide. Au laboratoire, nous étudions le vieillissement de l’ATK notamment par l’étude de son comportement de nage spontanée par analyse vidéo. Nos résultats préliminaires montrent, au cours d’un suivi cinétique, clairement que l’ATK a un comportement de nage qui se modifie avec l’âge. Cependant, les grandes quantités de données générées par l’analyse vidéo rendent l’intelligence artificielle (IA) indispensable pour l’extraction de variables pertinentes, l’analyse et l’interprétation des données. Nous proposons dans ce projet de développer des approches d’apprentissage multimodal
(« Multimodal Machine Learning », MML) permettant d’identifier, à partir des données déjà générées, des combinaisons de comportements de nage qui évoluent avec l’âge. Nous devons relever plusieurs défis pour le MML en raison du caractère hétérogène des données longitudinale à traiter. L’encodage unimodale des données est crucial pour le MML et influence fortement son efficacité prédictive. L’identification et le tuning des encodeurs pour extraire les caractéristiques abstraites se limitent actuellement à des tâches unimodales. Dans ce projet, nous développerons (i) des stratégies d’intégration de données originales (sans homogénéisation) pour améliorer l’efficacité de nos analyses, (ii) une méthode de « meta-learning » pour identifier les encodeurs optimaux adaptés à chaque modalité, et (iii) une méthode d’explicabilité multimodale pour identifier les biomarqueurs les plus pertinents et comprendre les relations causales dans les flux de données. L’utilisation du MML appliquée à l’étude du comportement de l’ATK, nous permettra d’atteindre nos objectifs qui sont de (i) réaliser une modélisation longitudinale du comportement de l’ATK, (ii) prédire, en fonction des patterns de nage, la durée de vie d’un individu donné et (iii) son score de fragilité, et enfin (iv) évaluer l’efficacité d’une intervention thérapeutique, qu’elle soit nutritionnelle, génétique ou médicamenteuse.

II. Objectifs du Stage :

L’objectif du stage Master est de contribuer au développement d’approches d’apprentissage multimodal pour l’étude du vieillissement à partir des données comportementales du poisson African Turquoise Killifish (ATK). Plus précisément, le stage se concentrera sur les objectifs suivants :
• Exploration des Architectures d’Apprentissage Multimodal : Réaliser une revue de la littérature sur les architectures et techniques de fusion adaptées à l’intégration de données hétérogènes déjà générés.
• Analyse des Comportements de Nage : Étudier les relations entre différents paramètres comportementaux (vitesse, trajectoire, fréquence de nage) pour identifier les caractéristiques qui évoluent avec l’âge.
• Expériences sur l’Explicabilité Multimodale : Mettre en œuvre des approches d’intelligence artificielle explicable (XAI) pour comprendre comment les comportements identifiés influencent la prédiction de la durée de vie et du score de fragilité.
Le stage impliquera une revue approfondie de la littérature, la conception d’expériences d’apprentissage multimodal, l’analyse des données existantes et l’interprétation des résultats. Le candidat sélectionné travaillera en étroite collaboration avec notre équipe de recherche, acquérant une expérience pratique en apprentissage machine, en intégration de données hétérogènes et en IA explicable appliquée à la biologie du vieillissement.

Profil du candidat :
• Le/la candidat(e) doit être en Master 1/2. Il/elle aura un profil informatique avec de profondes connaissances en apprentissage automatique, avec un intérêt pour le travail interdisciplinaire.
• Compétences techniques : Solide bagage en apprentissage automatique, apprentissage profond et analyse de données.
• Programmation : Maîtrise des langages de programmation tels que Python et expérience avec des bibliothèques pertinentes (e.g., TensorFlow, PyTorch).
• Compétences analytiques : Excellentes compétences en analyse et en résolution de problèmes, avec un intérêt marqué pour la recherche multidisciplinaire.

Formation et compétences requises :

Adresse d’emploi :
Institut de Recherche en Informatique de Toulouse

Document attaché : 202411211601_Stage ML_ATK.pdf

Jan
31
Fri
2025
Arbitrary-scale Flow Matching for super-resolution on satellite maritime images
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA, Université Bretagne Sud
Durée : 6 mois
Contact : minh-tan.pham@univ-ubs.fr
Date limite de publication : 2025-01-31

Contexte :

Sujet :
We propose an internship for Master 2 and Ecole d’Ingénieur students, with a funded opportunity to pursue a PhD within the team on the topic.

This internship is part of the European HORIZON AXOLOTLproject, for which exchanges with Cypriot researchers are planned.

For more information, please consult the offer on this link:
https://www-obelix.irisa.fr/files/2024/11/Master_internship_super_resolution.pdf

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
The expected intern will join the OBELIX research group (www.irisa.fr/obelix) from IRISA (UMR 6074) is located in the UBS (Universit´e Bretagne Sud) campus in Vannes 56000, France.

Document attaché : 202411210845_Master_topic_super_resolution.pdf

Classification semi-supervisée avec réseaux de graphes convolutionnels. Application à la prédiction du risque d’infarctus
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC, LISSI
Durée : 6 mois
Contact : aurelien.hazan@u-pec.fr
Date limite de publication : 2025-01-31

Contexte :
Le scanner de perfusion myocardique (ou scintigraphie de perfusion myocardique) est un examen d’imagerie de médecine nucléaire non-invasif qui utilise une petite quantité d’un traceur radioactif

L’acquisition se fait typiquement sur une durée de 20 à 40 minutes, synchronisée au rythme cardiaque permettant ainsi de reconstituer un cycle cardiaque sur une séquence 3D animée
Cependant, ces images scintigraphiques souffrent d’une mauvaise résolution spatiale (environ 1 cm3), et d’un mauvais rapport signal sur bruit.

La méthode la plus efficace utilisée actuellement pour traiter ces deux problèmes est d’augmenter les images de scintigraphie par une image 3D anatomique obtenue par tomographie à rayon X (CT) pour corriger l’atténuation des rayons gamma.

Sujet :
Méthode: Les GNN, sont une classe de modèles de deep learning spécialement conçue pour traiter des données représentées sous forme de graphes. Contrairement aux images classiques, qui sont souvent traitées en utilisant des CNN sur des grilles de pixels, les GNN permettent de capturer des relations complexes entre des éléments non structurés de manière régulière, ce qui peut être particulièrement utile pour les images médicales, la segmentation d’objets ou l’analyse de structures 3D [muller_survey_2024,han_vision_2022]

Un réseau de graphes permettra de recréer un cycle cardiaque complet à partir d’une seule image tomodensitométrique et d’un ECG. La reconstitution permettra de générer sur l’ensemble du cycle cardiaque une représentation de haute qualité de l’atténuation des tissus afin de recaler la correction d’atténuation sur l’acquisition par scintigraphie. Ceci permettrait ainsi d’éviter les artefacts observés.

Dans le but de valider notre approche sur une large base de données représentative des pratiques du service de médecine nucléaire, cette étude s’appuiera sur la base de donnée du CHSF.

Profil du candidat :
La personne recrutée devra justifier d’un diplôme d’ingénieur ou d’un Master, de solides connaissances en intelligence artificielle, par exemple en deep learning (DL), en réseaux de neurones profonds et en codage (Python, Cuda, C++). Des expériences de développement sur processeurs graphiques (GPU) seront très appréciées. Son anglais sera courant. Le candidat sélectionné aura la chance de travailler dans une équipe interdiciplinaire et avec un consortium de data scientists et de cliniciens du centre hospitalier sud-francilien (CHSF)

Formation et compétences requises :

Adresse d’emploi :
Lieux:
IBISC, EVRY.
LISSI, IUT Sénart-Fontainebleau, Lieusaint.

Contact: hichem.maaref@ibisc.univ-evry.fr, aurelien.hazan@u-pec.fr

Déploiement et évaluation d’un annotateur immersif et embarqué, application à la reconnaissance d’entité
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : MaIAGE, INRAE, université Paris-Saclay
Durée : 6 mois
Contact : arnaud.ferre@inrae.fr
Date limite de publication : 2025-01-31

Contexte :
Les techniques d’extraction d’information (text-mining) récentes les plus performantes reposent sur de l’apprentissage automatique supervisé. Or, l’évaluation et l’entraînement de ces méthodes nécessitent une phase d’annotation humaine laborieuse. Cela est particulièrement vrai pour les domaines spécialisés, tels que la microbiologie, où la production et la validation des annotations nécessitent l’intervention d’experts, et où les données produites sont d’un grand intérêt [Deléger2016]. La Réalité Virtuelle (RV) et par extension la Réalité Étendue (XR) permettent d’améliorer les performances d’utilisateurs ainsi que leur engagement lors de la réalisation de tâches spécifiques comme de la rééducation ou de l’apprentissage humain [David2017, Mayer2023].

Sujet :
Projet :
Nous proposons dans ce stage de développer et d’évaluer un outil d’annotation textuelle immersif en Réalité Virtuelle (RV) similaire à VAnnotator [Spiekermann2018] pouvant tirer parti des possibilités d’annotation en Réalité Étendue (XR) [Borhani2023]. La tâche d’annotation spécifique visée sera la reconnaissance d’entités. Cette dernière consiste à identifier et classifier des entités nommées dans un texte (ex : identifier dans la phrase suivante que la mention “Escherichia coli” est une bactérie – “Escherichia coli est trouvée dans les intestins des animaux”). L’accent sera mis sur la mise en place de l’annotateur immersif ainsi que de son évaluation comparée avec les outils existants.

Objectifs du stage :
– Revue de la littérature des solutions d’annotation immersives.
– Transfert de données textuelles issues d’un corpus BB4 pour la reconnaissance d’entités et développé à MaIAGE dans un casque de RV.
– Installation et configuration d’un annotateur standard [Colucci2024] dans un environnement immersif, pour la visualisation des données, le développement de fonctionnalités et pour améliorer l’annotation en RV.
– Mise en place d’expérimentations utilisateurs pour comparer l’utilisation immersive et non-immersive de Doccano (cybersickness, utilisabilité, etc.).
– Rédaction du manuscrit pour diffusion et documentation.

Le stage pourra être l’occasion de préparer un poster pour une conférence des domaines concernés (ex : IHM, TALN).

Profil du candidat :
Étudiant en Master 2, élève-ingénieur des Grandes Écoles ou équivalent.

Formation et compétences requises :
Formations visées : informatique (IHM, IA, etc.) ou équivalent.

Compétences requises :
– Compétences en développement informatique (préférentiellement web, Python et Android)
– Compétences en IHM (évaluation de l’expérience utilisateur, analyse d’applications interactives)
– Une expérience en développement XR serait un plus
– Capacité de travail en autonomie
– Un attrait pour la recherche scientifique

Adresse d’emploi :
INRAE – Unité MaIAGE Bât 210 et 233 Domaine de Vilvert 78352 JOUY-EN-JOSAS

Document attaché : 202411201454_Offre de stage M2 IHM & Text-Mining.pdf

Estimation d’Incertitudes de Données Multimodales en Situations de Visibilité Dégradée
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab / INSA Rouen
Durée : 6 mois
Contact : hind.laghmara@insa-rouen.fr
Date limite de publication : 2025-01-31

Contexte :
Les systèmes de perception multimodale (caméras, radars, lidars, capteurs infrarouges) sont de plus en plus utilisés dans les applications de mobilité autonome (véhicules, drones) et de surveillance, en particulier pour surmonter les situations de visibilité dégradée (brouillard, pluie, faible luminosité). Dans ces conditions, les données provenant des différents capteurs peuvent être sujettes à des incertitudes importantes qui impactent la fiabilité des décisions prises par les systèmes automatisés. Pour cela, ce stage se tient dans le cadre du projet ANR AdaV (2025-2028) qui a pour but d’étudier les possibilités d’extraction de caractéristiques environnementales pour l’amélioration de la fusion adaptative des modalités pour la détection d’objets multiples.

Mots clés :
Capteurs non-conventionnels, fusion multi-capteurs, analyse de scènes routières, physical attention learning, incertitude, traitement de signal et des images, deep learning.

Sujet :
Ce stage vise à développer une méthode permettant d’estimer et de modéliser les incertitudes associées aux données multimodales collectées en conditions de visibilité dégradée. L’objectif est de quantifier ces incertitudes et d’améliorer la robustesse de la fusion de données en vue d’applications critiques (navigation autonome, détection d’obstacles, etc.).

Dans un second temps, l’objectif est d’appliquer une approche de perception basée sur une fusion adaptative d’information provenant d’une caméra polarimétrique et d’une caméra RGB ainsi que de données provenant d’un LiDAR . Une partie du stage portera également sur la réalisation d’expérimentations en collaboration avec Lucas Deregnaucourt, doctorant au LITIS, pour la détection d’objets dynamiques dans le cadre de conduite en situation de visibilité réduite [1]. Le LITIS dispose d’une plateforme robotique, PERMIS, qui comprend différents robots ainsi qu’un dispositif permettant de simuler une dégradation de visibilité par la génération d’un brouillard artificiel. L’objectif du stagiaire sera de mener à bien l’entraînement de réseaux de neurones évidentiel et d’appliquer un modèle à l’un des robots en utilisant l’environnement ROS.

[1] L. Deregnaucourt, A. Lerchervy, H. Laghmara, and S. Ainouz, “An evidential deep network based on Dempster-Shafer theory for large dataset,” Advances and Applications of DSmT for Information Fusion, 2023.

Profil du candidat :
Niveau Master 2 ou ingénieur (ou équivalent) en informatique ou mathématiques appliquées ou science des données (ou disciplines similaires)

Le stage est susceptible d’être poursuivi par une thèse de doctorat dans le cadre du projet ANR AdaV (financement acquis).

Merci d’envoyer votre CV et relevés de notes aux encadrants :
— Hind Laghmara, LITIS – EA 4108, hind.laghmara@insa-rouen.fr
— Alexis Lechervy, GREYC – UMR CNRS 6072 alexis.lechervy@unicaen.fr
— Paul Honeine, LITIS – EA 4108 paul.honeine@univ-rouen.fr

Formation et compétences requises :
— Bonnes compétences en Machine Learning et vision par ordinateur
— Bonnes compétences en programmation par Python
— Un intérêt pour la robotique et la mobilité intelligente, ainsi que l’utilisation de l’environnement ROS.

Adresse d’emploi :
LITIS Lab, INSA Rouen Normandie

Document attaché : 202411220859_Offre_de_stage_Printemps_2025.pdf

Étude de controverses dans le domaine de l’agriculture à partir de commentaires en français issus de Youtube
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR TETIS / UMR STL
Durée : 6 mois
Contact : mathieu.roche@cirad.fr
Date limite de publication : 2025-01-31

Contexte :
Avec la liberté d’expression et la pluralité d’opinions, la société moderne voit apparaître de nombreuses controverses, comme par exemple les questions liées à la vaccination, au végétarianisme ou au réchauffement climatique. De manière générale, on considère qu’une controverse apparaît lorsqu’il existe des points de vue, des croyances ou des avis différents, ce qui peut se transformer en désaccord plus ou moins manifeste entre les acteurs. Une situation de controverse se manifeste typiquement par l’emploi de l’argumentation et une charge émotive des énoncés. Leur étude permet de comprendre les enjeux et les positions qui peuvent exister autour d’une question donnée.

Dans le cadre du projet CNRS MITI STAY (Savoirs Techniques pour l’Auto-suffisance, sur Youtube), nous nous intéressons aux controverses en lien avec l’agriculture alternative. Les données de travail proviennent essentiellement des vidéos Youtube transcrites et les commentaires correspondants. Il est rare que les vidéos comportent des controverses. En revanche, les commentaires, qui se construisent en interaction entre les intervenants, peuvent contenir des opinions ou réactions controversées. Pour s’attaquer à un tel problème, nous pouvons nous intéresser aux structures des discussions et/ou au contenu des commentaires.

Sujet :
Ce stage s’intéressera plus spécifiquement à analyser les contenus textuels source de controverse. Pour mener de telles études, les données à exploiter sont souvent rares et leur collecte et annotation sont longues et complexes. Pour aider la constitution d’un corpus conséquent contenant des commentaires controversés en volume nécessaire pour être ensuite traité par des modèles de langue, il est souvent proposé d’augmenter ces données avec des méthodes spécifiques. Cette tâche constitue le coeur de ce stage. Plus particulièrement, il s’agit de travailler avec un premier ensemble de commentaires déjà annotés et d’augmenter de manière automatique ces données.

De manière concrète, le travail de stage se déroulera en trois phases successives :
– Dans un premier temps, le ou la stagiaire réalisera un état de l’art sur les approches à mobiliser en lien avec le travail de stage, à savoir l’identification automatique des controverses sur la base du contenu textuel et l’augmentation de données textuelles.
– Dans un deuxième temps, le travail proposé consistera à identifier les controverses en lien avec les thématiques sur lesquelles elles portent. Pour cela, le ou la stagiaire utilisera (1) les données en français annotées du projet STAY, (2) un lexique thématique produit par les chercheuses et chercheurs du projet.
– Enfin, des méthodes d’augmentation de données seront proposées, mises en place et évaluées sur la base des analyses réalisées précédemment.

Profil du candidat :
Profil des candidat.e.s : TAL, science des données avec une sensibilité au travail avec des données textuelles dans un cadre pluridisciplinaire

Candidature :
Envoyer un CV + relevés de notes des deux dernières années aux encadrant.e.s

Date limite : 04 décembre 2024

Formation et compétences requises :

Adresse d’emploi :
Encadrant.e.s :
– Mathieu Roche (mathieu.roche@cirad.fr) UMR TETIS, CIRAD, Montpellier
– Natalia Grabar (natalia.grabar@univ-lille.fr) UMR STL, CNRS, Lille

Lieu du stage : Montpellier ou Lille