Poste SV MCF Math/Stat AGRO Dijon

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut Agro, DSIP et UMR INRAe Agroécologie
Durée : fonctionnaire Etat
Contact : ludovic.journaux@agrosupdijon.fr
Date limite de publication : 2024-04-01

Contexte :
poste validé en CA Institut Agro, Susceptible d’être vacant et ouvert à la session de printemps 2024 du Ministère de l’Agriculture

Sujet :
voir pdf joint

Profil du candidat :
voir pdf joint

Formation et compétences requises :
voir pdf joint

Adresse d’emploi :
Institut Agro Dijon

Document attaché : 202311151757_Poste_MCF_Math-DSIP-AE_dffuse_nov23.pdf

Développement de modèles d’apprentissage pour le système de détection de la Sonde Atomique Tomographique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Groupe de Physique des Matériaux (GPM), en collab
Durée : 6 mois
Contact : christian.bacchi1@univ-rouen.fr
Date limite de publication : 2024-04-01

Contexte :
Le Groupe de Physique des Matériaux est une Unité Mixte de Recherche entre l’Université deRouen Normandie, l’INSA de Rouen Normandie et le CNRS. Nos activités scientifiques sont centrées sur l’étude des matériaux, et en particulier sur les relations entre leurs propriétés physiques et structurales. Grâce à une plateforme instrumentale de premier rang mondial, les analyses sont réalisées à toutes les échelles, jusqu’à la résolution atomique. Nous bénéficions par ailleurs d’une reconnaissance internationale pour notre expertise en instrumentation scientifique dédiée aux techniques d’analyse innovantes. Le GPM a de nombreux partenaires industriels et académiques, y compris à l’international.

Sujet :
La SAT est un outil d’analyse qui permet de déterminer la structure et la composition locale de matériaux à l’échelle atomique. L’utilisation de cet outil d’analyse ne cesse de se démocratiser, depuis sa première commercialisation dans les années 1990, et a permis de contribuer à la résolution d’un grand nombre de problèmes en science des matériaux. Néanmoins, la technologie actuelle des systèmes de détection de SAT, associée à ses algorithmes de traitement de données, ne permet pas de réaliser des analyses quantitatives et/ou qualitatives dans toutes les situations (erreurs de localisation, pertes sélectives, rendement de détection insuffisant…). À ce jour, aucune métrique ne permet de contrôler et/ou résoudre l’ensemble de ces biais pour le large spectre de matériaux à analyser sur cet instrument.

L’utilisation d’algorithmes de Machine Learning, en apprentissage supervisé ou non-supervisé, permet aujourd’hui de réduire des incertitudes liées à l’utilisation de certains dispositifs scientifiques avec très peu de connaissances sur les lois physiques sous-jacentes [1, 2]. En prenant exemple sur ces algorithmes existants, il pourrait être envisageable d’améliorer la qualité des analyses en SAT et d’obtenir des critères de performances qui assureront la voie vers une démocratisation à plus grande échelle de cet instrument. Pour aborder ces problématiques, ce sujet de stage a pour objectif, dans un premier temps, de développer un ou plusieurs modèles d’apprentissage qui serviront à prédire la position et la nature chimique des atomes détectés en SAT. Dans une première partie, ce/ces premiers modèles devront être généré à partir de données simulées de SAT, puis pourront être testés sur des données expérimentales provenant d’une SAT réelle.

[1] Wei, Ye, et al. “Machine-learning-enhanced time-of-flight mass spectrometry analysis.” Patterns 2.2 (2021).
[2] Broderick, Scott R., et al. “Data mining for isotope discrimination in atom probe tomography.” Ultramicroscopy 132 (2013): 121-128.

Profil du candidat :
Le candidat recherché doit préparer un diplôme de niveau BAC+5 (Master 2 ou École d’ingénieur) dans le domaine des sciences des données (data science), de la physique numérique ou des mathématiques appliquées. Des connaissances en sciences des matériaux seraient appréciés.

Vous êtes passionné par la recherche scientifique et technologique. Vous êtes organisé et êtes reconnu pour votre rigueur et votre capacité à travailler en équipe. Vous possédez des compétences et un goût pour la programmation (Python, C/C++, Matlab). Vous avez des connaissances en statistiques, en physique et idéalement en machine learning.

Formation et compétences requises :

Adresse d’emploi :
Lieu : Groupe de Physique des Matériaux (GPM), Avenue de l’Université, 76800 Saint-Étienne-du-Rouvray

Poursuite possible en thèse : Oui (Financement prévu pour octobre 2024)
Démarrage : Février 2024

Document attaché : 202311151648_Stage M2 – GPM.pdf

Offre de Stage Master / Bac+5 – Segmentation d’IRM cérébrales 3D

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT – Université de Tours
Durée : 5/6 mois
Contact : jyramel@univ-tours.fr
Date limite de publication : 2024-04-01

Contexte :
Titre du stage : SILA-3D : Segmentation Incrémentale, Locale, Anatomique d’images cérébrales 3D

Organismes d’accueil
• Laboratoire d’Informatique Fondamentale et Appliquée de Tours (LIFAT), Université de Tours
• Equipe Neuroéthologie et cognition sociale (NECOS), INRAE Centre Val de Loire, Nouzilly

Encadrement
● Jean-Yves Ramel, Mostafa Darwiche – LIFAT Université de Tours
● Antoine Bourlier – LIFAT / INRAE NECOS
● Elodie Chaillou – INRAE NECOS
● Barthélémy Serres – ILIAD3

Plus d’infos : https://lifat.univ-tours.fr/medias/fichier/stagesila3d_1700035984157-pdf

Sujet :
L’essor de méthodes d’imagerie cérébrale génère une masse considérable de données morphologiques et fonctionnelles mais leur exploration puis leur comparaison au cours du temps pour un individu (développement et vieillissement), entre individus (variabilité au sein de l’espèce), et plus encore entre espèces différentes restent pour l’instant très partielles et limitées. Cette limite provient du fait que l’analyse et la comparaison de cerveaux nécessitent une segmentation des images 3D en structures anatomiques sous jacentes qui reste, pour l’instant, une étape très chronophage lorsqu’elle est réalisée manuellement.
Pour pallier à ce problème notre consortium pluridisciplinaire réunissant des chercheurs informatique (LIFAT, ILIAD3), en neuroanatomie (INSERM) et en biologie animale (INRAE) travaille depuis plusieurs années sur SILA3D, une plateforme logicielle, en accès libre permettant de réaliser une segmentation sémantique incrémentale, locale, anatomique des images en assistant l’utilisateur grâce à une approche interactive et à des algorithmes de machine learning.

Dans ce contexte, le stage proposé vise à poursuivre le développement de cette plateforme . Il s’agira donc de :
– Prendre en main l’existant (technologies, librairies : ITK, docker, …) assez conséquent
– Améliorer les interfaces du client SILA3D basé sur 3D-SLICER
– Améliorer les algorithmes de segmentation exploités par SILA3D coté serveur en intégrant des techniques de deep learning (en python)
– Evaluer les performances des algorithmes de segmentation et la qualité des interfaces au travers d’expérimentations et de discussions menées en collaboration avec les experts du domaine

Profil du candidat :
Stage Niveau Bac + 5 en informatique (Master ou ingénieurs)

Formation et compétences requises :
Profil du candidat :
• Le candidat souhaité est un étudiant en Master ou dernières années d’une formation d’ingénieur en Informatique

• Compétences souhaitées : Analyse d’images médicales et/ou 3D, programmation C++, Des connaissances en Docker, Python et Deep Learning seront un plus.

Adresse d’emploi :
Quand ? Où ? Combien ? Comment ?
Le stage se déroulera entre février et septembre 2024. Le stage sera rétribué à hauteur de l’indemnité légale des stages (environ 580€/mois). La durée du stage est limitée à 5 mois
Le stage aura lieu au Laboratoire d’Informatique Fondamentale et Appliquees de Tours (LIFAT, http://lifat.univ-tours.fr )

Veuillez soumettre votre CV en format pdf à JY Ramel (LIFAT): ramel@univ-tours.fr

Ecological Habitat Mapping via Semantic Segmentation from airborne imagery

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR TETIS
Durée : 6 mois
Contact : dino.ienco@inrae.fr
Date limite de publication : 2024-04-01

Contexte :

In the frame of a collaboration between the engineering consultancy firm ECO-MED (https://ecomed.fr/) and the Joint Research lab TETIS (https://umr-tetis.fr), we are looking for a master intern with the aim of assessing the potential of deep learning methods from the field of computer vision and AI to support ecological habitat mapping from very high resolution (airborne) imagery.
To this end, the engineering consultancy firm ECO-MED has constituted a large dataset containing both airborne imagery and manual expert annotation of ecological habitat mapping following the hierarchical nomenclature proposed in the EUNIS standard https://inpn.mnhn.fr/habitat/cd_typo/7.
This rich and extensively annotated dataset will be shared with the researchers from the Joint Research Unit TETIS, enabling them to conduct,in conjunction with the master intern, several studies to assess and quantify the capabilities of neural network-based semantic segmentation methods to detect fine-grained habitat mapping on the available very high resolution (airborne) imagery.

https://nextcloud.inrae.fr/s/iNfEiNrwTSzpnZ5

Sujet :
The research internship will have the following objectives:
– Conduct a literature review on Semantic Segmentation methodologies for habitat mapping from very high spatial resolution imagery;
– Explore and perform analytics on the ECO-MED dataset;
– Perform initial Semantic Segmentation tests on the data provided by ECO-MED with state of the art approaches (CNN / ViT);
– Adapt and customize state of the art Semantic Segmentation approaches to deal with the ECO-MED dataset. Possible research paths that will be explored are: i) hierarchical semantic segmentation or ii) semantic segmentation with sparse data;
– Quantitative and qualitative evaluation of the proposed method compared to state-of-the-art competitors;
– Preparation of the internship report.

Profil du candidat :
Computer Science
Computer Vision
Deep Learning

Formation et compétences requises :
Computer Science
Computer Vision
Deep Learning

Adresse d’emploi :
500, rue Jean François Breton
34090 Montpellier
France

Document attaché : 202311151041_Short_internship_proposal (1).pdf

Adapter les modèles de type ChatGPT pour interroger en langage naturel une base de données mondiales sur les acquisitions foncières

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2023-12-15

Contexte :
L’initiative Land Matrix (https://landmatrix.org) et son observatoire mondial des acquisitions de terres à grande échelle ont pour objectifs de créer une source fiable de données permettant d’alimenter les débats et de mettre en œuvre des actions éclairées sur les transactions foncières à grande échelle. La Land Matrix collecte des données sur les tentatives prévues, conclues et échouées visant à acquérir des terres au moyen d’achat, de location ou de concession à des fins de production agricole, d’extraction de bois, de finance du carbone, d’activités industrielles, de production d’énergie renouvelable, de conservation de la nature et de tourisme, dans les pays à revenus faibles ou intermédiaires.
Référence mondiale sur les phénomènes d’acquisitions de terres dans le monde académique, les données de la Land Matrix restent encore peu utilisées pour accompagner l’action publique malgré d’importants efforts pour que les données soient en accès libre. Nous faisons l’hypothèse que l’accès aux données et leur exploitation restent des freins importants à l’utilisation des informations contenues dans la base de la Land Matrix. En effet, une certaine expertise en informatique et une bonne connaissance des champs de variables sont nécessaires pour que l’utilisateur puisse accéder aux informations nécessaires.

Sujet :
L’objectif du stage est de simplifier l’accès aux données de la base Land Matrix en permettant son interrogation en langage naturel. Les récentes avancées en intelligence artificielle, dont bénéficient les modèles de langues de type OpenAI/ChatGPT ou meta/Llama-2, offrent de nouvelles opportunités pour convertir des questions, formulées en langage naturelle, en langage informatique (génération de code python et/ou SQL). Ces modèles généralistes nécessitent, cependant, d’être ajustés à la structure de données de la base Land Matrix afin de n’extraire que les données réellement attendues par les utilisateurs. Les stratégies d’ajustement sont un attendu de ce stage dont l’objectif final est de proposer un agent conversationnel (Chat bot) capable de générer les requêtes informatiques à partir d’une formulation en langage naturel. Une requête potentielle serait un croisement de filtres géographiques, filtres de types d’investisseurs et de filtres d’intentions d’investissements, par exemple : « j’aimerais savoir quelles banques soutiennent des investissements miniers (lithium) en Argentine ».

Compétences du candidat/e :
• Analyse des données (collecte, exploration, mise en lien)
• Programmation (préférablement Python)
• Capacité d’analyses, rédactionnelles et de synthèse
• Travail d’équipe
Informations complémentaires :
Durée de 6 mois, à partir de février 2024.
Le stage se déroulera au CIRAD, dans l’UMR TETIS (Territoire, Environnement, Télédétection et Information Spatiale), située dans les locaux de la Maison de la Télédétection à Montpellier.
Le stagiaire sera encadré par Rémi Decoupes (INRAE, UMR TETIS), Jérémy Bourgoin, Roberto Interdonato (CIRAD, UMR TETIS) et Marie Gradeler (ILC).
Financement :
Le stage est soutenu par le projet Land Matrix. La rémunération du stagiaire sera de l’ordre de 600 euros par mois.

Modalité de candidature :
Attention : cette proposition ne concerne que les stages d’étudiants sous convention avec une école ou une université : il ne s’agit pas d’une offre d’emploi.
Envoyer une lettre de motivation d’une page, précisant en outre la durée et période possible du stage, un CV détaillé, et un relevé des notes à : remy.decoupes@inrae.fr et jeremy.bourgoin@cirad.fr
Date limite pour l’envoi du dossier : 30 Novembre, 2023

Profil du candidat :
Compétences du candidat/e :
• Analyse des données (collecte, exploration, mise en lien)
• Programmation (préférablement Python)
• Capacité d’analyses, rédactionnelles et de synthèse
• Travail d’équipe

Formation et compétences requises :
Compétences du candidat/e :
• Analyse des données (collecte, exploration, mise en lien)
• Programmation (préférablement Python)
• Capacité d’analyses, rédactionnelles et de synthèse
• Travail d’équipe

Adresse d’emploi :
Maison de la Télédétection, 500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202311141527_stage.pdf

Modèles d’apprentissage automatique sur des données complexes pour la prévention de défaut de paiement

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS
Durée : 5-6 mois
Contact : hamida.seba@univ-lyon1.fr
Date limite de publication : 2023-11-13

Contexte :
Pour plusieurs applications du monde réel, identifier des motifs qui ne se conforment pas à une activité normale est une question fondamentale pour garantir une prestation de service correcte ainsi que la sécurité et la fiabilité du système [1]. C’est principalement le cas pour des applications de surveillance et de suivi telles que la vidéosurveillance, la surveillance médicale, la détection de logiciels malveillants, la détection de fraudes financières, etc. Un motif anormal est appelé anomalie ou valeur aberrante. Une anomalie est généralement définie comme un motif comportemental qui s’écarte significativement de la plupart des motifs comportementaux du système surveillé et apparaît dans une proportion significativement plus petite que celle des motifs normaux. Avec l’explosion des quantités de données à traiter pour ce genre d’applications, le recours aux modèles d’apprentissage et en particulier l’apprentissage profond est devenu inévitable dans ce domaine.

Sujet :
Durant ce stage, nous nous intéressons aux modèles d’apprentissage capables de traiter des données complexes multi-sources et hétérogènes sur les clients d’une entreprise de location d’ordinateurs personnels (MacBook & iPad) :
• données contrôlées communiqués par le client (nom, prénom, adresses (facturation, livraison), tel, mail)
• données informatique extraites de la connexion internet du client (IP)
• données bancaires
• données issues de blacklists
• données socio-démographiques issues de l’INSEE
Le but de l’analyse de ces données est de réaliser un profiling plus « fair » (sans critères socio-discriminants) de clients qui permettra de prévenir les défauts de paiement. L’approche proposée est la construction de graphes de connaissances ego-centriques [2] profilons (profilant ???) les clients et permettant de représenter toutes les informations les concernant. Ensuite, il s’agira de se baser sur cette représentation pour détecter toute anomalie qui peut engendrer un défaut de paiement. Cette représentation basée sur des graphes de connaissances nécessitera d’utiliser et/ou de concevoir des modèles d’apprentissage adaptés [3, 4]. Le stagiaire commencera par effectuer un état de l’art sur la problématique ainsi que sur les modèles d’apprentissage existants. Il mettra ensuite en place la solution la plus adaptée aux données considérées durant le stage.

Ce stage pourra se poursuivre avec une thèse CIFRE.

Profil du candidat :
Compétences avancées (niveau M2) en informatique (en particulier en apprentissage machine fortement souhaitées).

Formation et compétences requises :
Data science, machine learning

Adresse d’emploi :
LIRIS, Université Lyon 1

Document attaché : 202311131510_LIRISHOPLIZ Sujet de stage.pdf

Appel à communication Conférence EGC 2024 : Atelier HIA

Date : 2023-11-15
Lieu : 24ème conférence francophone sur l’Extraction et la Gestion des Connaissances EGC 2024 Dijon

Atelier HIA (2ieme édition)
Humain et IA, travailler et apprendre en bonne intelligence

Résumé :
La société emploie désormais quotidiennement des outils reposant sur des techniques d’IA et réciproquement afin de perfectionner les techniques d’IA, un grand nombre de données en partie générées par l’humain sont nécessaires. Cet atelier a pour objectif de réunir les acteurs/actrices de la recherche et de l’industrie intéréssé.e.s par les enjeux écologique, sociétaux et éthique de la cohabitation entre humain et IA. Nous nous intéresserons notamment aux plates-formes de crowdsourcing, de sciences participatives ou d’éducation participative, qui préfigurent une forme de travail hybride entre humains et IA.

L’ atelier aborde plusieurs problématiques :
Comment tendre vers une association durable bénéfique et réciproque entre l’homme et la machine notamment quand les deux partis entrent en conflits ?
Comment permettre à une IA d’apprendre avec moins de données ?
Quels outils sont mis à la disposition de l’humain pour favoriser son travail voir son apprentissage dans ces conditions ?

Thèmes de l’atelier (liste non exhaustive) :
– Sobriété numérique (Collection et analyse de données en faveur de la sobriété numérique, réduction de l’emprunte CO2 de plateformes de crowdsourcing…)
– Modélisation des utilisateurs (ontologies de compétences, validation des qualifications, qualité des réponses, motivation, …) Apprentissage machine en présence d’humains (apprentissage supervisé interactif,
incrémental, apprentissage actif, …)
– Apprentissage Humain favorisé par le crowdsourcing ( Systèmes adaptatifs, Tuteurs ou agents intelligents, Personnalisation de l’apprentissage, Systèmes de recommandation, Modalités de collaboration …)
– Défis de l’interaction homme-machine dans les plate-formes (ergonomie, biais de comportement en présence d’IA, …)
– Ethique des plateformes (protection de la vie privée, transparence, équité, auditabilité, droit du travail, durée du travail, …)
– Modèles de description des tâches pour humains et machines (workflows, langage naturel, …)
– Interface Homme-Machine pour le crowdsourcing (visualisation des données de crowdsourcing, visualisation de collaboration, design de systèmes…)
– Infrastructures sous-jacentes (centralisée, distribuée, chiffrée, composition de plateformes, …)
– Fiabilité des plates-formes (satisfaction de bonnes propriétés, preuves, performances, respect de la vie privée,…)

Les soumission peuvent être écrites en français ou en anglais et de quatre types selon leur
état d’avancement :

résumés étendus de papier publiés (4 pages)
articles longs (maximum 12 pages)
articles courts (maximum 4 pages)
propositions de démonstrations logicielles (4 pages)

Les soumissions doivent être au format PDF et utiliser le format LaTeX RNTI. Les articles et résumés doivent être soumis via EasyChair.

Les dates :

15 Novembre : Soumission sur Easychair

20 Décembre : Notifications aux auteurs

20 Janvier : Version finale

23 Janvier : Atelier à la conférence EGC

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Apprentissage profond pour l’accélération d’IRM

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Insitut Fresnel
Durée : 5 à 6 mois
Contact : andre@fresnel.fr
Date limite de publication : 2024-04-24

Contexte :
L’IRM est l’une des principales modalités d’imagerie utilisées dans la pratique clinique aujourd’hui. L’une de ses particularités est de fournir un contraste des tissus mous. De plus, contrairement aux autres modalités d’imagerie, l’IRM permet d’obtenir des informations sur les processus pathologiques de manière non invasive. Cependant, le temps d’acquisition de l’IRM constitue un obstacle majeur dans de nombreuses applications. Un long temps d’acquisition conduit, par exemple, à l’inconfort du patient, à l’apparition d’artefacts de mouvement sur l’image et à l’augmentation du coût de l’examen.

Sujet :
Une manière d’accélérer les examens IRM est de réduire le nombre de points dans l’espace d’acquisition. Deux stratégies peuvent alors être employées pour restaurer la qualité des images : L’imagerie parallèle [1] et le « Compressed Sensing » (CS) [2]. L’imagerie parallèle utilise la diversité de l’information fournie par un système multi-capteurs. Le CS, quant à lui, est basé sur l’apriori que les images sont parcimonieuses dans certains domaines de transformation. Le CS fait alors appel à des algorithmes itératifs permettant de prendre en compte cette contrainte de parcimonie.
Récemment les méthodes d’apprentissage profond ont montré leur efficacité pour la reconstruction d’IRM [3]. Parmi ces approches, certaines ont été proposés pour imiter les algorithmes de compressed sensing [4]. Le but de ce stage est de recenser et de faire une étude comparative de ces méthodes.

[1] Griswold MA, Jakob PM, Heidemann RM, Nittka M, Jellus V, Wang J, Kiefer B, Haase A. Generalized autocalibrating partially parallel acquisitions (GRAPPA). Magn Reson Med. 2002.

[2] M. Lustig, David Donoho, J. M. Pauly, Sparse MRI: The application of compressed sensing for rapid MR imaging, Magn Reson Med. 2007.

[3] F. Knoll et al., Deep-Learning Methods for Parallel Magnetic Resonance Imaging Reconstruction: A Survey of the Current Approaches, Trends, and Issues, in IEEE Signal Processing Magazine, vol. 37, no. 1, pp. 128-140, Jan. 2020.

[4] Zeng, G., Guo, Y., Zhan, J. et al. A review on deep learning MRI reconstruction without fully sampled k-space. BMC Med Imaging 21,2021

Profil du candidat :
Etudiant en dernière année d’école d’ingénieur ou Master 2 en Traitement signal/image, sciences des données ou mathématiques appliqués.

Formation et compétences requises :
Le candidat devra obligatoirement être à l’aise avec le langage python et les bibliothèques numpy et pytorch. Cela signifie qu’une première expérience en apprentissage profond est nécessaire. Un goût pour la physique et les applications biomédicales est souhaité.

Adresse d’emploi :
Insitut Fresnel, 52 Av. Escadrille Normandie Niemen, 13013 Marseille

Apprentissage automatique et profond pour la prédiction d’indicateurs de sécurité alimentaire à partir de données hétérogènes

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2023-12-15

Contexte :
La sécurité alimentaire (SA) est un problème central dans de nombreuses régions du monde, comme en témoigne sa présence parmi les 17 objectifs de développement durable (ODD 2 – Faim zéro). Pour surveiller les situations d’insécurité alimentaire, plusieurs systèmes d’alerte précoce sont actifs aujourd’hui, tels que GIEWS (FAO) et FEWSNET (USAID). Ces systèmes utilisent un ensemble limité de types de données, i.e., données agroclimatiques provenant d’images satellites et indicateurs extraits d’enquêtes auprès des ménages sur les facteurs nutritionnels, économiques et liés à la production. De plus, une intervention humaine est souvent nécessaire pour combiner et résumer toutes les sources d’information.
Les recherches menées précédemment par TETIS ont montré que des données ouvertes hétérogènes, liées à différents niveaux à la sécurité alimentaire, peuvent être utilisées pour développer des méthodes d’apprentissage automatique capables de produire des indicateurs en lien direct avec la SA. L’idée est d’utiliser des données qui représentent des proxys pour les raisons multiples et interdépendantes à l’origine de ce phénomène. Quelques exemples peuvent être des rasters d’informations spatiales (i.e. cartes de distance aux infrastructures, aux marchés, etc.), information géographique bénévole (Open Street Map), données météorologiques (i.e. températures moyennes, cumuls de précipitations, etc.), indicateurs économiques et données textuelles issus des médias locaux [2,3].

Sujet :
L’objectif de ce stage est d’évaluer le framework développé à TETIS [1] et testé initialement sur le cas du Burkina Faso, sur différents pays d’Afrique, notamment Rwanda et Tanzanie. L’idée à la base du framework est d’exploiter des stratégies d’apprentissage automatique et profond de dernière génération qui peuvent faire face à des aspects critiques, tels qu’une grande hétérogénéité des données d’apprentissage, mis face à une quantité des données de vérité de terrain (scores de SA) limitée.
Dans un premier temps, le travail sera focalisé sur l’actualisation des sources d’un ensemble de données hétérogènes adaptées aux zones d’étude. Cela inclut la collecte et la mise en lien des données a différentes échelles et de nature différentes.
Une fois finalisée la base des donnés, l’étudiant s’occupera de tester le framework d’entraînement des modèles et l’évaluation des modèles d’estimation des indices de SA ainsi entraînés. Les résultats attendus sont soit quantitatifs (évaluation des performance du framework par rapport à des données de référence), soit qualitatifs (production des cartes d’insécurité alimentaire à l’échelle nationale).

[1] Hugo Deléglise, Roberto Interdonato, Agnès Bégué, Elodie Maître d’Hôtel, Maguelonne Teisseire, Mathieu Roche. Food security prediction from heterogeneous data combining machine and deep learning methods. Expert Syst. Appl. 190: 116189 (2022)
[2] Cheick Tidiane Ba, Chloé Choquet, Roberto Interdonato, Mathieu Roche. Explaining food security warning signals with YouTube transcriptions and local news articles. GoodIT 2022: 315-322
[3] Hugo Deléglise, Agnès Bégué, Roberto Interdonato, Elodie Maître d’Hôtel, Mathieu Roche, Maguelonne Teisseire. Mining News Articles Dealing with Food Security. ISMIS 2022: 63-73

Profil du candidat :
 Analyse des données (collecte, exploration, mise en lien)
 Programmation (préférablement Python)
 Capacité d’analyses, rédactionnelles et de synthèse
 Travail d’équipe

Formation et compétences requises :
 Analyse des données (collecte, exploration, mise en lien)
 Programmation (préférablement Python)
 Capacité d’analyses, rédactionnelles et de synthèse
 Travail d’équipe

Adresse d’emploi :
Maison de la télédétection, 500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202311091909_SujetStageM2.pdf

MODÉLISATION PAR APPRENTISSAGE PROFOND D’UN “STYLO MAGIQUE”

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : IGN
Durée : 6 mois
Contact : nicolas.gonthier@ign.fr
Date limite de publication : 2023-12-15

Contexte :
L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu’à leur évolution.

Grâce à son école d’ingénieurs, l’ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).

Au sein de la DSI, le Service Innovation, Maturation et Valorisation (SIMV) est chargé de la mise en œuvre du programme de R&D. Il doit assurer l’entretien et l’évolution des plateformes et équipements technologiques permettant de structurer le processus d’innovation et d’assurer l’interface entre l’enseignement, la recherche, et les développements à caractère plus opérationnel. Il est chargé de développer des prototypes, technologiques d’une part et produits et d’usages d’autre part, qui seront de nature à évaluer l’innovation et à décider de son éventuelle valorisation industrielle en interne ou en externe.
Au sein du SIMV, le Département Appui à l’Innovation (DAI) réalise des études et des prototypes permettant de valider la pertinence et la maturité des travaux de recherche. Le cas échéant, il monte en maturité des codes de recherche vers les souches de production via le développement de maquettes, la réalisation de tests et la rédaction de documentation.

Sujet :
Dans un contexte où la transition écologique est devenue un enjeu national et international, l’IGN s’est donné comme mission de cartographier le plus fréquemment possible l’anthropocène, autrement dit les évolutions et l’impact de l’activité humaine sur le territoire. Cela implique un suivi de l’artificialisation des sols, des zones agricoles, de la forêt, etc. Cela demande d’être capable de pouvoir mettre à jour plus régulièrement nos référentiels cartographiques. Le faire de façon complétement manuelle est un travail titanesque et l’apport de solutions automatiques est primordiale pour atteindre nos objectifs. Pour cela, le travail, qu’il soit manuel ou automatique, consiste à comparer deux images co-alignées spatialement, et de repérer les zones de changement qui ont une valeur sémantique au sens de nos nomenclatures métiers, de détourer ces zones et de mettre à jour nos référentiels cartographiques là où le territoire a changé.

La piste que nous souhaitons étudier pour accélérer le suivi du territoire, consiste à essayer de faciliter le travail pour l’opérateur dans le détourage des zones de changement. L’apparition de modèles de vision par ordinateur inspirés des LLM utilisant de la prompt-ingénierie [1] laisse penser que cela pourrait être transposable dans le cadre de la détection du changement. D’autant plus que des travaux de recherche très récents montrent d’excellents résultats dans l’exploitation de modèles de type “segment anything” pour la segmentation du changement [2]. Nous avons déjà conduit des tests avec le modèle “segment anything” sur nos images, mais dans le cas de la segmentation mono-date. Ici, le challenge sera de trouver les bonnes adaptations sur la partie prompt et décodeur afin qu’elles soient exploitables dans le cadre d’une paire d’images présentant un changement significatif pour l’IGN.

Les missions du stage :

Pour cette mission vous intégrerez une équipe projet dédiée à la détection du changement de 3 personnes actuellement, vous serez encadré par deux d’entre elles.
Dans un premier temps, le stage consistera à faire un état de l’art sur la prompt-ingénierie appliquée à la vision par ordinateur et de se mettre à jour sur les architectures siamois pour la détection du changement [4].
Il faudra ensuite implémenter avec pytorch un modèle inspiré de la littérature, il est fort probable en effet qu’il faille combiner des idées de deux ou quelques papiers de recherche dans le cadre de ce stage. On utilisera un ou deux jeux de données open data à des fins d’entraînement et de test.
Selon les avancées du stage, une intégration dans un SIG (système d’information géographique) ainsi que des tests en coordination avec les équipes de production pourraient être envisagés.
Bibliographie :

[1] : Kirillov, A., Mintun, E., Ravi, N., Mao, H., Rolland, C., Gustafson, L., … & Girshick, R. (2023). Segment anything. arXiv preprint arXiv:2304.02643.

[2] : Ding, L., Zhu, K., Peng, D., Tang, H., & Guo, H. (2023). Adapting Segment Anything Model for Change Detection in HR Remote Sensing Images. arXiv preprint arXiv:2309.01429.

[3] : Shafique, A., Cao, G., Khan, Z., Asad, M., & Aslam, M. (2022). Deep learning-based change detection in remote sensing images: A review. Remote Sensing, 14(4), 871.

[4] : Daudt, R. C., Le Saux, B., & Boulch, A. (2018). Fully convolutional siamese networks for change detection. In 2018 25th IEEE International Conference on Image Processing (ICIP) (pp. 4063-4067). IEEE.

[5] : Zheng, Z., Ma, A., Zhang, L., & Zhong, Y. (2021). Change is everywhere: Single-temporal supervised object change detection in remote sensing imagery. In Proceedings of the IEEE/CVF international conference on computer vision (pp. 15193-15202).

Profil du candidat :
Formation Bac +5, spécialisation en apprentissage machine et vision par ordinateur.

Formation et compétences requises :
Connaissance et pratique de python et de la bibliothèque Pytorch. Le stage étant exigeant techniquement, il est préférable d’avoir déjà pratiqué Pytorch appliqué à de la computer vision, de savoir implémenter un réseau de convolution ou d’attention ‘from scratch’.

Savoir lire et exploiter des API python, car il vous sera probablement demandé d’exploiter des bibliothèques spécialisées dans la manipulation de données géographique.

Savoir mobiliser des résultats de recherche (recherche bibliographique, lecture et ré-implémentation de publications scientifiques…).

Bon niveau d’anglais lu (lecture d’articles).

Une expérience en manipulation de l’information géographique est un plus.

Adresse d’emploi :
IGN Saint-Mandé (94)