Stage M2 : Apprentissage profond pour la génération de séries temporelles – Application à l’Analyse Quantifiée de la Marche des enfants avec Paralysie Cérébrale

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaTIM INSERM (CHU Brest) et IRIMAS (Université Hau
Durée : 6 mois
Contact : maxime.devanne@uha.fr
Date limite de publication : 2023-12-31

Contexte :
La Paralysie Cérébrale (PC) est un terme qui désigne un groupe de troubles permanents du développement du mouvement et de la posture, responsables de limitations d’activité, imputables à des événements ou atteintes non progressives survenus sur le cerveau en développement du fœtus ou du nourrisson. Les troubles moteurs de la PC sont souvent accompagnés de troubles sensoriels, perceptifs, cognitifs, de la communication et du comportement. La PC touche environ 2 enfants sur 1000 en Europe et est le handicap physique le plus fréquent de l’enfance.
L’Analyse Quantifiée de la Marche (AQM) est un des outils que possède le clinicien pour l’aider dans sa prise de décision thérapeutique afin d’améliorer la marche des enfants avec PC. Cet examen est réalisé en routine clinique dans un laboratoire du mouvement et quantifie les déviations à la marche. Cet examen permet d’obtenir la reconstruction 3D du mouvement (cinématique) à partir de caméras infrarouges et de marqueurs posés en regard de points anatomiques, l’activité musculaire et la force de réaction lors de l’appui, … Ces paramètres peuvent être considérés comme des séries temporelles.
Le service de Médecine Physique et Réadaptation du CHU de Brest possède un laboratoire du mouvement dans lequel plus de 1100 patients (enfants et adultes) ont réalisé au moins une AQM. Afin d’aider sa prise de décision thérapeutique, le clinicien aimerait pouvoir prédire la cinématique d’un patient après action thérapeutique (injection de toxine botulinique, chirurgie, …) ou après un intervalle de temps. Pour cela la génération automatique de séries temporelles est requise.

Sujet :
L’objectif du stage est la génération de séries temporelles à l’aide de réseaux de neurones. Il s’agira tout d’abord d’effectuer une étude bibliographique des méthodes d’apprentissage automatique et d’apprentissage profond utilisées pour la génération de séries temporelles. Ensuite, l’objectif sera de développer des modèles génératifs pour la génération de séries temporelles dans ce contexte clinique. La performance des algorithmes développés sera évaluée à partir des cycles de marche acquis au CHU de Brest. Les cliniciens pourront ainsi prédire l’évolution d’un patient et proposer des recommandations thérapeutiques en conséquence.

Profil du candidat :
– M2 recherche en Informatique / Intelligence Artificielle
– Très bon niveau de programmation Python
– Des bonnes connaissances en apprentissage automatique et apprentissage profond
– Des connaissances sur les techniques de mesures du mouvement humain par systèmes optoélectroniques seraient appréciées

Formation et compétences requises :
– M2 recherche en Informatique / Intelligence Artificielle
– Très bon niveau de programmation Python
– Des bonnes connaissances en apprentissage automatique et apprentissage profond
– Des connaissances sur les techniques de mesures du mouvement humain par systèmes optoélectroniques seraient appréciées

Adresse d’emploi :
CHU de Brest

Document attaché : 202311162024_M2 IRIMAS 2023-2024.pdf

Chaire de Professeur Junior « IA et Transition Numérique Industrielle » –

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC / ULCO
Durée : 5 maximum selon doss
Contact : gilles.roussel@univ-littoral.fr
Date limite de publication : 2023-12-31

Contexte :
Contexte scientifique
Le laboratoire LISIC est une unité de recherche de l’Université du Littoral Côte d’Opale. Il est installé sur un site principal situé à Calais et une extension plus récente située à Saint-Omer. Le LISIC a défini son identité autour de la thématique de Jumeaux Numériques pour des systèmes environnementaux ou industriels et ses équipes contribuent à différents niveaux de ce thème : modélisation, perception de l’environnement, analyse, fusion d’informations, complétion de données multidimensionnelles, optimisation, synthèse d’images. Ses activités concernent les deux sections scientifiques (27 et 61).
Beaucoup des théories de l’IA font parties des activités menées au LISIC. Les besoins de la transition numérique industrielle rejoignent les objectifs théoriques : analyser, interpréter, comprendre et décider en développant des méthodes et des outils d’apprentissage, de raisonnement, d’optimisation et de décisions explicables.
Les applications du LISIC sont actuellement majoritairement tournées vers l’environnement naturel ou anthropisé. Le laboratoire souhaite continuer à développer aux meilleurs niveaux internationaux son positionnement vers les applications industrielles.
Le LISIC participe au CPER CornellIA de l’alliance A2U sur le domaine de l’IA dans lequel sont définis 4 axes. Au-delà des aspects théoriques dans lesquels le laboratoire s’inscrit, le troisième axe vise à irriguer d’autres disciplines dont l’un des domaines est l’industrie. Le 4ème axe concerne la création d’un pôle régional de compétences en IA visant l’apport de résultats de recherche des laboratoires vers les entreprises. Le LISIC prend sa part dans ces objectifs.

Conditions du Poste
Date limite de dépôt des candidatures (Galaxie): 4 décembre 2023
Durée du contrat : 5 ans maximum selon dossier
Après évaluation des réalisations scientifiques et des capacités professionnelles du titulaire de la chaire par une commission de titularisation, celui-ci pourra prétendre à un poste de professeur titulaire.
Conditions financières

– Traitement brut : 55 k€/an.
– Soutien financier pour mener à bien le projet de recherche et d’enseignement (financement de l’ ANR) : 200 k€ dont 60 % destiné à des charges de personnel.
– Moyens additionnels de l’université (ULCO) : 1 cofinancement de thèse.

Sujet :
Projet de recherche :
La chaire de Pr junior devra s’inscrire dans la thématique IA et jumeau numérique appliquée à l’industrie du futur avec les contraintes de l’IoT. Les recherches porteront dans la définition de modèles d’aide à la décision pour des systèmes manufacturiers, de production d’énergie, de transport, de distribution ou de communications, etc … dans le but de prédire leur comportement et d’optimiser leur performance et/ou accroître leur sécurité.
Dans le contexte de la transition numérique pour les usines du futur et de l’industrie 4.0, de la transition énergétique, de l’exploitation en ligne et d’un environnement instrumental dense sur le modèle de l’Internet des objets, les données possèdent les caractéristiques « 3V » du Big Data : volume, variété et véracité. Ces contraintes influenceront les choix pour le développement d’algorithmes d’IA pour certains des buts suivants :
– améliorer les performances en termes de sécurité, fiabilité, résilience, maintenance, disponibilité, etc ..
– développer des modèles à base d’apprentissage automatique pour la prédiction et l’optimisation des systèmes évolutifs, le diagnostic de défauts des systèmes dynamiques hybrides de grande taille
– combiner les types de modèles pour l’aide à la maintenance prédictive

Projet d’enseignement :

Le Pr junior sera pleinement investi dans le développement d’une chaire d’enseignement de l’IA pour la transition numérique de l’industrie, dans le contexte du CMQ Industrie et Transition Numérique du territoire et de la candidature au Campus d’Excellence de ce même territoire et son orientation vers l’efficience écologique industrielle. Il serait impliqué dans :

– le pilotage des modules disciplinaires à destination d’étudiants de la spécialité Génie Industriel de l’école d’ingénieurs (EIL-Côte d’Opale);
– la participation au projet pédagogique dans le contexte d’une projection décennale de la spécialité du site dans le domaine de l’industrie du futur et ce, en lien avec les objectifs du projet recherche ;
– la participation à l’encadrement d’étudiants entre autres pour des projets d’innovation et de conception sur le thème de l’IA et l’industrie numérique ;
– l’intervention dans des séminaires scientifiques et l’encadrement d’étudiants en stage dans le cadre de la formation à et par la recherche.

Profil du candidat :
Profil du candidat :
Le candidat doit être titulaire d’une thèse de doctorat en automatique ou en informatique avec une solide expérience dans les domaines de l’intelligence artificielle tels que l’apprentissage automatique, la prise de décision automatique. L’excellence du candidat doit se traduire par une production scientifique significative (publications dans des revues à comité de lecture de premier plan, communications dans des conférences internationales à comité de lecture de premier plan dans son domaine).

Formation et compétences requises :
Formation et compétences requises :
Le candidat doit être capable de gérer des activités de recherche, de diriger des projets de recherche nationaux et internationaux et de superviser de jeunes chercheurs. Le candidat doit faire preuve d’aptitudes au travail en équipe.

Adresse d’emploi :
ULCO : Laboratoire LISIC & École d’Ingénieurs du Littoral – Côte d’Opale (EIL-CO)

Document attaché : 202311161939_CPJ LISIC-ULCO 2023 (3eme campagne)_.pdf

Stage M2 – Non-stationary and robust Reinforcement Learning methodologies for drones detection

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire des signaux et syst`emes (L2S)
Durée : between 4 and 6 mont
Contact : stefano.fortunati@centralesupelec.fr
Date limite de publication : 2024-04-16

Contexte :
Reinforcement Learning (RL) methodologies are currently adopted in different context requiring sequential decision-making tasks under uncertainty. The RL paradigm is based on the perception-action cycle, characterized by the presence of an agent that senses and explores the unknown environment, tracks the evolution of the system state and intelligently adapts its behavior in order to fulfill a specific mission. This is accomplished through a sequence of actions aiming at optimizing a pre-assigned performance metric (reward). Despite of their wide applicability, classical RL algorithms are based on a cumbersome assumption: the stationarity of the environment, i.e. the statistical and physical characterization of the scenario, is assumed to be time-invariant. This assumption is clearly violated in surveillance application, where the position and the number of targets, along with the statistical characterization of the disturbance may change over time. To overcome this limitation and include the non-stationarity in the RL framework, both theoretical and application-oriented non-stationary approaches have been proposed recently in the RL literature. The application of these non-stationary-based line of research to robust radar detection problems has been recently investigated.

Sujet :
The aim of this internship is then to support and complete the ongoing research activity by testing and validating the non-stationary RL algorithms on several realistic scenarios where the radar acts as an agent that continuously senses the unknown environment (i.e., targets and disturbance) and consequently optimizes transmitted waveforms in order to maximize the probability of detection (PD) by focusing the energy in specific range-angle cells. Due to their crucial strategical interest, particular attention will be devoted to scenarios containing drones.

Profil du candidat :
Master 2 or equivalent in machine learning / applied mathematics / statistical signal processing or any related field.

Formation et compétences requises :
machine learning / applied mathematics / statistical signal processing / Matlab/ Python

Adresse d’emploi :
Laboratoire des signaux et systèmes (L2S), Bât IBM, Rue Alfred Kastler, 91400 Orsay.

Document attaché : 202311161045_Internship_proposal_IPSA.pdf

Conférence EGC Atelier HIA : Extension de la date de soumission au 1er Décembre

Date : 2023-12-01

Atelier HIA (2ieme édition)
Humain et IA, travailler et apprendre en bonne intelligence
Extension de la date de soumission au 1er Décembre !

Résumé :
La société emploie désormais quotidiennement des outils reposant sur des techniques d’IA et réciproquement afin de perfectionner les techniques d’IA, un grand nombre de données en partie générées par l’humain sont nécessaires. Cet atelier a pour objectif de réunir les acteurs et actrices de la recherche et de l’industrie intéressés par les enjeux écologique, sociétaux et éthique de la cohabitation entre humain et IA. Nous nous intéresserons notamment aux plates-formes de crowdsourcing, de sciences participatives ou d’éducation participative, qui préfigurent une forme de travail hybride entre humains et IA.

L’ atelier aborde plusieurs problématiques :
Comment tendre vers une association durable bénéfique et réciproque entre l’homme et la machine notamment quand les deux partis entrent en conflits ?
Comment permettre à une IA d’apprendre avec moins de données ?
Quels outils sont mis à la disposition de l’humain pour favoriser son travail voir son apprentissage dans ces conditions ?

Thèmes de l’atelier (liste non exhaustive) :
– Sobriété numérique (Collection et analyse de données en faveur de la sobriété numérique, réduction de l’emprunte CO2 de plateformes de crowdsourcing…)
– Modélisation des utilisateurs (ontologies de compétences, validation des qualifications, qualité des réponses, motivation, …) Apprentissage machine en présence d’humains (apprentissage supervisé interactif,
incrémental, apprentissage actif, …)
– Apprentissage Humain favorisé par le crowdsourcing ( Systèmes adaptatifs, Tuteurs ou agents intelligents, Personnalisation de l’apprentissage, Systèmes de recommandation, Modalités de collaboration …)
– Défis de l’interaction homme-machine dans les plateformes (ergonomie, biais de comportement en présence d’IA, …)
– Éthique des plateformes (protection de la vie privée, transparence, équité, auditabilité, droit du travail, durée du travail, …)

– Modèles de description des tâches pour humains et machines (workflows, langage naturel, …)
– Interface Homme-Machine pour le crowdsourcing (visualisation des données de crowdsourcing, visualisation de collaboration, design de systèmes…)
– Infrastructures sous-jacentes (centralisée, distribuée, chiffrée, composition de plateformes, …)
– Fiabilité des plates-formes (satisfaction de bonnes propriétés, preuves, performances, respect de la vie privée,…)

Les soumission peuvent être écrites en français ou en anglais et de quatre types selon leur
état d’avancement :

résumés étendus de papier publiés (4 pages)
articles longs (maximum 12 pages)
articles courts (maximum 4 pages)
propositions de démonstrations logicielles (4 pages)

Les soumissions doivent être au format PDF et utiliser le format LaTeX RNTI. Les articles et résumés doivent être soumis via EasyChair.

Les dates :

1er Décembre : Soumission sur Easychair

20 Décembre : Notifications aux auteurs

20 Janvier : Version finale

23 Janvier : Atelier à la conférence EGC

Site de l’atelier HIA : https://www-druid.irisa.fr/atelier-hia-2/

Je reste à votre disposition pour toute information complémentaire.

Cordialement,

Constance THIERRY

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Poste SV MCF Math/Stat AGRO Dijon

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut Agro, DSIP et UMR INRAe Agroécologie
Durée : fonctionnaire Etat
Contact : ludovic.journaux@agrosupdijon.fr
Date limite de publication : 2024-04-01

Contexte :
poste validé en CA Institut Agro, Susceptible d’être vacant et ouvert à la session de printemps 2024 du Ministère de l’Agriculture

Sujet :
voir pdf joint

Profil du candidat :
voir pdf joint

Formation et compétences requises :
voir pdf joint

Adresse d’emploi :
Institut Agro Dijon

Document attaché : 202311151757_Poste_MCF_Math-DSIP-AE_dffuse_nov23.pdf

Développement de modèles d’apprentissage pour le système de détection de la Sonde Atomique Tomographique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Groupe de Physique des Matériaux (GPM), en collab
Durée : 6 mois
Contact : christian.bacchi1@univ-rouen.fr
Date limite de publication : 2024-04-01

Contexte :
Le Groupe de Physique des Matériaux est une Unité Mixte de Recherche entre l’Université deRouen Normandie, l’INSA de Rouen Normandie et le CNRS. Nos activités scientifiques sont centrées sur l’étude des matériaux, et en particulier sur les relations entre leurs propriétés physiques et structurales. Grâce à une plateforme instrumentale de premier rang mondial, les analyses sont réalisées à toutes les échelles, jusqu’à la résolution atomique. Nous bénéficions par ailleurs d’une reconnaissance internationale pour notre expertise en instrumentation scientifique dédiée aux techniques d’analyse innovantes. Le GPM a de nombreux partenaires industriels et académiques, y compris à l’international.

Sujet :
La SAT est un outil d’analyse qui permet de déterminer la structure et la composition locale de matériaux à l’échelle atomique. L’utilisation de cet outil d’analyse ne cesse de se démocratiser, depuis sa première commercialisation dans les années 1990, et a permis de contribuer à la résolution d’un grand nombre de problèmes en science des matériaux. Néanmoins, la technologie actuelle des systèmes de détection de SAT, associée à ses algorithmes de traitement de données, ne permet pas de réaliser des analyses quantitatives et/ou qualitatives dans toutes les situations (erreurs de localisation, pertes sélectives, rendement de détection insuffisant…). À ce jour, aucune métrique ne permet de contrôler et/ou résoudre l’ensemble de ces biais pour le large spectre de matériaux à analyser sur cet instrument.

L’utilisation d’algorithmes de Machine Learning, en apprentissage supervisé ou non-supervisé, permet aujourd’hui de réduire des incertitudes liées à l’utilisation de certains dispositifs scientifiques avec très peu de connaissances sur les lois physiques sous-jacentes [1, 2]. En prenant exemple sur ces algorithmes existants, il pourrait être envisageable d’améliorer la qualité des analyses en SAT et d’obtenir des critères de performances qui assureront la voie vers une démocratisation à plus grande échelle de cet instrument. Pour aborder ces problématiques, ce sujet de stage a pour objectif, dans un premier temps, de développer un ou plusieurs modèles d’apprentissage qui serviront à prédire la position et la nature chimique des atomes détectés en SAT. Dans une première partie, ce/ces premiers modèles devront être généré à partir de données simulées de SAT, puis pourront être testés sur des données expérimentales provenant d’une SAT réelle.

[1] Wei, Ye, et al. “Machine-learning-enhanced time-of-flight mass spectrometry analysis.” Patterns 2.2 (2021).
[2] Broderick, Scott R., et al. “Data mining for isotope discrimination in atom probe tomography.” Ultramicroscopy 132 (2013): 121-128.

Profil du candidat :
Le candidat recherché doit préparer un diplôme de niveau BAC+5 (Master 2 ou École d’ingénieur) dans le domaine des sciences des données (data science), de la physique numérique ou des mathématiques appliquées. Des connaissances en sciences des matériaux seraient appréciés.

Vous êtes passionné par la recherche scientifique et technologique. Vous êtes organisé et êtes reconnu pour votre rigueur et votre capacité à travailler en équipe. Vous possédez des compétences et un goût pour la programmation (Python, C/C++, Matlab). Vous avez des connaissances en statistiques, en physique et idéalement en machine learning.

Formation et compétences requises :

Adresse d’emploi :
Lieu : Groupe de Physique des Matériaux (GPM), Avenue de l’Université, 76800 Saint-Étienne-du-Rouvray

Poursuite possible en thèse : Oui (Financement prévu pour octobre 2024)
Démarrage : Février 2024

Document attaché : 202311151648_Stage M2 – GPM.pdf

Offre de Stage Master / Bac+5 – Segmentation d’IRM cérébrales 3D

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT – Université de Tours
Durée : 5/6 mois
Contact : jyramel@univ-tours.fr
Date limite de publication : 2024-04-01

Contexte :
Titre du stage : SILA-3D : Segmentation Incrémentale, Locale, Anatomique d’images cérébrales 3D

Organismes d’accueil
• Laboratoire d’Informatique Fondamentale et Appliquée de Tours (LIFAT), Université de Tours
• Equipe Neuroéthologie et cognition sociale (NECOS), INRAE Centre Val de Loire, Nouzilly

Encadrement
● Jean-Yves Ramel, Mostafa Darwiche – LIFAT Université de Tours
● Antoine Bourlier – LIFAT / INRAE NECOS
● Elodie Chaillou – INRAE NECOS
● Barthélémy Serres – ILIAD3

Plus d’infos : https://lifat.univ-tours.fr/medias/fichier/stagesila3d_1700035984157-pdf

Sujet :
L’essor de méthodes d’imagerie cérébrale génère une masse considérable de données morphologiques et fonctionnelles mais leur exploration puis leur comparaison au cours du temps pour un individu (développement et vieillissement), entre individus (variabilité au sein de l’espèce), et plus encore entre espèces différentes restent pour l’instant très partielles et limitées. Cette limite provient du fait que l’analyse et la comparaison de cerveaux nécessitent une segmentation des images 3D en structures anatomiques sous jacentes qui reste, pour l’instant, une étape très chronophage lorsqu’elle est réalisée manuellement.
Pour pallier à ce problème notre consortium pluridisciplinaire réunissant des chercheurs informatique (LIFAT, ILIAD3), en neuroanatomie (INSERM) et en biologie animale (INRAE) travaille depuis plusieurs années sur SILA3D, une plateforme logicielle, en accès libre permettant de réaliser une segmentation sémantique incrémentale, locale, anatomique des images en assistant l’utilisateur grâce à une approche interactive et à des algorithmes de machine learning.

Dans ce contexte, le stage proposé vise à poursuivre le développement de cette plateforme . Il s’agira donc de :
– Prendre en main l’existant (technologies, librairies : ITK, docker, …) assez conséquent
– Améliorer les interfaces du client SILA3D basé sur 3D-SLICER
– Améliorer les algorithmes de segmentation exploités par SILA3D coté serveur en intégrant des techniques de deep learning (en python)
– Evaluer les performances des algorithmes de segmentation et la qualité des interfaces au travers d’expérimentations et de discussions menées en collaboration avec les experts du domaine

Profil du candidat :
Stage Niveau Bac + 5 en informatique (Master ou ingénieurs)

Formation et compétences requises :
Profil du candidat :
• Le candidat souhaité est un étudiant en Master ou dernières années d’une formation d’ingénieur en Informatique

• Compétences souhaitées : Analyse d’images médicales et/ou 3D, programmation C++, Des connaissances en Docker, Python et Deep Learning seront un plus.

Adresse d’emploi :
Quand ? Où ? Combien ? Comment ?
Le stage se déroulera entre février et septembre 2024. Le stage sera rétribué à hauteur de l’indemnité légale des stages (environ 580€/mois). La durée du stage est limitée à 5 mois
Le stage aura lieu au Laboratoire d’Informatique Fondamentale et Appliquees de Tours (LIFAT, http://lifat.univ-tours.fr )

Veuillez soumettre votre CV en format pdf à JY Ramel (LIFAT): ramel@univ-tours.fr

Ecological Habitat Mapping via Semantic Segmentation from airborne imagery

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR TETIS
Durée : 6 mois
Contact : dino.ienco@inrae.fr
Date limite de publication : 2024-04-01

Contexte :

In the frame of a collaboration between the engineering consultancy firm ECO-MED (https://ecomed.fr/) and the Joint Research lab TETIS (https://umr-tetis.fr), we are looking for a master intern with the aim of assessing the potential of deep learning methods from the field of computer vision and AI to support ecological habitat mapping from very high resolution (airborne) imagery.
To this end, the engineering consultancy firm ECO-MED has constituted a large dataset containing both airborne imagery and manual expert annotation of ecological habitat mapping following the hierarchical nomenclature proposed in the EUNIS standard https://inpn.mnhn.fr/habitat/cd_typo/7.
This rich and extensively annotated dataset will be shared with the researchers from the Joint Research Unit TETIS, enabling them to conduct,in conjunction with the master intern, several studies to assess and quantify the capabilities of neural network-based semantic segmentation methods to detect fine-grained habitat mapping on the available very high resolution (airborne) imagery.

https://nextcloud.inrae.fr/s/iNfEiNrwTSzpnZ5

Sujet :
The research internship will have the following objectives:
– Conduct a literature review on Semantic Segmentation methodologies for habitat mapping from very high spatial resolution imagery;
– Explore and perform analytics on the ECO-MED dataset;
– Perform initial Semantic Segmentation tests on the data provided by ECO-MED with state of the art approaches (CNN / ViT);
– Adapt and customize state of the art Semantic Segmentation approaches to deal with the ECO-MED dataset. Possible research paths that will be explored are: i) hierarchical semantic segmentation or ii) semantic segmentation with sparse data;
– Quantitative and qualitative evaluation of the proposed method compared to state-of-the-art competitors;
– Preparation of the internship report.

Profil du candidat :
Computer Science
Computer Vision
Deep Learning

Formation et compétences requises :
Computer Science
Computer Vision
Deep Learning

Adresse d’emploi :
500, rue Jean François Breton
34090 Montpellier
France

Document attaché : 202311151041_Short_internship_proposal (1).pdf

Adapter les modèles de type ChatGPT pour interroger en langage naturel une base de données mondiales sur les acquisitions foncières

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2023-12-15

Contexte :
L’initiative Land Matrix (https://landmatrix.org) et son observatoire mondial des acquisitions de terres à grande échelle ont pour objectifs de créer une source fiable de données permettant d’alimenter les débats et de mettre en œuvre des actions éclairées sur les transactions foncières à grande échelle. La Land Matrix collecte des données sur les tentatives prévues, conclues et échouées visant à acquérir des terres au moyen d’achat, de location ou de concession à des fins de production agricole, d’extraction de bois, de finance du carbone, d’activités industrielles, de production d’énergie renouvelable, de conservation de la nature et de tourisme, dans les pays à revenus faibles ou intermédiaires.
Référence mondiale sur les phénomènes d’acquisitions de terres dans le monde académique, les données de la Land Matrix restent encore peu utilisées pour accompagner l’action publique malgré d’importants efforts pour que les données soient en accès libre. Nous faisons l’hypothèse que l’accès aux données et leur exploitation restent des freins importants à l’utilisation des informations contenues dans la base de la Land Matrix. En effet, une certaine expertise en informatique et une bonne connaissance des champs de variables sont nécessaires pour que l’utilisateur puisse accéder aux informations nécessaires.

Sujet :
L’objectif du stage est de simplifier l’accès aux données de la base Land Matrix en permettant son interrogation en langage naturel. Les récentes avancées en intelligence artificielle, dont bénéficient les modèles de langues de type OpenAI/ChatGPT ou meta/Llama-2, offrent de nouvelles opportunités pour convertir des questions, formulées en langage naturelle, en langage informatique (génération de code python et/ou SQL). Ces modèles généralistes nécessitent, cependant, d’être ajustés à la structure de données de la base Land Matrix afin de n’extraire que les données réellement attendues par les utilisateurs. Les stratégies d’ajustement sont un attendu de ce stage dont l’objectif final est de proposer un agent conversationnel (Chat bot) capable de générer les requêtes informatiques à partir d’une formulation en langage naturel. Une requête potentielle serait un croisement de filtres géographiques, filtres de types d’investisseurs et de filtres d’intentions d’investissements, par exemple : « j’aimerais savoir quelles banques soutiennent des investissements miniers (lithium) en Argentine ».

Compétences du candidat/e :
• Analyse des données (collecte, exploration, mise en lien)
• Programmation (préférablement Python)
• Capacité d’analyses, rédactionnelles et de synthèse
• Travail d’équipe
Informations complémentaires :
Durée de 6 mois, à partir de février 2024.
Le stage se déroulera au CIRAD, dans l’UMR TETIS (Territoire, Environnement, Télédétection et Information Spatiale), située dans les locaux de la Maison de la Télédétection à Montpellier.
Le stagiaire sera encadré par Rémi Decoupes (INRAE, UMR TETIS), Jérémy Bourgoin, Roberto Interdonato (CIRAD, UMR TETIS) et Marie Gradeler (ILC).
Financement :
Le stage est soutenu par le projet Land Matrix. La rémunération du stagiaire sera de l’ordre de 600 euros par mois.

Modalité de candidature :
Attention : cette proposition ne concerne que les stages d’étudiants sous convention avec une école ou une université : il ne s’agit pas d’une offre d’emploi.
Envoyer une lettre de motivation d’une page, précisant en outre la durée et période possible du stage, un CV détaillé, et un relevé des notes à : remy.decoupes@inrae.fr et jeremy.bourgoin@cirad.fr
Date limite pour l’envoi du dossier : 30 Novembre, 2023

Profil du candidat :
Compétences du candidat/e :
• Analyse des données (collecte, exploration, mise en lien)
• Programmation (préférablement Python)
• Capacité d’analyses, rédactionnelles et de synthèse
• Travail d’équipe

Formation et compétences requises :
Compétences du candidat/e :
• Analyse des données (collecte, exploration, mise en lien)
• Programmation (préférablement Python)
• Capacité d’analyses, rédactionnelles et de synthèse
• Travail d’équipe

Adresse d’emploi :
Maison de la Télédétection, 500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202311141527_stage.pdf

Modèles d’apprentissage automatique sur des données complexes pour la prévention de défaut de paiement

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS
Durée : 5-6 mois
Contact : hamida.seba@univ-lyon1.fr
Date limite de publication : 2023-11-13

Contexte :
Pour plusieurs applications du monde réel, identifier des motifs qui ne se conforment pas à une activité normale est une question fondamentale pour garantir une prestation de service correcte ainsi que la sécurité et la fiabilité du système [1]. C’est principalement le cas pour des applications de surveillance et de suivi telles que la vidéosurveillance, la surveillance médicale, la détection de logiciels malveillants, la détection de fraudes financières, etc. Un motif anormal est appelé anomalie ou valeur aberrante. Une anomalie est généralement définie comme un motif comportemental qui s’écarte significativement de la plupart des motifs comportementaux du système surveillé et apparaît dans une proportion significativement plus petite que celle des motifs normaux. Avec l’explosion des quantités de données à traiter pour ce genre d’applications, le recours aux modèles d’apprentissage et en particulier l’apprentissage profond est devenu inévitable dans ce domaine.

Sujet :
Durant ce stage, nous nous intéressons aux modèles d’apprentissage capables de traiter des données complexes multi-sources et hétérogènes sur les clients d’une entreprise de location d’ordinateurs personnels (MacBook & iPad) :
• données contrôlées communiqués par le client (nom, prénom, adresses (facturation, livraison), tel, mail)
• données informatique extraites de la connexion internet du client (IP)
• données bancaires
• données issues de blacklists
• données socio-démographiques issues de l’INSEE
Le but de l’analyse de ces données est de réaliser un profiling plus « fair » (sans critères socio-discriminants) de clients qui permettra de prévenir les défauts de paiement. L’approche proposée est la construction de graphes de connaissances ego-centriques [2] profilons (profilant ???) les clients et permettant de représenter toutes les informations les concernant. Ensuite, il s’agira de se baser sur cette représentation pour détecter toute anomalie qui peut engendrer un défaut de paiement. Cette représentation basée sur des graphes de connaissances nécessitera d’utiliser et/ou de concevoir des modèles d’apprentissage adaptés [3, 4]. Le stagiaire commencera par effectuer un état de l’art sur la problématique ainsi que sur les modèles d’apprentissage existants. Il mettra ensuite en place la solution la plus adaptée aux données considérées durant le stage.

Ce stage pourra se poursuivre avec une thèse CIFRE.

Profil du candidat :
Compétences avancées (niveau M2) en informatique (en particulier en apprentissage machine fortement souhaitées).

Formation et compétences requises :
Data science, machine learning

Adresse d’emploi :
LIRIS, Université Lyon 1

Document attaché : 202311131510_LIRISHOPLIZ Sujet de stage.pdf