MaDICS

Huitième édition du Symposium MaDICS

Ce rendez-vous annuel rassemble la communauté MaDICS afin de mettre en lumière les avancées récentes en sciences des données, à travers un programme scientifique riche comprenant des conférences invitées (keynotes), des ateliers thématiques, des tables rondes et des sessions de posters.
Ces temps forts favorisent des échanges scientifiques à la fois stimulants et conviviaux.
Cette année le Symposium se tiendra à Avignon les 2 et 3 juin 2026.

Pour en savoir plus…

Second SEEDS@MaDICS
Cette rencontre vise à créer des échanges entre les milieux industriels et le monde académique (doctorant·es et post-doctorant·es) par le biais d’une semaine de travail sur des problèmes concrets posés par des industriels et nécessitant des approches informatiques et/ou mathématiques innovantes. Ces semaines s’inspirent du modèle des SEME (Semaine d’Etude Mathématiques – Entreprise) de l’AMIES.

SEEDS@MaDICS 2026 aura lieu à l’Université de Technologie de Troyes du 22 au 26 juin 2026.
Inscrivez-vous ici (deadline le 1er juin 2026)

Pour en savoir plus…

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…

Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.

Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus…
Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus…
Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus…
Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…

Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS

Dec

Fri

2023

Apprentissage automatique et profond pour la prédiction d’indicateurs de sécurité alimentaire à partir de données hétérogènes

Tickets

Dec 15 – Dec 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2023-12-15

Contexte :
La sécurité alimentaire (SA) est un problème central dans de nombreuses régions du monde, comme en témoigne sa présence parmi les 17 objectifs de développement durable (ODD 2 – Faim zéro). Pour surveiller les situations d’insécurité alimentaire, plusieurs systèmes d’alerte précoce sont actifs aujourd’hui, tels que GIEWS (FAO) et FEWSNET (USAID). Ces systèmes utilisent un ensemble limité de types de données, i.e., données agroclimatiques provenant d’images satellites et indicateurs extraits d’enquêtes auprès des ménages sur les facteurs nutritionnels, économiques et liés à la production. De plus, une intervention humaine est souvent nécessaire pour combiner et résumer toutes les sources d’information.
Les recherches menées précédemment par TETIS ont montré que des données ouvertes hétérogènes, liées à différents niveaux à la sécurité alimentaire, peuvent être utilisées pour développer des méthodes d’apprentissage automatique capables de produire des indicateurs en lien direct avec la SA. L’idée est d’utiliser des données qui représentent des proxys pour les raisons multiples et interdépendantes à l’origine de ce phénomène. Quelques exemples peuvent être des rasters d’informations spatiales (i.e. cartes de distance aux infrastructures, aux marchés, etc.), information géographique bénévole (Open Street Map), données météorologiques (i.e. températures moyennes, cumuls de précipitations, etc.), indicateurs économiques et données textuelles issus des médias locaux [2,3].

Sujet :
L’objectif de ce stage est d’évaluer le framework développé à TETIS [1] et testé initialement sur le cas du Burkina Faso, sur différents pays d’Afrique, notamment Rwanda et Tanzanie. L’idée à la base du framework est d’exploiter des stratégies d’apprentissage automatique et profond de dernière génération qui peuvent faire face à des aspects critiques, tels qu’une grande hétérogénéité des données d’apprentissage, mis face à une quantité des données de vérité de terrain (scores de SA) limitée.
Dans un premier temps, le travail sera focalisé sur l’actualisation des sources d’un ensemble de données hétérogènes adaptées aux zones d’étude. Cela inclut la collecte et la mise en lien des données a différentes échelles et de nature différentes.
Une fois finalisée la base des donnés, l’étudiant s’occupera de tester le framework d’entraînement des modèles et l’évaluation des modèles d’estimation des indices de SA ainsi entraînés. Les résultats attendus sont soit quantitatifs (évaluation des performance du framework par rapport à des données de référence), soit qualitatifs (production des cartes d’insécurité alimentaire à l’échelle nationale).

[1] Hugo Deléglise, Roberto Interdonato, Agnès Bégué, Elodie Maître d’Hôtel, Maguelonne Teisseire, Mathieu Roche. Food security prediction from heterogeneous data combining machine and deep learning methods. Expert Syst. Appl. 190: 116189 (2022)
[2] Cheick Tidiane Ba, Chloé Choquet, Roberto Interdonato, Mathieu Roche. Explaining food security warning signals with YouTube transcriptions and local news articles. GoodIT 2022: 315-322
[3] Hugo Deléglise, Agnès Bégué, Roberto Interdonato, Elodie Maître d’Hôtel, Mathieu Roche, Maguelonne Teisseire. Mining News Articles Dealing with Food Security. ISMIS 2022: 63-73

Profil du candidat :
 Analyse des données (collecte, exploration, mise en lien)
 Programmation (préférablement Python)
 Capacité d’analyses, rédactionnelles et de synthèse
 Travail d’équipe

Formation et compétences requises :
 Analyse des données (collecte, exploration, mise en lien)
 Programmation (préférablement Python)
 Capacité d’analyses, rédactionnelles et de synthèse
 Travail d’équipe

Adresse d’emploi :
Maison de la télédétection, 500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202311091909_SujetStageM2.pdf

Categories: Stages

Conception et implémentation d’un lac de données de robotique agricole

Tickets

Dec 15 – Dec 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : INRAE – Unité TSCF, équipe ROMEA
Durée : 6 mois
Contact : sandro.bimonte@inrae.fr
Date limite de publication : 2023-12-15

Contexte :
Pour accompagner la transition agroécologique, les robots ont un rôle essentiel à jouer dans le domaine de l’agriculture intelligente. Ils sont capables d’effectuer des opérations agricoles répétitives et précises sur une longue période avec un faible impact sur l’environnement.

Avec des équipements particuliers, et associés à des technologies d’acquisition et de traitement de données, les robots sont capables d’effectuer de manière autonome des tâches ciblées de manière efficace dans les champs.

De nombreux travaux de recherche portent sur l’agriculture intelligente. Dans le cadre du projet ISITE CAP2025, une architecture Big Data a été conçue pour le traitement des données temps réel issues des robots et des capteurs (avec Apache Kafka et Spark), ainsi qu’une base de données relationnelle pour stocker ces données.

Dans ce travail de stage, nous visons à mettre en place un lac de données (data lake) pour le stockage et l’exploration des données sources.

Sujet :
En particulier le travail consiste à :

étudier et comparer les travaux existants sur les lac de données données spatiales : stockage et exploration

implémenter le système de stockage des données (ex. Apache Hadoop HDFS ou PostGIS)

concevoir un modèle de métadonnées et implémenter un système de métadonnées

implémenter un système d’exploration des données (ex. Apache Atlas, Open Metadata, Geonetwork, etc.)

Profil du candidat :
Master 2 en informatique ou équivalent

Formation et compétences requises :
Architectures big data
Gestion de données

Adresse d’emploi :
INRAE, Campus des Cézeaux, Aubière

Document attaché : 202301111441_M2 datalake.pdf

Categories: Stages

MODÉLISATION PAR APPRENTISSAGE PROFOND D’UN “STYLO MAGIQUE”

Tickets

Dec 15 – Dec 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : IGN
Durée : 6 mois
Contact : nicolas.gonthier@ign.fr
Date limite de publication : 2023-12-15

Contexte :
L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu’à leur évolution.

Grâce à son école d’ingénieurs, l’ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).

Au sein de la DSI, le Service Innovation, Maturation et Valorisation (SIMV) est chargé de la mise en œuvre du programme de R&D. Il doit assurer l’entretien et l’évolution des plateformes et équipements technologiques permettant de structurer le processus d’innovation et d’assurer l’interface entre l’enseignement, la recherche, et les développements à caractère plus opérationnel. Il est chargé de développer des prototypes, technologiques d’une part et produits et d’usages d’autre part, qui seront de nature à évaluer l’innovation et à décider de son éventuelle valorisation industrielle en interne ou en externe.
Au sein du SIMV, le Département Appui à l’Innovation (DAI) réalise des études et des prototypes permettant de valider la pertinence et la maturité des travaux de recherche. Le cas échéant, il monte en maturité des codes de recherche vers les souches de production via le développement de maquettes, la réalisation de tests et la rédaction de documentation.

Sujet :
Dans un contexte où la transition écologique est devenue un enjeu national et international, l’IGN s’est donné comme mission de cartographier le plus fréquemment possible l’anthropocène, autrement dit les évolutions et l’impact de l’activité humaine sur le territoire. Cela implique un suivi de l’artificialisation des sols, des zones agricoles, de la forêt, etc. Cela demande d’être capable de pouvoir mettre à jour plus régulièrement nos référentiels cartographiques. Le faire de façon complétement manuelle est un travail titanesque et l’apport de solutions automatiques est primordiale pour atteindre nos objectifs. Pour cela, le travail, qu’il soit manuel ou automatique, consiste à comparer deux images co-alignées spatialement, et de repérer les zones de changement qui ont une valeur sémantique au sens de nos nomenclatures métiers, de détourer ces zones et de mettre à jour nos référentiels cartographiques là où le territoire a changé.

La piste que nous souhaitons étudier pour accélérer le suivi du territoire, consiste à essayer de faciliter le travail pour l’opérateur dans le détourage des zones de changement. L’apparition de modèles de vision par ordinateur inspirés des LLM utilisant de la prompt-ingénierie [1] laisse penser que cela pourrait être transposable dans le cadre de la détection du changement. D’autant plus que des travaux de recherche très récents montrent d’excellents résultats dans l’exploitation de modèles de type “segment anything” pour la segmentation du changement [2]. Nous avons déjà conduit des tests avec le modèle “segment anything” sur nos images, mais dans le cas de la segmentation mono-date. Ici, le challenge sera de trouver les bonnes adaptations sur la partie prompt et décodeur afin qu’elles soient exploitables dans le cadre d’une paire d’images présentant un changement significatif pour l’IGN.

Les missions du stage :

Pour cette mission vous intégrerez une équipe projet dédiée à la détection du changement de 3 personnes actuellement, vous serez encadré par deux d’entre elles.
Dans un premier temps, le stage consistera à faire un état de l’art sur la prompt-ingénierie appliquée à la vision par ordinateur et de se mettre à jour sur les architectures siamois pour la détection du changement [4].
Il faudra ensuite implémenter avec pytorch un modèle inspiré de la littérature, il est fort probable en effet qu’il faille combiner des idées de deux ou quelques papiers de recherche dans le cadre de ce stage. On utilisera un ou deux jeux de données open data à des fins d’entraînement et de test.
Selon les avancées du stage, une intégration dans un SIG (système d’information géographique) ainsi que des tests en coordination avec les équipes de production pourraient être envisagés.
Bibliographie :

[1] : Kirillov, A., Mintun, E., Ravi, N., Mao, H., Rolland, C., Gustafson, L., … & Girshick, R. (2023). Segment anything. arXiv preprint arXiv:2304.02643.

[2] : Ding, L., Zhu, K., Peng, D., Tang, H., & Guo, H. (2023). Adapting Segment Anything Model for Change Detection in HR Remote Sensing Images. arXiv preprint arXiv:2309.01429.

[3] : Shafique, A., Cao, G., Khan, Z., Asad, M., & Aslam, M. (2022). Deep learning-based change detection in remote sensing images: A review. Remote Sensing, 14(4), 871.

[4] : Daudt, R. C., Le Saux, B., & Boulch, A. (2018). Fully convolutional siamese networks for change detection. In 2018 25th IEEE International Conference on Image Processing (ICIP) (pp. 4063-4067). IEEE.

[5] : Zheng, Z., Ma, A., Zhang, L., & Zhong, Y. (2021). Change is everywhere: Single-temporal supervised object change detection in remote sensing imagery. In Proceedings of the IEEE/CVF international conference on computer vision (pp. 15193-15202).

Profil du candidat :
Formation Bac +5, spécialisation en apprentissage machine et vision par ordinateur.

Formation et compétences requises :
Connaissance et pratique de python et de la bibliothèque Pytorch. Le stage étant exigeant techniquement, il est préférable d’avoir déjà pratiqué Pytorch appliqué à de la computer vision, de savoir implémenter un réseau de convolution ou d’attention ‘from scratch’.

Savoir lire et exploiter des API python, car il vous sera probablement demandé d’exploiter des bibliothèques spécialisées dans la manipulation de données géographique.

Savoir mobiliser des résultats de recherche (recherche bibliographique, lecture et ré-implémentation de publications scientifiques…).

Bon niveau d’anglais lu (lecture d’articles).

Une expérience en manipulation de l’information géographique est un plus.

Adresse d’emploi :
IGN Saint-Mandé (94)

Categories: Stages

Multi-modal explainable machine learning for exploring consciousness recovery of coma patients

Tickets

Dec 15 – Dec 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS
Durée : 6 mois
Contact : stefan.duffner@insa-lyon.fr
Date limite de publication : 2023-12-15

Contexte :
–

Sujet :
–

Profil du candidat :
–

Formation et compétences requises :
–

Adresse d’emploi :
–

Document attaché : 202310231316_sujet_stage_M2_being_miti.pdf

Categories: Stages

Réseaux de neurones dynamiques pour des systèmes embarqués

Tickets

Dec 15 – Dec 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS
Durée : 6 mois
Contact : stefan.duffner@insa-lyon.fr
Date limite de publication : 2023-12-15

Contexte :
–

Sujet :
–

Profil du candidat :
–

Formation et compétences requises :
–

Adresse d’emploi :
–

Document attaché : 202310231313_sujet_stage_M2_ia3f.pdf

Categories: Stages

Dec

Sat

2023

Révision de la fonction d’allocation du carbone du modèle V-Mango pour une meilleure prise en compte de l’effet des relations source-puits sur la croissance des fruit

Tickets

Dec 30 – Dec 31 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UR Hortsys et UMR AGAP Institut, CIRAD, Montpellie
Durée : 6 mois
Contact : frederic.boudon@cirad.fr
Date limite de publication : 2023-12-30

Contexte :
Chez de nombreuses espèces fruitières, il a été signalé que les relations source-puits affectent sur la
croissance des fruits. La quantité des assimilats carbonés synthétisés par les feuilles (les sources)
qui est fournie aux fruits (les puits) dépend de l’équilibre entre l’offre des sources et la demande des
puits. Chez le pêcher par exemple, la masse des fruits dépend non seulement des assimilats carbonés
produits par la photosynthèse des feuilles situées à proximité immédiate du fruit, mais aussi des
assimilats carbonés provenant de parties plus éloignées de l’arbre (Marini et Sowers, 1994). Chez le
manguier, de précédentes études suggèrent une autonomie partielle des charpentières et des
branches fruitières (Grechi et Normand, 2019), tandis que d’autres études suggèrent un échange de
carbone entre les différentes parties de l’arbre à un niveau global (Stassen et Janse van Vuuren,
1997). Cette étude a pour but d’évaluer comment les relations source-puits d’une échelle locale
(branche) à une échelle globale (arbre) affectent la croissance des fruits chez le manguier.
Étant donné les interactions entre les processus qui se produisent à différentes échelles, la
modélisation apparaît comme une approche méthodologique intégrative puissante pour aborder cette
question.
Une approche de modélisation sera développée et utilisée comme cadre d’intégration pour
analyser un ensemble de données acquises à différentes échelles. Ces données sont issues de
plusieurs expérimentations et mesures réalisées sur des manguiers (cv Cogshall) à la Réunion i) pour
quantifier les sources et puits de carbone de l’échelle locale des axes feuillés jusqu’à l’échelle
globale de l’arbre (topologie des branches et charpentières, caractérisation des axes feuillés et de
leur environnement lumineux, nombre et répartition des fruits dans l’arbre, croissance des fruits, etc) ;
ii) pour numériser l’architecture 3D de la partie aérienne d’un arbre adulte ; et iii) pour acquérir une
cartographie dynamique de la biomasse sèche et des sucres non structuraux dans les différents
compartiments d’arbres adultes au cours d’un cycle de production. Le cadre de modélisation
s’appuiera sur un modèle structure-fonction du manguier (V-Mango : Boudon et al 2020 ; Vaillant
et al., 2022) qui a été développé pour simuler le développement architectural de l’arbre et la production
de fruits. La version actuelle du modèle considère l’arbre comme un ensemble de branches fruitières
indépendantes. La modélisation de la croissance des fruits est basée sur un modèle d’allocation de
carbone paramétré à l’échelle individuelle des branches fruitières. En particulier, les échanges de
carbone des axes feuillés individualisés vers les fruits environnants utilisent une version simplifiée de
la fonction d’allocation basée sur la distance proposée dans des travaux antérieurs (Reyes et al.,
2020, Lescourret et al., 2011). Toutefois, ils restent limités à des échanges au sein de branches
fruitières indépendantes. Du point de vue de la modélisation, le défi consistera à définir un modèle multi-échelle de la structure de la plante et à formaliser les échanges de carbone à différentes
échelles (locale et globale). L’intensité des échanges dépendra de l’équilibre entre l’offre des sources
et la demande des puits, ainsi que des distances entre les organes. Pour cela, les méthodes
d’estimation des distances entre organes dans le graphe de l’arborescence seront adaptées pour
prendre en compte les informations multi-échelles.
L’approche intégrative s’appuyant sur V-Mango permettra d’étudier plus en profondeur les
processus liés au carbone, des axes feuillés à l’arbre entier, et de quantifier les effets des relations
source-puits, et d’autres facteurs structurels, environnementaux ou biotiques, sur l’hétérogénéité de
la masse des fruits à la récolte. L’intégration de ces connaissances et leur formalisation dans le
modèle V-Mango ouvrira un large éventail d’applications. En particulier, V-Mango sera mobilisé pour
quantifier in silico l’effet de certaines pratiques culturales ou de certains bio-agresseurs affectant les
sources ou les puits.

Sujet :
L’étudiant formalisera et étudiera les effets des relations source-puits d’une échelle locale (axes
feuillés, branche) à une échelle globale (arbre) sur la croissance des fruits en utilisant le modèle V-
Mango et les ensembles de données disponibles. V-Mango, basé sur Jupyter notebooks et Python,
est disponible sur un environnement de modélisation virtuel (vmango-lab ;
https ://github.com/fredboudon/vmango-lab) qui permet de travailler de manière distribuée et
collaborative. Plus spécifiquement, le travail de l’étudiant consistera en les tâches suivantes :
• Structuration des données pour les rendre facilement utilisables pour les applications de
modélisation. Les résultats expérimentaux et la description des architectures doivent être convertis
en une base de données structurelle et temporelle compatible avec une représentation multi-
échelle, en utilisant, par exemple, des graphes arborescents multi-échelles (MTG).
• Révision de la formalisation des processus liés au carbone de V-Mango :
– Extension de la fonction d’allocation basée sur la distance afin de prendre en compte les
relations multi-échelles pour l’allocation du carbone entre sources et puits.
– Optimisation du calcul des distances entre les organes en utilisant des relations multi-échelles.
– Intégration de nouveaux compartiments de réserve pour représenter les racines et le vieux bois.
• Recalibrage du modèle, en tenant compte du fait que le nombre d’organes, qui définissent les
compartiments pour la procédure d’allocation, peut varier au cours de la simulation.
• Analyse de sensibilité du comportement du modèle en utilisant des architectures de manguiers
observées et simulées :
– Évaluation de l’importance des différents paramètres du modèle.
– Quantification et comparaison des échanges de carbone à différentes échelles.
– Quantification des effets des relations source-puits, modifiés par des pratiques culturales ou
bio-agresseurs, sur la variabilité de la masse individuelle des fruits à la récolte.

Profil du candidat :
– Bonnes notions de modélisation et de programmation, et connaissance du langage Python
– Aptitude à travailler en équipe pluridisciplinaire (agronomes, informaticiens)

Formation et compétences requises :
– Niveau Master (Bac+5)
– Statisticien(ne)/informaticien(ne) avec un goût pour la biologie, ou agronome/éco-physiologiste
avec des connaissances solides en informatique et en statistiques

Adresse d’emploi :
Montpellier et la Réunion :

– Campus international de Baillarguet, 34398 Montpellier Cedex 5 France
– Station de Bassin-Plat BP 180 97455 Saint-Pierre cedex

Document attaché : 202310241137_Offre de stage Cirad 2024_Modélisation_FR.docx

Categories: Stages

Dec

Sun

2023

Analyse d’images de microscopie électronique par réseaux profonds : Augmentation de données.

Tickets

Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS-UMR 7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre d’un projet collaboratif de recherche biomédicale sur l’endocardite infectieuse (EI) nous souhaitons développer une approche par réseaux profonds (deep-learning) pour la segmentation d’images de microscopie électronique à balayage dans le but d’analyser l’ultrastructure de valves cardiaques.
Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes (LIS), expert dans l’analyse d’image, et le laboratoire Mephi (IHU Méditerranée Infection), expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité (Habib 2019). L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon (lien). Par une approche innovante par MEB, on a démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux (Hannachi 2020 ; vidéo). Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse.

Sujet :
L’objectif du stage est de développer une méthode à base de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Nous nous proposons d’utiliser une architecture qui permettra à la fois la détection et la segmentation des objets d’intérêt dans l’image. L’entrainement de réseaux profonds demande une quantité importante d’images annotées. Le nombre des images disponibles étant limité, il s’agira alors de mettre en œuvre une stratégie d’augmentation de données qui pourrait profiter d’une architecture GAN (Hostin 2023). Aussi dans le cadre de ce stage les 2 types d’architectures seront considérées, une architecture d’analyse d’images pour détecter les microbes et une architecture générative pour son entrainement.

Financement:
Le stagiaire recevra la gratification d’usage, de l’ordre de 600€ par mois, prise en charge par l’institut d’établissement Marseille Imaging.

Candidature :
Les candidats sont invités à transmettre leurs candidatures par mél. Le dossier de candidature comprendra un CV détaillé, une lettre de motivation pour le projet et les derniers relevés de notes.

Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale.

Formation et compétences requises :
La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées

Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’) ou dans ceux de l’équipe MEPHI de l’IHU Méditerranée Infection, selon les besoins.

Laboratoire d’Informatique et Systèmes – LIS – UMR CNRS 7020 – Aix-Marseille Université
Campus scientifique de St Jérôme – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20
www.lis-lab.fr

Document attaché : 202311171631_Sujet_Master2_SegmentationAugmentationDL-SEM.pdf

Categories: Stages

Exploring Gradient-Based Metalearning for RNA 3D Structure Prediction

Tickets

Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC. Université Paris Saclay, Univ Evry
Durée : 6 mois
Contact : fariza.tahi@univ-evry.fr
Date limite de publication : 2023-12-31

Contexte :
Determining the 3D structure of ribonucleic acid (RNA) chains is essential to understanding their function and role in the various stages of living organisms and viruses. Due to the high cost of experimental methods (NMR, cristallography, etc.), computational methods could be very helpful. Although methods have been proposed in the literature for several years, the task remains open. For proteins, this problem has witnessed tremendous advances in recent years: DeepMind’s AlphaFold2 [1] made a giant leap in solving the 3D structure prediction problem for many types of single-chain protein structures using deep learning. Unfortunately, RNA still remains challenging [2]: unlike for proteins, (i) data of known 3D RNA structures are not available in large quantities; (ii) RNA are not stable and thus may have different 3D conformations; (iii) RNA sequences can vary from a few nucleotides to several tens of thousands of nucleotides.
It is suggested in the literature that the only way to address these challenges is for the quantity of RNA structures or sequence alignments to catch up with the amount of protein data that is currently accessible for models like AlphaFold [2]. We think the solution does not solely lie in the quantity of data but in finding suitable search biases and principled ways to incorporate domain knowledge into the learning process. The metalearning paradigm can provide answers to these challenges. This paradigm aims to improve a learning model’s generalization capabilities by leveraging prior knowledge from a family of tasks and accumulating past experience in a meaningful way [5, 6, 3]. Gradient-based metalearning approaches are examples of this paradigm, where the goal is to learn a model that knows how to adapt to new tasks or domains using limited quantities of data [5, 13, 4]. These approaches made tremendous breakthroughs in many applications where adaptation to new tasks required only a few learning examples.

Sujet :
Recently, only a very few studies in the literature [7, 8, 9, 10] have started to address the use of metalearning in computational biology. Works like [7] and [8] have been limited to the prediction of non-coding RNA using metalearning, leaving the structural level unexplored. In this internship, we want to investigate metalearning for the problem of 3D structure prediction of RNA chains. In particular, the ability to leverage the 3D conformations coming from multiple known species and know how to adapt rapidly to new ones under few available samples.
Furthermore, we want to investigate how prior knowledge can be leveraged to guide the adaptation process further [6]. For example, we can exploit the knowledge base of prominent RNA structural patterns provided in the CaRNAval dataset maintained by the LISN laboratory at UPSaclay [11]. Concretely, the prior knowledge in the form of RNA structural patterns can, for example, be used to devise better parameterizations for the optimization landscapes induced by the initial learning problem.
We will use the RNANet [12] database, developed by our research team, that integrates various information on RNA, including sequences, families (e.g., MSA multiple sequence alignments), secondary structures, 3D structures, etc.
The steps of the internship will, first, consist of the study of the state-of-the-art on RNA 3D structure prediction and gradient-based metalearning approaches. Second, frame the problem of RNA 3D prediction in the metalearning setting and build a first metalearning-based architecture for RNA 3D structure prediction. Third, study the prominent RNA structural patterns included in the CaRNAval knowledge base and propose a way to leverage such structural patterns to devise better parameterizations for the learning process. Finally, benchmark with RNANet dataset and possibly other datasets.
From a methodological point of view, we want to develop new metalearning approaches that can effectively deal with limited data in predicting the 3D structure of RNA and incorporate prior knowledge into the learning process.
From a bioinformatic perspective, we would like to propose an efficient tool for predicting RNA 3D structures, a tool that could be used in a personalized medicine project we are involved in, the IHU Prometheus project (2024-2034) on Sepsis, where RNAs can be potential biomarkers and/or therapeutic targets.
The developed tool will be available through our EvryRNA bioinformatics platform (http://evryrna.ibisc.univ-evry.fr), a platform providing the scientific community with several tools developed under the team for the analysis and prediction of non-coding RNAs.
The internship can lead to a Ph.D. thesis to further deepen the use of metalearning for the prediction of RNA 3D structures.
References
[1] Jumper, John, et al. “Highly accurate protein structure prediction with AlphaFold.” Nature 596.7873 (2021): 583-589.
[2] Schneider, Bohdan, et al. “When will RNA get its AlphaFold moment?.” Nucleic Acids Research 51.18 (2023): 9522-9532.
[3] Hospedales, Timothy, et al. “Meta-learning in neural networks: A survey.” IEEE transactions on pattern analysis and machine intelligence 44.9 (2021): 5149-5169.
[4] Nichol, Alex, and John Schulman. “Reptile: a scalable metalearning algorithm.” arXiv preprint arXiv:1803.02999 2.3 (2018): 4.
[5] Finn, Chelsea, Pieter Abbeel, and Sergey Levine. “Model-agnostic meta-learning for fast adaptation of deep networks.” International conference on machine learning. PMLR, 2017.
[6] Hamidi, Massinissa. Metalearning guided by domain knowledge. Diss. Université Paris-Nord-Paris XIII, 2022.
[7] Li, Zhongshen, et al. “CoraL: interpretable contrastive meta-learning for the prediction of cancer- associated ncRNA-encoded small peptides.” Briefings in Bioinformatics 24.6 (2023): bbad352.
[8] Bonidia, Robson P., et al. “BioAutoML: automated feature engineering and metalearning to predict noncoding RNAs in bacteria.” Briefings in Bioinformatics 23.4 (2022): bbac218.
[9] Wu, Xue, et al. “Meta-learning shows great potential in plant disease recognition under few available samples.” The Plant Journal (2023).
[10] Rodrigues, Vânia, and Sérgio Deusdado. “Metalearning approach for leukemia informative genes prioritization.” Journal of Integrative Bioinformatics 17.1 (2020): 20190069.
[11] Reinharz, Vladimir, et al. “Mining for recurrent long-range interactions in RNA structures reveals embedded hierarchies in network families.” Nucleic acids research 46.8 (2018): 3841-3851.
[12] Becquey, Louis, Eric Angel, and Fariza Tahi. “RNANet: an automatically built dual-source dataset integrating homologous sequences and RNA structures.” Bioinformatics 37.9 (2021): 1218-1224.
[13] Raghu, Aniruddh, et al. “Rapid Learning or Feature Reuse? Towards Understanding the Effectiveness of MAML.” International Conference on Learning Representations. 2019.

Profil du candidat :
Master 2 (or equivalent) in DataSciences, Computer Sciences or bioinformatics / Computational Biology

Formation et compétences requises :
Master 2 (or equivalent) in DataSciences, Computer Sciences or bioinformatics / Computational Biology

Adresse d’emploi :
IBGBI building. 23 bv. de France, Evry

Document attaché : 202311191845_Internship-Metalarning-RNA3D.pdf

Categories: Stages

Simulation biomécanique, fondée sur IRM, du comportement dynamique des organes pelviens

Tickets

Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS UMR7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre d’un projet de recherche concernant la modélisation de la dynamique des organes pelviens , nous nous intéressons particulièrement à la déformation d’organes à tissus mous [1]. Ce projet développé en collaboration avec le service de chirurgie digestive du CHU La Timone (APHMarseille) et l’équipe ICB-COM (UTBM) vise à terme la réalisation d’un simulateur de la dynamique des organes pelviens utile à la préparation du geste chirurgical.

Sujet :
A partir de l’exploration IRM volumique un modèle géométrique 3D maillé est construit. Il s’agit de « plonger » ce modèle dans un environnement de simulation biomécanique pour tester des lois de comportement hyper-élastique (Mooney-Rivlin, Ogden, Yeoh…). L’imagerie IRM 2D dynamique permet d’observer le comportement des organes en charge dans le plan médian sagittal. Une méthode basée sur les Large Deformation Diffeomorphic Metric Mapping (LDDMM) permet de suivre des points spécifiques sur les contours se déformant [2]. Ces mêmes points seront suivis sur les modèles simulés. Les expériences de simulation seront évaluées par comparaison des résultats de simulation avec les séquences observées grâce à l’IRM (Figure). Les conditions limites et les caractéristiques mécaniques seront celles disponibles dans la littérature associées à nos hypothèses expérimentales, ces questions étant particulièrement ouvertes.
Les notions fondamentales concernent les interactions entre modèles maillés pour la gestion des collisions et le respect de contraintes mécaniques (conservation du volume…). Les développements seront produits avec une plateforme dédiée à la simulation.

Contexte de travail :
Le stage se déroulera entre Février 2024 et Juillet 2024, essentiellement dans les locaux de :
– Université de Technologie de Belfort-Montbéliard (Site Sévenans)
– ICB UMR 6303, CNRS, Univ. Bourgogne Franche-Comté, Département COMM (Conception, Optimisation, Modélisation en Mécanique), UTBM.
Le transfert de « savoir-faire » pourra induire des séjours à Marseille au laboratoire d’informatique et des systèmes (LIS) dans l’équipe Images & Modèles sur le campus de St Jérome (LIS UMR 7020, www.lis-lab.fr ).
La gratification d’usage (de l’ordre de 600€) sera perçue. Une poursuite en thèse pourrait-être envisagée

Profil du candidat :
Le candidat ou la candidate sera intéressé(e) par un projet pluridisciplinaire et par l’imagerie médicale. Il ou elle sera de préférence issu de formation de master 2 ou master Ingénieur en mécanique numérique.

Formation et compétences requises :
Des compétences en simulation mécanique, en mathématiques appliquées ou dans le développement de jeux vidéo seront particulièrement appréciées. Une expérience de la programmation avec l’environnement python serait un plus.

Adresse d’emploi :
ICB UMR 6303, CNRS, Univ. Bourgogne Franche-Comté, Département COMM (Conception, Optimisation, Modélisation en
Mécanique), UTBM.
10 r Château 90400 Sevenans

Document attaché : 202311171639_Sujet_Master2_RecalageSimu.pdf

Categories: Stages

Stage M2 : Apprentissage profond pour la génération de séries temporelles – Application à l’Analyse Quantifiée de la Marche des enfants avec Paralysie Cérébrale

Tickets

Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaTIM INSERM (CHU Brest) et IRIMAS (Université Hau
Durée : 6 mois
Contact : maxime.devanne@uha.fr
Date limite de publication : 2023-12-31

Contexte :
La Paralysie Cérébrale (PC) est un terme qui désigne un groupe de troubles permanents du développement du mouvement et de la posture, responsables de limitations d’activité, imputables à des événements ou atteintes non progressives survenus sur le cerveau en développement du fœtus ou du nourrisson. Les troubles moteurs de la PC sont souvent accompagnés de troubles sensoriels, perceptifs, cognitifs, de la communication et du comportement. La PC touche environ 2 enfants sur 1000 en Europe et est le handicap physique le plus fréquent de l’enfance.
L’Analyse Quantifiée de la Marche (AQM) est un des outils que possède le clinicien pour l’aider dans sa prise de décision thérapeutique afin d’améliorer la marche des enfants avec PC. Cet examen est réalisé en routine clinique dans un laboratoire du mouvement et quantifie les déviations à la marche. Cet examen permet d’obtenir la reconstruction 3D du mouvement (cinématique) à partir de caméras infrarouges et de marqueurs posés en regard de points anatomiques, l’activité musculaire et la force de réaction lors de l’appui, … Ces paramètres peuvent être considérés comme des séries temporelles.
Le service de Médecine Physique et Réadaptation du CHU de Brest possède un laboratoire du mouvement dans lequel plus de 1100 patients (enfants et adultes) ont réalisé au moins une AQM. Afin d’aider sa prise de décision thérapeutique, le clinicien aimerait pouvoir prédire la cinématique d’un patient après action thérapeutique (injection de toxine botulinique, chirurgie, …) ou après un intervalle de temps. Pour cela la génération automatique de séries temporelles est requise.

Sujet :
L’objectif du stage est la génération de séries temporelles à l’aide de réseaux de neurones. Il s’agira tout d’abord d’effectuer une étude bibliographique des méthodes d’apprentissage automatique et d’apprentissage profond utilisées pour la génération de séries temporelles. Ensuite, l’objectif sera de développer des modèles génératifs pour la génération de séries temporelles dans ce contexte clinique. La performance des algorithmes développés sera évaluée à partir des cycles de marche acquis au CHU de Brest. Les cliniciens pourront ainsi prédire l’évolution d’un patient et proposer des recommandations thérapeutiques en conséquence.

Profil du candidat :
– M2 recherche en Informatique / Intelligence Artificielle
– Très bon niveau de programmation Python
– Des bonnes connaissances en apprentissage automatique et apprentissage profond
– Des connaissances sur les techniques de mesures du mouvement humain par systèmes optoélectroniques seraient appréciées

Formation et compétences requises :
– M2 recherche en Informatique / Intelligence Artificielle
– Très bon niveau de programmation Python
– Des bonnes connaissances en apprentissage automatique et apprentissage profond
– Des connaissances sur les techniques de mesures du mouvement humain par systèmes optoélectroniques seraient appréciées

Adresse d’emploi :
CHU de Brest

Document attaché : 202311162024_M2 IRIMAS 2023-2024.pdf

Categories: Stages

Transformation d’un modèle Structure fonction de pommier pour l’assimilation de données de phénotypage numérique

Tickets

Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR AGAP Institut, CIRAD, Montpellier
Durée : 6 mois
Contact : frederic.boudon@cirad.fr
Date limite de publication : 2023-12-31

Contexte :
Les modèles fonctionnels-structurels de plantes (FSPM) prennent en compte la structure modulaire des plantes, leur fonctionnement interne et l’interaction avec l’environnement (Prusinkiewicz, 2004 ; Fourcaud et al., 2008 ; Louarn et Song 2020). Leur développement est motivé par l’idée que la structure tridimensionnelle des plantes forme son interface avec l’environnement et module sa croissance et sa productivité (Costes et al., 2006). Ils ont notamment été utilisés pour la modélisation d’arbres fruitiers (Costes et al., 2008 ; Allen et al., 2005 ; Lescourret et al., 2011 ; Boudon et al., 2020) chez lesquels la compétition interne pour les ressources entre organes nécessite d’avoir des représentations dynamiques spatialisées.
Le développement de FSPM répond à trois objectifs principaux (Louarn et Song 2020):
• Intégrer les connaissances de différentes disciplines, notamment la biologie végétale, la biophysique, l’écologie et l’informatique ;
• Comprendre le fonctionnement des plantes à différentes échelles, du méristème aux communautés végétales ;
• Développer des modèles prédictifs ou explicatifs pour répondre à des enjeux sociétaux tel que la modélisation des plantes dans des environnements spécifiques (panneaux photovoltaïques, serres, vergers, etc.), la compétition pour les ressources, l’introduction de perturbations (taille, bioagresseurs, etc.) et la définition d’idéotypes pour les sélectionneurs.
Un verrou majeur de cette approche est la paramétrisation du modèle qui rend difficile son adoption pour construire des outils d’aide à la décision pour la gestion des vergers (DeJong, 2019) et plus généralement qui freine son utilisation dans la communauté scientifique. Récemment de nombreuses initiatives visent à automatiser le phénotypage des plantes, mais se concentrent sur un ensemble limité de traits, souvent peu compatible avec la définition d’un FSPM (Streit et al., 2023)

Sujet :
L’objectif de ce stage sera de réaliser une première étape de reformulation d’un modèle FSPM d’arbre fruitier, MAppleT (Costes et al., 2008) pour préparer son couplage avec des données numériques issues de différents protocoles d’acquisition (LiDAR, imagerie aéroportée).
Les résultats attendus portent sur
(1) l’évaluation de la faisabilité de reproduire les séquences d’événements développementaux observées en fonction de génotypes différents à partir de reconstructions 3D issues de scans LiDAR en hiver et par des méthodes d’assimilation de données, basées sur du machine ou deep learning (i.e. CNNS, RNNs, LSTMs et Transformers).
(2) la ré-écriture des règles de développement et de ramification d’un modèle FSPM de pommier de façon à pourvoir les paramétriser automatiquement à partir de données issues du phénotypage.

Le stage débutera par une analyse bibliographique des traits accessibles par phénotypage pour la modélisation. Un bilan sera fait des différents traits mesurés par phénotypage LiDAR et imagerie qui seront mis en regard des paramètres des modèles de simulation. En particulier, les aspects de topologie de l’architecture des arbres, notamment leur ramification seront analysés.
– La modification du FSPM MappleT portera principalement sur les paramètres des règles de développement et de ramification des méristèmes formalisées pour l’instant par des règles stochastiques dans le modèle pommier. A partir de reconstructions construites issues de scans LiDAR en hiver, des méthodes d’assimilation de données, basées sur du machine ou deep learning, pour permettre de reproduire les séquences d’événements développementaux observées en fonction des génotypes seront développées. Pour modéliser et simuler ces séquences, différents types d’architecture de réseaux seront testés, (i.e. CNNS, RNNs, LSTMs et Transformers). Les séquences déduites de la reconstruction 3D devront prendre en compte l’incertitude des mesures. Les modèles initiaux de séquences de ramification, construits à partir de modèles de semi chaînes de markov cachées, seront utilisés pour pré-entraîner les modèles de réseaux. Ceux-ci seront évalués pour leur capacité à prendre en compte les effets génotypiques.

Profil du candidat :
– Master en maths-info.

Formation et compétences requises :
– Connaissances : programmation en langage Python, des connaissances en statistiques seront appréciées
– Compétences opérationnelles : Goût pour le travail en équipe et l’inter-disciplinarité
– Langues : français, anglais

Adresse d’emploi :
Avenue Agropolis – 34398 Montpellier Cedex 05, France

Document attaché : 202310241551_Sujet-Bourse-Master2-GIS-Fruits-2024.pdf

Categories: Stages

Jan

Fri

2024

Development of automated segmentation and clustering methods for spICP-ToF-MS time-series in Nanogeochemistry.

Tickets

Jan 12 – Jan 13 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de physique du globe de Paris, Université
Durée : 6 mois
Contact : tharaud@ipgp.fr
Date limite de publication : 2024-01-12

Contexte :
Nanoparticles (NPs) are pervasive in natural systems, playing a crucial role in nanogeochemistry. The emergence of single-particle time-of-flight inductively coupled plasma mass spectrometry (spICP-ToF-MS) has revolutionized NP characterization, presenting new challenges in data analysis.

Sujet :
This research project seeks to bridge advanced nano-instrumentation with data-driven insights, focusing on the development of standardized methodologies for integrating spICP-ToF-MS with state-of-the-art machine learning algorithms. The IPGP hosts a world-leading geochemistry platform (PARI) equipped with an operational spICP-ToF-MS instrument and possesses an extensive dataset to (1) develop a novel methodology for the automated segmentation and clustering of NP time series generated by spICP-ToF-MS, (2) address challenges including instrumental noise, unknown NP compositions, and large data volumes requiring sophisticated statistical methods, and (3) explore interdisciplinary collaboration between geochemists, data scientists, and analytical chemists.

Preliminary tests have shown encouraging results using a 4-step methodology described and illustrated below:
– Detection: Establish a conservative threshold for detecting significant NP signals within time series data using intensity distribution across channels (b).
– Clustering: Identify families of NP signals through unsupervised clustering algorithms, considering the unknown number of NP families in natural environments.
– Classification: Train a classifier to differentiate various NPs within continuous time series, including an additional noise class, using realistic data.
– Segmentation: Divide time series into segments based on the classifier, addressing the challenge of determining optimal segmentation window size (c).

Profil du candidat :
We seek candidate with a strong background in data science, including machine learning or deep learning tehcniques.

Formation et compétences requises :
Master 2 level or engineering school.

Adresse d’emploi :
IPGP, 1, Rue Jussieu, 75005 Paris

Document attaché : 202311231031_M2 Internship IPGP-LIPADE.pdf

Categories: Stages

Generation of spatial arrangements for lightening by material removal

Tickets

Jan 12 – Jan 13 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube UMR 7357
Durée : 6 mois
Contact : remi.allegre@unistra.fr
Date limite de publication : 2024-01-12

Contexte :
The aim of this internship is to identify and generate spatial arrangements of patterns relevant to the removal of material from solid materials for lightening purposes, in the context of construction and civil engineering applications.

Sujet :
The aim is to study geometric and statistical criteria for characterizing spatial arrangements of patterns in relation to desired mechanical properties, and to develop a generation algorithm.

A full description of the subject, together with information on how to apply, is available in the attached document.

Profil du candidat :
Skills:
– Some knowledge and experience in Computer Graphics and/or Image Processing is required.
– Experience in Machine Learning in Python is a plus.
– Curiosity and ability to communicate and share your progress and to make written reports.
– Autonomy and good organization skills.

Formation et compétences requises :
Academic level equivalent to a Master 2 in progress or Engineer in its 5th year, in Computer Science with courses in Computer Graphics and/or Image Processing, and Machine Learning.

Adresse d’emploi :
ICube – UMR 7357
300 boulevard Sébastien Brant
67400 ILLKIRCH

Document attaché : 202311221751_2023-2024-ASAM_Stage_M2_EN.pdf

Categories: Stages

Jan

Mon

2024

Clustering de Réseaux d’ordre supérieur pour des données de transports maritimes

Tickets

Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N
Durée : 5/6 mois
Contact : francois.queyroi@univ-nantes.fr
Date limite de publication : 2024-01-15

Contexte :
Le contexte de ce stage est l’analyse des relations entre lieux à partir de trajectoires maritimes Ces traces peuvent être définies comme des séquences discrètes d’événements (e.g. les différents ports visités par un navire). Dans ce cadre, on s’intéresse aux relations indirectes entre lieux e.g. sachant qu’un navire vient de Shanghai et est actuellement à Singapour, quelle est sa prochaine destination ? On va ainsi chercher à dépasser la représentation usuelle des déplacements sous la forme de graphes en utilisant des « réseaux d’ordre supérieur » (voir Fig. 1). Ces réseaux représentent les probabilités de transitions d’un lieu à un autre en tenant compte d’un historique de déplacement. Ainsi, ce nouveau type de graphe inclut des « noeuds-mémoire » correspondant à des sous-séquence de lieux. Par exemple, le nœud « Singapour/Tokyo » va encoder l’événement « Le navire, actuellement à Singapour, est arrivé de Tokyo ». Ces modèles reflètent mieux les données d’entrées que les modèles « sans mémoire » (chaîne de Markov d’ordre 1) où la probabilité de transition d’un port à l’autre ne dépendra que du port actuel.
La construction et la fouille de ces nouveaux modèles constituent d’important axes de recherche dans le domaine de la fouille de réseaux. Une application importante est la détection de communautés de lieux chevauchantes, qui est l’objectif de ce stage détaillé plus bas. Ce stage se situe dans la prolongation d’avancées récentes sur ce sujet [Saebi et al. 2020, Queiros et al, 2022]. Les résultats obtenus seront valorisés à travers des publications scientifiques et des outils logiciels.

Sujet :
Un premier objectif du stage est de proposer des outils permettant de produire un clustering chevauchant des lieux à partir d’un partitionnement des noeuds-mémoires d’un réseau d’ordre supérieur. En effet, un cluster de lieux doit représenter un groupe de lieux dont la majorité des flux est dirigée vers d’autres lieux du même groupe. Toutefois, certains lieux (typiquement des grands ports du réseau maritime international) vont pouvoir appartenir à différents groupes. Une problématique dans ce cadre est que la façon dont sont construit les réseaux d’ordre supérieur va beaucoup influencer les clusters découverts si on utilise directement des algorithmes classiques [Queiros et al, 2022]. Le stage consistera à développer un algorithme évitant cet écueil. On pourra par exemple proposer une alternative à l’algorithme de clustering Walktrap [Pons et Latapy, 2005] (voir Fig. 2). Cela impliquera toutefois d’utiliser une fonction de scoring qui est définie pour les clusterings chevauchant (par ex. [Esquivel et Rosvall, 2011]). L’algorithme développé pourra être intégré au paquet Python honyx (https://pypi.org/project/honyx).

Un deuxième objectif sera la constitution de jeux de données de trajectoires maritimes par l’utilisation d’API de sites recensant les positions des navires.

Profil du candidat :
Nous cherchons un.e étudiant.e en M2 mathématique/informatique (ou équivalent) intéressé.e et ayant des compétences dans l’analyse de données et la fouille de graphes.
– intérêt pour la Recherche et le travail à la fois en équipe et en autonomie
– bonne maîtrise de Python
– capacités rédactionnelles
– bon niveau d’Anglais

Formation et compétences requises :
Nous cherchons un.e étudiant.e en M2 mathématique/informatique (ou équivalent) intéressé.e et ayant des compétences dans l’analyse de données et la fouille de graphes.
– intérêt pour la Recherche et le travail à la fois en équipe et en autonomie
– bonne maîtrise de Python
– capacités rédactionnelles
– bon niveau d’Anglais

Adresse d’emploi :
Polytech Nantes.
Rue Christian Pauc, 44300 Nantes

Document attaché : 202311081135_sujet_clust2024_fr.pdf

Categories: Stages

Deep Learning methods for fetal cortical surfaces generation from MRI scans

Tickets

Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de Neurosciences de la Timone
Durée : 5 ou 6 mois
Contact : olivier.coulon@univ-amu.fr
Date limite de publication : 2024-01-15

Contexte :
The human cerebral cortex undergoes dynamic and regionally heterogeneous development during gestation [1]. Cortical surface-based analysis is based on the reconstruction of topologically-correct and geometrically accurate surface representations of the folded, thin cerebral cortex. The fetal cerebral cortex is typically represented as a triangulated mesh with a spherical topology for each brain hemisphere, generated from a tissue segmentation of the structural MRI scan.

Sujet :
In this context, and although various algorithmic solutions have been proposed in the past to propose such meshes, deep learning approaches have now become state-of-the-art for cortical surface generation [2]. The goal of this internship is to evaluate some of these methods. In particular we will evaluate their performance on fetal MR data, that are difficult to process with standard methods.
The candidate will be in charge of:
1. Testing pre-selected deep-learning approaches from the literature (CortexODE [3] CorticalFlow++[4], DeepCSR[5], PialNN[6], Topofit[7]).
2. Comparing these methods on a large dataset of fetal MRI available in the team and containing normal and pathological scans
3. Perform an application study on the obtained surfaces representations to characterize normal and pathological fetal development (optional, depending on progress)

[1] I.Kostović,G.Sedmak,andM.Judaš,“Neuralhistologyandneurogenesisofthehumanfetal and infant brain,” NeuroImage. 2019, doi: 10.1016/j.neuroimage.2018.12.043.
[2] F.Zhao,Z.Wu,andG.Li,“Deeplearningincorticalsurface-basedneuroimageanalysis:a systematic review,” Intell. Med., 2023, doi: 10.1016/j.imed.2022.06.002.
[3] Q.Ma,L.Li,E.C.Robinson,B.Kainz,D.Rueckert,andA.Alansary,“CortexODE:Learning Cortical Surface Reconstruction by Neural ODEs.” arXiv, 2022 http://arxiv.org/abs/2202.08329
[4] R.SantaCruzetal.,“CorticalFlow++:BoostingCorticalSurfaceReconstructionAccuracy, Regularity, and Interoperability,” in MICCAI 2022, doi: 10.1007/978-3-031-16443-9_48.
[5] R.S.Cruz,L.Lebrat,P.Bourgeat,C.Fookes,J.Fripp,andO.Salvado,“DeepCSR:A3D Deep Learning Approach for Cortical Surface Reconstruction,” IEEE/CVF, 2021, https://openaccess.thecvf.com/content/WACV2021/html/Santa_Cruz_DeepCSR_A_3D_Deep_ Learning_Approach_for_Cortical_Surface_Reconstruction_WACV_2021_paper.html
[6] Q.Ma,E.C.Robinson,B.Kainz,D.Rueckert,andA.Alansary,“PialNN:AFastDeepLearning Framework for Cortical Pial Surface Reconstruction,” in Machine Learning in Clinical Neuroimaging, 2021, doi: 10.1007/978-3-030-87586-2_8.
[7] A.Hoopes,J.E.Iglesias,B.Fischl,D.Greve,andA.V.Dalca,“TopoFit:RapidReconstruction of Topologically-Correct Cortical Surfaces,” MIDL, 2021, https://openreview.net/forum?id=-JiHeZNDY3a

Profil du candidat :
Nous recherchons un étudiant en M2 ou Dernière année d’école d’ingénieur, motivé par l’imagerie médicale ou les neurosciences, et possédant les compétences suivantes:

Formation et compétences requises :
– une bonne connaissance des principes de l’apprentissage profond.
– une expérience de python pour l’apprentissage profond (e.g. Pytorch)
– une connaissance de Git et des environnements de type Linux.
– une expériences précédente dans le domaine de l’apprentissage profond est un plus.

Adresse d’emploi :
The intern will integrate the MeCA research team of the Institut des Neurosciences de la Timone, in Marseille, France. The Meca team (www;meca-brain.org)combines expertise in processing of large fetal MRI databases and surface based morphometry methods. Tools and data required for the internship will be provided by the team.

Document attaché : 202310201221_2024_M2_internship_surface_extraction.pdf

Categories: Stages

Extraction de contenu multimodal — Application au cas des manuels scolaires

Tickets

Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire CEDRIC du CNAM (Paris)
Durée : 5 ou 6 mois
Contact : guinaudeau@limsi.fr
Date limite de publication : 2024-01-15

Contexte :
Le projet ANR MALIN a pour objectif de rendre utilisables les manuels scolaires numériques par les enfants en situation de handicap. En effet, les manuels numériques actuellement disponibles nécessitent d’être adaptés pour être accessibles à ces enfants. Ces adaptations concernent aussi bien les aspects techniques que pédagogiques. Dans la plupart des cas, les manuels sont adaptés de façon artisanale et les délais de livraison peuvent être de plusieurs mois. Ces contraintes ne permettent pas de rendre efficiente l’inclusion scolaire des enfants en situation de handicap. L’objectif du projet ANR MALIN est donc de développer des solutions techniques afin d’aboutir à l’automatisation de l’adaptation des manuels scolaires numériques pour les rendre accessibles (accès, traitement et interaction avec les contenus) aux élèves en situation de handicap. Le projet ANR repose sur une collaboration entre quatre laboratoires : LISN (Université Paris-Saclay), MICS (Ecole CentraleSupelec), CEDRIC (CNAM), Inserm 1284 (CRI, Université de Paris).

Sujet :
L’objectif du stage consiste à concevoir des approches d’extraction automatique de la structure d’un exercice de manuel scolaire (consignes, enoncés, exemples, etc.) et de son contenu multimédia (textes, images, dessins, graphiques, équations, courbes…) à partir des fichiers fournis par les éditeurs (ceux-ci sont le plus souvent au format pdf). Plusieurs approches seront à envisager : une approche d’adaptation et d’enrichissement de systèmes de structuration automatique de documents textuels (segmentation thématique, segmentation discursive) prenant en compte la spécificité et la multi-modalité des données traitées et une approche basée sur le traitement automatique des images visant à identifier les différents blocs en se basant sur les caractéristiques de l’image, connue sous le nom de « Document Layout Segmentation and Analysis » [1, 2]. Des approches récentes d’apprentissage profond seront testées sur des jeux de données annotées manuellement afin d’adapter des modèles existants et obtenir des résultats d’extraction satisfaisants.

[1] Wang, Jiapeng, Lianwen Jin, and Kai Ding. “Lilt: A simple yet effective language-independent layout transformer for structured document understanding.” arXiv preprint arXiv:2202.13669 (2022).
[2] Huang, Yupan, et al. “Layoutlmv3: Pre-training for document ai with unified text and image masking.” Proceedings of the 30th ACM International Conference on Multimedia. 2022.

Profil du candidat :
Master en informatique ou TAL avec une spécialisation dans au moins un des domaines suivants :
○ traitement automatique des langues
○ apprentissage automatique

Formation et compétences requises :
Maîtrise de Python (langage de prédilection du projet)
La connaissance des principales librairies d’apprentissage sera appréciée.

Adresse d’emploi :
Lieu de travail : Laboratoire CEDRIC du CNAM
Durée du contrat : 5/6 mois
Début souhaité : printemps 2024
Contact : Pour postuler, merci d’envoyer un CV, les notes de M1 et M2 et une lettre de motivation à Camille Guinaudeau (guinaudeau@limsi.fr), Olivier Pons (olivier.pons@lecnam.net) et Caroline Huron (caroline.huron@cri-paris.org).

Document attaché : 202311080140_SujetStageMALIN_extraction.pdf

Categories: Stages

Fairness in Machine Learning on Graphs

Tickets

Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab / INSA Rouen
Durée : 6 months
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2024-01-15

Contexte :
Fairness is a major ingredient for Safe and Trustworthy Artificial Intelligence (AI). It is central to have fair Machine Learning (ML) models in any AI system in major application areas, and it is even more crucial in medicine. Within this context, the ANR project FAMOUS aims to address fairness in Machine Learning with multimodality. This project brings forth experts in Machine Learning and Neuroscientists from 4 major research institutes in France and a company: Laboratoire d’Informatique et Systèmes (Marseille), Institut des Neurosciences de la Timone (Marseille), Laboratoire Hubert Curien (Saint Etienne), LITIS Lab (Rouen) and Euranova (R&D division in France). Within this environment, we are offering this Master’s internship in the LITIS Lab at the INSA Rouen Normandy, with the possibility to pursue a PhD thesis.

Sujet :
Unfairness starts from the existence of biases in the datasets used to learn ML models. The main advances in deep learning in ML are due to learning an embedding of data in a latent space that is appropriate for the given task at hand. Thus, the performance of the ML model highly depends on the investigated embedding, and so does its fairness.

Dealing with graph data is more complex than Euclidean data due to their structure. This internship considers the problem of learning from a set of graph data – multiple graphs – (as opposed to graph mining of a single large-scale graph, e.g. social network). Since an explicit embedding of graphs into a Euclidean space suffers from information loss and restricted precision, graph embedding will be considered with graph neural networks (GNNs) [1, 2].

The internship aims to study bias-free embedding with GNNs. Within the last few years, there has been an increased interest in fairness-promoting graph embedding methods, mainly for node embedding in network mining with applications on social networks [3, 4, 5], and more recently using GNNs as black boxes [6]. Within this internship, the intern will explore this research direction of bias-free GNNs. She/he will investigate relevant methods and devise the appropriate algorithms to address datasets of MRI of the brain. It is worth noting that graph representations have demonstrated their relevance for characterizing MRI of the human brain, such as for the analysis of the brain activity and of its cortical folding. This application will be conducted within a narrow collaboration with the Institut des Neurosciences de la Timone.

The objectives of the internship are as following:
1- Familiarize herself/himself with fairness in GNNs.
2- Explore the most relevant methods on well-known graph datasets.
3- Devise appropriate method for the MRI application at hand.
4- Gain hands-on with graphs constructed from brain MRI datasets.
These objectives will allow to lay the groundwork for advanced research in a subsequent PhD.

Research Environment

This intern will conduct her/his research within the Machine Learning group in the LITIS Lab, under the supervision of Dr. Benoît Gaüzère and Prof. Paul Honeine. This internship will be conducted within the research project FAMOUS, and within a strong collaboration with the Institut des Neurosciences de la Timone.

Duration and Location

– The internship will last 5 to 6 months, starting from February or March 2024.
– It will be located at INSA Rouen Normandie, within the ML team of LITIS lab, France.

[1] M. Balcilar, G. Renton, P. Héroux, B. Gaüzère, S. Adam, and P. Honeine. “Analyzing the Expressive Power of Graph Neural Networks in a Spectral Perspective”. In: ICLR. 2021.
[2] M. Balcilar, G. Renton, P. Héroux, B. Gaüzère, S. Adam, and P. Honeine. “When Spectral Domain Meets Spatial Domain in Graph Neural Networks”. In: ICML – Workshop on Graph Representation Learning and Beyond. 2020.
[3] A. Bose and W. Hamilton. “Compositional fairness constraints for graph embeddings”. In: ICML. 2019.
[4] J. Kang, J. He, R. Maciejewski, and H. Tong. “Inform: Individual fairness on graph mining”. In: ACM SIGKDD Int. Conf. Knowl. 2020.
[5] J. Palowitch and B. Perozzi. “Debiasing Graph Representations via Metadata-Orthogonal Training”. In: IEEE/ACM ASONAM. 2020.
[6] E. Dai and S. Wang. “Say No to the Discrimination: Learning Fair Graph Neural Networks with Limited Sensitive Attribute Information”. In: WSDM. 2021.

Profil du candidat :
– Student in final year of Master or Engineering School, in applied mathematics, data science, artificial intelligence, or related fields

Formation et compétences requises :
– Strong skills in data analysis and Machine Learning
– Good programming skills in Python and the scientific ecosystem numpy/pytorch
– Interest in neuroscience and/or ML fairness

Application

Interested candidates are invited to send by email a CV, a cover letter expressing their interest and background in the subject, and academic transcripts. Reference letters may also be beneficial.

Contacts

Benoit Gaüzère : benoit.gauzere@insa-rouen.fr
Paul Honeine : paul.honeine@univ-rouen.fr

Adresse d’emploi :
INSA Rouen

Document attaché : 202311262056_Internship – FAMOUS.pdf

Categories: Stages

Master Internship on Enabling XAI in IoT-enhanced Spaces at Institut Polytechnique de Paris

Tickets

Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : SAMOVAR
Durée : 6
Contact : aikaterini.tzompanaki@cyu.fr
Date limite de publication : 2024-01-15

Contexte :
With the emergence of the Internet of Things (IoT) and computing (cloud-edge) continuum technologies
infrastructures are becoming more sensorized, fueling the development of smart space ecosystems and
improving societal quality of life. As a result, smart spaces are becoming popular in many domains,
including healthcare, education, building management, and more. This integration with the IoT brings
much potential in revolutionizing the way that these environments operate. Initially, IoT sensors mea-
sure physical phenomena (temperature, energy consumption, luminosity) in a continuous way, producing
streams of data. Such data is often used for analysis and predictions to either optimize different criteria
(e.g., occupancy, user comfort, energy consumption, etc.), or identify and anticipate problems. To man-
age and control the data generated by IoT devices, AI algorithms can be used to enable smarter, more
efficient, and more responsive devices to their environment.

Sujet :
To enable efficient decision making, it is increasingly common that predictions be accompanied by
explanations, i.e., pieces of information either on the data, the models, or both for giving insights on
why the predictions were made. For example, a smart building employs IoT devices to measure energy
consumption of different plugs in households, as well as temperature of different rooms. Using this
measurements as training data, a Machine Learning model can be used to predict the energy consumption
of the air-conditioning appliance plug (label) using different IoT data features (e.g., temperature). Since
this is a continuous setting scenario, at time t1 we may have gathered D1 data, which we use to train a
decision tree M1. At a later time t2, incrementally we have obtained D1 ⊂ D2, along with a new trained
model M2. Let’s assume the following predictions made by M1 and M2 for a test point p: y1 = M1(p) =
10watts and y2= M2(p) = 50watts. An example of traditional local explanations for these two predictions
could be e1 : p.temperature = 20 while e2 : p.temperature = 35. We argue that a more informative
and correct explanation would be the information that the distribution of the training data has changed;
it is not only that the current temperature is at 35 degrees, but also that the timestamps with high
temperatures appear more often in the data than before t1.
This internship aims to study the usage of data distribution changes through time for the construction
of more pertinent XAI models for IoT-enhanced spaces. Use cases will be provided from existing data
models and data instances from IoT devices deployed in smart spaces of the Institut Polytechnique de
Paris (IP Paris). The successful candidate will be considered for a 3 year PhD contract at the end of the internship

Profil du candidat :
Internship Objectives
The selected candidate will be working on the following tasks:
– Get familiar with data models for smart spaces.
– Leverage datasets of smart spaces for prediction and decision making.
– Study data drifts and distribution changes in datasets for IoT space predictions.
– Propose explanation formalizations based on data distribution changes.

Formation et compétences requises :
Master 2 on computer science or last year of engineering school.

Adresse d’emploi :
Telecom SudParis, Evry or Palaiseau

Document attaché : 202311091058_XAI_IoT_internship.pdf

Categories: Stages

Jan

Fri

2024

Développement d’IA pour la prédiction de besoins de lit dans les hôpitaux.

Tickets

Jan 26 – Jan 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : école d’ingénieur ISIS Castres
Durée : 5 à 6 mois
Contact : imen.megdiche@univ-jfc.fr
Date limite de publication : 2024-01-26

Contexte :
Actuellement, le temps d’attente moyen dans les services d’urgence est alarmant, atteignant une moyenne de 9 heures, principalement en raison d’une gestion perfectible des ressources disponibles à l’hôpital. Il est essentiel de noter que 75 % des admissions à l’hôpital découlent d’admissions non programmées suite à des passages aux urgences.

Sujet :
L’objectif de ce stage est d’élaborer un modèle d’intelligence artificielle visant à anticiper les besoins en lits pour chaque service hospitalier suite aux admissions non programmées aux urgences. Actuellement, le temps d’attente moyen dans les services d’urgence est alarmant, atteignant une moyenne de 9 heures, principalement en raison d’une gestion perfectible des ressources disponibles à l’hôpital. Il est essentiel de noter que 75 % des admissions à l’hôpital découlent d’admissions non programmées suite à des passages aux urgences.
Ce stage s’inscrit dans un projet recherche avec l’entreprise Atout Majeur Concept (AMC). Nous envisageons de croiser plusieurs types de données issues du SI de l’entreprise pour propose une approche IA , basée sur du MultiTask Leanring afin de prédire des besoins en lits sur une période de 7 à 15 jours.
Le stagiaire sera chargé de : faire une revue des travaux connexes dans la littérature, mettre en œuvre l’intégralité de la chaîne de développement de l’intelligence artificielle et de produire un livrable à tester avec l’ entreprise AMC.

Profil du candidat :
Des compétences en pyhton pour la data science
Connaissances solides en IA .
Rigoureux et autonome.
Très bon niveau de communication orale et écrite (anglais/ Français )

Formation et compétences requises :
formation en IA ou machine learning requise ( master ou école d’ingénieur)

Adresse d’emploi :
95 rue firmin Oulès , 81100 Castres

Categories: Stages

Développement et évaluation d’une descente d’échelle statistique des prévisions météorologiques sur la Réunion avec des méthodes de deep learning

Tickets

Jan 26 – Jan 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Centre National de Recherches Météorologiques
Durée : 6 mois
Contact : laure.raynaud@meteo.fr
Date limite de publication : 2024-01-26

Contexte :
Les prévisions météorologiques opérationnelles sur les domaines Outre-Mer ont vu leur résolution spatiale augmenter de 2.5km à 1.3km à l’été 2022. Cette évolution a permis d’améliorer la performance des prévisions, en particulier pour les événements à enjeux tels que les cyclones tropicaux et les fortes pluies. Des résolutions hectométriques permettraient de gagner encore en réalisme, en particulier sur l’île de la Réunion dont le relief est complexe. Néanmoins, le coût des prévisions à des résolutions de quelques centaines de mètres ne permet pas d’envisager leur utilisation opérationnelle avant plusieurs années.

Une alternative moins coûteuse à cette descente d’échelle dynamique est la descente d’échelle statistique. L’objectif est d’apprendre une relation statistique entre les prévisions basse résolution (par exemple 2.5km ou 1.3km) et les prévisions haute résolution (par exemple 500m). Les méthodes de descente d’échelle les plus classiques reposent sur des interpolations simples ou des approches de régression linéaire. Récemment, plusieurs études ont montré que des méthodes d’apprentissage profond tels que les réseaux de neurones convolutifs offrent des perspectives intéressantes pour la descente d’échelle (Vandal et al., 2018; Baño-Medina et al., 2019, Leinonen et al., 2020; Höhlein et al. 2020, Sha et al., 2020).

Sujet :
L’objectif du travail proposé est de développer une descente d’échelle à 500m des prévisions sur la Réunion, par apprentissage profond, et pour des variables de temps sensible telles que la température, le vent et les précipitations. Un premier stage en 2023 a permis de mettre en place les jeux de données et d’évaluer deux architectures : un réseau convolutif simple de type U-Net et un modèle de diffusion. Les premiers résultats sont encourageants et plusieurs pistes d’approfondissement et d’amélioration sont envisagées, qui feront l’objet du présent stage, parmi lesquelles :
1. l’intégration de contraintes physiques dans les réseaux
2. l’amélioration des modèles de diffusion et de leur coût d’inférence : des variantes telles que les modèles implicites (Song et al., 2021), la diffusion latente ou la distillation progressive (Salimans et Ho, 2022) pourront être implémentées
3. la descente d’échelle stochastique, au travers de la génération d’ensembles de prévisions
4. la descente d’échelle pour les précipitations.

Profil du candidat :
Le stage requiert un réel intérêt pour la prévision du temps. De bonnes compétences en statistiques également sont attendues. Le langage de programmation utilisé sera Python. Une connaissance préalable du fonctionnement des réseaux de neurones profonds (en particulier des réseaux convolutifs) est souhaitée. Une première expérience d’une bibliothèque de Deep Learning (PyTorch, TensorFlow, …) serait un plus.

Formation et compétences requises :
Ecole d’ingénieur ou M2.

Adresse d’emploi :
CNRM, Toulouse.

Document attaché : 202310251324_Fiche-proposition-PFE_IENM_IA500m_2024.pdf

Categories: Stages

December 2023 – January 2024 Dec 2023 – Jan 2024

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Présentation Générale

Manifestations à venir

Actions, Ateliers et Groupes de Travail :