Présentation Générale

 



           
Huitième édition du Symposium MaDICS

Ce rendez-vous annuel rassemble la communauté MaDICS afin de mettre en lumière les avancées récentes en sciences des données, à travers un programme scientifique riche comprenant des conférences invitées (keynotes), des ateliers thématiques, des tables rondes et des sessions de posters.
Ces temps forts favorisent des échanges scientifiques à la fois stimulants et conviviaux.

Une Session Poster sera spécialement consacrée aux jeunes chercheuses et jeunes chercheurs souhaitant présenter leurs travaux en analyse et gestion de données et dans les domaines interdisciplinaires autour de la Science des Données. Cette session sera également l’occasion d’échanger avec des collègues académiques et des acteurs industriels sur les thématiques de recherche présentées.

Dates importantes :

  • Soumission de posters : au plus tard le 23 mars 2026
  • Retour : 9 avril 2026
  • Symposium : les 2 et 3 juin 2026 à Avignon

Nous vous invitons d’ores et déjà à réserver ces dates dans votre agenda

Pour en savoir plus…

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS  


Dec
31
Sun
2023
Analyse d’images de microscopie électronique par réseaux profonds : Augmentation de données.
Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS-UMR 7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre d’un projet collaboratif de recherche biomédicale sur l’endocardite infectieuse (EI) nous souhaitons développer une approche par réseaux profonds (deep-learning) pour la segmentation d’images de microscopie électronique à balayage dans le but d’analyser l’ultrastructure de valves cardiaques.
Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes (LIS), expert dans l’analyse d’image, et le laboratoire Mephi (IHU Méditerranée Infection), expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité (Habib 2019). L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon (lien). Par une approche innovante par MEB, on a démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux (Hannachi 2020 ; vidéo). Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse.

Sujet :
L’objectif du stage est de développer une méthode à base de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Nous nous proposons d’utiliser une architecture qui permettra à la fois la détection et la segmentation des objets d’intérêt dans l’image. L’entrainement de réseaux profonds demande une quantité importante d’images annotées. Le nombre des images disponibles étant limité, il s’agira alors de mettre en œuvre une stratégie d’augmentation de données qui pourrait profiter d’une architecture GAN (Hostin 2023). Aussi dans le cadre de ce stage les 2 types d’architectures seront considérées, une architecture d’analyse d’images pour détecter les microbes et une architecture générative pour son entrainement.

Financement:
Le stagiaire recevra la gratification d’usage, de l’ordre de 600€ par mois, prise en charge par l’institut d’établissement Marseille Imaging.

Candidature :
Les candidats sont invités à transmettre leurs candidatures par mél. Le dossier de candidature comprendra un CV détaillé, une lettre de motivation pour le projet et les derniers relevés de notes.

Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale.

Formation et compétences requises :
La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées

Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’) ou dans ceux de l’équipe MEPHI de l’IHU Méditerranée Infection, selon les besoins.

Laboratoire d’Informatique et Systèmes – LIS – UMR CNRS 7020 – Aix-Marseille Université
Campus scientifique de St Jérôme – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20
www.lis-lab.fr

Document attaché : 202311171631_Sujet_Master2_SegmentationAugmentationDL-SEM.pdf

Exploring Gradient-Based Metalearning for RNA 3D Structure Prediction
Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC. Université Paris Saclay, Univ Evry
Durée : 6 mois
Contact : fariza.tahi@univ-evry.fr
Date limite de publication : 2023-12-31

Contexte :
Determining the 3D structure of ribonucleic acid (RNA) chains is essential to understanding their function and role in the various stages of living organisms and viruses. Due to the high cost of experimental methods (NMR, cristallography, etc.), computational methods could be very helpful. Although methods have been proposed in the literature for several years, the task remains open. For proteins, this problem has witnessed tremendous advances in recent years: DeepMind’s AlphaFold2 [1] made a giant leap in solving the 3D structure prediction problem for many types of single-chain protein structures using deep learning. Unfortunately, RNA still remains challenging [2]: unlike for proteins, (i) data of known 3D RNA structures are not available in large quantities; (ii) RNA are not stable and thus may have different 3D conformations; (iii) RNA sequences can vary from a few nucleotides to several tens of thousands of nucleotides.
It is suggested in the literature that the only way to address these challenges is for the quantity of RNA structures or sequence alignments to catch up with the amount of protein data that is currently accessible for models like AlphaFold [2]. We think the solution does not solely lie in the quantity of data but in finding suitable search biases and principled ways to incorporate domain knowledge into the learning process. The metalearning paradigm can provide answers to these challenges. This paradigm aims to improve a learning model’s generalization capabilities by leveraging prior knowledge from a family of tasks and accumulating past experience in a meaningful way [5, 6, 3]. Gradient-based metalearning approaches are examples of this paradigm, where the goal is to learn a model that knows how to adapt to new tasks or domains using limited quantities of data [5, 13, 4]. These approaches made tremendous breakthroughs in many applications where adaptation to new tasks required only a few learning examples.

Sujet :
Recently, only a very few studies in the literature [7, 8, 9, 10] have started to address the use of metalearning in computational biology. Works like [7] and [8] have been limited to the prediction of non-coding RNA using metalearning, leaving the structural level unexplored. In this internship, we want to investigate metalearning for the problem of 3D structure prediction of RNA chains. In particular, the ability to leverage the 3D conformations coming from multiple known species and know how to adapt rapidly to new ones under few available samples.
Furthermore, we want to investigate how prior knowledge can be leveraged to guide the adaptation process further [6]. For example, we can exploit the knowledge base of prominent RNA structural patterns provided in the CaRNAval dataset maintained by the LISN laboratory at UPSaclay [11]. Concretely, the prior knowledge in the form of RNA structural patterns can, for example, be used to devise better parameterizations for the optimization landscapes induced by the initial learning problem.
We will use the RNANet [12] database, developed by our research team, that integrates various information on RNA, including sequences, families (e.g., MSA multiple sequence alignments), secondary structures, 3D structures, etc.
The steps of the internship will, first, consist of the study of the state-of-the-art on RNA 3D structure prediction and gradient-based metalearning approaches. Second, frame the problem of RNA 3D prediction in the metalearning setting and build a first metalearning-based architecture for RNA 3D structure prediction. Third, study the prominent RNA structural patterns included in the CaRNAval knowledge base and propose a way to leverage such structural patterns to devise better parameterizations for the learning process. Finally, benchmark with RNANet dataset and possibly other datasets.
From a methodological point of view, we want to develop new metalearning approaches that can effectively deal with limited data in predicting the 3D structure of RNA and incorporate prior knowledge into the learning process.
From a bioinformatic perspective, we would like to propose an efficient tool for predicting RNA 3D structures, a tool that could be used in a personalized medicine project we are involved in, the IHU Prometheus project (2024-2034) on Sepsis, where RNAs can be potential biomarkers and/or therapeutic targets.
The developed tool will be available through our EvryRNA bioinformatics platform (http://evryrna.ibisc.univ-evry.fr), a platform providing the scientific community with several tools developed under the team for the analysis and prediction of non-coding RNAs.
The internship can lead to a Ph.D. thesis to further deepen the use of metalearning for the prediction of RNA 3D structures.
References
[1] Jumper, John, et al. “Highly accurate protein structure prediction with AlphaFold.” Nature 596.7873 (2021): 583-589.
[2] Schneider, Bohdan, et al. “When will RNA get its AlphaFold moment?.” Nucleic Acids Research 51.18 (2023): 9522-9532.
[3] Hospedales, Timothy, et al. “Meta-learning in neural networks: A survey.” IEEE transactions on pattern analysis and machine intelligence 44.9 (2021): 5149-5169.
[4] Nichol, Alex, and John Schulman. “Reptile: a scalable metalearning algorithm.” arXiv preprint arXiv:1803.02999 2.3 (2018): 4.
[5] Finn, Chelsea, Pieter Abbeel, and Sergey Levine. “Model-agnostic meta-learning for fast adaptation of deep networks.” International conference on machine learning. PMLR, 2017.
[6] Hamidi, Massinissa. Metalearning guided by domain knowledge. Diss. Université Paris-Nord-Paris XIII, 2022.
[7] Li, Zhongshen, et al. “CoraL: interpretable contrastive meta-learning for the prediction of cancer- associated ncRNA-encoded small peptides.” Briefings in Bioinformatics 24.6 (2023): bbad352.
[8] Bonidia, Robson P., et al. “BioAutoML: automated feature engineering and metalearning to predict noncoding RNAs in bacteria.” Briefings in Bioinformatics 23.4 (2022): bbac218.
[9] Wu, Xue, et al. “Meta-learning shows great potential in plant disease recognition under few available samples.” The Plant Journal (2023).
[10] Rodrigues, Vânia, and Sérgio Deusdado. “Metalearning approach for leukemia informative genes prioritization.” Journal of Integrative Bioinformatics 17.1 (2020): 20190069.
[11] Reinharz, Vladimir, et al. “Mining for recurrent long-range interactions in RNA structures reveals embedded hierarchies in network families.” Nucleic acids research 46.8 (2018): 3841-3851.
[12] Becquey, Louis, Eric Angel, and Fariza Tahi. “RNANet: an automatically built dual-source dataset integrating homologous sequences and RNA structures.” Bioinformatics 37.9 (2021): 1218-1224.
[13] Raghu, Aniruddh, et al. “Rapid Learning or Feature Reuse? Towards Understanding the Effectiveness of MAML.” International Conference on Learning Representations. 2019.

Profil du candidat :
Master 2 (or equivalent) in DataSciences, Computer Sciences or bioinformatics / Computational Biology

Formation et compétences requises :
Master 2 (or equivalent) in DataSciences, Computer Sciences or bioinformatics / Computational Biology

Adresse d’emploi :
IBGBI building. 23 bv. de France, Evry

Document attaché : 202311191845_Internship-Metalarning-RNA3D.pdf

Simulation biomécanique, fondée sur IRM, du comportement dynamique des organes pelviens
Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS UMR7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre d’un projet de recherche concernant la modélisation de la dynamique des organes pelviens , nous nous intéressons particulièrement à la déformation d’organes à tissus mous [1]. Ce projet développé en collaboration avec le service de chirurgie digestive du CHU La Timone (APHMarseille) et l’équipe ICB-COM (UTBM) vise à terme la réalisation d’un simulateur de la dynamique des organes pelviens utile à la préparation du geste chirurgical.

Sujet :
A partir de l’exploration IRM volumique un modèle géométrique 3D maillé est construit. Il s’agit de « plonger » ce modèle dans un environnement de simulation biomécanique pour tester des lois de comportement hyper-élastique (Mooney-Rivlin, Ogden, Yeoh…). L’imagerie IRM 2D dynamique permet d’observer le comportement des organes en charge dans le plan médian sagittal. Une méthode basée sur les Large Deformation Diffeomorphic Metric Mapping (LDDMM) permet de suivre des points spécifiques sur les contours se déformant [2]. Ces mêmes points seront suivis sur les modèles simulés. Les expériences de simulation seront évaluées par comparaison des résultats de simulation avec les séquences observées grâce à l’IRM (Figure). Les conditions limites et les caractéristiques mécaniques seront celles disponibles dans la littérature associées à nos hypothèses expérimentales, ces questions étant particulièrement ouvertes.
Les notions fondamentales concernent les interactions entre modèles maillés pour la gestion des collisions et le respect de contraintes mécaniques (conservation du volume…). Les développements seront produits avec une plateforme dédiée à la simulation.

Contexte de travail :
Le stage se déroulera entre Février 2024 et Juillet 2024, essentiellement dans les locaux de :
– Université de Technologie de Belfort-Montbéliard (Site Sévenans)
– ICB UMR 6303, CNRS, Univ. Bourgogne Franche-Comté, Département COMM (Conception, Optimisation, Modélisation en Mécanique), UTBM.
Le transfert de « savoir-faire » pourra induire des séjours à Marseille au laboratoire d’informatique et des systèmes (LIS) dans l’équipe Images & Modèles sur le campus de St Jérome (LIS UMR 7020, www.lis-lab.fr ).
La gratification d’usage (de l’ordre de 600€) sera perçue. Une poursuite en thèse pourrait-être envisagée

Profil du candidat :
Le candidat ou la candidate sera intéressé(e) par un projet pluridisciplinaire et par l’imagerie médicale. Il ou elle sera de préférence issu de formation de master 2 ou master Ingénieur en mécanique numérique.

Formation et compétences requises :
Des compétences en simulation mécanique, en mathématiques appliquées ou dans le développement de jeux vidéo seront particulièrement appréciées. Une expérience de la programmation avec l’environnement python serait un plus.

Adresse d’emploi :
ICB UMR 6303, CNRS, Univ. Bourgogne Franche-Comté, Département COMM (Conception, Optimisation, Modélisation en
Mécanique), UTBM.
10 r Château 90400 Sevenans

Document attaché : 202311171639_Sujet_Master2_RecalageSimu.pdf

Stage M2 : Apprentissage profond pour la génération de séries temporelles – Application à l’Analyse Quantifiée de la Marche des enfants avec Paralysie Cérébrale
Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaTIM INSERM (CHU Brest) et IRIMAS (Université Hau
Durée : 6 mois
Contact : maxime.devanne@uha.fr
Date limite de publication : 2023-12-31

Contexte :
La Paralysie Cérébrale (PC) est un terme qui désigne un groupe de troubles permanents du développement du mouvement et de la posture, responsables de limitations d’activité, imputables à des événements ou atteintes non progressives survenus sur le cerveau en développement du fœtus ou du nourrisson. Les troubles moteurs de la PC sont souvent accompagnés de troubles sensoriels, perceptifs, cognitifs, de la communication et du comportement. La PC touche environ 2 enfants sur 1000 en Europe et est le handicap physique le plus fréquent de l’enfance.
L’Analyse Quantifiée de la Marche (AQM) est un des outils que possède le clinicien pour l’aider dans sa prise de décision thérapeutique afin d’améliorer la marche des enfants avec PC. Cet examen est réalisé en routine clinique dans un laboratoire du mouvement et quantifie les déviations à la marche. Cet examen permet d’obtenir la reconstruction 3D du mouvement (cinématique) à partir de caméras infrarouges et de marqueurs posés en regard de points anatomiques, l’activité musculaire et la force de réaction lors de l’appui, … Ces paramètres peuvent être considérés comme des séries temporelles.
Le service de Médecine Physique et Réadaptation du CHU de Brest possède un laboratoire du mouvement dans lequel plus de 1100 patients (enfants et adultes) ont réalisé au moins une AQM. Afin d’aider sa prise de décision thérapeutique, le clinicien aimerait pouvoir prédire la cinématique d’un patient après action thérapeutique (injection de toxine botulinique, chirurgie, …) ou après un intervalle de temps. Pour cela la génération automatique de séries temporelles est requise.

Sujet :
L’objectif du stage est la génération de séries temporelles à l’aide de réseaux de neurones. Il s’agira tout d’abord d’effectuer une étude bibliographique des méthodes d’apprentissage automatique et d’apprentissage profond utilisées pour la génération de séries temporelles. Ensuite, l’objectif sera de développer des modèles génératifs pour la génération de séries temporelles dans ce contexte clinique. La performance des algorithmes développés sera évaluée à partir des cycles de marche acquis au CHU de Brest. Les cliniciens pourront ainsi prédire l’évolution d’un patient et proposer des recommandations thérapeutiques en conséquence.

Profil du candidat :
– M2 recherche en Informatique / Intelligence Artificielle
– Très bon niveau de programmation Python
– Des bonnes connaissances en apprentissage automatique et apprentissage profond
– Des connaissances sur les techniques de mesures du mouvement humain par systèmes optoélectroniques seraient appréciées

Formation et compétences requises :
– M2 recherche en Informatique / Intelligence Artificielle
– Très bon niveau de programmation Python
– Des bonnes connaissances en apprentissage automatique et apprentissage profond
– Des connaissances sur les techniques de mesures du mouvement humain par systèmes optoélectroniques seraient appréciées

Adresse d’emploi :
CHU de Brest

Document attaché : 202311162024_M2 IRIMAS 2023-2024.pdf

Transformation d’un modèle Structure fonction de pommier pour l’assimilation de données de phénotypage numérique
Dec 31 2023 – Jan 1 2024 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR AGAP Institut, CIRAD, Montpellier
Durée : 6 mois
Contact : frederic.boudon@cirad.fr
Date limite de publication : 2023-12-31

Contexte :
Les modèles fonctionnels-structurels de plantes (FSPM) prennent en compte la structure modulaire des plantes, leur fonctionnement interne et l’interaction avec l’environnement (Prusinkiewicz, 2004 ; Fourcaud et al., 2008 ; Louarn et Song 2020). Leur développement est motivé par l’idée que la structure tridimensionnelle des plantes forme son interface avec l’environnement et module sa croissance et sa productivité (Costes et al., 2006). Ils ont notamment été utilisés pour la modélisation d’arbres fruitiers (Costes et al., 2008 ; Allen et al., 2005 ; Lescourret et al., 2011 ; Boudon et al., 2020) chez lesquels la compétition interne pour les ressources entre organes nécessite d’avoir des représentations dynamiques spatialisées.
Le développement de FSPM répond à trois objectifs principaux (Louarn et Song 2020):
• Intégrer les connaissances de différentes disciplines, notamment la biologie végétale, la biophysique, l’écologie et l’informatique ;
• Comprendre le fonctionnement des plantes à différentes échelles, du méristème aux communautés végétales ;
• Développer des modèles prédictifs ou explicatifs pour répondre à des enjeux sociétaux tel que la modélisation des plantes dans des environnements spécifiques (panneaux photovoltaïques, serres, vergers, etc.), la compétition pour les ressources, l’introduction de perturbations (taille, bioagresseurs, etc.) et la définition d’idéotypes pour les sélectionneurs.
Un verrou majeur de cette approche est la paramétrisation du modèle qui rend difficile son adoption pour construire des outils d’aide à la décision pour la gestion des vergers (DeJong, 2019) et plus généralement qui freine son utilisation dans la communauté scientifique. Récemment de nombreuses initiatives visent à automatiser le phénotypage des plantes, mais se concentrent sur un ensemble limité de traits, souvent peu compatible avec la définition d’un FSPM (Streit et al., 2023)

Sujet :
L’objectif de ce stage sera de réaliser une première étape de reformulation d’un modèle FSPM d’arbre fruitier, MAppleT (Costes et al., 2008) pour préparer son couplage avec des données numériques issues de différents protocoles d’acquisition (LiDAR, imagerie aéroportée).
Les résultats attendus portent sur
(1) l’évaluation de la faisabilité de reproduire les séquences d’événements développementaux observées en fonction de génotypes différents à partir de reconstructions 3D issues de scans LiDAR en hiver et par des méthodes d’assimilation de données, basées sur du machine ou deep learning (i.e. CNNS, RNNs, LSTMs et Transformers).
(2) la ré-écriture des règles de développement et de ramification d’un modèle FSPM de pommier de façon à pourvoir les paramétriser automatiquement à partir de données issues du phénotypage.

Le stage débutera par une analyse bibliographique des traits accessibles par phénotypage pour la modélisation. Un bilan sera fait des différents traits mesurés par phénotypage LiDAR et imagerie qui seront mis en regard des paramètres des modèles de simulation. En particulier, les aspects de topologie de l’architecture des arbres, notamment leur ramification seront analysés.
– La modification du FSPM MappleT portera principalement sur les paramètres des règles de développement et de ramification des méristèmes formalisées pour l’instant par des règles stochastiques dans le modèle pommier. A partir de reconstructions construites issues de scans LiDAR en hiver, des méthodes d’assimilation de données, basées sur du machine ou deep learning, pour permettre de reproduire les séquences d’événements développementaux observées en fonction des génotypes seront développées. Pour modéliser et simuler ces séquences, différents types d’architecture de réseaux seront testés, (i.e. CNNS, RNNs, LSTMs et Transformers). Les séquences déduites de la reconstruction 3D devront prendre en compte l’incertitude des mesures. Les modèles initiaux de séquences de ramification, construits à partir de modèles de semi chaînes de markov cachées, seront utilisés pour pré-entraîner les modèles de réseaux. Ceux-ci seront évalués pour leur capacité à prendre en compte les effets génotypiques.

Profil du candidat :
– Master en maths-info.

Formation et compétences requises :
– Connaissances : programmation en langage Python, des connaissances en statistiques seront appréciées
– Compétences opérationnelles : Goût pour le travail en équipe et l’inter-disciplinarité
– Langues : français, anglais

Adresse d’emploi :
Avenue Agropolis – 34398 Montpellier Cedex 05, France

Document attaché : 202310241551_Sujet-Bourse-Master2-GIS-Fruits-2024.pdf

Jan
12
Fri
2024
Development of automated segmentation and clustering methods for spICP-ToF-MS time-series in Nanogeochemistry.
Jan 12 – Jan 13 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de physique du globe de Paris, Université
Durée : 6 mois
Contact : tharaud@ipgp.fr
Date limite de publication : 2024-01-12

Contexte :
Nanoparticles (NPs) are pervasive in natural systems, playing a crucial role in nanogeochemistry. The emergence of single-particle time-of-flight inductively coupled plasma mass spectrometry (spICP-ToF-MS) has revolutionized NP characterization, presenting new challenges in data analysis.

Sujet :
This research project seeks to bridge advanced nano-instrumentation with data-driven insights, focusing on the development of standardized methodologies for integrating spICP-ToF-MS with state-of-the-art machine learning algorithms. The IPGP hosts a world-leading geochemistry platform (PARI) equipped with an operational spICP-ToF-MS instrument and possesses an extensive dataset to (1) develop a novel methodology for the automated segmentation and clustering of NP time series generated by spICP-ToF-MS, (2) address challenges including instrumental noise, unknown NP compositions, and large data volumes requiring sophisticated statistical methods, and (3) explore interdisciplinary collaboration between geochemists, data scientists, and analytical chemists.

Preliminary tests have shown encouraging results using a 4-step methodology described and illustrated below:
– Detection: Establish a conservative threshold for detecting significant NP signals within time series data using intensity distribution across channels (b).
– Clustering: Identify families of NP signals through unsupervised clustering algorithms, considering the unknown number of NP families in natural environments.
– Classification: Train a classifier to differentiate various NPs within continuous time series, including an additional noise class, using realistic data.
– Segmentation: Divide time series into segments based on the classifier, addressing the challenge of determining optimal segmentation window size (c).

Profil du candidat :
We seek candidate with a strong background in data science, including machine learning or deep learning tehcniques.

Formation et compétences requises :
Master 2 level or engineering school.

Adresse d’emploi :
IPGP, 1, Rue Jussieu, 75005 Paris

Document attaché : 202311231031_M2 Internship IPGP-LIPADE.pdf

Generation of spatial arrangements for lightening by material removal
Jan 12 – Jan 13 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube UMR 7357
Durée : 6 mois
Contact : remi.allegre@unistra.fr
Date limite de publication : 2024-01-12

Contexte :
The aim of this internship is to identify and generate spatial arrangements of patterns relevant to the removal of material from solid materials for lightening purposes, in the context of construction and civil engineering applications.

Sujet :
The aim is to study geometric and statistical criteria for characterizing spatial arrangements of patterns in relation to desired mechanical properties, and to develop a generation algorithm.

A full description of the subject, together with information on how to apply, is available in the attached document.

Profil du candidat :
Skills:
– Some knowledge and experience in Computer Graphics and/or Image Processing is required.
– Experience in Machine Learning in Python is a plus.
– Curiosity and ability to communicate and share your progress and to make written reports.
– Autonomy and good organization skills.

Formation et compétences requises :
Academic level equivalent to a Master 2 in progress or Engineer in its 5th year, in Computer Science with courses in Computer Graphics and/or Image Processing, and Machine Learning.

Adresse d’emploi :
ICube – UMR 7357
300 boulevard Sébastien Brant
67400 ILLKIRCH

Document attaché : 202311221751_2023-2024-ASAM_Stage_M2_EN.pdf

Jan
15
Mon
2024
Clustering de Réseaux d’ordre supérieur pour des données de transports maritimes
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N
Durée : 5/6 mois
Contact : francois.queyroi@univ-nantes.fr
Date limite de publication : 2024-01-15

Contexte :
Le contexte de ce stage est l’analyse des relations entre lieux à partir de trajectoires maritimes Ces traces peuvent être définies comme des séquences discrètes d’événements (e.g. les différents ports visités par un navire). Dans ce cadre, on s’intéresse aux relations indirectes entre lieux e.g. sachant qu’un navire vient de Shanghai et est actuellement à Singapour, quelle est sa prochaine destination ? On va ainsi chercher à dépasser la représentation usuelle des déplacements sous la forme de graphes en utilisant des « réseaux d’ordre supérieur » (voir Fig. 1). Ces réseaux représentent les probabilités de transitions d’un lieu à un autre en tenant compte d’un historique de déplacement. Ainsi, ce nouveau type de graphe inclut des « noeuds-mémoire » correspondant à des sous-séquence de lieux. Par exemple, le nœud « Singapour/Tokyo » va encoder l’événement « Le navire, actuellement à Singapour, est arrivé de Tokyo ». Ces modèles reflètent mieux les données d’entrées que les modèles « sans mémoire » (chaîne de Markov d’ordre 1) où la probabilité de transition d’un port à l’autre ne dépendra que du port actuel.
La construction et la fouille de ces nouveaux modèles constituent d’important axes de recherche dans le domaine de la fouille de réseaux. Une application importante est la détection de communautés de lieux chevauchantes, qui est l’objectif de ce stage détaillé plus bas. Ce stage se situe dans la prolongation d’avancées récentes sur ce sujet [Saebi et al. 2020, Queiros et al, 2022]. Les résultats obtenus seront valorisés à travers des publications scientifiques et des outils logiciels.

Sujet :
Un premier objectif du stage est de proposer des outils permettant de produire un clustering chevauchant des lieux à partir d’un partitionnement des noeuds-mémoires d’un réseau d’ordre supérieur. En effet, un cluster de lieux doit représenter un groupe de lieux dont la majorité des flux est dirigée vers d’autres lieux du même groupe. Toutefois, certains lieux (typiquement des grands ports du réseau maritime international) vont pouvoir appartenir à différents groupes. Une problématique dans ce cadre est que la façon dont sont construit les réseaux d’ordre supérieur va beaucoup influencer les clusters découverts si on utilise directement des algorithmes classiques [Queiros et al, 2022]. Le stage consistera à développer un algorithme évitant cet écueil. On pourra par exemple proposer une alternative à l’algorithme de clustering Walktrap [Pons et Latapy, 2005] (voir Fig. 2). Cela impliquera toutefois d’utiliser une fonction de scoring qui est définie pour les clusterings chevauchant (par ex. [Esquivel et Rosvall, 2011]). L’algorithme développé pourra être intégré au paquet Python honyx (https://pypi.org/project/honyx).

Un deuxième objectif sera la constitution de jeux de données de trajectoires maritimes par l’utilisation d’API de sites recensant les positions des navires.

Profil du candidat :
Nous cherchons un.e étudiant.e en M2 mathématique/informatique (ou équivalent) intéressé.e et ayant des compétences dans l’analyse de données et la fouille de graphes.
– intérêt pour la Recherche et le travail à la fois en équipe et en autonomie
– bonne maîtrise de Python
– capacités rédactionnelles
– bon niveau d’Anglais

Formation et compétences requises :
Nous cherchons un.e étudiant.e en M2 mathématique/informatique (ou équivalent) intéressé.e et ayant des compétences dans l’analyse de données et la fouille de graphes.
– intérêt pour la Recherche et le travail à la fois en équipe et en autonomie
– bonne maîtrise de Python
– capacités rédactionnelles
– bon niveau d’Anglais

Adresse d’emploi :
Polytech Nantes.
Rue Christian Pauc, 44300 Nantes

Document attaché : 202311081135_sujet_clust2024_fr.pdf

Deep Learning methods for fetal cortical surfaces generation from MRI scans
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de Neurosciences de la Timone
Durée : 5 ou 6 mois
Contact : olivier.coulon@univ-amu.fr
Date limite de publication : 2024-01-15

Contexte :
The human cerebral cortex undergoes dynamic and regionally heterogeneous development during gestation [1]. Cortical surface-based analysis is based on the reconstruction of topologically-correct and geometrically accurate surface representations of the folded, thin cerebral cortex. The fetal cerebral cortex is typically represented as a triangulated mesh with a spherical topology for each brain hemisphere, generated from a tissue segmentation of the structural MRI scan.

Sujet :
In this context, and although various algorithmic solutions have been proposed in the past to propose such meshes, deep learning approaches have now become state-of-the-art for cortical surface generation [2]. The goal of this internship is to evaluate some of these methods. In particular we will evaluate their performance on fetal MR data, that are difficult to process with standard methods.
The candidate will be in charge of:
1. Testing pre-selected deep-learning approaches from the literature (CortexODE [3] CorticalFlow++[4], DeepCSR[5], PialNN[6], Topofit[7]).
2. Comparing these methods on a large dataset of fetal MRI available in the team and containing normal and pathological scans
3. Perform an application study on the obtained surfaces representations to characterize normal and pathological fetal development (optional, depending on progress)

[1] I.Kostović,G.Sedmak,andM.Judaš,“Neuralhistologyandneurogenesisofthehumanfetal and infant brain,” NeuroImage. 2019, doi: 10.1016/j.neuroimage.2018.12.043.
[2] F.Zhao,Z.Wu,andG.Li,“Deeplearningincorticalsurface-basedneuroimageanalysis:a systematic review,” Intell. Med., 2023, doi: 10.1016/j.imed.2022.06.002.
[3] Q.Ma,L.Li,E.C.Robinson,B.Kainz,D.Rueckert,andA.Alansary,“CortexODE:Learning Cortical Surface Reconstruction by Neural ODEs.” arXiv, 2022 http://arxiv.org/abs/2202.08329
[4] R.SantaCruzetal.,“CorticalFlow++:BoostingCorticalSurfaceReconstructionAccuracy, Regularity, and Interoperability,” in MICCAI 2022, doi: 10.1007/978-3-031-16443-9_48.
[5] R.S.Cruz,L.Lebrat,P.Bourgeat,C.Fookes,J.Fripp,andO.Salvado,“DeepCSR:A3D Deep Learning Approach for Cortical Surface Reconstruction,” IEEE/CVF, 2021, https://openaccess.thecvf.com/content/WACV2021/html/Santa_Cruz_DeepCSR_A_3D_Deep_ Learning_Approach_for_Cortical_Surface_Reconstruction_WACV_2021_paper.html
[6] Q.Ma,E.C.Robinson,B.Kainz,D.Rueckert,andA.Alansary,“PialNN:AFastDeepLearning Framework for Cortical Pial Surface Reconstruction,” in Machine Learning in Clinical Neuroimaging, 2021, doi: 10.1007/978-3-030-87586-2_8.
[7] A.Hoopes,J.E.Iglesias,B.Fischl,D.Greve,andA.V.Dalca,“TopoFit:RapidReconstruction of Topologically-Correct Cortical Surfaces,” MIDL, 2021, https://openreview.net/forum?id=-JiHeZNDY3a

Profil du candidat :
Nous recherchons un étudiant en M2 ou Dernière année d’école d’ingénieur, motivé par l’imagerie médicale ou les neurosciences, et possédant les compétences suivantes:

Formation et compétences requises :
– une bonne connaissance des principes de l’apprentissage profond.
– une expérience de python pour l’apprentissage profond (e.g. Pytorch)
– une connaissance de Git et des environnements de type Linux.
– une expériences précédente dans le domaine de l’apprentissage profond est un plus.

Adresse d’emploi :
The intern will integrate the MeCA research team of the Institut des Neurosciences de la Timone, in Marseille, France. The Meca team (www;meca-brain.org)combines expertise in processing of large fetal MRI databases and surface based morphometry methods. Tools and data required for the internship will be provided by the team.

Document attaché : 202310201221_2024_M2_internship_surface_extraction.pdf

Extraction de contenu multimodal — Application au cas des manuels scolaires
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire CEDRIC du CNAM (Paris)
Durée : 5 ou 6 mois
Contact : guinaudeau@limsi.fr
Date limite de publication : 2024-01-15

Contexte :
Le projet ANR MALIN a pour objectif de rendre utilisables les manuels scolaires numériques par les enfants en situation de handicap. En effet, les manuels numériques actuellement disponibles nécessitent d’être adaptés pour être accessibles à ces enfants. Ces adaptations concernent aussi bien les aspects techniques que pédagogiques. Dans la plupart des cas, les manuels sont adaptés de façon artisanale et les délais de livraison peuvent être de plusieurs mois. Ces contraintes ne permettent pas de rendre efficiente l’inclusion scolaire des enfants en situation de handicap. L’objectif du projet ANR MALIN est donc de développer des solutions techniques afin d’aboutir à l’automatisation de l’adaptation des manuels scolaires numériques pour les rendre accessibles (accès, traitement et interaction avec les contenus) aux élèves en situation de handicap. Le projet ANR repose sur une collaboration entre quatre laboratoires : LISN (Université Paris-Saclay), MICS (Ecole CentraleSupelec), CEDRIC (CNAM), Inserm 1284 (CRI, Université de Paris).

Sujet :
L’objectif du stage consiste à concevoir des approches d’extraction automatique de la structure d’un exercice de manuel scolaire (consignes, enoncés, exemples, etc.) et de son contenu multimédia (textes, images, dessins, graphiques, équations, courbes…) à partir des fichiers fournis par les éditeurs (ceux-ci sont le plus souvent au format pdf). Plusieurs approches seront à envisager : une approche d’adaptation et d’enrichissement de systèmes de structuration automatique de documents textuels (segmentation thématique, segmentation discursive) prenant en compte la spécificité et la multi-modalité des données traitées et une approche basée sur le traitement automatique des images visant à identifier les différents blocs en se basant sur les caractéristiques de l’image, connue sous le nom de « Document Layout Segmentation and Analysis » [1, 2]. Des approches récentes d’apprentissage profond seront testées sur des jeux de données annotées manuellement afin d’adapter des modèles existants et obtenir des résultats d’extraction satisfaisants.

[1] Wang, Jiapeng, Lianwen Jin, and Kai Ding. “Lilt: A simple yet effective language-independent layout transformer for structured document understanding.” arXiv preprint arXiv:2202.13669 (2022).
[2] Huang, Yupan, et al. “Layoutlmv3: Pre-training for document ai with unified text and image masking.” Proceedings of the 30th ACM International Conference on Multimedia. 2022.

Profil du candidat :
Master en informatique ou TAL avec une spécialisation dans au moins un des domaines suivants :
○ traitement automatique des langues
○ apprentissage automatique

Formation et compétences requises :
Maîtrise de Python (langage de prédilection du projet)
La connaissance des principales librairies d’apprentissage sera appréciée.

Adresse d’emploi :
Lieu de travail : Laboratoire CEDRIC du CNAM
Durée du contrat : 5/6 mois
Début souhaité : printemps 2024
Contact : Pour postuler, merci d’envoyer un CV, les notes de M1 et M2 et une lettre de motivation à Camille Guinaudeau (guinaudeau@limsi.fr), Olivier Pons (olivier.pons@lecnam.net) et Caroline Huron (caroline.huron@cri-paris.org).

Document attaché : 202311080140_SujetStageMALIN_extraction.pdf

Fairness in Machine Learning on Graphs
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab / INSA Rouen
Durée : 6 months
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2024-01-15

Contexte :
Fairness is a major ingredient for Safe and Trustworthy Artificial Intelligence (AI). It is central to have fair Machine Learning (ML) models in any AI system in major application areas, and it is even more crucial in medicine. Within this context, the ANR project FAMOUS aims to address fairness in Machine Learning with multimodality. This project brings forth experts in Machine Learning and Neuroscientists from 4 major research institutes in France and a company: Laboratoire d’Informatique et Systèmes (Marseille), Institut des Neurosciences de la Timone (Marseille), Laboratoire Hubert Curien (Saint Etienne), LITIS Lab (Rouen) and Euranova (R&D division in France). Within this environment, we are offering this Master’s internship in the LITIS Lab at the INSA Rouen Normandy, with the possibility to pursue a PhD thesis.

Sujet :
Unfairness starts from the existence of biases in the datasets used to learn ML models. The main advances in deep learning in ML are due to learning an embedding of data in a latent space that is appropriate for the given task at hand. Thus, the performance of the ML model highly depends on the investigated embedding, and so does its fairness.

Dealing with graph data is more complex than Euclidean data due to their structure. This internship considers the problem of learning from a set of graph data – multiple graphs – (as opposed to graph mining of a single large-scale graph, e.g. social network). Since an explicit embedding of graphs into a Euclidean space suffers from information loss and restricted precision, graph embedding will be considered with graph neural networks (GNNs) [1, 2].

The internship aims to study bias-free embedding with GNNs. Within the last few years, there has been an increased interest in fairness-promoting graph embedding methods, mainly for node embedding in network mining with applications on social networks [3, 4, 5], and more recently using GNNs as black boxes [6]. Within this internship, the intern will explore this research direction of bias-free GNNs. She/he will investigate relevant methods and devise the appropriate algorithms to address datasets of MRI of the brain. It is worth noting that graph representations have demonstrated their relevance for characterizing MRI of the human brain, such as for the analysis of the brain activity and of its cortical folding. This application will be conducted within a narrow collaboration with the Institut des Neurosciences de la Timone.

The objectives of the internship are as following:
1- Familiarize herself/himself with fairness in GNNs.
2- Explore the most relevant methods on well-known graph datasets.
3- Devise appropriate method for the MRI application at hand.
4- Gain hands-on with graphs constructed from brain MRI datasets.
These objectives will allow to lay the groundwork for advanced research in a subsequent PhD.

Research Environment

This intern will conduct her/his research within the Machine Learning group in the LITIS Lab, under the supervision of Dr. Benoît Gaüzère and Prof. Paul Honeine. This internship will be conducted within the research project FAMOUS, and within a strong collaboration with the Institut des Neurosciences de la Timone.

Duration and Location

– The internship will last 5 to 6 months, starting from February or March 2024.
– It will be located at INSA Rouen Normandie, within the ML team of LITIS lab, France.

[1] M. Balcilar, G. Renton, P. Héroux, B. Gaüzère, S. Adam, and P. Honeine. “Analyzing the Expressive Power of Graph Neural Networks in a Spectral Perspective”. In: ICLR. 2021.
[2] M. Balcilar, G. Renton, P. Héroux, B. Gaüzère, S. Adam, and P. Honeine. “When Spectral Domain Meets Spatial Domain in Graph Neural Networks”. In: ICML – Workshop on Graph Representation Learning and Beyond. 2020.
[3] A. Bose and W. Hamilton. “Compositional fairness constraints for graph embeddings”. In: ICML. 2019.
[4] J. Kang, J. He, R. Maciejewski, and H. Tong. “Inform: Individual fairness on graph mining”. In: ACM SIGKDD Int. Conf. Knowl. 2020.
[5] J. Palowitch and B. Perozzi. “Debiasing Graph Representations via Metadata-Orthogonal Training”. In: IEEE/ACM ASONAM. 2020.
[6] E. Dai and S. Wang. “Say No to the Discrimination: Learning Fair Graph Neural Networks with Limited Sensitive Attribute Information”. In: WSDM. 2021.

Profil du candidat :
– Student in final year of Master or Engineering School, in applied mathematics, data science, artificial intelligence, or related fields

Formation et compétences requises :
– Strong skills in data analysis and Machine Learning
– Good programming skills in Python and the scientific ecosystem numpy/pytorch
– Interest in neuroscience and/or ML fairness

Application

Interested candidates are invited to send by email a CV, a cover letter expressing their interest and background in the subject, and academic transcripts. Reference letters may also be beneficial.

Contacts

Benoit Gaüzère : benoit.gauzere@insa-rouen.fr
Paul Honeine : paul.honeine@univ-rouen.fr

Adresse d’emploi :
INSA Rouen

Document attaché : 202311262056_Internship – FAMOUS.pdf

Master Internship on Enabling XAI in IoT-enhanced Spaces at Institut Polytechnique de Paris
Jan 15 – Jan 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : SAMOVAR
Durée : 6
Contact : aikaterini.tzompanaki@cyu.fr
Date limite de publication : 2024-01-15

Contexte :
With the emergence of the Internet of Things (IoT) and computing (cloud-edge) continuum technologies
infrastructures are becoming more sensorized, fueling the development of smart space ecosystems and
improving societal quality of life. As a result, smart spaces are becoming popular in many domains,
including healthcare, education, building management, and more. This integration with the IoT brings
much potential in revolutionizing the way that these environments operate. Initially, IoT sensors mea-
sure physical phenomena (temperature, energy consumption, luminosity) in a continuous way, producing
streams of data. Such data is often used for analysis and predictions to either optimize different criteria
(e.g., occupancy, user comfort, energy consumption, etc.), or identify and anticipate problems. To man-
age and control the data generated by IoT devices, AI algorithms can be used to enable smarter, more
efficient, and more responsive devices to their environment.

Sujet :
To enable efficient decision making, it is increasingly common that predictions be accompanied by
explanations, i.e., pieces of information either on the data, the models, or both for giving insights on
why the predictions were made. For example, a smart building employs IoT devices to measure energy
consumption of different plugs in households, as well as temperature of different rooms. Using this
measurements as training data, a Machine Learning model can be used to predict the energy consumption
of the air-conditioning appliance plug (label) using different IoT data features (e.g., temperature). Since
this is a continuous setting scenario, at time t1 we may have gathered D1 data, which we use to train a
decision tree M1. At a later time t2, incrementally we have obtained D1 ⊂ D2, along with a new trained
model M2. Let’s assume the following predictions made by M1 and M2 for a test point p: y1 = M1(p) =
10watts and y2= M2(p) = 50watts. An example of traditional local explanations for these two predictions
could be e1 : p.temperature = 20 while e2 : p.temperature = 35. We argue that a more informative
and correct explanation would be the information that the distribution of the training data has changed;
it is not only that the current temperature is at 35 degrees, but also that the timestamps with high
temperatures appear more often in the data than before t1.
This internship aims to study the usage of data distribution changes through time for the construction
of more pertinent XAI models for IoT-enhanced spaces. Use cases will be provided from existing data
models and data instances from IoT devices deployed in smart spaces of the Institut Polytechnique de
Paris (IP Paris). The successful candidate will be considered for a 3 year PhD contract at the end of the internship

Profil du candidat :
Internship Objectives
The selected candidate will be working on the following tasks:
– Get familiar with data models for smart spaces.
– Leverage datasets of smart spaces for prediction and decision making.
– Study data drifts and distribution changes in datasets for IoT space predictions.
– Propose explanation formalizations based on data distribution changes.

Formation et compétences requises :
Master 2 on computer science or last year of engineering school.

Adresse d’emploi :
Telecom SudParis, Evry or Palaiseau

Document attaché : 202311091058_XAI_IoT_internship.pdf

Jan
26
Fri
2024
Développement d’IA pour la prédiction de besoins de lit dans les hôpitaux.
Jan 26 – Jan 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : école d’ingénieur ISIS Castres
Durée : 5 à 6 mois
Contact : imen.megdiche@univ-jfc.fr
Date limite de publication : 2024-01-26

Contexte :
Actuellement, le temps d’attente moyen dans les services d’urgence est alarmant, atteignant une moyenne de 9 heures, principalement en raison d’une gestion perfectible des ressources disponibles à l’hôpital. Il est essentiel de noter que 75 % des admissions à l’hôpital découlent d’admissions non programmées suite à des passages aux urgences.

Sujet :
L’objectif de ce stage est d’élaborer un modèle d’intelligence artificielle visant à anticiper les besoins en lits pour chaque service hospitalier suite aux admissions non programmées aux urgences. Actuellement, le temps d’attente moyen dans les services d’urgence est alarmant, atteignant une moyenne de 9 heures, principalement en raison d’une gestion perfectible des ressources disponibles à l’hôpital. Il est essentiel de noter que 75 % des admissions à l’hôpital découlent d’admissions non programmées suite à des passages aux urgences.
Ce stage s’inscrit dans un projet recherche avec l’entreprise Atout Majeur Concept (AMC). Nous envisageons de croiser plusieurs types de données issues du SI de l’entreprise pour propose une approche IA , basée sur du MultiTask Leanring afin de prédire des besoins en lits sur une période de 7 à 15 jours.
Le stagiaire sera chargé de : faire une revue des travaux connexes dans la littérature, mettre en œuvre l’intégralité de la chaîne de développement de l’intelligence artificielle et de produire un livrable à tester avec l’ entreprise AMC.

Profil du candidat :
Des compétences en pyhton pour la data science
Connaissances solides en IA .
Rigoureux et autonome.
Très bon niveau de communication orale et écrite (anglais/ Français )

Formation et compétences requises :
formation en IA ou machine learning requise ( master ou école d’ingénieur)

Adresse d’emploi :
95 rue firmin Oulès , 81100 Castres

Développement et évaluation d’une descente d’échelle statistique des prévisions météorologiques sur la Réunion avec des méthodes de deep learning
Jan 26 – Jan 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Centre National de Recherches Météorologiques
Durée : 6 mois
Contact : laure.raynaud@meteo.fr
Date limite de publication : 2024-01-26

Contexte :
Les prévisions météorologiques opérationnelles sur les domaines Outre-Mer ont vu leur résolution spatiale augmenter de 2.5km à 1.3km à l’été 2022. Cette évolution a permis d’améliorer la performance des prévisions, en particulier pour les événements à enjeux tels que les cyclones tropicaux et les fortes pluies. Des résolutions hectométriques permettraient de gagner encore en réalisme, en particulier sur l’île de la Réunion dont le relief est complexe. Néanmoins, le coût des prévisions à des résolutions de quelques centaines de mètres ne permet pas d’envisager leur utilisation opérationnelle avant plusieurs années.

Une alternative moins coûteuse à cette descente d’échelle dynamique est la descente d’échelle statistique. L’objectif est d’apprendre une relation statistique entre les prévisions basse résolution (par exemple 2.5km ou 1.3km) et les prévisions haute résolution (par exemple 500m). Les méthodes de descente d’échelle les plus classiques reposent sur des interpolations simples ou des approches de régression linéaire. Récemment, plusieurs études ont montré que des méthodes d’apprentissage profond tels que les réseaux de neurones convolutifs offrent des perspectives intéressantes pour la descente d’échelle (Vandal et al., 2018; Baño-Medina et al., 2019, Leinonen et al., 2020; Höhlein et al. 2020, Sha et al., 2020).

Sujet :
L’objectif du travail proposé est de développer une descente d’échelle à 500m des prévisions sur la Réunion, par apprentissage profond, et pour des variables de temps sensible telles que la température, le vent et les précipitations. Un premier stage en 2023 a permis de mettre en place les jeux de données et d’évaluer deux architectures : un réseau convolutif simple de type U-Net et un modèle de diffusion. Les premiers résultats sont encourageants et plusieurs pistes d’approfondissement et d’amélioration sont envisagées, qui feront l’objet du présent stage, parmi lesquelles :
1. l’intégration de contraintes physiques dans les réseaux
2. l’amélioration des modèles de diffusion et de leur coût d’inférence : des variantes telles que les modèles implicites (Song et al., 2021), la diffusion latente ou la distillation progressive (Salimans et Ho, 2022) pourront être implémentées
3. la descente d’échelle stochastique, au travers de la génération d’ensembles de prévisions
4. la descente d’échelle pour les précipitations.

Profil du candidat :
Le stage requiert un réel intérêt pour la prévision du temps. De bonnes compétences en statistiques également sont attendues. Le langage de programmation utilisé sera Python. Une connaissance préalable du fonctionnement des réseaux de neurones profonds (en particulier des réseaux convolutifs) est souhaitée. Une première expérience d’une bibliothèque de Deep Learning (PyTorch, TensorFlow, …) serait un plus.

Formation et compétences requises :
Ecole d’ingénieur ou M2.

Adresse d’emploi :
CNRM, Toulouse.

Document attaché : 202310251324_Fiche-proposition-PFE_IENM_IA500m_2024.pdf

Jan
30
Tue
2024
Postdoctoral Position – Systems Biology of Neuronal Vulnerability in Neurodegenerative Diseases, Paris, France
Jan 30 – Jan 31 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Brain-C Lab, Institute of Biology Paris-Seine (IBP
Durée : 2 years (CDD)
Contact : christian.neri@inserm.fr
Date limite de publication : 2024-01-30

Contexte :
Brain-C Lab, Institute of Biology Paris-Seine (IBPS), Paris

see http://www.ibps.upmc.fr/en/research/biological-adaptation-and-ageing/brainc)

Research on neurodegenerative disease mechanisms and targets

Sujet :
the project addresses outstanding questions about the temporal and molecular dynamic of neurodegenerative disorders and define new therapeutic rationales for early-stage intervention in these disorders. The successful applicant will use BioGemix —our machine learning platform for biological precision in leveraging complex omics data— to analyze omics data (e.g., epigenomic data, transcriptomic data) obtained in models of amyotrophic lateral sclerosis (ALS) and compare resulting models to computational models of neurodegenerative disorders such as Huntington’s disease (HD). In addition to using existing approaches (feature selection, network inference, shape analysis), the successful applicant will also have the possibility to develop innovative machine-learning approaches for modeling and simulating gene regulatory networks and for optimal target selection, in collaboration with mathematicians and bioinformaticians inside and outside the team. This position is a unique opportunity to further develop expertise and skills in a multidisciplinary team and network of direct collaborators that cover systems modeling, cellular neurobiology and preclinical/clinical research.

Profil du candidat :
The candidates are expected to be highly-qualified and to have strong collaborative skills and commitment to team work along with strong ability to work independently, and to have track record of expertise & writing papers as demonstrated by publications and pre-prints. The position is full time and on site, and candidates should have less than 5 years of postdoctoral experience and a strong interest for research in biology.

Formation et compétences requises :
Candidates should hold a Ph.D. in Informatics/Bioinformatics or Mathematics or Probability & Statistics or Physics. Candidates that hold a diploma from high-profile Engineer Schools (e.g. Ecole Polytechnique, Supelec, Centrale, EPFL, ETZ) are welcome to apply.

• Demonstrated experience and autonomy in probability and statistics for the analysis of complex datasets (probabilistic models, R)
• Good autonomy in machine programming (at least one of the following languages: Python, C/C++, Java).
• Skills in database management or web technologies (javascript, Php) are desirable but not mandatory.
• Knowledge of genome sciences and omics technologies will be a plus.

Adresse d’emploi :
IBPS, Campus de Jussieu
9 Quai St Bernard
75005 Paris – France

RESEAUX DE NEURONES GUIDES PAR LA PHYSIQUE pour l’ETUDE D’UNE CHRONIQUE PIEZOMETRIQUE
Jan 30 – Jan 31 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Aprona et UMR ITES, Strasbourg
Durée : 6 mois
Contact : fahs@unistra.fr
Date limite de publication : 2024-01-30

Contexte :
L’APRONA (Association pour la Protection de la Nappe Phréatique de la plaine d’Alsace – www.aprona.net/), a pour principales missions la surveillance qualitative et quantitative de la nappe d’alsace et des aquifères du Sundgau. Elle assure ainsi la gestion des réseaux d’observation des eaux souterraines, la collecte et l’exploitation des données ainsi que leur diffusion et leur communication.

La nappe d’Alsace, partie intégrante du réservoir aquifère le plus important d’Europe, constitue un patrimoine naturel et un enjeu économique majeur pour l’alimentation en eau potable, en eau d’irrigation et en eau industrielle. Les échanges eaux superficielles – eaux souterraines, très fréquents, sont la caractéristique principale de ce hydro-système unique par sa taille. Les fluctuations de niveau, plus ou moins importantes suivant l’endroit et les types d’événements qui en sont la cause, ne sont pas sans conséquence sur le milieu naturel et les activités humaines : assèchement des zones humides, remontées d’eau dans les caves et les parkings souterrains, incidences sur l’importance et la propagation des pollutions.

Sujet :
Face à ces enjeux accentués par les impacts du changement climatique1, comment prédire efficacement la réaction de la nappe afin de mieux faire face aux situations de crises (crue et sècheresse) ?
Connaissant les facteurs responsables de l’évolution de la recharge2 des nappes, plusieurs approches modélisation sont alors possibles. Avec les progrès dans le domaine de développement des cartes graphiques (GPU), les réseaux de neurones d’apprentissage profond émergent comme une nouvelle technique pour la modélisation avec d’excellents résultats dans de nombreux domaines et applications scientifiques. Un intérêt particulier est porté actuellement à l’utilisation de ces techniques pour la gestion des ressources en eaux souterraines. Cependant, dans contexte, la mise en œuvre des réseaux de neurones est limitée par la disponibilité et la qualité des données. Très récemment (en 2019), une nouvelle classe des réseaux de neurones a fait son apparition pour pallier ce problème. Dans cette classe, connue sous le nom PINNs (Physics Informed Neural Networks), l’apprentissage du réseau est guidé par les lois physiques et peut se faire d’une façon efficace même avec peu de données. L’intégration des lois physiques dans l’apprentissage des réseaux permet de les rendre plus fiables pour la prédiction des effets des changements climatiques, où les modèles basés uniquement sur les données peuvent être moins fiables dans des conditions différentes de celles observées. Les PINNs sont prometteurs dans différentes applications scientifiques. Leur application dans le domaine de la gestion des eaux souterraines est actuellement l’un des défis de la communauté scientifique. Ceci représente l’objectif principal de ce stage.
Une formation spécifique est prévue pour faciliter l’accès vers cette méthode.

La méthodologie du stage repose sur les trois tâches suivantes :
1. Formation
a. Synthèse bibliographique (analyse des documents fournis)
b. Compréhension des processus physiques et des modèles mathématiques
c. Prise en main des outils (PINNs, Python et modèle éléments finis)
2. Modèle PINNS (cas synthétique)
a. Construction d’un modèle PINNs sans données pour l’écoulement souterrain en nappe libre
b. Vérification du modèle par comparaison à un modèle éléments finis
3. Cas réel (échange nappe et cours d’eau)
a. Construction d’un modèle PINNs pour un cas réel impliquant des processus d’échange nappe-rivière et utilisation des données d’observation avec les PINNs.
b. Evaluation de la fiabilité des prédictions du modèle PINNs.
c. Evaluation de l’intérêt d’utiliser PINNs par rapport à un modèle de réseaux de neurones standard.

Profil du candidat :
Master 2 ou 3ème année d’école d’ingénieur dans les domaines suivants : Mathématiques appliquées (méthodes numériques, statistiques, probabilités) ; Sciences des données ; Mécanique des fluides ; Physique ; Sciences de la terre et de l’environnement.

Formation et compétences requises :
– Des connaissances en Python sont impératives. Une volonté de développer ces compétences est indispensable.
– Capacité à travailler en groupe ; Bonne aptitude à la communication interpersonnelle ; Assimilation de nouvelles connaissances.

Adresse d’emploi :
Le stage aura lieu dans l’Institut Terre et Environnement de Strasbourg (ITES : https://ites.unistra.fr/).
Le stagiaire sera encadré par un hydrogéologue (APRONA) et par François Lehmann et Marwan Fahs enseignant-chercheurs à ITES

Document attaché : 202311191633_FICHE_STAGE_2024_ITES.PDF

Study Engineer Position – Bioinformatics & systems modeling for neurodegenerative disease research, Paris, France
Jan 30 – Jan 31 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Brain-C Lab, Institute of Biology Paris-Seine (IBP
Durée : 2 years (CDD)
Contact : christian.neri@inserm.fr
Date limite de publication : 2024-01-30

Contexte :
Research on neurodegenerative disease mechanisms and targets

Sujet :
A two-year position is immediately available in the Brain-C Lab in Paris for a bioinformatician at the Study Engineer (IE) level (post-master position). The selected candidate will work with a team of mathematicians, bioinformaticians, and neurobiologists on modeling time- and cell-resolved omics data to built computational models of molecular pathogenesis in neurodegenerative diseases such as amyotrophic lateral sclerosis (ALS), integrate data from other diseases such as Huntington’s disease (HD) and disseminate data via online platforms. The selected candidate will use BioGemix, our post-omics machine learning platform and related databases. This position is a unique opportunity to further develop expertise and skills in a multidisciplinary team and network of direct collaborators that cover systems modeling, database development, and cellular neurobiology for breakthrough in neurodegenerative disease research.

Profil du candidat :
The candidates should hold a Master in Biofinformatics or a Master in Informatics and they should have no more than 3-4 years of post-master experience. The position is full time, on site, and candidates should have strong collaborative skills and commitment to team work along with strong ability to work independently in addition to strong interest for research.

Interested candidates should apply immediately by sending a letter of motivation, a full CV, and the names and emails of two-three references to christian.neri@inserm.fr and lucile.megret@sorbonne-universite.fr

Formation et compétences requises :
• Programming autonomy on at least one of the following languages: python, R, C / C ++.
• Good knowledge of basic web technologies: PHP, MySQL, JavaScript, jQuery.
• Fluency in using Ubuntu.
• Hands-on experience with in house server maintenance (Backup, shared space, and webserver).
• Scientific English essential
• Skills in data visualization will be a plus.
• Experience working with NGS data and performing respective bioinformatic pipelines in order to process sequencing data will be a plus.
• Basic knowledge in statistics and machine learning are desirable but not mandatory.

Adresse d’emploi :
IBPS, Campus de Jussieu
9 Quai St Bernard
75005 Paris – France

Jan
31
Wed
2024
Analyse topologique de mouvements de grains dans une séquence d’images 3D
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC
Durée : 6 mois
Contact : nicolas.passat@univ-reims.fr
Date limite de publication : 2024-01-31

Contexte :
cf. https://kenmochi.users.greyc.fr/tmp/sujetStageM2_2024_YK-NP.pdf

Sujet :
cf. https://kenmochi.users.greyc.fr/tmp/sujetStageM2_2024_YK-NP.pdf

Profil du candidat :
cf. https://kenmochi.users.greyc.fr/tmp/sujetStageM2_2024_YK-NP.pdf

Formation et compétences requises :
cf. https://kenmochi.users.greyc.fr/tmp/sujetStageM2_2024_YK-NP.pdf

Adresse d’emploi :
Caen

Conception et implémentation d’un lac de données de robotique agricole
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : INRAE-Univ Clermont Auvergne
Durée : 5-6 mois
Contact : sandro.bimonte@inraefr
Date limite de publication : 2024-01-31

Contexte :
Pour accompagner la transition agroécologique, les robots ont un rôle essentiel à jouer dans le domaine de l’agriculture intelligente. Ils sont capables d’effectuer des opérations agricoles répétitives et précises sur une longue période avec un faible impact sur l’environnement.

Avec des équipements particuliers, et associés à des technologies d’acquisition et de traitement de données, les robots sont capables d’effectuer de manière autonome des tâches ciblées de manière efficace dans les champs.

De nombreux travaux de recherche portent sur l’agriculture intelligente. Dans le cadre du projet ISITE CAP2025, deux projets se sont intéressés à la gestion de données de l’agriculture. Le premier a réalisé une architecture Big Data pour le traitement des données des robots et des capteurs (avec Apache Kafka et Spark), ainsi qu’une base de données relationnelle pour stocker ces données. Le deuxième de type lac de données, le CEBA (Cloud Environnemental au Bénéfice de l’Auvergne), s’est intéressé à la collecte, l’ingestion et la restitution des données issues de capteurs bas débit en utilisant la pile Elastic et des bases de données relationnelles manipulant des données semi-structurée, sans fonctionnalité d’analyse.

Sujet :
Dans ce travail de stage, nous visons à mettre en place, dans le CEBA, un lac de données (data lake) complet (intégrant les outils des deux projets précédents) pour le stockage et l’exploration des données sources.

En particulier le travail consiste à :

– étudier et comparer les travaux existants sur les lacs de données spatiales : stockage et exploration

– caractériser les flux et implémenter un système d’ingestion (kafka, redpanda…)

– implémenter le système de stockage des données (ex. Apache Hadoop HDFS ou PostGIS)

– concevoir un modèle de métadonnées et implémenter un système de métadonnées

– implémenter un système d’exploration des données (ex. Apache Atlas, Open Metadata, Geonetwork, etc.)

Profil du candidat :
Master 2

Formation et compétences requises :
Outil Big Data (Hadoop, S3, Kafka)
Programmation: Java, Python, Spark
SQL, NoSQL

Adresse d’emploi :
Campus Cezeaux, Aubiere

Document attaché : 202401131652_sujetBigData.pdf

Construction et validation statistique de modèles dédiés à la génération de traces d’événements associées à des séries temporelles multivariées. Application au cas d’une cohorte de patients ayant subi une chirurgie avec anesthésie générale.
Jan 31 – Feb 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N
Durée : 6 mois
Contact : hugo.boisaubert@univ-nantes.fr
Date limite de publication : 2024-01-31

Contexte :
Ce stage s’inscrit dans le cadre d’une collaboration à l’interface entre numérique et santé, avec Le Laboratoire Expérimental de SImulation en Médecine Intensive (LE SiMU) de Nantes Université. Le SiMU permet notamment de se perfectionner dans la gestion de situations critiques en anesthésie. Il intervient sur simulateurs de patients haute-fidélité( mannequins), avec immersion des acteurs en formation dans une équipe médicale humaine pleine-échelle interprofessionnelle. Dans le but d’améliorer la sécurité et la qualité des soins per-opératoires, les formateurs du SiMU souhaitent varier la diversité des scénarios à proposer aux internes en anesthésie et infirmiers anesthésistes, en formation initiale, ainsi qu’aux praticiens plus expérimentés, en formation continue.

Pour varier les scénarios, il est proposé à terme d’automatiser la génération de scénarios réalistes desimulation, en s’appuyant sur tout ou partie de la base de profils anesthésiques enregistrés par le CHU de Nantes depuis 2004 (500 000 profils anesthésiques). Dans cette modalité assistée par le numérique, la personne qui suit la formation (interne ou infirmier), fait partie de l’équipe médicale. Les autres membres de l’équipe médicale sont simulés très simplement (icônes réalisant des actions et émettant des
informations, sur l’écran de l’ordinateur assigné à l’apprenant). De cette innovation est attendu un accès potentiel à une grande variété de scénarios réalistes de simulation de cas d’anesthésie. Servir cet objectif
de formation répond également à terme au besoin d’anticipation par prédiction de risque, inhérent au paradigme de la médecine personnalisée, en pleine émergence.

Les CHU ont obligation légale d’enregistrer toutes les données relatives aux interventions chirurgicales.

Parmi ces dernières, figurent les profils anesthésiques des patients. Un profil anesthésique est constitué d’une trace d’événements et d’une série temporelle multivariée. La trace d’événements est la séquence
horodatée des actions de l’équipe médicale (e.g., administration d’un anesthésique). Les actions déterminent l’évolution des paramètres physiologiques du patient. La série temporelle multivariée
correspond à un ensemble de séries temporelles univariées qui décrivent chacune l’évolution d’un paramètre physiologique du patient (e.g., fréquence cardiaque).

Sujet :
L’accès aux données médicales est particulièrement contraint en raison du cadre réglementaire qui s’applique à ce type de données. Un générateur de données réaliste a donc été développé au sein de l’équipe DUKe du LS2N, grâce à l’expertise des partenaires du SiMU / CHU de Nantes.

Le premier objectif de ce stage est de tester sur ce type de données, les modèles et méthodes élaborés par la collaboration LS2N / LE SiMU / CHU de Nantes.

Une approche par expertise, utilisant l’expertise des soignants en anesthésie, sera utilisée pour construire un modèle du déroulement d’une chirurgie choisie. Ce modèle se présentera sous la forme d’une grammaire formelle. Cette grammaire servira ensuite de guide pour l’adaptation du générateur de données réalistes à la chirurgie choisie, ainsi que pour la construction de la représentation synthétique évoquée ci-dessous.

Pour générer un simulateur de scénarios réactifs, deux axes de recherche ont été explorés au sein de l’équipe DUKe du LS2N. Ils portent respectivement sur une approche de data mining / raisonnement à
base de cas, et une approche machine learning (modèle de Markov à changements de régimes et autorégressif). Les travaux du stage exploreront la première catégorie d’approche, centrée sur la
construction d’une représentation synthétique des scénarios observés sur une cohorte de patients.

Le but des travaux est d’utiliser les données de santé issues des profils anesthésiques observés dans une cohorte de patients, pour construire des scénarios réactifs. Il faut pouvoir intégrer dans une seule structure de données l’ensemble des éléments nécessaires pour jouer les scénarios.

Des travaux récents de l’équipe DUKe, dont la publication est à venir, ont amené à faire émerger une nouvelle représentation de connaissances pour des données complexes, comme le sont les profils anesthésiques. Cette représentation appelée représentation synthétique associe de manière novatrice · les différentes séquences d’actions médicales d’une cohorte de patients (ayant subi la même chirurgie), sous la forme d’un graphe orienté,
· des séries temporelles multivariées consensus, associées à chaque intervalle de temps séparant deux actions médicales successives.

La représentation synthétique des traces d’actions médicales d’une cohorte de patients peut être le support utilisé pour générer des scénarios réactifs. En effet, ce type de représentation contient tous les
éléments pour contrôler l’évolution d’un patient numérique soumis à des actions médicales

Dans le cadre de ce stage, le/la stagiaire aura à produire une représentation synthétique pour la chirurgie prise en compte. La grammaire formelle construite sera utilisée pour construire
la représentation synthétique. La ou les représentations synthétiques produites seront testées et évaluées statistiquement afin de
mesurer la similarité des scénarios générés aux scénarios observés.

Par ailleurs, grâce à leur caractère synthétique, ces représentations peuvent représenter des opportunités de réponse aux problématiques d’anonymisation de jeux de données complexes, multivariées et
interdépendantes, comme c’est le cas des profils anesthésiques.

Le stage pourra éventuellement explorer les opportunités que représentent les représentations synthétiques pour la production de jeux de donnés réalistes anonymisées.

Profil du candidat :
Profil Master Bioinformatique / Statistique avec compétences en programmation ou Master Informatique, avec un intérêt marqué pour les travaux en collaboration avec des professionnels de santé et des informaticiens/bioinformaticiens.

Formation et compétences requises :
Intérêt pour la gestion de données médicales et l’anonymisation
de données. Rigueur en programmation et capacité à générer de la documentation, avec usage des outils standard (Git, Doctest, Sphinx). Des compétences en bases de données (SQL, pour la curation de données,
éventuellement) sont attendues et une expérience en calcul intensif (ordonnanceur, parallélisation) sera appréciée. Capacités à rendre compte de son travail régulièrement.

Adresse d’emploi :
LS2N – Site Faculté des Sciences et des Techniques
Campus Lombarderie
2 chemin de la houssinière
44300 Nantes

Document attaché : 202311252322_sujet_2023_2024_bdlbs_m2_repres_synth_23_11_24_thur_14h12-1.pdf