
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire ImViA, Dijon, France & CHU Dijon, Fran
Durée : 6 mois
Contact : franck.marzani@u-bourgogne.fr
Date limite de publication : 2025-03-31
Contexte :
Wide-band tympanometry (WBT) is a routine and non-invasive clinical tool to estimate the micromechanical properties of the middle and inner ears. The system delivers a pure-tone signal into the ear at several frequencies and records the reflecting signal in the ear canal. Il also analyses the absorbance at different pressures in the ear canal (-300 to +300 daPa). It estimates the reflectance and the absorbance of the recorded sound and thus provides interesting indicators of tympanic membrane and ossicular chain mobility, and middle ear pressure. The ear is connected to the intracranial space through the inner ear structures. An increase in the intracranial pressure (ICP) changes the micromechanical properties of the middle ear and the WBT signal. The relation between intracranial pressure and WBT signal alterations is complex and poorly studied. The WBT signal varies between individuals and these 2 obstacles hamper the estimation of intracranial pressure by WBT. Monitoring the ICP is crucial in patients undergoing intracranial surgical procedures or in those with head trauma. The gold standard for measuring ICP is invasive pressure sensors placed inside the head. Developing non-invasive ICP measurements would be a significant breakthrough in the neurosurgical field.
We have undertaken a clinical study in the intensive care unit (Dijon hospital) for the measurement of ICP with the intracranial invasive system and multiple WBT recordings on both ears in 20 patients after head trauma or surgery. The database includes 1200 recordings with corresponding invasive ICP values (ground truth). Each WBT recording is composed of absorbance values for probe sound frequencies ranging from 120 to 8000 Hz and for ear canal pressures ranging from -300 to +300 daPa).
Sujet :
The aim of the study is to develop a neural network to analyze the data and to estimate the ICP in 3 categories of pressure (low, medium, high). As a first step, the person recruited will have to understand the physical meaning of the signals handled. He/she will then have to propose and implement a deep learning architecture capable of modeling the relation between ICP and WBT signals in order to meet the objective of estimating.
This study opens insights to the understanding of the mechanisms connecting the middle ear micromechanics and ICP.
Profil du candidat :
Master or engineering student in imaging, computer vision.
Strong skills in image analysis, AI, programming such as Python.
Interest in working as part of a team in an interdisciplinarity environment. Interest in healthcare applications.
Enthusiasm for research. Autonomy.
Formation et compétences requises :
Applicants are invited to submit their application to: Franck MARZANI (franck.marzani@u-bourgogne.fr) and Alexis BOZORG GRAYELI (alexis.bozorggrayeli@chu-dijon.fr).
Application must contain the following documents: cover letter, CV, transcript of the last 2 years, at least 2 reference letters or referral contacts.
Adresse d’emploi :
Laboratoire ImViA, Dijon, Université de Bourgogne
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : IBISC, Univ. Évry Paris-Saclay/MIT
Durée : 6
Contact : massinissa.hamidi@univ-evry.fr
Date limite de publication : 2025-03-31
Contexte :
Context
This project will lead to concrete machine learning empirical insights intended to be exploited in the larger context of IHU Prometheus, a multi-year large-scale research and training institute for understanding sepsis disease. The student will also have the opportunity to get involved in ongoing collaboration with the IMES at MIT.
Sujet :
Project description
Machine learning is increasingly used in healthcare applications to assist medical staff in diagnosing their patients and providing tailored medications. Many real datasets in healthcare are hierarchically structured. However, traditional machine learning models map the data to Euclidean latent space, which cannot efficiently handle tree-like structures. This is the case with variational auto-encoders (VAEs), a powerful type of machine learning model that is widely used for generative purposes. In particular, they allow capturing explainable factors of variation, an important property that we seek in healthcare applications. In this project, we are interested in exploring the benefits of hierarchical representations for healthcare applications with a particular kind of VAEs which are embedded in hyperbolic spaces [1, 2].
As a starting point, we will take a look at this paper “Continuous Hierarchical Representations with Poincaré Variational Auto-Encoders” [1] and adapt it to a healthcare application. The goal is to leverage meta-knowledge [3] about the learning problem, for example, the hierarchical structure of the labels to improve the learning process. In particular, we are interested in assessing what happens for the learning process and the learned representations when choosing appropriate parameterizations (here, leveraging the hierarchical structure of the target labels) compared to when we simply map data to the Euclidean latent space, i.e., flatten the target labels and ignoring their hierarchical structure. Other VAEs that feature hyperbolic embedded spaces, such as [2, 4, 5] will also be explored and compared to basic Euclidean embedded space in terms of performances, representational properties, and learning bounds.
The experiments will be performed on the MIMIC-IV dataset [6], a freely available real-world dataset encompassing electronic health records of patients admitted to intensive care units. The idea is to adapt one of the healthcare learning problems featured in MIMIC-IV dataset to a hierarchical representation learning problem.
We seek to publish the obtained results in machine learning and machine learning for healthcare related workshops or conference venues.
Contact
Massinissa HAMIDI
Maître de conférences
IBISC Laboratory, Univ. Évry Paris-Saclay massinissa.hamidi@univ-evry.fr
Li-wei H. LEHMAN
Research Scientist
Massachusetts Institute of Technology lilehman@mit.edu
Bibliography
[1] Mathieu E, Le Lan C, Maddison CJ, Tomioka R, Teh YW. Continuous hierarchical representations with poincaré variational auto-encoders. Advances in neural information processing systems. 2019;32.
[2] Bose, Joey, et al. “Latent variable modelling with hyperbolic normalizing flows.” International conference on machine learning. PMLR, 2020.
[3] Hamidi, Massinissa. Metalearning guided by domain knowledge in distributed and decentralized applications. Diss. Université Paris-Nord-Paris XIII, 2022.
[4] Davidson, Tim R., et al. “Hyperspherical variational auto-encoders.” 34th Conference on Uncertainty in Artificial Intelligence 2018, UAI 2018. Association For Uncertainty in Artificial Intelligence (AUAI), 2018.
[5] Cho, Seunghyuk, Juyong Lee, and Dongwoo Kim. “Hyperbolic VAE via latent Gaussian distributions.” Advances in Neural Information Processing Systems 36 (2024).
[6] A. E. Johnson, L. Bulgarelli, L. Shen, A. Gayles, A. Shammout, S. Horng, T. J. Pollard, S. Hao, B. Moody, B. Gow, et al. Mimic-iv, a freely accessible electronic health record dataset. Scientific data, 10(1):1, 2023.
Profil du candidat :
Niveau Master, MSc ou Programme Grande Ecole
Formation et compétences requises :
Adresse d’emploi :
23 Bd de France-Georges Pompidou, 91037 Évry-Courcouronnes
Document attaché : 202412191341_2425-UPSay-MIT-internship-Metalearning-Poincare-VAE.pdf
Offre en lien avec l’Action/le Réseau : TIDS/– — –
Laboratoire/Entreprise : Laboratoire CRIStAL (Université de Lille)
Durée : 12 semaines minimum
Contact : mathilde.regue@univ-lille.fr
Date limite de publication : 2025-03-31
Contexte :
Le projet CALYPSO : Vers une psychiatrie de précision
CALYPSO est un projet de recherche interdisciplinaire de l’Université de Lille qui réunit des chercheurs en intelligence artificielle, psychiatrie, psychologie et neurosciences issus du laboratoire CRIStAL, du centre Lille Neuroscience et Cognition et du SCALab. Le projet CALYPSO vise à identifier des marqueurs objectifs des troubles psychiatriques pour améliorer la précision des diagnostics, la prédiction du pronostic et de la réponse aux traitements, et personnaliser les interventions.
Contexte sociétal du projet :
Les troubles psychiatriques touchent aujourd’hui près d’une personne sur huit dans le monde, faisant de la santé mentale un enjeu majeur de santé publique. Cette situation s’intensifie face aux crises globales qui amplifient la prévalence des troubles tels que la dépression et le trouble de stress post-traumatique (TSPT). Bien que la recherche en psychiatrie ait permis des avancées significatives, les mécanismes sous-jacents à ces troubles demeurent encore peu voire pas connus, et les découvertes peinent souvent à se traduire dans la pratique clinique.
Quelques chiffres… L’ampleur des troubles visés par CALYPSO
*300 millions : Nombre de personnes affectées par la dépression dans le monde
*70 % : Proportion des individus exposés à des événements potentiellement traumatiques au cours de leur vie
*24 % : Prévalence du TSPT suite à un événement traumatique
Description du projet CALYPSO :
Le projet CALYPSO vise à enrichir la définition des troubles psychiatriques grâce à des marqueurs objectifs, rendus possibles par les technologies d’intelligence artificielle et de vision par ordinateur. Les marqueurs objectifs incluent des indicateurs mesurables et quantifiables tels que les expressions faciales, les tonalités de voix, les comportements moteurs, et les données physiologiques (par exemple, rythme cardiaque, respiration). En permettant d’étudier des groupes de patients plus homogènes, ces avancées offriraient une voie vers des traitements plus ciblés, ouvrant ainsi de nouvelles perspectives pour répondre aux besoins spécifiques de chaque patient.
Sujet :
Missions du stage:
Durant ce stage, l’étudiant ou l’étudiante s’intéressera au développement de méthodes de machine learning adaptées au projet.
Ses missions seront :
*Développer et mettre en œuvre un algorithme d’analyse pour un des marqueurs objectifs enregistrés (expressions faciales / mouvements du visage / vitesse de déplacement / analyse de la voix…).
*Utiliser des techniques d’apprentissage automatique pour identifier des sous-groupes de patients en fonction des marqueurs objectifs.
*Effectuer des évaluations expérimentales des algorithmes et techniques développés.
*Discuter avec des équipes interdisciplinaires pour intégrer les résultats dans la pratique clinique.
Profil du candidat :
Étudiant ou étudiante en M2 dans un Master en informatique, en intelligence artificielle, ou dans un domaine connexe.
Formation et compétences requises :
*Connaissance en vision par ordinateur, apprentissage automatique et intelligence artificielle.
*Connaissance de travail avec des ensembles de données à grande échelle et de réalisation d’évaluations expérimentales.
*Compétences en programmation en Python. Une connaissance des bibliothèques de vision par ordinateur telles que OpenCV, TensorFlow, PyTorch ou similaires serait un avantage.
*Compétences analytiques et en résolution de problèmes.
Adresse d’emploi :
Infos pratiques :
La durée du stage sera de minimum 12 semaines.
Le projet sera encadré par les Pr. Mohamed Daoudi (UMR 9189 CRIStAL – Computer Science et AI), Pr Ali Amad (UMR-S 1172 et CHU de Lille –Psychiatrie) et Dr Fabien D’Hondt (UMR-S 1172 – Neurosciences).
Le stagiaire sera principalement localisé dans les locaux du laboratoire CRIStAL, campus Cité Scientifique et ponctuellement au centre Lille Neuroscience et Cognition.
Contact : Pour postuler à cette offre, merci d’envoyer un CV ainsi qu’une lettre de présentation à : mathilde.regue@univ-lille.fr
Document attaché : 202412190951_Offre de stage M2 – Projet CALYPSO.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Institut Fresnel
Durée : Flexible
Contact : andre@fresnel.fr
Date limite de publication : 2025-04-03
Contexte :
L’histologie joue un rôle crucial dans le diagnostic des tumeurs cérébrales, car elle implique l’extraction et l’analyse d’un échantillon de tissu. La méthode classique pour l’analyse des biopsies est la coloration à l’hématoxyline et à l’éosine (H&E), qui aide les experts à identifier les tissus cancéreux, mais qui peut prendre beaucoup de temps. Une technique alternative, plus rapide, appelée Histologie Raman Stimulée (SRH) est apparue, produisant des images comparables à la coloration H&E. Cette technique permet d’imager les liaisons chimiques CH2 et CH3, et la soustraction de ces deux canaux (CH3-CH2) est utilisée pour mettre en évidence les noyaux des tissus. Ces images sont ensuite traitées, assemblées et mises en correspondance avec un code couleur de type H&E à l’aide d’outils de colorisation virtuel.
Sujet :
Le candidat devra modifier et améliorer une application web existante qui effectue les différents traitements aux images brutes afin de générer des images SRH de haute qualité. La tâche principale consiste à concevoir et à construire une nouvelle application robuste axée uniquement sur la coloration virtuelle en garantissant des performances et une réactivité élevée.
Profil du candidat :
Développement d’applications web, en particulier dans le domaine de l’analyse d’images ou dans des domaines connexes.
Maîtrise des technologies frontales et dorsales (par exemple, HTML, CSS, JavaScript, Python).
Expérience avec SQL ou un autre système de gestion de base de données (MongoDB).
Expérience avec des bibliothèques de traitement d’images (par exemple, OpenCV, Scikit-image).
Appétence pour la résolution de problèmes informatiques et souci du détail.
Forte aptitude de communication et travail en équipe.
Formation et compétences requises :
Etudiant de Bac+2 à Bac+5 en informatique ayant un fort intérêt pour le développement web.
Adresse d’emploi :
Institut Fresnel, 52 Av. Escadrille Normandie Niemen, 13013 Marseille
Document attaché : 202409031543_offre_stage_interface Web.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LAMSADE – Dauphine PSL
Durée : 4 à 6 mois
Contact : sana.mrabet@dauphine.psl.eu
Date limite de publication : 2025-04-04
Contexte :
L’apprentissage fédéré (Federated Learning, FL) est une approche de l’apprentissage machine décentralisé où les modèles sont entraînés localement sur plusieurs appareils sans partager les données brutes, préservant ainsi la confidentialité et réduisant les coûts de communication. Ce paradigme est de plus en plus utilisé dans des domaines sensibles comme la santé, la finance ou encore les appareils connectés. Cependant, il pose des défis uniques, notamment :
• L’hétérogénéité des données entre les participants,
• L’optimisation efficace des modèles sur des ensembles de données distribués et déséquilibrés,
• La communication coûteuse entre les participants et le serveur central.
Sujet :
Ce sujet vise à développer des approches innovantes pour améliorer la performance des modèles d’apprentissage fédéré. Il s’agira d’explorer des méthodes hybrides mêlant l’intégration de méta-heuristiques (ex. : colonies de fourmis, algorithmes génétiques) pour :
• Identifier dynamiquement les sous-ensembles d’appareils participant à chaque cycle, maximisant ainsi la performance globale du modèle tout en respectant les contraintes du système.
• Optimiser la sélection dynamique des modèles locaux contribuant efficacement à la performance globale.
• Optimiser les stratégies d’agrégation des poids pour gérer le déséquilibre des données et améliorer la convergence.
Profil du candidat :
L’offre s’adresse à un étudiant en M2 ou équivalent en Informatique, avec bonnes connaissances en Machine Learning et en programmation Python.
Formation et compétences requises :
Adresse d’emploi :
LAMADE – Université Paris Dauphine – PSL
Place du Maréchal de Lattre de Tassigny – 75775 PARIS Cedex 16
Document attaché : 202501131418_Projet master recherche – FL – 2025.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : GREYC
Durée : 5 mois
Contact : alexis.mortelier@unicaen.fr
Date limite de publication : 2025-04-04
Contexte :
La reconnaissance de démarche est une technique biométrique utilisée pour identifier ou suivre une personne en analysant ses mouvements. Ce domaine trouve des applications dans la sécurité, la surveillance, et l’interaction homme-machine. Cependant, les défis restent nombreux, notamment dans des environnements réels où des variations d’angle de caméra, de vêtements ou de conditions d’éclairage peuvent affecter la robustesse des algorithmes.
Ce stage s’inscrit dans les travaux récents sur l’analyse et le suivi de démarche en exploitant des approches modernes basées sur des données spatio-temporelles et des modèles d’apprentissage automatique. Des études comme celles sur OpenGait, Gait Parsing Sequence (GPS) et la reconnaissance en conditions de changement de vêtements fournissent des bases pour ce sujet
Sujet :
Pour ce stage, votre objectif sera de développer un système capable de reconnaître une personne à partir de sa démarche, indépendamment des variations de vêtements ou d’angles de caméra, et de suivre cette personne à travers plusieurs vidéos en exploitant des caractéristiques robustes et discriminantes.
Vous commencerez par explorer les méthodes existantes. Analysez les approches actuelles en reconnaissance de démarche, notamment des solutions comme GaitSet, GPS et OpenGait. Étudiez les ensembles de données pertinents, tels que GREW, CASIA-B, et Gait3D, pour comprendre les défis et les méthodologies en vigueur. Identifiez les limites des solutions actuelles et les opportunités d’amélioration.
Ensuite, vous concevrez et implémenterez un pipeline de reconnaissance basé sur des architectures modernes, telles que les réseaux convolutionnels 3D ou les transformers. Intégrerez des mécanismes spécifiques pour traiter les changements d’apparence (par exemple, les variations de vêtements) et les variations d’angles. Vous utiliserez des frameworks comme PyTorch ou TensorFlow pour entraîner et optimiser votre modèle, en veillant à garantir robustesse et efficacité.
Après le développement, vous évaluerez votre modèle en réalisant des tests approfondis sur des ensembles de données publics. Comparerez ses performances avec les méthodes de l’état de l’art, en termes de précision, de robustesse et de temps de calcul. Vous identifierez les points forts et faibles de votre approche pour orienter d’éventuelles améliorations.
Enfin, vous documenterez votre travail en rédigeant un rapport détaillé en présentant les méthodologies utilisées, les résultats obtenus, et proposerez des pistes d’amélioration.
N’oubliez pas d’intégrer des idées pour des applications pratiques, notamment dans des contextes en temps réel. Soyez méthodique, rigoureux et force de proposition tout au long de ce stage.
Profil du candidat :
Master/Ingénieur dernière année en informatique, traitement du signal et des images, biométrie
Formation et compétences requises :
– apprentissage profond (modèles spatio-temporels, CNN, transformers).
– traitement d’images
– familiarité avec les concepts de biométrie ou d’analyse de mouvement serait un plus.
– compétences en programmation Python, OpenCV, Tensorflow, PyTorch.
Adresse d’emploi :
laboratoire GREYC site de Caen (Campus 2, 6 boulevard maréchal juin) et/ou Saint-Lô (IUT GON, 120 Rue de l’Exode, 50000 Saint-Lô)
Document attaché : 202501141533_Stage_M2__2025_biométrie_SAFE.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : INRIA Opis
Durée : 5 mois
Contact : laurent.duval@ifpen.fr
Date limite de publication : 2025-04-04
Contexte :
In the context of the ERC MAJORIS, and in collaboration with IFPEN company, the aim of this internship is to investigate the problem of sparse principal component analysis (PCA), with norm-ratio sparsifying penalties. Online information:
https://jobs.inria.fr/public/classic/fr/offres/2024-08488
Sujet :
Principal component analysis (PCA) is a workhorse in linear dimensionality reduction [Jol02]. It is widely applied in exploratory data analysis, visualization, data preprocessing).
Principal components are usually linear combinations of all input variables. For high-dimension data, this may involve input variables that contribute very little to the understanding. Finding the few directions in space that explain best observations is desirable. Sparse PCA overcomes this disadvantage by finding linear combinations that contain just a few input variables, by adding sparsity constraints [CR24,ZX18]. One of such is formulated (cf. lasso) with the help of an absolute norm penalty/regularization. In [MBPS10], one designs this matrix factorization problem as:
minimize_{alpha} || X – D alpha ||^2_F + lambda|| alpha ||_{1,1}
where: X = [x_1,…,x_n] is the matrix of data vectors; D is a square matrix from a suitable basis set, ||.||_F denotes the Frobenius norm; ||.||_{1,1} denotes the sum of the magnitude of matrix coefficients, lambda is a positive penalty weight.
A penalty such as ||.||_{1,1} is 1-homogeneous. This may only weakly emulate the sheer count of non-zero entries of a matrix, that would be scale-invariant or 0-homogeneous.
Recently, the SOOT/SPOQ family of penalties has been developed in our research group, as smooth emulations to the scale-invariant lp/lq norm ratios. The latter had been used for a while, as stopping-criteria, penalties or “continuous” sparsity count estimators [HR09]. They have been used successfully for the restoration/deconvolution/source separation of sparse signals [CCDP20,RPD+15].
The goal of the internship is to investigate the resolution of sparse PCA models, by replacing the standard l1 norm by such norm ratios. Convergence analysis of the proposed optimization algorithm, imlementation and validation over public benchmarks will be conducted.
[CCDP20] Afef Cherni, Emilie Chouzenoux, Laurent Duval, and Jean-Christophe Pesquet. SPOQ ℓp-over-ℓq regularization for sparse signal
recovery applied to mass spectrometry. IEEE Trans. Signal Process., 68:6070–6084, 2020.
[CR24] Fan Chen and Karl Rohe. A new basis for sparse principal component analysis. J. Comp. Graph. Stat.), 33(2):421–434, 2024.
[HR09] N. Hurley and S. Rickard. Comparing measures of sparsity. IEEE Trans. Inform. Theory, 55(10):4723–4741, Oct. 2009.
[Jol02] I. T. Jolliffe. Principal component analysis. Springer Series in Statistics, 2nd edition, 2002.
[MBPS10] Julien Mairal, Francis Bach, Jean Ponce, and Guillermo Sapiro. Online learning for matrix factorization and sparse coding. J. Mach.
Learn. Res., 11:19–60, 2010.
[RPD+15] A. Repetti, M. Q. Pham, L. Duval, E. Chouzenoux, and J.-C. Pesquet. Euclid in a taxicab: Sparse blind deconvolution with smoothed
ℓ1/ℓ2 regularization. IEEE Signal Process. Lett., 22(5):539–543, May 2015.
[ZCD23] Paul Zheng, Emilie Chouzenoux, and Laurent Duval. PENDANTSS: PEnalized Norm-ratios Disentangling Additive Noise, Trend
and Sparse Spikes. IEEE Signal Process. Lett., 30:215–219, 2023.
[ZX18] Hui Zou and Lingzhou Xue. A selective overview of sparse principal component analysis. Proc. IEEE, 106(8):1311–1320, August
2018.
Profil du candidat :
We seek for a talented candidate in Master 1, Master 2, or Engineering studies
Formation et compétences requises :
A solid background in optimization, and signal processing, and a strong motivation for research and innovation. Experience in Python is necessary.
Adresse d’emploi :
INRIA Saclay
Document attaché : 202501132057_main-IFPEN-INRIA-master-pca-spoq-sparse-revisited.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : GREYC/GAMPAM
Durée : 4 à 6 mois
Contact : francois.rioult@unicaen.fr
Date limite de publication : 2025-04-15
Contexte :
GAMPAM est une entreprise spécialisée dans le développement de jeux web et mobiles. Parmi ses domaines d’intérêt figurent la création d’edugames, une catégorie de jeux dédiée à l’apprentissage et à la pédagogie, ainsi que la création de jeux en ligne.
Les motivations de GAMPAM sont de proposer un service no-code de développement assisté par IA pour concevoir les jeux, leurs mécaniques et leurs graphismes.
Sujet :
Les récents développements en IA générative permettent l’exécution de prompts complexes pour la création de données structurées. L’ingénierie du prompt peut ainsi être abordée comme une recherche dans un espace vectoriel de programmes [1]. De plus, l’enrichissement du prompt par construction automatique d’une chaîne de pensée simule un raisonnement approfondissant les résultats usuels [2].
Pour spécialiser la base de connaissances du modèle, des techniques de RAG [3] permettent d’enrichir le prompt grâce aux résultats de l’interrogation de cette base. Des techniques de distillation sont également utiles [4] pour transférer les connaissances d’un grand modèle superviseur vers un modèle compact.
L’étudiant(e) réalisera une synthèse de l’état de l’art en matière de RAG et de distillation. Il/elle mettra en œuvre un processus de distillation pour obtenir un modèle compact capable de générer un tableau de bord à l’aide d’un langage maison, BoxLang, dédié à la création d’interfaces de contrôle.
Profil du candidat :
Étudiant(e) de master 2 en informatique ou 3è année d’école d’ingénieur.
Formation et compétences requises :
– Maîtrise du JavaScript (vanilla),
– Bases solides en algorithmie,
– Intérêt pour l’abstraction, la généralisation et la conception de jeux,
– Bonne culture de l’IA, en particulier les LLM et leurs applications
– Bon niveau d’anglais (lu, écrit, parlé)
Adresse d’emploi :
Caen (GREYC ou GAMPAM)
Document attaché : 202502271516_fiche-de-poste-m2-greyc.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Sesstim, Aix Marseille Université
Durée : 6 Mois
Contact : raquel.urena@univ-amu.fr
Date limite de publication : 2025-04-15
Contexte :
Ce stage s’inscrit dans un projet de recherche visant à intégrer des données cliniques, d’imagerie, et génomiques pour construire une base de données avancée en oncologie. Le but est de faciliter l’analyse des données et d’améliorer les prédictions sur la survie et la récidive du cancer du sein.
Sujet :
Le stagiaire sera impliqué dans :
1. Collecte et nettoyage des données : Extraction et harmonisation de données issues de multiples sources.
2. Constitution de la base de données : Conception et structuration d’un entrepôt de données robuste pour des analyses futures.
3. Application de techniques d’intelligence artificielle : Détection d’anomalies, fusion de données, et analyse prédictive avec des algorithmes de machine learning.
Profil du candidat :
• Étudiant(e) en Master 2 en Sciences des Données, Informatique ou équivalent.
• Connaissances solides en Python et en bases de données (SQL, NoSQL).
• Intérêt pour le traitement des données en santé et la bio-informatique
Formation et compétences requises :
Machine learning, SQL, Sciences des données
Adresse d’emploi :
Institut Paoli Calmettes, : 232 Bd de Sainte-Marguerite, 13009 Marseille
Document attaché : 202503101036_Offre de Stage 2025.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : CIRAD Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-04-30
Contexte :
Le projet DeepAeroDynamics (DADY) vise à combiner l’imagerie drone multispectrale time-lapse et le deep learning pour faire face aux défis du changement climatique et de la sécurité alimentaire dans les pays du Sud. L’objectif est de développer un modèle fondation capable d’intégrer les données multispectrales, spatiales et temporelles observées par drone aérien dans des environnements complexes et hétérogènes du Sud dans le but d’anticiper et prédire le comportement de plantes cultivées en agroécologie (Sahel, Madagascar, Guadeloupe).
Sujet :
Le stagiaire sera au coeur du développement d’une architecture deep learning permettant :
* D’analyser des séries temporelles multispectrales d’imagerie drone, et extraire automatiquement des représentations informatives de l’état des systèmes observés.
* D’analyser les dynamiques temporelles en utilisant des modèles de type Transformers pour capturer les évolutions des cultures décrites dans un espace latent.
* De maximiser l’utilisation des données par des techniques d’apprentissage semi-supervisées et des consignes prétextes pour maximiser la capacité d’apprentissage de l’architecture fondation.
Le développement des modèles s’appuiera sur des architectures CNN et Transformers. L’approche sera validée sur des jeux de données déjà acquis et stockés à proximité d’un supercalculateur. Les tests de niveau 1 s’effectueront sur une ferme GPU locale, et les modèles de niveau 2 seront testés sur les supercalculateurs Jean Zay et Adastra (20e mondial au TOP500). Les modèles seront documentés et diffusés en open-source, accompagnés de scripts pour le fine-tuning.
Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en deep learning.
Formation et compétences requises :
Travail avec Python, Pytorch/Tensorflow, Github, Intégration Continue. Expérience en traitement d’images. Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.
Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€ mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av. Agropolis, 34980 Montferrier-sur-Lez.
Document attaché : 202412131037_Offre de stage M2 – 2025 – DADY.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire IBISC, Université d’Evry Paris-Saclay
Durée : 5-6 mois
Contact : Khalifa.Djemal@ibisc.univ-evry.fr
Date limite de publication : 2025-04-30
Contexte :
Sujet :
Description du sujet:
Le cancer du sein est considéré dans le monde comme la première cause de mortalité parmi les différentes localisations du cancer chez les femmes. Malgré les progrès importants réalisés ces dernières décennies pour améliorer la gestion de ce type de cancer, des outils de diagnostic plus précis sont encore nécessaires pour aider les experts à lutter contre cette maladie mortelle. De nombreux travaux ont été menés pour détecter la présence de tissus cancéreux dans le sein et pour la classification tumorale, en utilisant des outils dérivés de l’intelligence artificielle, souvent inspirés des systèmes naturels. En effet, des études récentes ont été publiées et plusieurs outils ont été développés, essentiellement basés sur l’apprentissage automatique, pour identifier et catégoriser automatiquement les masses mammaires malignes. Dans ce travail, nous nous concentrons sur l’extraction des attributs caractérisant les masses mammaires malignes, en tenant compte des paramètres environnementaux, tels que la pollution atmosphérique. Après une étude approfondie des méthodes récentes, le candidat développera une méthode basée sur les approches d’apprentissage automatique. La méthode développée permettra l’identification du cancer du sein et facilitera la prise de décision. La validation de la méthode proposée sera effectuée sur des bases de données connues.
Références:
[1] Peikari, M., Salama, S., Nofech-Mozes, S. and Martel, A.L., 2017. Automatic cellularity assessment from post-treated breast surgical specimens. Cytometry Part A, 91(11), pp.1078-1087.
[2] P. Khosravi, E. Kazemi, M. Imielinski, O. Elemento, and I. Hajirasouliha, Deep convolutional neural networks enable discrimination of heterogeneous digital pathology images,EBioMedicine, vol. 27, pp. 317 – 328, 2018.
[3] Adel Abdelli, Rachida Saouli, Khalifa Djemal, Imane Youkana, Combined Datasets For Breast Cancer Grading Based On Multi-CNN Architectures. 10th IEEE International conference on Image processing Theory, Tools and Applications IPTA 2020, November 09-12, Paris, France.
[4] Rima Daoudi and Khalifa Djemal, Breast Cancer Classification by Artificial Immune Algorithm based Validity Interval Cells Selection, Proceedings of ECTA 2016, ISBN: 978-989-758-201-1, Porto, Portugal, 9-11 november 2016.
[5] Konstantinos Charalampous and Antonios Gasteratos, Bio-inspired Deep Learning Model for Object Recognition, IEEE International Conference on Imaging Systems and Techniques (IST), pages:51 – 55, October 22-23, Beijing, china, 2013.
[6] S.R. Kheradpisheh, M. Ganjtabesh, and T. Masquelier, Bio-inspired unsupervised learning of visual features leads to robust invariant object recognition. Neurocomputing 205 (2016), pages: 382-392.
[7] https://www.acr.org
Profil du candidat :
Sujet de stage pour Master 2 ou équivalent, de préférence des spécialités suivantes :
– Machine Learning
– Imagerie Biomédicale
– Informatique Biomédicale
Formation et compétences requises :
– Programmation Python, Matlab,
– Machine Learning
– Des connaissances de base en traitement d’images
Adresse d’emploi :
Université d’Evry Paris Saclay
Laboratoire Informatique, Biologie Intégrative et Systèmes Complexes – IBISC, 40 rue du Pelvoux, 91020 Evry, France.
Document attaché : 202503170951_Sujet-Stage-Master2-CS-2024-2025.pdf
Offre en lien avec l’Action/le Réseau : DOING/– — –
Laboratoire/Entreprise : LaSTIG (Université Gustave Eiffel – IGN/ENSG)
Durée : 5 mois
Contact : charly.bernard@ign.fr
Date limite de publication : 2025-04-30
Contexte :
Sujet :
Ce stage s’inscrit dans un ensemble de travaux visant à proposer une méthodologie générique et reproductible pour la construction d’un graphe de connaissances géohistorique des voies et des adresses à partir des documents historiques et de données publiées sur le Web.
Profil du candidat :
Formation et compétences requises :
Adresse d’emploi :
Équipe LaSTIG/Strudel – École Nationale des Sciences Géographiques
6-8 avenue Blaise Pascal
77420 Champs-sur-Marne
(RER A, station Noisy-Champs)
Document attaché : 202412131314_2025-Sujet_Stage_M2_LLM_Rues_Paris.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : ICube
Durée : 6 mois
Contact : nicolas.lachiche@unistra.fr
Date limite de publication : 2025-05-04
Contexte :
Collaboration avec le service de réanimation de l’hôpital de Hautepierre à Strasbourg
Sujet :
Description de l’offre
Les patients admis en réanimation médicale sont souvent atteints de maladies graves, voire potentiellement mortelles, nécessitant de multiples traitements. L’incidence des interactions médicamenteuses y est donc élevée, avec des conséquences parfois sévères, telles qu’une exacerbation des effets secondaires ou une augmentation de la toxicité des médicaments.
De plus, ces patients présentent fréquemment des insuffisances rénale et/ou hépatique, ce qui peut entraîner des surdosages médicamenteux en raison d’une élimination altérée. Cela complexifie davantage la tâche du prescripteur, qui doit quotidiennement évaluer le rapport bénéfice/risque des traitements administrés.
Aujourd’hui, un grand nombre de données sont automatiquement collectées chez les patients de réanimation. L’objectif de ce stage est d’utiliser ces informations pour apprendre à détecter les interactions médicamenteuses et ainsi assister le clinicien dans ses décisions thérapeutiques.
Dans le cadre de ce projet, nous nous concentrerons sur l’allongement de l’intervalle QT comme indicateur mesurable des interactions médicamenteuses touchant le cœur. Cet intervalle, mesuré sur l’électrocardiogramme, est influencé par de nombreux facteurs et médicaments (CredibleMeds). En cas d’allongement excessif, il peut induire des troubles du rythme cardiaque
potentiellement mortels.
Travail à réaliser
– Calculer l’intervalle QT à partir des électrocardiogrammes en utilisant les librairies de traitement
du signal existantes
– Vérifier l’influence de situations et médicaments connus sur le QT extrait des bases de données
– Identifier et extraire les médicaments et autres informations pertinentes des données
– Utiliser des algorithmes d’apprentissage machine pour prédire la variation du QT
Profil du candidat :
Bac +4-5 en informatique, science des données, intelligence artificielle, apprentissage automatique
Formation et compétences requises :
Python et les librairies classiques de l’apprentissage profond et des séries temporelles
Adresse d’emploi :
ICube
300 Boulevard Brant
67412 Illkirch
Document attaché : 202410071201_StageM2_Interactions2024.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire MAP5, Université Paris-Cité,
Durée : 4-6 months + opportu
Contact : anne.sabourin@u-paris.fr
Date limite de publication : 2025-05-04
Contexte :
The internship is intended to lead to a PhD thesis if everything goes as planned. The PhD will be funded by the ANR project EXSTA led by A. Sabourin. The Phd Candidate will benefit from interactions with other researchers in the field e.g. through workshops organised within the project’s framework, in addition to usual participation in conferences.
Sujet :
Context: Extreme Value Theory (EVT) is a field of probability and statistics concerned with tails of distributions, that is, regions of the sample space located far away from the bulk, associated with rare and extreme events. Poviding probabilistic descriptions and statistical inference methods for the tails requires sound theoretical assumptions pertaining to the theory of regular variation and maximum domains of attraction, ensuring that a limit distribution of extremes exists. This setting encompasses a wide range of applications in various disciplines where extremes have tremendous impact, such as climate science, insurance, environmental risks and industrial monitoring systems [1].
In a supervised learning framework, the goal is to learn a good prediction function to predict new, unobserved labels. In many contexts (covariate-shifts, climate change), extrapolation (or out-of-sample) properties of the predictors thus constructed are crucial, and obtaining good generalization properties on unobserved regions of the covariate space is key. Recently, there has been significant interest in the ML literature regarding out-of-domain generalization (see e.g. [2]).
Recent works [3,4,5] focus on the problem of learning a tail predictor based on a small of the most, with non-asymptotic guarantees regarding the risk on extreme regions . For simplicity, the theoretical study in both works is limited to Empirical Risk Minimization (ERM) algorithms without a penalty term. In addition, the regression problem analysed in [5] covers least squares regression only. Also, with heavy-tailed targets, non-linear transformations of the target are required in order to satisfy boundedness assumptions.
Research Objectives: The general purpose of this internship and subsequent thesis is to extend the scope of applications of the supervised learning methods described above to a wider class of learning algorithms. One main limitation of least squares regression is that the optimal predictor (i.e. the conditional expectation given the covariate) is not invariant under non-linear transformations of the target. As a starting point, the least-squares framework will be extended to the quantile regression framework which, in contrast to least squares, is compatible with non-linear transformations. From a statistical learning perspective, we shall extend the ERM framework considered thus far to encompass penalized risk minimizations procedures amenable to high dimensional covariates or non-linear regression functions. SVM quantile regression [6] is a natural candidate for this purpose. The goal will be to obtain finite sample guarantees on the generalization error of quantile regression functions learnt with the a subsample made of the largest observations and hopefully recover learning rates of comparable order as the ones obtained in the classical framework, with the full sample size n replaced with the reduced sample size. The bottleneck is that these largest observations may not be considered as an independent sample because they are order statistics of a full sample. However it is anticipated that proof techniques from recent works [7,8,9] based on conditioning arguments and concentration inequalities incorporating (small) variance terms can be leveraged for this purpose.
References
[1] Beirlant, J., Goegebeur, Y., Segers, J., and Teugels, J. L. (2004). Statistics of Extremes: Theory and
Applications, volume 558. John Wiley & Sons.
[2] Zhou, K., Liu, Z., Qiao, Y., Xiang, T., and Loy, C. C. (2022). Domain generalization: A survey. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 45(4):4396–4415.
[3] Jalalzai, H., Clémençon, S., and Sabourin, A. (2018). On binary classification in extreme regions. In
NeurIPS Proceedings, volume 31.
[4] Clémençon, S., Jalalzai, H., Lhaut, S., Sabourin, A., and Segers, J. (2023). Concentration bounds for the
empirical angular measure with statistical learning applications. Bernoulli, 29(4):2797–2827.
[5] Huet, N., Clémençon, S., and Sabourin, A. (2023). On Regression in Extreme Regions. arXiv preprint
arXiv:2303.03084.
[6] Takeuchi, I., Le, Q. V., Sears, T. D., Smola, A. J., and Williams, C. (2006). Nonparametric quantile
estimation. Journal of machine learning research, 7(7).
Supervisory Team/contact: Anne Sabourin (MAP5, Université Paris-Cité), Clément Dombry (LMB, Université de Franche-Comté)
Profil du candidat :
Master’s student (2nd year) in Applied Mathematics/Statistics/Statistical Machine Learning with an excellent track record and a strong interest for mathematical statistics and learning theory. Some knowledge of R or Python.
Application to the PhD thesis from candidates having already graduated from a Master’s program will also be considered.
Formation et compétences requises :
Being enrolled in or having graduated from a Master’s program in Mathematics/Statistics/Statistical Machine Learning
Adresse d’emploi :
Laboratoire MAP5, Université Paris Cité, 45 rue des Saint Pères, Paris.
Document attaché : 202410081334_offreStage2024.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Centre d’Epidémiologie et de Santé Publique des A
Durée : 4 à 6 mois
Contact : muriel.visani@univ-lr.fr
Date limite de publication : 2025-05-31
Contexte :
/! À noter que ce sujet de stage s’adresse préférentiellement à des étudiants de M2 mais, en fonction de leur profil et de leur expérience, des étudiants de M1 pourraient être acceptés.
/! Parmi les pré-requis explicités dans le fichier ci-joint, nous attirons l’attention des potentiels candidats sur les contraintes en termes de nationalité liées à ce poste.
Sujet :
Voir le fichier ci-joint.
Profil du candidat :
Nous recherchons un(e) étudiant(e) de Master 2 ou de Master 1, de nationalité Française, avec :
– Motivation dans la recherche et l’innovation
– Bonnes compétences en programmation (en particulier avec Python)
– Bonnes compétences en IA et en apprentissage automatique
– Une première expérience du deep learning serait un atout
– Très bon niveau d’anglais (parlé et écrit)
– Connaissances en traitement et analyse d’images
Tous les demandeurs devront se soumettre à une enquête d’habilitation de sécurité avant de pouvoir accéder au site du CESPA.
Formation et compétences requises :
Adresse d’emploi :
Centre d’Epidémiologie et de Santé Publique des Armées (CESPA), Marseille.
Document attaché : 202501240639_StageMaster-CESPA.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Cirad, Montpellier
Durée : 4 à 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-05-31
Contexte :
Les rizières jouent un rôle central dans la sécurité alimentaire mondiale, et un rôle important dans
le changement climatique d’origine anthropique en émettant chaque année 50 mégatonnes de méthane. Le
projet interdisciplinaire ARIZE vise à relever le double défi de la transition agroécologique et de la sécurité
alimentaire en développant des outils innovants pour l’exploration morpho-anatomique du riz en 3D afin de
sélectionner des variétés de riz adaptées aux cultures en sol sec. Dans ce cadre, nous explorons
l’architecture interne des plantes de riz en 3D via des images inédites par micro-tomographie aux rayons X à
une résolution de 10 μm. Chaque image volumétrique, de l’ordre de 1 To, permet de révéler le réseau 3D
des aérenchymes, ces “canaux” internes qui transportent l’oxygène. Automatiser l’analyse de ces structures
en 3D serait une première mondiale et constitue le cœur de ce stage.
Sujet :
Concevoir un pipeline complet d’analyse 3D pour la segmentation anatomique et l’estimation de
caractéristiques complexes en 3D. Dans ce but, le stagiaire aura la responsabilité de réaliser des
expérimentations avec des outils de l’état de l’art (modèles dédiés “plante” et modèles-fondation
généralistes), et de concevoir une solution technique open-source qui sera mise à disposition dans un
démonstrateur open-source via un plugin Python pour le logiciel Napari. Le stagiaire travaillera en lien étroit
avec le deuxième stagiaire X-atlas 3D, dédié à la reconstruction architecturale en 3D. Une forte collaboration
est prévue pour combiner les résultats dans une solution intégrée.
Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en informatique, analyse
d’images, ou modélisation mathématique. Le langage de programmation utilisé sera Python, en utilisant
des outils de développement communautaire et de maintien logiciel (Github, Intégration Continue), et des
librairies standards de deep learning (Pytorch/Tensorflow).
Formation et compétences requises :
Expérience en traitement d’images 3D, et/ou
modélisation géométrique appréciée. Intérêt pour le développement d’outils open-source et la
collaboration interdisciplinaire. Capacité à travailler en équipe dans un environnement mêlant
informatique, biologie et agroécologie.
Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€
mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av.
Agropolis, 34980 Montferrier-sur-Lez.
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Cirad, Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-05-31
Contexte :
Les rizières jouent un rôle central dans la sécurité alimentaire mondiale, et un rôle important dans le changement climatique d’origine anthropique en émettant chaque année 50 mégatonnes de méthane. Le projet interdisciplinaire ARIZE vise à relever le double défi de la transition agroécologique et de la sécurité alimentaire en développant des outils innovants pour l’exploration morpho-anatomique du riz en 3D afin de sélectionner des variétés de riz adaptées aux cultures en sol sec. Dans ce cadre, nous explorons l’architecture interne des plantes de riz en 3D via des images inédites par micro-tomographie aux rayons X à une résolution de 10 µm. Chaque image volumétrique, de l’ordre de 1 To, permet de révéler le réseau 3D des aérenchymes, ces “canaux” internes qui transportent l’oxygène. Automatiser l’analyse de ces structures en 3D serait une première mondiale et constitue le cœur de ce stage.
Sujet :
Concevoir un pipeline complet d’analyse 3D pour la segmentation anatomique et l’estimation de caractéristiques complexes en 3D. Dans ce but, le stagiaire aura la responsabilité de réaliser des expérimentations avec des outils de l’état de l’art (modèles dédiés “plante” et modèles-fondation généralistes), et de concevoir une solution technique open-source qui sera mise à disposition dans un démonstrateur open-source via un plugin Python pour le logiciel Napari. Le stagiaire travaillera en lien étroit avec le deuxième stagiaire X-atlas 3D, dédié à la reconstruction architecturale en 3D. Une forte collaboration est prévue pour combiner les résultats dans une solution intégrée.
Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en informatique, analyse d’images, ou modélisation mathématique. Le langage de programmation utilisé sera Python, en utilisant des outils de développement communautaire et de maintien logiciel (Github, Intégration Continue), et des librairies standards de deep learning (Pytorch/Tensorflow).
Formation et compétences requises :
Expérience en traitement d’images 3D, et/ou modélisation géométrique appréciée. Intérêt pour le développement d’outils open-source et la collaboration interdisciplinaire. Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.
Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€ mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av. Agropolis, 34980 Montferrier-sur-Lez.
Document attaché : 202501271049_Offre de stage M2 – Deep aerenchimas.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : IMT Atlantique & ENSTA
Durée : 6 mois
Contact : dorian.cazau@ensta.fr
Date limite de publication : 2025-06-30
Contexte :
Sujet :
IA Non‐Supervisée pour le Suivi de la Biodiversité Marine par Acoustique Passive Sous Marine (IANSPAM)
Profil du candidat :
Formation et compétences requises :
Adresse d’emploi :
Brest ‐ IMT Atlantique / ENSTA
Document attaché : 202502101141_Stage IANSPAM.pdf
Offre en lien avec l’Action/le Réseau : – — –/Innovation
Laboratoire/Entreprise : CRISTAL UMR CNRS 9189
Durée : 6 mois
Contact : hayfa.zgaya-biau@univ-lille.fr
Date limite de publication : 2025-10-31
Contexte :
Le projet IARISQ (projet ANR 2025) vise à développer des modèles d’intelligence artificielle avancés pour prédire la toxicité des particules atmosphériques en fonction de leur composition physico-chimique et de leurs variations spatio-temporelles. Le stage s’inscrit dans une dynamique interdisciplinaire mêlant IA explicable (XAI), gestion de l’incertitude, toxicologie environnementale et données de qualité de l’air.
Suite possible : thèse (2026–2029)
Le stage pourra évoluer naturellement vers une thèse de doctorat de 3 ans au sein du laboratoire CRISTAL, dans la continuité des travaux réalisés. Le/la doctorant(e) travaillera en lien étroit avec les partenaires ATMO-HDF et LGCgE, sur la modélisation avancée des risques toxiques et l’intégration des modèles IA dans des outils opérationnels de surveillance.
Sujet :
• Participer à la construction et préparation de bases de données (mesures ATMO-HDF, composition physico-chimique, tests de toxicité).
• Déployer des modèles d’apprentissage automatique supervisés et non supervisés pour identifier les caractéristiques les plus influentes sur la toxicité.
• Expérimenter des techniques d’explicabilité (SHAP, LIME) et de réduction de dimension (UMAP, PCA).
• Contribuer au design d’une première version de pipeline IA à intégrer dans un futur système d’aide à la décision.
Profil du candidat :
• M2 en informatique, intelligence artificielle, science des données.
• Maîtrise de Python, notamment avec les bibliothèques scikit-learn, pandas, PyTorch ou TensorFlow.
• Connaissance des modèles de machine learning, des réseaux de neurones et/ou des approches XAI.
• Rigueur, autonomie et appétence pour les projets interdisciplinaires (santé, environnement, IA).
Formation et compétences requises :
• M2 en informatique, intelligence artificielle, science des données.
• Maîtrise de Python, notamment avec les bibliothèques scikit-learn, pandas, PyTorch ou TensorFlow.
• Connaissance des modèles de machine learning, des réseaux de neurones et/ou des approches XAI.
• Rigueur, autonomie et appétence pour les projets interdisciplinaires (santé, environnement, IA).
Adresse d’emploi :
Centre de Recherche en Informatique, Signal et Automatique de Lille
UMR CNRS 9189 CRIStAL
Université de Lille – Campus scientifique
Bâtiment ESPRIT
Avenue Henri Poincaré
59655 Villeneuve d’Ascq
https://www.cristal.univ-lille.fr
Offre en lien avec l’Action/le Réseau : – — –/Innovation
Laboratoire/Entreprise : CRISTAL UMR CNRS 9189
Durée : 6 mois
Contact : hayfa.zgaya-biau@univ-lille.fr
Date limite de publication : 2025-10-31
Contexte :
Le projet IARISQ (projet ANR 2025) vise à développer des modèles d’intelligence artificielle avancés pour prédire la toxicité des particules atmosphériques en fonction de leur composition physico-chimique et de leurs variations spatio-temporelles. Le stage s’inscrit dans une dynamique interdisciplinaire mêlant IA explicable (XAI), gestion de l’incertitude, toxicologie environnementale et données de qualité de l’air.
Suite possible : thèse (2026–2029)
Le stage pourra évoluer naturellement vers une thèse de doctorat de 3 ans au sein du laboratoire CRISTAL, dans la continuité des travaux réalisés. Le/la doctorant(e) travaillera en lien étroit avec les partenaires ATMO-HDF et LGCgE, sur la modélisation avancée des risques toxiques et l’intégration des modèles IA dans des outils opérationnels de surveillance.
Sujet :
• Participer à la construction et préparation de bases de données (mesures ATMO-HDF, composition physico-chimique, tests de toxicité).
• Déployer des modèles d’apprentissage automatique supervisés et non supervisés pour identifier les caractéristiques les plus influentes sur la toxicité.
• Expérimenter des techniques d’explicabilité (SHAP, LIME) et de réduction de dimension (UMAP, PCA).
• Contribuer au design d’une première version de pipeline IA à intégrer dans un futur système d’aide à la décision.
Profil du candidat :
• M2 en informatique, intelligence artificielle, science des données.
• Maîtrise de Python, notamment avec les bibliothèques scikit-learn, pandas, PyTorch ou TensorFlow.
• Connaissance des modèles de machine learning, des réseaux de neurones et/ou des approches XAI.
• Rigueur, autonomie et appétence pour les projets interdisciplinaires (santé, environnement, IA).
Formation et compétences requises :
• M2 en informatique, intelligence artificielle, science des données.
• Maîtrise de Python, notamment avec les bibliothèques scikit-learn, pandas, PyTorch ou TensorFlow.
• Connaissance des modèles de machine learning, des réseaux de neurones et/ou des approches XAI.
• Rigueur, autonomie et appétence pour les projets interdisciplinaires (santé, environnement, IA).
Adresse d’emploi :
Centre de Recherche en Informatique, Signal et Automatique de Lille
UMR CNRS 9189 CRIStAL
Université de Lille – Campus scientifique
Bâtiment ESPRIT
Avenue Henri Poincaré
59655 Villeneuve d’Ascq
https://www.cristal.univ-lille.fr
