Offre de stages en IA pour la physique fondamentale

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire des 2 Infinis – Toulouse
Durée : Flexible
Contact : catherine.biscarat@l2it.in2p3.fr
Date limite de publication : 2025-12-02

Contexte :
Le Laboratoire des 2 Infinis – Toulouse (L2IT) est une unité mixte de recherche (UMR) du CNRS et de l’Université de Toulouse, jeune et dynamique, née en janvier 2020. Les objets d’étude des chercheurs et des ingénieurs du L2IT sont les deux infinis – l’infiniment petit et l’infiniment grand – et les relations entre les phénomènes qui régissent chacun d’entre eux. Le laboratoire est organisé en quatre équipes “Calcul, Analyse et Données”, “Physique Nucléaire”, “Physique des particules” et “Ondes Gravitationnelles”. Nous poursuivons nos recherches au sein de collaborations internationales. Nous sommes actuellement 32 membres, dont 15 permanents qui mettent en place les équipes de recherche.

La spécificité du L2IT est son accent sur les méthodes numériques de pointe (IA, calcul HPC, ingénierie logicielle, expertise CUDA) qui accompagnent les travaux d’analyse de données, de modélisation, simulation, et de développements théoriques. Le L2IT est implanté sur un campus dynamique qui regroupe facultés, écoles et laboratoires.

Sujet :
Trois sujets de stage sont actuellement proposés. Ils sont à l’intersection entre l’IA et nos domaines de recherche en physique fondamentale (physique des particules, cosmologie, ondes gravitationnelles). Pour les détails des sujets, veuillez vous référer à notre site internet : https://www.l2it.in2p3.fr/en/emplois-et-stages/internships-2026/

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Laboratoire des 2 Infinis – Toulouse, Maison de la Recherche et de la Valorisation, 75 cours des Sciences, 31400 Toulouse, France

Postdoc on Anomaly Localization in Temporal Graphs

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Université du Littoral
Durée : 1 year
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2025-12-31

Contexte :
The Industrial Internet of Things (IIoT) is a rapidly evolving paradigm in which industrial sensors, machines, and other instruments are connected to the internet. The data provided by these systems are of great value for automated surveillance and detecting anomalies in them is a task of utmost importance.

Temporal graphs are a very effective model for IIoT data, where nodes represent devices; node features represent their measurements; and time-varying weighted edges capture various types of information. In the initial phase of this project, we have already developed powerful auto-encoder models capable of detecting both temporal and structural anomalies in temporal graphs. Yet, while our models allow us to detect the presence of an anomaly, they are still unable to localise it.

The main goal of this postdoctoral project is therefore to fundamentally extend our temporal graph auto-encoder models beyond anomaly detection to also perform anomaly localization.

Sujet :
The recruited postdoc will have two main goals:

Extension of Auto-Encoders for Anomaly Localization.

Our models currently receive a temporal graph as input and produce an anomaly score that is proportional to the severity of its abnormal events. Even though they can be used to localize anomalies by searching for the subset of maximal anomaly score, such an approach is impractical due to the exponential number of subsets to test. We aim to prune-down the search space by properly structuring the auto-encoder’s latent representation. This will require substantial architectural innovation to disentangle the auto-encoder’s structured representation and achieve fine-grained anomaly localization.
Application to IIoT logs and measurements.

We aim to evaluate the methodological developments above in real-world IIoT dataset that contain various types of attacks (structural anomalies) and measurement faults (feature anomalies). We aim to explore the advantages of our approach in real-world, potentially on-line, scenarios, such as machine health monitoring, transportation network monitoring, or other use cases that may arise from collaborations with local companies.

Profil du candidat :
We look for highly motivated candidates with relevant experience in anomaly detection, signal processing, graph machine learning, and/or deep learning. Experience in Python programming, cybersecurity and/or streaming algorithms is a plus. Ideal candidates will have a publication record in selective AI conferences.

Interested candidates are invited to send a cover letter, a detailed CV (with a publication list and the contact details of two references), and their PhD manuscript or a recent paper to:

esteban.bautista@univ-littoral.fr
claire.guilloteau@univ-littoral.fr

Applications will be reviewed on a rolling basis until the position is filled.

Formation et compétences requises :
PhD in Computer Science or related areas

Adresse d’emploi :
LISIC Laboratory, Saint-Omer, France

Document attaché : 202511041003_Postdoc___Temporal_Graph_Auto_Encoders____Job_Offer.pdf

Postdoctoral Researcher in Cosmological Modelling and Inference

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut d’Astrophysique de Paris (IAP), Paris, F
Durée : 2 years
Contact : florent.leclercq@iap.fr
Date limite de publication : 2026-01-15

Contexte :

Sujet :
The Institut d’Astrophysique de Paris (IAP) invites applications for a two‑year postdoctoral position in cosmological modelling and inference. See the full position description and application instructions here: https://cloud.aquila-consortium.org/s/Postdoc_ad_INFOCW

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Institut d’Astrophysique de Paris (IAP), 98bis boulevard Arago, F-75014 Paris, France

Stage M2 – Objectivation des phases de sommeil sur la base de données cérébrales chez le babouin

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : Institut de Science des Données de Montpellier / C
Durée : 5-6 mois
Contact : gino.frazzoli@umontpellier.fr
Date limite de publication : 2025-12-10

Contexte :
Le sommeil, bien que d’apparence triviale, constitue un état biologique complexe, difficile à quantifier sans recourir à une approche multimodale intégrant notamment l’enregistrement de l’activité cérébrale (EEG). Cette contrainte technologique rend l’étude du sommeil exigeante en conditions naturelles. Comprendre comment les animaux dorment dans leur environnement, en particulier dans un cadre social, représente ainsi un défi majeur. Chez les espèces grégaires comme le babouin, le sommeil ne se résume pas à un phénomène individuel : il s’organise dans un contexte collectif, influencé par les interactions sociales, la hiérarchie et la vigilance partagée. Le projet ERC COSLEEP (dirigé par Meg Crofoot, Max Planck Institute of Animal Behavior) s’attache à explorer cette dimension sociale du sommeil en conditions écologiques réelles, grâce à des suivis simultanés du comportement, de la position et de l’activité physiologique d’individus vivant à l’état sauvage. Le stage proposé s’inscrit dans cette collaboration entre le Centre d’Écologie Fonctionnelle et Évolutive (CEFE), l’Institut de Science des Données et le Max Planck Institute, et portera sur l’analyse de données de sommeil (activité cérébrale, musculaire, oculaire, accéléromètre et vidéo) afin de caractériser la structure et la qualité du sommeil dans un contexte social et écologique réel, et de développer un modèle prédictif fiable basé sur les signaux accélérométriques.

Sujet :
Le stage aura pour objectif de contribuer à la mise au point d’outils d’analyse automatisée du sommeil chez le babouin à partir de séries temporelles multimodales. Dans un premier temps, le ou la stagiaire évaluera la cohérence du scorage manuel du sommeil réalisé par plusieurs spécialistes à partir d’enregistrements physiologiques (EEG, EMG, EOG, accéléromètre, vidéo), afin de quantifier le niveau d’accord inter-experts et d’établir une base de données de référence. Dans un second temps, il s’agira de tester et d’adapter des modèles d’apprentissage automatique existants (tels que Somnotate ou USleep) pour obtenir un algorithme de scorage automatique capable de s’ajuster aux caractéristiques propres aux signaux enregistrés chez le babouin. Enfin, le stage visera à développer un modèle prédictif du sommeil à partir des signaux d’accéléromètre seuls, en s’appuyant sur les labels dérivés de l’activité cérébrale. Ce modèle permettra à terme d’estimer les phases et sous-états du sommeil à partir de capteurs portés sur collier, ouvrant la voie à une analyse non invasive du sommeil en milieu naturel.

Profil du candidat :
Le ou la candidat(e) devra posséder une formation en analyse de données expérimentales, data science, ou domaine connexe avec une appétence pour les neurosciences, sciences cognitives, bio-informatique, ou l’écophysiologie. Une bonne familiarité avec le traitement de signaux temporels, des compétences en programmation (Python, Matlab ou R) et des compétences en méthodes d’apprentissage automatique (réseaux de neurones, classification supervisée et modèles de deep learning) seraient un atout majeur.
Le ou la stagiaire devra faire preuve de rigueur, d’autonomie et de curiosité scientifique, ainsi que d’un goût marqué pour l’analyse de données et le travail interdisciplinaire, à l’interface entre neurosciences, écologie comportementale et science des données. Une aisance en anglais scientifique (lecture et échanges techniques) sera également souhaitée.

Formation et compétences requises :
• Maîtrise de Python (NumPy, Pandas, Scikit-learn, PyTorch). Des notions en Matlab sont appréciées.
• Connaissances en statistiques, apprentissage automatique et deep learning.
• Intérêt pour les méthodes utilisées dans les modèles de scorage automatique du sommeil :
o USleep : réseau profond combinant CNN inspiré de U-net pour la classification EEG/EMG. https://www.nature.com/articles/s41746-021-00440-5
o Somnotate : approche probabiliste (HMM + LDA) intégrant la dynamique temporelle du sommeil. https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1011793
• Intérêt à développer des compétences en analyse de signaux physiologiques (EEG, EMG, EOG, accélérométrie).
• Notions en validation de modèles et évaluation inter-experts (Kappa, ICC, …).
• Rigueur, autonomie, et intérêt pour les approches interdisciplinaires (neurosciences, écologie, data science).
• Bon niveau d’anglais scientifique (lecture et communication).

Adresse d’emploi :
Case courrier, 13004 Pl. Eugène Bataillon Bât. 4, 34095 Montpellier Cedex 5

Document attaché : 202511030916_Analyse_donnees_physiologiques_babouins_CEFE_ISDM_Montpellier.pdf

Postdoctoral position: Long Term Time series prediction in environmental sciences

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT, Université de Tours
Durée : 6 months (end in Jun
Contact : nicolas.ragot@univ-tours.fr
Date limite de publication : 2026-01-16

Contexte :
The JUNON project, driven by the BRGM, is granted from the Centre-Val de Loire region through ARD program (« Ambition Recherche Développement ») which goal is to develop a research & innovation pole around environmental resources (agriculture, forest, waters…). The main goal of JUNON is to elaborate digital services through large scale digital twins in order to improve the monitoring, understanding and prediction of environmental resources evolution and phenomena, for a better management of natural resources. Digital twins will allow to virtually reproduce natural processes and phenomena using combination of AI and environmental tools.
JUNON will focus on the elaboration of digital twins concerning quality and quantity of ground waters, as well as emissions of greenhouse gases and pollutants with health effects, at the scale of geographical area corresponding to the North part of the Centre-Val-de-Loire region.
These digital twins will rely on geological and meteorological knowledge and data (time series), as well as physic-based models.
The project actors are: BRGM, Université d’Orléans, Université de Tours, CNRS, INRAE, and ATOS and ANTEA companies. There are 5 work packages (WP):
1. User’s needs and geological knowledge for ground water
2. User’s needs and biological/chemical knowledge about pollutants and greenhouse gases
3. Data management and data mining
4. Time series prediction
5. Aggregation and realization of digital twins themselves
The postdoctoral position will be in the WP 4, focused on the prediction of quantity of ground waters. There will be strong interactions with WP 1 and 3 (BRGM) through postdocs and engineers. The work will be supervised by the LIFAT – RFAI and you will have to interact with one PhD student in JUNON as well. Interaction with the RFAI group and other PhDs working on similar subjects will also be done.

Sujet :
While the BRGM (a postdoc to be recruited) will have in charge to collect and arrange data (ground waters levels at different locations) and to benchmark predictions with mechanistic models as well as with classical prediction AI tools, the goal of the postdoc will be
– To set up an evaluation protocol and SOTA approaches to design a specific competition for an upcoming conference. The protocol will relies on previous analysis and data and will focus on infrastructure and meachnisms to deliver data to participants according to different scenarii including continual learning ones
– to build new prediction models (able to integrate several sources of information ; using correlation between mulitple sensors ; using knowledge transfer or domain adaptation, etc.)

Profil du candidat :
The position is initially for a postdoc position but candidates with a Master of Science degree and strong skills and experience in Machine Learning for Time Series could also apply.

Formation et compétences requises :
– required:
– strong experience in data analysis and machine learning (theory and practice of deep learning in python)
– experiences/knowledge in time series prediction with SOTA deep learning approaches
– interest or experiences with environmental science (hydrogeology, air pollution…)
– curiosity and ability to communicate (in English at least) and work in collaboration with scientists from other fields
– ability to propose and validate new solutions and to publish the results
– autonomy and good organization skills

Adresse d’emploi :
Computer Science Lab of Université de Tours (LIFAT), Pattern Recognition and Image Analysis Group (RFAI)
https://www.rfai.lifat.univ-tours.fr
64 av. Jean Portalis,
37200 TOURS
FRANCE

Document attaché : 202510311520_Fiche de poste Pdoc 2 Junon.pdf

Détection et caractérisation de façades par apprentissage profond dans des images GSV

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PRISME / Université d’Orléans
Durée : 6 mois
Contact : youssef.fouzai@etu.univ-orleans.fr
Date limite de publication : 2026-01-16

Contexte :
Ce stage s’inscrit dans le cadre du projet régional CERES, porté par le BRGM en partenariat avec le laboratoire PRISME de l’Université d’Orléans, Thélem Assurances et l’Agglomération de Blois. L’objectif global du projet est de caractériser grâce à des
techniques d’intelligence artificielle les éléments exposés du territoire du Centre-Val de Loire face aux risques naturels. On s’appuie sur des images satellitaires, d’autres issues de Google Street View (GSV )et des données cartographiques.

Sujet :
Dans le cadre du stage, les travaux à effectuer visent à approfondir l’analyse des façades de bâtiments, afin de produire des éléments exploitables pour caractériser leur
vulnérabilité face aux risques naturels dont le retrait/gonflement argileux qui fissure les constructions. Une façade contient de nombreux indicateurs de vulnérabilité auxquels l’expert attache une grande attention comme la surface et la position des portes et fenêtres ou la géométrie du bâtiment, pour l’affecter à une classe de vulnérabilité.
L’exploitation des images GSV utilisera des modèles deep learning pour détecter les façades dans les images et extraire des caractéristiques permettant d’en déduire un niveau de vulnérabilité Les résultats du stage seront exploités dans le cadre de la thèse du doctorant qui participera à l’encadrement du stagiaire.

Profil du candidat :
BAC+5 (Master 2/ école ingénieur) en informatique.

Formation et compétences requises :
BAC+5 (Master 2/ école ingénieur) en informatique avec de bonnes connaissances en traitement d’images, la maîtrise de la programmation Python (Pandas, NumPy, Scikitlearn, PyTorch/TensorFlow) ainsi qu’en apprentissage profond et un bon niveau d’anglais. Quelques connaissances en Systèmes d’Information Géographique (SIG) seraient également appréciées.

Adresse d’emploi :
Polytech, 12 Rue de Blois, 45100 Orléans

Document attaché : 202510311400_Stage Master_PRISME_CERES_v1.pdf

Apprentissage frugal de modèles génératifs multimodaux en contexte industriel

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRT SystemX
Durée : 36 mois
Contact : faicel.chamroukhi@irt-systemx.fr
Date limite de publication : 2026-01-16

Contexte :
L’IRT SystemX propose une thèse sur l’apprentissage frugal de modèles génératifs multimodaux en contexte industriel. La thèse s’inscrit dans le cadre d’un projet collaboratif sur l’IA Générative pour l’Industrie, mené en partenariat avec notamment Air Liquide et Michelin, et son volet applicatif vise à adresser des cas d’usage industriels liés à la gestion de connaissances techniques en ingénierie de systèmes complexes.

Le poste est basé à Palaiseau et la thèse sera inscrite à l’école doctorale STIC de l’Université Paris-Saclay.

La thèse est financée pour une durée de 36 mois, avec une rémunération de 2784 € brut/mois, pour un démarrage souhaité début 2026.

Voici pdf ci-joint pour plus de détails sur le contexte.

Sujet :
Apprentissage frugal de modèles génératifs multimodaux en contexte industriel. Le volet applicatif vise à adresser des cas d’usage industriels liés à la gestion de connaissances techniques en ingénierie de systèmes complexes.

Voici pdf ci-joint pour plus de détails sur le sujet.

Profil du candidat :
Le(la) candidat(te) doit justifier d’un Master Recherche (ou formation équivalente avec un intérêt avéré pour la recherche) dans le domaine des sciences des données et de l’Intelligence Artificielle.

Formation et compétences requises :
Master Recherche ou équivalent en sciences des données et Intelligence Artificielle.
Intérêt marqué pour la recherche et goût pour les applications.
Solides compétences en inférence statistique et en optimisation.
Maîtrise de l’apprentissage profond.
Programmation en Python, avec expérience PyTorch/TensorFlow.
Des compétences sur les modèles d’IA générative serait un plus.

Pour postuler, merci d’envoyer les éléments suivants au format PDF à : faicel.chamroukhi@irt-systemx.fr
CV détaillé
Lettre de motivation
Relevés de notes des deux dernières années d’étude de Master ou de cycle ingénieur
Au moins une lettre de recommandation

Adresse d’emploi :
IRT SystemX,
2 Boulevard Thomas Gobert
91120, Palaiseau

Document attaché : 202510310836_Offre-de-These-IRTSystemX-DIT-2-2026-IAG1.pdf

Appel à soumission – EGC 2026 Atelier IA centrée sur les données (IACD)

Date : 2026-01-27
Lieu : Anglet, France

—————————————————————————
Appel à soumission – EGC 2026 Atelier IA centrée sur les données (IACD)
—————————————————————————-

L’Intelligence Artificielle centrée sur les données (IACD, Data Centric AI, ou DCAI) est un paradigme qui place les données au cœur du processus d’apprentissage automatique, contrairement aux approches traditionnelles centrées sur les algorithmes et l’architecture des modèles. Cette approche met l’accent sur la qualité, la quantité et la représentativité des données qui sont des facteurs clés de la fiabilité et de la robustesse des systèmes d’IA. L’IA centrée sur les données s’intéresse aussi à l’automatisation du pipeline de science des données incluant la préparation des données, leur nettoyage, leur annotation et leur représentation.

L’objectif de l’atelier est de présenter les travaux des équipes francophones concernant l’IA centrée sur les données, et de fédérer les chercheurs travaillant sur cette thématique. Il fait suite à un premier atelier organisé lors d’EGC 2025, et qui a regroupé une trentaine de participants en moyenne autour de 13 présentations.

— Dates Importantes —

* Date de soumissions : 28/11/2025, 23:59 heure de Paris
* Notification aux auteurs : 20/12/2025
* Date de l’atelier : 27/01/2026

— Thèmes (liste non exhaustive) —

* Automatisation des pipelines de science des données
* Ingénierie des caractéristiques
* Méthodes centrées sur les données pour l’apprentissage automatique et la fouille de données
* Génération de jeux de données ou de Benchmarks
* Outils pour l’IA centrée sur les données
* Applications de méthodes centrées sur les données

— Soumission —

Les articles pourront porter sur des travaux originaux ou correspondre à des travaux déjà acceptés dans des conférences internationales. Ils pourront aussi décrire des solutions mises en place par des entreprises.

Deux types de soumissions :

Articles courts : 2 à 4 pages
Articles longs : 8 à 12 pages

Les soumissions devront être au format PDF exclusivement et devront utiliser le format RNTI latex : https://www.editions-rnti.fr/files/RNTI-202208.zip. Chaque article soumis sera évalué en double aveugle.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Développeur.euse C++ HPC d’un code de simulation pour la formation de grandes structures en cosmologie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut d’Astrophysique de Paris
Durée : 4 à 6 mois
Contact : tchernia@iap.fr
Date limite de publication : 2025-11-21

Contexte :
La modélisation et la compréhension de l’histoire de l’Univers, depuis le Big Bang jusqu’à aujourd’hui, reposent sur l’évaluation de nos modèles
cosmologiques à partir des grands relevés astronomiques (Euclid, DESI…). L’un des objectifs est de simuler la formation des grandes structures afin d’évaluer la robustesse des modèles cosmologiques vis-à-vis des observations. L’Institut d’Astrophysique de Paris (IAP), une Unité Mixte de Recherche (UMR) de Sorbonne Université et du Centre National de la Recherche Scientifique (CNRS), est impliqué dans cette activité. En son sein, l’équipe « Grandes structures et Univers profond » à laquelle le.la stagiaire sera affecté.e a développé le code Simbelmynë, qui permet de :

1. Calculer l’évolution de la répartition de matière noire en résolvant les
équations du mouvement de la gravité à l’échelle de l’univers observable
(problème à N corps),
2. En déduire une répartition des galaxies dans le ciel,
3. Produire des relevés cosmologiques simulés.

Cette chaîne de simulation est appelée à être lancée un très grand nombre de fois pour des paramètres d’entrée variés. C’est pourquoi le respect des contraintes du calcul haute performance (HPC) et la parallélisation des tâches sont des enjeux clés de ce code. Grâce à l’approche sCOLA qui divise la portion d’univers à simuler en morceaux indépendants, il est possible d’adopter une approche hybride entre calculs à mémoire distribuée et à mémoire partagée. Nous souhaitons aujourd’hui le rendre portable sur plusieurs architectures cibles (CPU et GPU).

Pour plus de détails sur le contexte scientifique, voici un article de vulgarisation traitant de ce sujet : https://theconversation.com/vers-une-simulation-de-lunivers-sur-un-telephone-portable-137421

Sujet :
La.le stagiaire participera au portage de C vers C++ du code Simbelmÿne ainsi qu’au développement de codes de calcul parallèle utilisant des CPU et GPUs. Il/elle se formera au framework Kokkos et l’utilisera afin de produire un code générique compatible avec toutes les architectures cibles. Il/elle mettra ces codes en œuvre à l’aide du cluster de calcul du laboratoire, mettant à disposition CPUs et GPUs. Il/elle travaillera en équipe et versionnera son code à l’aide de Git et produira les tests unitaires et benchmarks garantissant la qualité, la performance et la robustesse de son code.

Profil du candidat :
Nous recherchons un.e stagiaire de six mois en fin d’études ou césure, en école d’ingénieurs ou master, avec une spécialisation en informatique et si possible en calcul scientifique/HPC.

Formation et compétences requises :
– Maîtrise du langage de programmation C++, connaissance de python
– Savoir adopter une méthodologie de développement collaboratif (Git,
tests unitaires…)
– Connaître les enjeux de la programmation HPC, notamment la
parallélisation des tâches (multithreading, multiprocessing).
– Notions de mathématiques appliquées (Transformées de Fourier,
Équations aux dérivées partielles…)
– Anglais courant (réunions en anglais)
– Une formation en physique serait un plus.

Adresse d’emploi :
98 bis boulevard Arago, 75014 Paris

Document attaché : 202510231604_Fiche de stage HPC Cosmologie.pdf

Régression symbolique pour la modélisation en volcanologie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISTIC
Durée : 4-6 mois
Contact : argheesh.bhanot@univ-smb.fr
Date limite de publication : 2026-04-30

Contexte :

Sujet :
En sciences naturelles, la modélisation des phénomènes physiques constitue toujours un sujet difficile. Les formules existantes ne suffisent parfois pas à représenter adéquatement les mécanismes complexes, notamment ceux qui ne sont pas directement observables. Il arrive également que ces formules ne correspondent pas parfaitement aux observations issues des données. Ces problèmes ont, par exemple, été rencontrés dans le suivi de la concentration des polluants, l’étalement de la végétation ou encore les coulées de lave.
Dans ce projet, nous nous concentrons sur la modélisation volcanique. En volcanologie, par exemple, les scientifiques disposent de mesures de déplacements en surface, obtenues grâce à l’imagerie SAR, induits par une source volcanique en profondeur, et utilisent ces mesures pour estimer les paramètres physiques d’un modèle volcanique.
Dans un premier temps, nous sommes partis d’un modèle simple sous forme d’une expression analytique : le modèle Mogi. Dans ce modèle, deux paramètres clés, la variation du volume et la profondeur de la chambre magmatique ont été modifiés pour générer des données synthétiques. En utilisant la régression symbolique, nous avons exploré des expressions mathématiques directement à partir des données. La
pertinence de l’approche et la sensibilité de la modélisation à la variété de l’activité volcanique, sur des données synthétiques et des sites volcaniques réels, ont été mesurées et comparées au modèle Mogi original. L’approche fonctionne bien jusqu’à un certain niveau de bruit, notamment sur les données
synthétiques. L’objectif du stage consiste à utiliser les méthodes de régression symbolique pour affiner le modèle Mogi, car il reste une vision simplifiée de la physique sous-jacente. Des travaux supplémentaires sont encore nécessaires pour améliorer les résultats sur les données réelles en proposant des nouvelles techniques en régression symbolique. En s’appuyant sur des travaux d’IA classique développés au laboratoire sur
l’inversion de modèles géophysiques, trois types de données sont disponibles pour créer un cadre expérimental et de validation : 1) des déplacements simulés à partir du modèle Mogi ; 2) des déplacements simulés avec un bruit ajouté ; 3) des déplacements réels sur des volcans africains. Selon
l’avancement du projet, cette étude pourra être étendue à un modèle volcanique plus sophistiqué, par exemple le modèle Okada, qui décrit le mécanisme de fonctionnement d’un volcan à l’aide d’un plus grand nombre de paramètres et s’appuie sur des équations différentielles. Le stagiaire appuiera entre autres sur les articles suivants :
– Cranmer, M. (2023). Interpretable machine learning for science with PySR and SymbolicRegression. jl.
arXiv preprint arXiv:2305.01582.
– Tenachi, W., et al. (2023). Physical Symbolic Optimization. arXiv preprint arXiv:2312.03612.
– Albino, F., & Biggs, J. (2021). Magmatic processes in the East African Rift system: insights from a 2015–
2020 Sentinel‐1 InSAR survey. Geochemistry, Geophysics, Geosystems, 22(3), e2020GC009488.
– Dzurisin, D. (2007), Volcano Deformation: Geodetic Monitoring Techniques. Mogi, K. (1958), Bull. Earthq.
Inst. U. Tokyo, 36, 99‐134 Delaney, P., McTigue, D. (1994) Bull. Volcanology, 56 417‐42
– Lopez-Uroz L, Yan Y., Benoit A., Albino F., Bouygues P., Giffard-Roisin S., Pinel V., Exploring Deep Learning
for Volcanic Source Inversion, IEEE Transactions on Geosciences & Remote Sensing.
– Petersen, B. K., et al. (2019). Deep symbolic regression: Recovering mathematical expressions from data
via risk-seeking policy gradients. arXiv preprint arXiv:1912.04871.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
LISTIC, 5 chemin de bellevue, 74944, Annecy le Vieux, France.

Document attaché : 202510221322_stage_regressionsymbolique_2026.pdf