Offre de stage M2 – Enrichissement d’ontologies par approche neuro-symbolique (LLM)

Offre en lien avec l’Action/le Réseau : HELP/– — –

Laboratoire/Entreprise : Laboratoire d’Intelligence Artificielle et Sémant
Durée : 4 à 5 mois
Contact : t.mecharnia@iut.univ-paris8.fr
Date limite de publication : 2026-02-28

Contexte :

Sujet :
Ce stage s’inscrit dans des travaux de recherche à l’interface entre intelligence artificielle symbolique, apprentissage automatique et ingénierie des connaissances. Il portera notamment sur l’exploitation de LLM pour la génération, l’alignement et la validation de connaissances ontologiques.

Une description détaillée du sujet, des objectifs scientifiques et du contexte de recherche est disponible dans le document joint.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Équipe EID du LIASD, IUT de Montreuil, 140 Rue de la Nouvelle France,
93100 Montreuil, France

Document attaché : 202601071430_Annonce_Stage_M2.pdf

Low-Resource Bias Evaluation and Mitigation for Large Language Models

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : SAMOVAR, Télécom SudParis, IP Paris
Durée : 3 Years
Contact : luca.benedetto@telecom-sudparis.eu
Date limite de publication : 2026-02-28

Contexte :

Sujet :
We are offering a PhD Thesis position to perform research on NLP and AI Fairness, in the ACMES Team of the SAMOVAR lab at IP Paris.

In this project, we will work on low-resource techniques for bias detection and mitigation in large language models, across a variety of domains, from education to recommendation systems.

You can find a detailed description of this position at the following link: https://partage.imt.fr/index.php/s/qzGZz4KBCMnsJso

To apply, please reach out to luca.benedetto@telecom-sudparis.eu

Interviews will be held in late January.

Profil du candidat :

Formation et compétences requises :
Candidates are expected to have experience with machine learning in general, and specifically with NLP.

Familiarity with frameworks and libraries such as langchain, vLLM, ollama is preferred.

Adresse d’emploi :
Evry ou Palaiseau (France)

Document attaché : 202601071133_sujetThese_ED626_68505.pdf

Étude de l’apport des Prétraitements en imagerie sous-marine pour les approches Convolutives

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LabiISEN – ISEN Ouest
Durée : 4 à 6 mois
Contact : thibault.napoleon@isen-ouest.yncrea.fr
Date limite de publication : 2026-02-28

Contexte :

Sujet :
Dans le cadre de travaux avec Thales Underwater System (UWS), nous cherchons à évaluer la pertinence des prétraitements dans les techniques de vision par ordinateur en milieu sous-marin. En effet, il est d’usage de prétraiter les images issues du capteur (photo ou vidéo) afin de compenser les distorsions colorimétriques induites par le milieu aquatique ainsi que les phénomènes de brumes sous-marines induits par la turbidité. Cependant, ces approches s’appuient depuis quelques années sur des techniques utilisant des réseaux de neurones (souvent convolutifs) dont les architectures sont proches de celles utilisées pour les tâches de vision par ordinateur qui suivent ces prétraitements. Ainsi, cette étude vise à mieux comprendre les avantages et les inconvénients d’enchainer les étapes prétraitement (c.-à-d. approche dissociée) et traitements par vision (classification, détection ou segmentation par exemple) plutôt que de les combiner dans un même réseau de neurones (c.-à-d. approche combinée).

Le but de ce stage est de comparer ces deux approches, dissociée et combinée, dans un cadre unifié où plusieurs méthodes de prétraitements et plusieurs tâches de vision seront étudiées. Le but étant de montrer les avantages et les inconvénients des deux approches. Ainsi, il pourrait être possible de proposer une méthode combinant les avantages de chacune. L’une des pistes envisagées est une approche multi-objectifs dans un réseau de segmentation sémantique. Dans ce cadre, l’un des objectifs serait le débrumage d’image tandis qu’un autre serait la segmentation sémantique des images. Avec cette approche, la capacité d’apprendre à prétraiter les images en même temps qu’en extraire les informations pertinentes, pour plus de robustesse, pourrait apparaitre dans un unique réseau de neurones.

Le stage s’articulera autour des points suivants :
• Sélection des bases de données nécessaires à l’étude comparative.
• Sélection des méthodes de prétraitements utilisées en vision sous-marine.
• Sélection des méthodes de vision par ordinateur adaptées aux tâches de vision sous-marines.
• Étude comparative des approches dissociées et combinées.

Profil du candidat :
Le candidat doit avoir :
• suivi un cursus de Master ou d’Ingénieur dans un des domaines suivants : vision par
ordinateur, science des données, informatique ;
• de solides compétences en algorithmique et en programmation ;
• des connaissances en vision par ordinateur ;
• des connaissances en intelligence artificielle.

Pour candidater, le candidat doit fournir :
• un CV détaillé ;
• les relevées de notes des deux dernières années.

Merci de candidater sur https://isen.softy.pro/offers/186565 ou en envoyant un mail à thibault.napoleon@isen-ouest.yncrea.fr (objet : [Stage EPIC]).

Formation et compétences requises :

Adresse d’emploi :
ISEN Ouest, site de Brest – 20 rue Cuirassé Bretagne, 29200 Brest

Document attaché : 202601070932_Sujet.pdf

Postdoc (H/F) dans le domain de transitoire radio en astronomie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LPC2E – Laboratoire de Physique et Chimie de l’En
Durée : 3 ans
Contact : cherry.ng-guiheneuf@cnrs-orleans.fr
Date limite de publication : 2026-02-28

Contexte :
Les récentes avancées technologiques ont permis aux astronomes de numériser le ciel radio à une fraction de seconde près. Cette résolution temporelle sans précédent offre une sensibilité aux phénomènes transitoires qui nous auraient autrement échappé. Les transitoires à longue période (LPT) en sont un excellent exemple : il s’agit d’une nouvelle classe émergente de sources radio cohérentes qui remettent en question notre compréhension de la physique des émissions des étoiles à neutrons. Contrairement aux pulsars canoniques, qui présentent des périodes de rotation de quelques millisecondes à quelques secondes, les LPT émettent périodiquement sur des échelles de temps de quelques dizaines de secondes à quelques minutes, voire quelques heures. La découverte des LPT est tout à fait inattendue ; on pensait depuis longtemps qu’à mesure que les étoiles à neutrons ralentissaient et perdaient progressivement leur énergie de rotation, la production de paires et les émissions radio cohérentes devaient cesser au-delà de la « ligne de mort des pulsars ».

L’existence de ces émetteurs à longue période soulève des questions fondamentales sur la manière dont l’émission cohérente est générée dans les magnétosphères lorsque la chute de potentiel disponible est insuffisante pour maintenir les cascades de paires. À ce jour, seule une douzaine de LPT ont été découverts, bien que la nature extrêmement intermittente de nombre d’entre eux suggère que beaucoup d’autres objets de ce type restent à détecter. La compréhension des LPT est essentielle pour faire progresser les modèles de magnétosphères des étoiles à neutrons, tester les limites de l’accélération des particules et de la génération de plasma, et potentiellement découvrir les liens évolutifs entre les pulsars, les magnétars et d’autres phénomènes radio transitoires tels que les sursauts radio rapides (FRB). En bref, l’étude des LPT offre une occasion unique d’explorer à la fois la physique des émissions cohérentes et l’évolution tardive des étoiles à neutrons. Elle permet également d’étudier les systèmes binaires de naines blanches, car au moins certains des LPT semblent être des systèmes « polaires » en interaction, dans lesquels un pont magnétique se forme entre une naine blanche et une autre étoile de faible masse.

Sujet :
Afin d’augmenter la taille de l’échantillon LPT et obtenir une image plus complète, nous exploiterons la multitude de données du futur radiotélescope CHORD, un instrument de nouvelle génération actuellement en construction au Canada et dont la mise en service est prévue en 2027. Grâce aux récentes avancées technologiques, CHORD disposera de deux capacités uniques : une vitesse de cartographie du ciel sans précédent et une couverture quotidienne répétée du ciel, les deux ingrédients clés pour une étude réussie des pulsars. Ce projet est entièrement financé par une subvention nationale de l’ANR.

Le/la post-doctorant(e) dirigera le développement d’algorithmes de traitement du signal, le traitement des données temporelles et la modélisation. La tâche consistera notamment à optimiser le flux de travail et à le déployer sur des clusters GPU/CPU pour la production. À l’issue de ses trois années de recherche postdoctorale, le/la candidat(e) sera en mesure de faire preuve de leadership dans le cadre d’un projet de pointe sur les transitoires radio, en particulier dans le domaine des pulsars et des transitoires rapides. Le/la candidat(e) dirigera également l’étude de suivi des découvertes à l’aide du radiotélescope de Nançay (NRT) et du télescope NenuFAR de l’observatoire Radioastronomique de Nançay, en France. Le/la candidat(e) travaillera au suivi des découvertes à l’aide du Grand Radiotélescope de Nançay (NRT) et du télescope NenuFAR de l’Observatoire Radioastronomique de Nançay en France.

Profil du candidat :
La candidature doit être accompagnée d’un CV détaillé (3 pages maximum), de trois lettres de recommandation envoyées directement à cherry.ng-guiheneuf@cnrs-orleans.fr par les référents avant la date limite, ainsi que d’une lettre de motivation présentant la motivation du/de la candidat(e) à se former en tant que chercheur(euse) en astrophysique, et plus particulièrement au LPC2E/CNRS, son expérience de recherche, ses centres d’intérêt scientifiques, ainsi que ses projets et objectifs de carrière.

Formation et compétences requises :
Le/la candidat(e) doit être titulaire d’un doctorat en astrophysique (ou dans un domaine étroitement lié), être disponible à temps plein et avoir une bonne maîtrise de l’anglais. La capacité à travailler en collaboration et dans un cadre interdisciplinaire sera un élément déterminant dans l’évaluation des candidatures. Une expérience en programmation et en traitement du signal est requise.

Adresse d’emploi :
Le/la candidat sera accueilli(e) par l’équipe ASTRO au LPC2E à Orléans. L’équipe dispose du plus grand groupe de recherche sur les pulsars en France et est étroitement liée à l’Observatoire radioastronomique de Nançay, situé dans la forêt de Sologne. Le/la candidat(e) aura également l’occasion de voyager pour collaborer avec d’autres instituts partenaires, ainsi que de présenter ses travaux de recherche lors de conférences internationales. Un ordinateur portable lui sera fourni, ainsi que l’accès aux ressources informatiques nécessaires.

La collaboration CHORD est une équipe multi-institutionnelle comptant plus de 100 membres. Parmi les instituts partenaires figurent notamment l’Université de Toronto, l’Université McGill, l’Institut Perimeter, l’Université de Colombie-Britannique, le MIT, l’INAF et le CNRS. Le réseau central du télescope CHORD est hébergé à l’Observatoire radio-astrophysique Dominion (DRAO) sur la côte ouest du Canada, et deux stations satellites seront construites aux observatoires de Green Bank et Hat Creek aux États-Unis.

Les candidats sont invités à contacter les encadrants (Cherry Ng-Guiheneuf cherry.ng-guiheneuf@cnrs-orleans.fr et Gilles Theureau Gilles.Theureau@obspm.fr) pour discuter plus en détail.

Étude des transitoires en radio astronomie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LPC2E – Laboratoire de Physique et Chimie de l’Env
Durée : 3 ans
Contact : cherry.ng-guiheneuf@cnrs-orleans.fr
Date limite de publication : 2026-02-28

Contexte :
Les récentes avancées technologiques ont permis aux astronomes de numériser le ciel radio à une fraction de seconde près. Cette résolution temporelle sans précédent offre une sensibilité aux phénomènes transitoires qui nous auraient autrement échappé. Les transitoires à longue période (LPT) en sont un excellent exemple : il s’agit d’une nouvelle classe émergente de sources radio cohérentes qui remettent en question notre compréhension de la physique des émissions des étoiles à neutrons. Contrairement aux pulsars canoniques, qui présentent des périodes de rotation de quelques millisecondes à quelques secondes, les LPT émettent périodiquement sur des échelles de temps de quelques dizaines de secondes à quelques minutes, voire quelques heures. La découverte des LPT est tout à fait inattendue ; on pensait depuis longtemps qu’à mesure que les étoiles à neutrons ralentissaient et perdaient progressivement leur énergie de rotation, la production de paires et les émissions radio cohérentes devaient cesser au-delà de la « ligne de mort des pulsars ».

L’existence de ces émetteurs à longue période soulève des questions fondamentales sur la manière dont l’émission cohérente est générée dans les magnétosphères lorsque la chute de potentiel disponible est insuffisante pour maintenir les cascades de paires. À ce jour, seule une douzaine de LPT ont été découverts, bien que la nature extrêmement intermittente de nombre d’entre eux suggère que beaucoup d’autres objets de ce type restent à détecter. La compréhension des LPT est essentielle pour faire progresser les modèles de magnétosphères des étoiles à neutrons, tester les limites de l’accélération des particules et de la génération de plasma, et potentiellement découvrir les liens évolutifs entre les pulsars, les magnétars et d’autres phénomènes radio transitoires tels que les sursauts radio rapides (FRB). En bref, l’étude des LPT offre une occasion unique d’explorer à la fois la physique des émissions cohérentes et l’évolution tardive des étoiles à neutrons. Elle permet également d’étudier les systèmes binaires de naines blanches, car au moins certains des LPT semblent être des systèmes « polaires » en interaction, dans lesquels un pont magnétique se forme entre une naine blanche et une autre étoile de faible masse.

Sujet :
Afin d’augmenter la taille de l’échantillon LPT et obtenir une image plus complète, nous exploiterons la multitude de données du futur radiotélescope CHORD, un instrument de nouvelle génération actuellement en construction au Canada et dont la mise en service est prévue en 2027. Grâce aux récentes avancées technologiques, CHORD disposera de deux capacités uniques : une vitesse de cartographie du ciel sans précédent et une couverture quotidienne répétée du ciel, les deux ingrédients clés pour une étude réussie des pulsars.

Ce projet est entièrement financé par une subvention nationale de l’ANR. Le/la doctorant(e) participera à l’optimisation et au réglage précis de modules spécifiques d’algorithmes de traitement du signal, au traitement et à la modélisation de séries temporelles. Il/elle pourra également s’investir dans l’exploitation d’algorithmes basés sur l’apprentissage automatique (ML) afin de réduire les faux positifs causés par les signaux parasites générés par l’homme dans les données d’observation (par opposition aux signaux astrophysiques). Le/la candidat(e) participera également à la gestion du traitement des données et à l’évaluation des résultats de recherche. À la fin du doctorat, nous attendons de l’étudiant(e) qu’il/elle maîtrise parfaitement le traitement des signaux radioastronomiques et qu’il/elle soit devenu(e) un(e) expert(e) en analyse de données dans le domaine temporel, en particulier dans le domaine des pulsars et des transitoires rapides. Le/la candidat(e) travaillera au suivi des découvertes à l’aide du Grand Radiotélescope de Nançay (NRT) et du télescope NenuFAR de l’Observatoire Radioastronomique de Nançay en France.

Le/la candidat(e) sera accueilli(e) par l’équipe ASTRO au LPC2E à Orléans. L’équipe dispose du plus grand groupe de recherche sur les pulsars en France et est étroitement liée à l’Observatoire Radioastronomique de Nançay, situé dans la forêt de Sologne. Le/la candidat(e) aura également l’occasion de voyager pour collaborer avec d’autres instituts partenaires, ainsi que de présenter ses travaux de recherche lors de conférences internationales. Un ordinateur portable lui sera fourni, ainsi que l’accès aux ressources informatiques nécessaires. Les candidat(e)s sont invité(e)s à contacter les encadrants (Cherry Ng-Guiheneuf, Gilles Theureau) pour discuter plus en détail.

Profil du candidat :
La candidature doit être accompagnée d’un CV détaillé (2 pages maximum), d’une copie des relevés de notes officiels de licence (et de master, le cas échéant), avec une indication claire du système de notation et du classement de l’étudiant·e au sein de sa promotion, de deux lettres de recommandation envoyées directement à cherry.ng-guiheneuf@cnrs-orleans.fr par les référents avant la date limite, ainsi que d’une lettre de motivation présentant la motivation du/de la candidat(e) à se former en tant que chercheur(euse) en astrophysique, et plus particulièrement au LPC2E/CNRS, son expérience de recherche, ses centres d’intérêt scientifiques, ainsi que ses projets et objectifs de carrière.

Candidater sur: https://www.abg.asso.fr/fr/candidatOffres/show/id_offre/134797

Formation et compétences requises :
Le/la candidat(e) doit être titulaire d’un master en astrophysique (ou dans un domaine étroitement lié), être disponible à temps plein et avoir une bonne maîtrise de l’anglais. Une expérience préalable dans le domaine de la recherche est un atout.

Adresse d’emploi :
L’équipe ASTRO du LPC2E/CNRS à Orléans (https://www.lpc2e.cnrs.fr/en/astrophysique) est le plus grand groupe de recherche sur les pulsars en France et travaille en étroite collaboration avec l’Observatoire Radioastronomique de Nançay, situé dans la forêt de Sologne.

La collaboration CHORD est une équipe multi-institutionnelle comptant plus de 100 membres. Parmi les instituts partenaires figurent notamment l’Université de Toronto, l’Université McGill, l’Institut Perimeter, l’Université de Colombie-Britannique, le MIT, l’INAF et le CNRS. Le réseau central du télescope CHORD est hébergé à l’Observatoire radio-astrophysique Dominion (DRAO) sur la côte ouest du Canada, et deux stations satellites seront construites aux observatoires de Green Bank et Hat Creek aux États-Unis.

Coordonnées des encadrants : cherry.ng-guiheneuf@cnrs-orleans.fr , Gilles.Theureau@obspm.fr

Extraction semi-automatique d’annotations sémantiques pour la préservation du patrimoine culturel

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIAS
Durée : 6 mois
Contact : baron@ensma.fr
Date limite de publication : 2026-02-28

Contexte :
L’étude du patrimoine repose sur des données hétérogènes provenant de sources multiples (mesures, croquis, photographies, acquisitions 3D, etc.), souvent difficiles à manipuler en raison de la fragilité ou de l’inaccessibilité des objets. Le projet ANR DIGITALIS vise à développer des outils numériques dédiés à la gestion, à la pérennisation, à la réutilisation et à la visualisation de ces données. Le laboratoire LIAS, partenaire du projet ANR, travaille sur la conception de méthodes et de structures pour gérer des données complexes de manière interopérable.

Dans le cadre du projet ANR DIGITALIS, cette expertise est utilisée pour proposer un modèle de données dédié au patrimoine, permettant aux experts de partager et d’enrichir leurs annotations sur des objets patrimoniaux. Ce besoin s’inscrit dans la continuité de travaux existants,
comme le modèle sémantique CIDOC CRM, qui vise à assurer la traçabilité et l’annotation des objets numériques dans le domaine historique. Le principal enjeu est d’automatiser l’extraction des données vers ce modèle, une tâche complexe et chronophage, d’autant plus que les historiens maîtrisent peu ce formalisme et que les informaticiens ne sont pas spécialistes du patrimoine.

Le laboratoire LIAS a obtenu des résultats en explorant l’usage de l’IA générative pour transformer des données textuelles issues de fouilles archéologiques en représentations conformes au modèle CIDOC CRM.

Sujet :
Les objectifs du stage sont multiples à vise à compléter les travaux obtenus.

Le premier objectif porte sur le compromis entre précision, performance et impact environnemental, ainsi que sur les enjeux de vie privée liés aux déploiements cloud ou locaux. Le stagiaire devra donc reprendre les résultats existants et les évaluer sur différents modèles d’IA générative, qu’ils soient hébergés dans le cloud ou exécutés localement via des modèles à poids ouverts de plus petite taille. Cela permettra au stagiaire de se familiariser avec les concepts de base de l’IA générative et des travaux développés par le laboratoire LIAS dans ce domaine.

Le deuxième objectif porte sur la capacité à référencer les sources (mesures, croquis, photographies, acquisitions 3D, etc.) utilisées pour produire les annotations. Cette question, non traitée dans nos travaux initiaux, est pourtant essentielle pour assurer la traçabilité des anno-
tations. Le stagiaire devra ainsi explorer des solutions permettant d’intégrer explicitement la notion de source dans le processus de génération des annotations. Cela permettra au stagiaire de se familiariser avec le modèle CIDOC CRM.

Le troisième objectif, qui constitue la contribution principale de ce stage, porte sur l’intégration de vocabulaires contrôlés, tels que des thésaurus, dans le processus de génération des annotations. Cette intégration vise à améliorer la cohérence et la qualité des annotations, notamment
en facilitant la gestion des synonymes (par exemple : église <=> lieu de culte).

Ce stage recherche sera encadré par un doctorant travaillant sur des problématiques similaires, ainsi que deux chercheurs du laboratoire LIAS spécialisés dans le domaine de l’IA générative et du patrimoine. Une publication scientifique serait attendue à l’issue du stage, en fonction des résultats obtenus.

Profil du candidat :
Le candidat doit être en Master 2 en Informatique ou en dernière année de préparation d’un diplôme d’ingénieur spécialité Informatique.

Formation et compétences requises :
Une bonne connaissance du langage de programmation Python et des bibliothèques usuelles d’apprentissage automatique est requise.

Adresse d’emploi :
Le stage se déroulera dans les locaux du LIAS sur le site du Futuroscope.

Document attaché : 202601050906_Sujet_Stage_DigitalisAli_2026.pdf

TGD@EDBT’26: Transforming Graph Data Workshop CFP (12 Jan: Abstract Deadline)

Date : 2026-03-24
Lieu : Tampere, Finland

The second edition of the TGD workshop on “Transforming Graph Data” will be held on March 24th, 2026, as a full-day event co-located with the EDBT conference in Tampere, Finland (https://transforming-graph-data.github.io/2026/). The workshop aims to create a collaborative platform for communities working on and with graph transformations and queries to exchange expertise and showcase recent work.

### Important Dates ###

* Abstract Submission: January 12th, 2026 (coming soon!)
* Paper Submission: January 23rd, 2026
* Paper Notification: February 7th, 2026
* Camera Ready: February 13th, 2026
* Workshop Date: March 24th, 2026

### Topics ###

We welcome contributions on various topics, including but not limited to the following:

* Graph Transformations and Querying
– Human-centred and human-based approaches for graph transformations
– Logical aspects of graph transformations (based on rules, rewriting, algebra, etc.)
– Generative AI (LLM) methods for transforming graphs
– Learning graph transformations (inductive learning, self-regulated learning, etc.)
– Applying graph query languages for specifying transformations
– Optimisation for graph transformation and its relation to query optimisation

* Graph Changes and Evolution
– Formalisms to describe changes in graph data
– Dynamic graph data transformations
– Continuous queries and streaming graph processing

* Ecosystems for Graph Transformations
– Design and deployment of interoperability layers for graph data technologies
– Ensuring the reliable processing of graph data (verification and validation)
– Scalable, transformation-prone graph data processing and querying
– Human aspects of graph transformation ecosystems
– Usability, data integrity, quality
– Exploration of large evolving graphs

### Submission Link ###

Please submit your paper via the following link:
https://cmt3.research.microsoft.com/TGDWorkshop2026/

### Submission Guidelines ###

TGD welcomes high-quality research, application, and vision papers.

* Research papers should describe research ideas and results relevant to TGD’s topics of interest, and that fall into one of the following categories:
– original and unpublished results or
– recent results that have already been accepted or published at an international workshop or conference. These will not count as new publications. If accepted, a short abstract referencing the original publication will be included in the proceedings.

* Application papers are expected to describe graph transformations in the industrial setting or in new application domains. Discussions and lessons concerning technology transfer of research ideas to the real-world setting are particularly encouraged.

* Vision papers should describe graph transformation use cases/scenarios that push the limits of existing solutions. These should motivate the importance of the studied use case, present gaps in the state-of-the-art, and lay out directions for addressing these.

The expected format for all submissions is six pages in CEUR Double Column Format.

### After Acceptance ###

All TGD papers will be published in the CEUR online proceedings, either in full for unpublished works or as short abstracts for submissions summarising published works. Selected unpublished submissions will be invited to contribute an extended version to a special issue (acceptance pending) of the Transactions on Graph Data and Knowledge (TGDK) Journal.

### Workshop Organisers ###

* Anna Bernasconi, Politecnico di Milano, Italy.
Email: anna.bernasconi at polimi.it

* Stefania Dumbrava, ENSIIE & SAMOVAR Télécom SudParis, France.
Email: stefania.dumbrava at ensiie.fr

* Riccardo Tommasini, INSA Lyon & LIRIS, France.
Email: riccardo.tommasini at insa-lyon.fr

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Internship (+PhD) on Hyperspectral Foundation Models

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab, Rouen Normandie
Durée : 5 to 6 months
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2026-01-23

Contexte :

Sujet :
The foundation model (FM) paradigm is undoubtedly a major breakthrough in Machine Learning (ML) for Artificial Intelligence (AI). An FM is a large-scale neural network pre-trained with self-supervision on a vast unannotated dataset and designed to perform downstream tasks with minimal fine-tuning on small annotated datasets. While FMs have made an outstanding leap in computer vision and large language models, they have not yet emerged in fields where data is more complex, such as hyperspectral imaging and chemical analysis. Unlike traditional cameras with their primary colors (red, green, and blue), hyperspectral cameras capture detailed spectral information at every pixel, providing a detailed description of the properties of the material in the scene. ML methods have been devised to explore hyperspectral images, mainly addressing spectral unmixing, classification, and segmentation tasks. With the FM paradigm reshaping the landscape of ML, there is growing interest in FMs for hyperspectral imaging, with several papers published very recently mainly for image segmentation in airborne or satellite images [1, 2, 3].

This internship, leading to a PhD thesis, is an integral part of the interdisciplinary project HyFoundationS (Hyperspectral Foundation Models for Chemical Soil Analysis). Led by the LITIS Lab, HyFoundationS aims to develop an FM for chemical analysis of soil pollution by hyperspectral imaging. In order to unleash the full potential of FMs in the analysis of soil pollution, HyFoundationS brings together an AI laboratory (LITIS), a chemistry laboratory (Institut CARMeN), and a startup specialized in soil pollution analysis (Tellux). This consortium has been working together for more than 5 years, developing ML and chemical analysis for soil pollution assessment using hyperspectral cameras installed on a bench in lab conditions, allowing full environmental control on a wide variety of pollutants. HyFoundationS aims to provide major innovations to overcome key scientific and technical barriers for soil pollution analysis with FMs.

The intern will work (i) on reviewing the literature of FMs for hyperspectral imaging, focusing on several recently published papers [1, 2, 3], (ii) on providing a solid local implementation of an FM, (iii) on extending it to address chemical analysis tasks, and (iv) on providing experiments and evaluation for a case study. This work will be carried out in close collaboration with post-doc fellows, engineers, and senior researchers in AI, in chemical analysis, and in geoscience.

[1] N. A. A. Braham, C. M. Albrecht, J. Mairal, J. Chanussot, et al., “SpectralEarth: Training hyperspectral foundation models at scale.” IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (2025).
[2] D. Wang, M. Hu, Y. Jin, Y. Miao, et al., “Hypersigma: Hyperspectral intelligence comprehension foundation model.” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2025.
[3] D. Hong, B. Zhang, X. Li, Y. Li, C. Li, et al., “SpectralGPT: Spectral remote sensing foundation model,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024.

Profil du candidat :
We are seeking a highly motivated intern with a strong interest in AI for science. The candidate must be in a Master’s or an engineering program in computer science, applied mathematics, AI, or a related field (including remote sensing), and must have solid technical skills in deep learning, with experience in Python and the common ML libraries.

Candidates with a strong interest in interdisciplinary research and who are able to work in a collaborative environment are strongly encouraged to apply.

If interested in an internship leading to a PhD, please send your CV and transcripts along with a motivational email to paul.honeine@univ-rouen.fr.
We also welcome applications for a PhD or Post-doc within the project HyFoundationS.

Formation et compétences requises :

Adresse d’emploi :
Rouen Normandie

Approches de modélisation de processus et application en santé

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT (Institut de Recherche en Informatique de Tou
Durée : 6 mois
Contact : hugo.boisaubert@irit.fr
Date limite de publication : 2026-01-31

Contexte :
La finalité de ce stage est de contribuer à l’amélioration de la qualité des soins et de la vie des patients, tout en optimisant les ressources du système de santé avec des retombées potentielles applicables à d’autres secteurs et contextes cliniques.\

Dans le contexte médical, l’utilisation des modèles de processus ouvre de nouvelles possibilités pour la simulation de patient au bloc opératoire, la prédiction de ses futurs états ou encore la prédiction des besoins en médicaments. D’un point de vue décisionnel, les modèles de processus combinés aux données médicales peuvent permettre de nouvelles prédictions pour orienter un soignant dans les soins les plus adaptés à réaliser les plus adaptés aux patients dans une logique de médecine personnalisée.

Les processus de soins produisent des données qui peuvent être utilisée par des approche de modélisation automatique de processus. Cependant, alors que les données produites sont multi-modales (séries temporelles, textes, images, “mesures terrain”…), cette caractéristique est rarement exploitée.

Sujet :
Pour concrétiser ces possibilités, au cours de ce stage, il s’agira d’abord de constituer un état de l’art des approches de modélisation semi-automatique de processus, avec un focus particulier sur les cas d’application en santé. À partir des éléments identifiés, ce stage explorera de manière expérimentale l’enrichissement de processus par des données multimodales de santé dans un contexte d’anesthésie.

Profil du candidat :
Étudiant.e en cycle master ou ingénieur, en Informatique ou mention similaires, appétence pour la santé-numérique ou la bio-informatique.

Formation et compétences requises :
— Rigueur en programmation et capacité à générer de la documentation, avec usage des outils
standard (Git, Doctest, Sphinx ou équivalents) ;
— Des compétences en bases de données (SQL) sont attendues et une expérience en calcul intensif (ordonnanceur, parallélisation) sera appréciée ;
— Capacités à rendre compte de son travail régulièrement et à produire des outils de suivi et de pilotage ;
— Capacité à produire efficacement des documents de communication scientifique.
Langues : Maîtrise du Français (Niveau A2), conversationnel et écrit ; Maîtrise de l’anglais scientifique, écrit. Les certifications attestant de votre niveau en langues sont vivement encouragées.

Adresse d’emploi :
IRIT – IUT de Castres,
5 allée du Martinet
81100 CASTRES

Document attaché : 202512241517_stage_m2_2026_modele_processus-4.pdf

Post-doc in Deep Anomaly Detection in Time Series

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab, Rouen Normandie
Durée : 18 months
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2026-01-31

Contexte :

Sujet :
Anomaly detection is a challenge in itself. The capacity to detect anomalies is a major ingredient of safe and trustworthy AI systems across major application areas. Anomaly detection is unsupervised by nature, since abnormal events are rare, varied, and cumbersome to collect. Conventional methods can be roughly grouped into three interconnected categories: discriminative decision boundaries using one-class classification, reconstruction models that test any new sample by measuring its reconstruction error on a manifold or with prototypes, and probabilistic models based on density or level-set estimation. The major deep anomaly detection methods fall within these categories, redefined in a latent space generated by deep representation learning, such as deep one-class, autoencoders, generative adversarial networks, and self-supervised learning [1, 2].

The challenge is higher for anomaly detection in time series (i.e., temporal data), and it is even harder when it comes to online detection, namely in the context of streaming data [3, 4, 5]. When dealing with time series, temporal continuity is central to defining the “normality”, and thus to identifying and detecting anomalies. Time series may have specific characteristics such as seasonality, periodicity/cycles, trend, concept drift, recurrent concept drift, cyclostationarity, and non-stationarity, as well as modalities at multiple temporal scales.

This post-doc fellowship aims to provide novel advances in anomaly detection in time series, mainly focusing on the even harder online detection, namely in the context of streaming data. For this purpose, the post-doc fellow will address one of the two online detection formalisms, which arise depending on whether the anomaly is short-term or persistent:
– Point anomaly detection, namely, in an online setting, one seeks to detect whether each new sample is an anomaly. Anomalies may not be restricted to isolated samples, but may also form a group or sequence of points (often called collective anomalies).
– Change point detection (also referred to as concept drift), namely, in an online setting, one seeks to identify, as early as possible, whether the recent samples have deviated significantly from the historical ones.

This post-doc fellowship is an integral part of the global project ODD (Online Deep anomaly Detection). Led by the LITIS Lab, the ODD project brings together 4 PhD students and several permanent researchers from the Machine Learning group of the LITIS Lab. This project tackles a wide spectrum of signal scenarios to demonstrate the versatility of the proposed methods. The post-doc fellow will have the possibility to tackle signals in environmental science (including a startup collaboration), signals in industrial processes (including industrial and international collaborations), and medical signals/images (including a novel startup collaboration).

[1] Ruff, L., Kauffmann, J. R., Vandermeulen, R. A., Montavon, G., Samek, W., Kloft, M., … & Müller, K. R. (2021). A unifying review of deep and shallow anomaly detection. Proceedings of the IEEE, 109(5), 756-795.
[2] Pang, G., Shen, C., Cao, L., & Hengel, A. V. D. (2021). Deep learning for anomaly detection: A review. ACM computing surveys (CSUR), 54(2), 1-38.
[3] Boniol, P., Liu, Q., Huang, M., Palpanas, T., & Paparrizos, J. (2024). Dive into time-series anomaly detection: A decade review. arXiv preprint arXiv:2412.20512.
[4] Jia, X., Xun, P., Peng, W., Zhao, B., Li, H., & Shen, C. (2025). Deep anomaly detection for time series: A survey. Computer Science Review, 58, 100787.
[5] Zamanzadeh Darban, Z., Webb, G. I., Pan, S., Aggarwal, C., & Salehi, M. (2024). Deep learning for time series anomaly detection: A survey. ACM Computing Surveys, 57(1), 1-42.

Profil du candidat :
Requirements:

PhD in applied mathematics, machine learning, advanced statistics, computer science or related.
Strong background in advanced optimization and machine learning.
Proficiency in Python.
If interested, please send CV in a motivational email to paul.honeine@univ-rouen.fr, maxime.berar@univ-rouen.fr and fannia.pacheco@univ-rouen.fr

Formation et compétences requises :

Adresse d’emploi :
Rouen, Normandie