Présentation Générale

 


           
Huitième édition du Symposium MaDICS

Ce rendez-vous annuel rassemble la communauté MaDICS afin de mettre en lumière les avancées récentes en sciences des données, à travers un programme scientifique riche comprenant des conférences invitées (keynotes), des ateliers thématiques, des tables rondes et des sessions de posters.
Ces temps forts favorisent des échanges scientifiques à la fois stimulants et conviviaux.
Cette année le Symposium se tiendra à Avignon les 2 et 3 juin 2026.

Pour en savoir plus…


           
Second SEEDS@MaDICS
Cette rencontre vise à créer des échanges entre les milieux industriels et le monde académique (doctorant·es et post-doctorant·es) par le biais d’une semaine de travail sur des problèmes concrets posés par des industriels et nécessitant des approches informatiques et/ou mathématiques innovantes. Ces semaines s’inspirent du modèle des SEME (Semaine d’Etude Mathématiques – Entreprise) de l’AMIES.

SEEDS@MaDICS 2026 aura lieu à l’Université de Technologie de Troyes du 22 au 26 juin 2026.
Inscrivez-vous ici (deadline le 1er juin 2026)

Pour en savoir plus…

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS  


Feb
28
Fri
2025
Stage M2 (poursuite en thèse possible) – Machine Learning / Optimisation / Santé – Equipe ORKAD – Lille
Feb 28 – Mar 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Equipe ORKAD / Laboratoire CRIStAL Lille
Durée : 6 mois
Contact : julie.jacques@univ-lille.fr
Date limite de publication : 2025-02-28

Contexte :
ORKAD est une équipe de recherche du groupe thématique OPTIMA du laboratoire CRIStAL (Centre de Recherche en Informatique, Signal et Automatique de Lille) (UMR CNRS 9189) de l’Université de Lille. L’objectif principal de l’équipe ORKAD est d’exploiter simultanément l’optimisation combinatoire et l’extraction de connaissances pour résoudre des problèmes d’optimisation. Les métaheuristiques ont souvent été utilisées avec succès pour résoudre différentes tâches de machine learning [DhaenensJourdan2022]. En particulier, l’algorithme MOCA-I [Jacques2013-a], permet de classifier des données hétérogènes et mal réparties par méthode d’optimisation, sur des données médicales [Jacques2020]. L’équipe ORKAD a des partenariats avec le CHU de Lille ; notamment dans le cadre du projet européen PATHACOV pour la détection du cancer du poumon à partir de la concentration en composés organiques volatils dans l’air expiré [Hulo2023]. Dans ce stage, nous nous intéressons à l’extension de ces travaux aux données du projet ALCOVE, suite du projet PATHACOV, où l’objectif est de distinguer différentes classes de sujets: sain / malade (avec le stade : I, II, III, IV) ; opérable / non opérable.

Sujet :
Dans le problème de classification multi-label, un enregistrement du jeu de données peut être associé à plusieurs labels : par exemple « cancer du poumon » et « opérable ». Des approches à base de métaheuristiques ont été proposées par le passé pour gérer ce problème, comme par exemple les colonies de fourmis [Otero2010]. La classification multi-label est souvent associée à une répartition déséquilibrée des différents labels à prédire [Tarekegn2021] et une des spécificités de l’algorithme MOCA-I est justement sa capacité à gérer ce déséquilibre [Jacques2013-a]. Dans MOCA-I, la modélisation est adaptée pour la classification binaire partielle (représentation de la solution, opérateurs d’initialisation et de voisinage,…). L’objectif de ce stage est de proposer une nouvelle représentation et opérateurs adaptés au problème de classification multi-label. Des méthodes de configuration automatique d’algorithmes comme irace [López-Ibáñez2016] seront utilisées pour identifier si les nouveaux opérateurs et stratégies proposés sont efficaces sur les benchmarks sélectionnés.

Profil du candidat :
Programmation Objet (Python ou C++) ; Connaissances en machine learning
Des connaissances en C++ et recherche opérationnelle, optimisation combinatoire seraient un plus.

Formation et compétences requises :
M2 en informatique

Adresse d’emploi :
Lieu : Laboratoire CRISTAL, Equipe ORKAD (Université de Lille, France)

Document attaché : 202411141558_Sujet_stage_M2.pdf

Mar
1
Sat
2025
Adaptive optics control and learning
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Centre Astrophysique de Lyon
Durée : 5 months
Contact : eric.thiebaut@univ-lyon1.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
Internship supervisors: Eric Thiébaut, Michel Tallon
@ : eric.thiebaut@univ-lyon1.fr, mtallon@obs.univ-lyon1.fr

Address/Workplace: CRAL – site Charles André : 9 avenue C. André, St Genis Laval

Hosting research team: AIRI

Internship title: Adaptive optics control and learning

Summary of proposed work:

Context: Adaptive optics (AO) systems are used by most if not all current large telescopes to counteract the effects of the turbulence on the image quality and achieve diffraction limited angular resolution (i.e. λ/D). AO systems work by sensing the wavefront after its correction by a deformable mirror whose shape is controlled considering the departure of the measured wavefront to the ideal one (e.g. a flat wavefront). The AiRi team at CRAL is leading a project, UPCAO (funded by the French ANR), targeted at developing better algorithms and methods to control in real time (i.e. faster than 1,000 times per second) the shape of the wavefront given measurements by a wavefront sensor (WFS). The objective is to provide optimal wavefront correction under varying observing conditions for the THEMIS AO system, for SAXO+, and for future AO systems on ELTs. There are several ideas to improve current AO control systems: (i) improve the model of the AO system, (ii) account for the variable and uneven quality of the WFS measurements notably the fact that not all measures are always valid, and (iii) account for the spatio-temporal statistics of the turbulence to anticipate its evolution and reduce the effects of the delay between the times of measurements and of the correction by the mirror.

Research directions:
Modeling the AO system: To compute the wavefront correction, AO real time controllers assume a model of the behavior of the components of the AO system notably the wavefront sensor (WFS) and the deformable mirror (DM). Intuitively, the closer the model to reality the better the correction. The behavior of the instrument may be complicated (non-linear) and depends on the operating conditions. It is thus important to develop flexible models whose parameters can be calibrated and updated while the AO system is running (in closed-loop). We are currently considering affine approximations of the possibly non-linear behavior of the system that can be calibrated in real-time by a perturbative method. Another possibility to investigate is to exploit deep learning to automatically build the structure of a general non-linear model and to learn its parameters in real-time.
Wavefront reconstruction: For a linear wavefront sensor (WFS), the reconstruction of the wavefront shape given the measurements and accounting for their uneven quality amounts to solving an inverse problem which has a closed-form solution. For large systems, this solution may be computed in real-time by means of accelerated iterative methods [1]. For new non-linear WFS, fast reconstruction methods compatible with the constraints of real-time have to be developed and AI based methods are emerging as competitive candidates.
Modeling and learning the spatio-temporal behavior of the turbulence: Prediction of the temporal evolution of the wavefront is the key to compensate for the delay between the acquisition of wavefront sensor (WFS) measurements and the time at which the shape of the deformable mirror (DM) can effectively account for these measurements. We are developing a fast approximation of the covariance [2] that can be exploited to learn and apply the spatio-temporal statistics of the wavefront. Another possibility is to develop AI based methods.

[1] Béchet+, “Comparison of minimum-norm maximum likelihood and maximum a posteriori wavefront reconstructions for large adaptive optics systems’’ in J. Opt. Soc. Am. A, 26, 497-508 (2009) https://doi.org/10.1364/JOSAA.26.000497
[2] Thiébaut+, “Beyond FRiM, ASAP: a family of sparse approximation for covariance matrices and preconditioners.” Adaptive Optics Systems VIII. Vol. 12185. SPIE, 2022, https://arxiv.org/pdf/2311.17721

Nature of the financial support for the internship: Labex LIO or team funding

Potential for a follow-up as a PhD thesis: Yes

Profil du candidat :
Background in signal processing, numerical methods or related fields.

Formation et compétences requises :

Adresse d’emploi :
Centre de Recherche Astrophysique de Lyon
9 avenue Charles André
69230 Saint-Genis-Laval

Document attaché : 202411181118_FicheStage_CRAL_2024_AIRI_Thiebaut.pdf

DADY : un modèle fondation de réseau de neurones pour l’observation aérienne time-lapse de systèmes agroécologiques au Sud
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Cirad, Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-03-01

Contexte :
Le projet DeepAeroDynamics (DADY) vise à combiner l’imagerie drone multispectrale time-lapse et
le deep learning pour faire face aux défis du changement climatique et de la sécurité alimentaire dans les
pays du Sud. L’objectif est de développer un modèle fondation capable d’intégrer les données
multispectrales, spatiales et temporelles observées par drone aérien dans des environnements complexes
et hétérogènes du Sud dans le but d’anticiper et prédire le comportement de plantes cultivées en
agroécologie (Sahel, Madagascar, Guadeloupe).

Sujet :
Le stagiaire sera au coeur du développement d’une architecture deep learning permettant :
* D’analyser des séries temporelles multispectrales d’imagerie drone, et extraire automatiquement
des représentations informatives de l’état des systèmes observés.
* D’analyser les dynamiques temporelles en utilisant des modèles de type Transformers pour
capturer les évolutions des cultures décrites dans un espace latent.
* De maximiser l’utilisation des données par des techniques d’apprentissage semi-supervisées et
des consignes prétextes pour maximiser la capacité d’apprentissage de l’architecture fondation.

Le développement des modèles s’appuiera sur des architectures CNN et Transformers. L’approche sera
validée sur des jeux de données déjà acquis et stockés à proximité d’un supercalculateur. Les tests de
niveau 1 s’effectueront sur une ferme GPU locale, et les modèles de niveau 2 seront testés sur les
supercalculateurs Jean Zay et Adastra (20e mondial au TOP500). Les modèles seront documentés et diffusés
en open-source, accompagnés de scripts pour le fine-tuning.

Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en deep learning. Travail
avec Python, Pytorch/Tensorflow, Github, Intégration Continue.

Formation et compétences requises :
Expérience en traitement d’images.
Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€
mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av.
Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202502121716_Offre de stage M2 – 2025 – DADY.pdf

DADY : un modèle fondation de réseau de neurones pour l’observation aérienne time-lapse de systèmes agroécologiques au Sud
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-03-01

Contexte :
Le projet DeepAeroDynamics (DADY) vise à combiner l’imagerie drone multispectrale time-lapse et le deep learning pour faire face aux défis du changement climatique et de la sécurité alimentaire dans les pays du Sud. L’objectif est de développer un modèle fondation capable d’intégrer les données multispectrales, spatiales et temporelles observées par drone aérien dans des environnements complexes et hétérogènes du Sud dans le but d’anticiper et prédire le comportement de plantes cultivées en
agroécologie (Sahel, Madagascar, Guadeloupe).

Sujet :
Le stagiaire sera au coeur du développement d’une architecture deep learning permettant :
● D’analyser des séries temporelles multispectrales d’imagerie drone, et extraire automatiquement des représentations informatives de l’état des systèmes observés.
●D’analyser les dynamiques temporelles en utilisant des modèles de type Transformers pour capturer les évolutions des cultures décrites dans un espace latent.
●De maximiser l’utilisation des données par des techniques d’apprentissage semi-supervisées et des consignes prétextes pour maximiser la capacité d’apprentissage de l’architecture fondation.

Le développement des modèles s’appuiera sur des architectures CNN et Transformers. L’approche sera validée sur des jeux de données déjà acquis et stockés à proximité d’un supercalculateur. Les tests de niveau 1 s’effectueront sur une ferme GPU locale, et les modèles de niveau 2 seront testés sur les supercalculateurs Jean Zay et Adastra (20e mondial au TOP500). Les modèles seront documentés et diffusés
en open-source, accompagnés de scripts pour le fine-tuning.

Profil du candidat :
Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Formation et compétences requises :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en deep learning. Travail avec Python, Pytorch/Tensorflow, Github, Intégration Continue. Expérience en traitement d’images.

Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€
mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av.
Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202412041713_Offre de stage M2 – 2025 – DADY.pdf

Detection and Localization Of Volcanic Fissures in Interferograms Using AI
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISTIC
Durée : 4-6 mois
Contact : yajing.yan@univ-smb.fr
Date limite de publication : 2025-03-01

Contexte :
Satellite radar interferometry, more commonly known as InSAR,
provides precise displacement measurements over vast land
areas. The availability of satellite constellations and frequent
revisit times make it a crucial source of information for
monitoring volcanic activity. Understanding and
modeling a volcanic eruption are critical steps in decision-
making when dealing with such geological phenomena. The
opening of a dyke (volcanic vein) or a fissure, as
well as its initial geometry, depends on several factors, including
the pressures exerted and the mechanical properties of the
ground.

Volcanic fissures do not have a simple, flat geometry; they
narrow and widen, flare, branch, and stratify. Furthermore,
their width and shape can also change during an eruption
depending on various geological configurations.
The identification of volcanic fissures is therefore particularly
important for accurate volcanic modeling. However, this task is
currently performed manually based on in-situ observations. However, with the continuous increase in the
amount of available SAR data, there is a growing need for
advanced methods to effectively automate this detection
process. Surface deformation detection in interferograms is a
well-studied topic in the literature, whereas fissure
detection has not received the same level of attention. The Piton
de la Fournaise on the island of Réunion is the subject of
extensive monitoring and has a database spanning 24 years. Preliminary results obtained by our team on
this volcano have demonstrated the feasibility of detecting
fissures in the interferograms. Using classical methods, we
successfully detected the presence or absence of a fissure within the interferograms from a dozen different satellites. However, the mere presence or absence of a fissure is far from sufficient for analyzing the geological mechanisms associated with the volcano, and further work is needed to obtain precise locations of these fissures.

Sujet :
The objective of this project is to detect and localize volcanic
fissures in satellite radar interferograms using artificial
intelligence techniques and skeleton-based geometry
recognition. Several types of satellites pass over the Piton de la
Fournaise enclosure, allowing for regular and
continuous observation. However, each sensor has its own
characteristics, including mandated revisit times, operational
costs (free or paid), as well as different observation angles and
pass directions. One of the initial hypotheses is that the
localization of fissures follows a logical pattern depending on
the type of InSAR source and the spatial area around the
eruptive cone. The second hypothesis explores the similarity
between the structure of volcanic fissures and that of skeletons,
like action recognition based on skeletal data extracted from
photographs. Action recognition from skeletons is a task that
involves recognizing human actions from a sequence of point
data on joints captured by specific sensors. In our project, the
approach is reversed: given the eruptive attributes and the
InSAR data, we aim to recognize the fissure and associate it with
a geometric shape, regardless of the type of satellite and its field
of view.

For more details, please see the attached file.

Profil du candidat :

Formation et compétences requises :
The candidate should have knowledge and skills in machine
learning and AI programming (Python). Experience in remote
sensing and volcanic geophysics would be highly valued,
particularly concerning the analysis of InSAR data.

Adresse d’emploi :
LISTIC, 5 chemin de bellevue, CS80439, 74944, Annecy-le-Vieux

Document attaché : 202412050746_Internship LISTIC 2025 – Fissures.pdf

Direct detection and characterization of exoplanets: statistical learning, multi-epoch and multi-spectral data fusion
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Centre Astrophysique de Lyon
Durée : 5 months
Contact : olivier.flasseur@univ-lyon1.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
Internship supervisors: Olivier Flasseur, Eric Thiébaut, Maud Langlois
@ : olivier.flasseur@univ-lyon1.fr, eric.thiebaut@univ-lyon1.fr, maud.langlois@univ-lyon1.fr

Address/Workplace: CRAL – site Charles André : 9 avenue C. André, St Genis Laval

Hosting research team: AIRI

Internship title: Direct detection and characterization of exoplanets: statistical learning, multi-epoch and multi-spectral data fusion

Summary of proposed work:

Context: The direct observation of the close environment of stars can reveal the presence of exoplanets and circumstellar disks, providing crucial information for a better understanding of planetary system formation, evolution, and diversity. Given the very small angular separation with respect to the host star and the huge contrast between the (bright) star and the (faint) exoplanets and disks, imaging the immediate vicinity of a star is extremely challenging. In addition to the use of extreme adaptive optics and a coronagraph, dedicated post-processing methods combining images recorded with the pupil tracking mode of the telescope are needed to efficiently suppress the nuisance component (speckles and noise) corrupting the signals of interest.
Beyond optimal post-processing of individual observations, fusing multiple observations of the same star taken over different epochs can significantly improve the detection sensitivity. The key challenge in this approach lies in accounting for both the nuisance statistics and the orbital motion of the exoplanet across epochs. To address this, the PACOME algorithm (for PACO Multi-Epoch; [1]) has been recently introduced. PACOME leverages statistical modeling of the nuisance component and its correlations at the local scale within a small pixel patch. This approach is inherited from the PACO algorithm, specifically designed for exoplanet detection from individual (mono-epoch) dataset of observations. The by-products of PACO from each epoch provide sufficient statistics that can be optimally combined using PACOME, while efficiently exploring the Keplerian motion of exoplanets. This multi-epoch strategy yields a combined detection score that is directly interpretable as a measure of detection confidence. In addition to improving sensitivity, PACOME enables the estimation of orbital parameters, along with their joint and marginal distributions. Although PACOME achieves state-of-the-art performance, there remains room for improvement, especially near the star. Here, the assumption of a local-scale statistical description of the nuisance component overlooks larger-scale spatial correlations, thus limiting the method’s detection sensitivity.
In this context, data science developments are decisive to improve the detection sensitivity of exoplanets and the accuracy of the estimation of their orbit.

Research directions: This project will build on recent advancements in modeling the nuisance component that corrupts high-contrast total intensity observations. The focus will be on improving exoplanet detection and characterization. Possible research directions include:
1/ Modeling large-scale nuisance correlations: To address the limitations discussed, the goal is to integrate a more refined modeling of the nuisance component within multi-epoch detection algorithms. This can be achieved using the ASAP approach [2], which approximates the precision matrix (i.e., inverse of the covariance matrix) with a structured, sparse model that may better capture large-scale correlations compared to PACO.
2/ Joint spatio-spectral modeling of large-scale correlations: Building on point 1/, the objective is to develop a joint spatio-spectral model of the nuisance that accounts for large-scale correlations across both spatial and spectral dimensions.

Data: The project will focus on developing / improving new processing algorithms using spectroscopic total intensity observations (i.e., spatio-temporal-spectral data recorded with an Integral Field Spectrograph) from the SPHERE instrument, currently operating on the Very Large Telescope (VLT). Several multi-epochs observations are available to both ground the performance of the proposed algorithm and to search for new exoplanets!
Once a proof of concept is established, simulations for HARMONI, one of the first-light instruments of the upcoming Extremely Large Telescope (ELT), may be considered. In this case, the algorithm will be adapted to account for HARMONI’s specific features, particularly its higher spectral resolution. Achieving the required contrast with this instrument will require extended total exposure times on a single star, making a multi-epoch strategy indispensable.

Bibliography:
[1] Dallant+, “PACOME: Optimal multi-epoch combination of direct imaging observations for joint exoplanet detection and orbit estimation.” Astronomy & Astrophysics, 679, A38, 2023, https://arxiv.org/pdf/2309.08679
[2] Thiébaut+, “Beyond FRiM, ASAP: a family of sparse approximation for covariance matrices and preconditioners.” Adaptive Optics Systems VIII. Vol. 12185. SPIE, 2022, https://arxiv.org/pdf/2311.17721

Nature of the financial support for the internship: Labex LIO or team funding

Potential for a follow-up as a PhD thesis: Yes

Profil du candidat :
Background in signal processing, numerical methods or related fields.

Formation et compétences requises :

Adresse d’emploi :
Centre Astrophysique de Lyon
9 avenue Charles André
69230 Saint-Genis-Laval

Document attaché : 202411181114_FicheStage_CRAL_2024_AIRI_Flasseur-1.pdf

Few-Shot Learning of Wheel Patterns for Matching Relief-Printed Decorations on Medieval Ceramic Sherds
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PRISME laboratory
Durée : 5 – 6 months
Contact : yassine.nasser@univ-orleans.fr
Date limite de publication : 2025-03-01

Contexte :
Archaeologists often face challenges in matching the relief-printed patterns found on ceramic sherds discovered during excavations. Identifying sherds created with the same patterning tool (wheel) plays a crucial role in understanding ancient trade networks and provides valuable insights into past civilizations. Traditional methods involve manually stamping the motifs followed by a meticulous visual analysis to verify if these patterns were produced by the same wheel, a process that is not only time-consuming but also labor-intensive. Recent advances in artificial intelligence present a unique opportunity to revolutionize fields like archaeology by automating recognition processes, thereby accelerating discoveries and improving analysis precision.
This internship is a continuation of the PRIA REMIA research project (Pattern Recognition through Artificial Intelligence), developed in partnership between the PRISME laboratory, LIFO, and the Archaeological Service of the City of Orléans. In this context, we aim to develop an automated/intelligent system to assist archaeologists in identifying relief-printed decorations on medieval ceramic shards.

Sujet :
Internship Objectives :
In this context, the internship aims to build on previous work in preprocessing and segmentation by proposing innovative approaches. The primary tasks will focus on:
 – Exploring state-of-the-art methods in few-shot learning, similarity learning, deep clustering, and texture transformer models.
 – Developing a novel method for identifying and clustering ceramic sherds decorated with the same wheel.
 – Integrating the developed solution into the existing system.
 – Drafting documentation for the developed solution.

Profil du candidat :
Required degree level: Bachelor’s + 4 or equivalent
Preferred degree: Master’s in IA, mathematics, applied mathematics, or computer science, or equivalent, with a strong motivation for applied research.

Formation et compétences requises :
Required Skills
 – Strong programming skills in Python, including proficiency with deep learning and machine learning frameworks (e.g., PyTorch, TensorFlow, Scikit-learn).
 – Familiarity with Deep Learning & Computer Vision, including Vision Transformers, Contrastive Learning, Similarity Learning, Clustering, and Texture Analysis.
 – Solid understanding of mathematics, especially in linear algebra and optimization.
 – Strong analytical, modeling, and writing skills.

Adresse d’emploi :
Polytech Orléans, 12 rue de Blois 45100 Orléans, France

Document attaché : 202412051055_M2 Internship 2024-2025 .pdf

IA contrainte par la physique pour la modélisation en sciences naturelles
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISTIC
Durée : 4-6 mois
Contact : yajing.yan@univ-smb.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
En sciences naturelles, la modélisation des phénomènes physiques constitue un sujet difficile. Les formules existantes ne suffisent parfois pas à représenter adéquatement les mécanismes complexes (notamment ceux non observables). Il arrive également que ces formules existantes ne correspondent pas parfaitement aux observations issues de données. Ces
problèmes ont été rencontrés par exemple dans les suivis de la concentration des polluants, des étalements de végétation, et des coulées de lave. Dans ce stage, nous nous concentrons
sur la modélisation volcanique. En volcanologie, les scientifiques disposent des mesures de déplacements en surface induits par une source volcanique en profondeur et utilisent ces
mesures pour estimer les paramètres physiques d’un modèle volcanique. Dans un premier temps, nous partons d’un modèle simple sous forme d’une expression analytique, le modèle Mogi. Dans ce modèle le déplacement en surface est directement
induit par un changement rapide du volume de la chambre magmatique qui se situe à une profondeur donnée. Dans ce modèle, les deux paramètres clés sont la variation du volume et
la profondeur de la chambre magmatique. L’objectif du stage consiste à utiliser les méthodes de régression symbolique pour affiner le modèle Mogi car il reste une vision simplifiée de la
physique sous-jacente. La régression symbolique devrait alors permettre d’affiner ce modèle directement à partir des données. La pertinence de l’approche et la sensibilité de la modélisation à la variété de l’activité volcanique sur différents sites volcaniques pourront être mesurées et comparées au modèle Mogi original. En s’appuyant sur des travaux basés sur l’IA classique développés au laboratoire sur l’inversion de modèles géophysiques, 3 types de données sont disponibles pour créer un cadre expérimental et de validation : 1) déplacements simulés à partir du modèle Mogi 2) déplacements simulés plus un bruit ajouté 3) déplacements réels sur des volcans africains. Cette étude sera étendue à un modèle volcanique plus sophistiqué, par exemple, le modèle Okada qui décrit le mécanisme de fonctionnement d’un volcan avec plus de paramètres et s’appuyant sur des équations différentielles.

Références :
– Tenachi, W., et al. (2023). Physical Symbolic Optimization. arXiv:2312.03612.
– Albino, F., & Biggs, J. (2021). Magmatic processes in the East African Rift system: insights from a 2015–2020 Sentinel‐1 InSAR survey. Geochemistry, Geophysics, Geosystems, 22(3), e2020GC009488.
– Dzurisin, D. (2007), Volcano Deformation: Geodetic Monitoring Techniques. Mogi, K. (1958), Bull. Earthq. Inst. U. Tokyo, 36, 99‐134
– Lopez-Uroz L, Yan Y., Benoit A., Albino F., Bouygues P., Giffard-Roisin S., Pinel V., Exploring Deep Learning for Volcanic Source Inversion, IEEE Transactions on Geosciences & Remote Sensing.
– Petersen, B. K., et al. (2019). Deep symbolic regression: Recovering mathematical expressions from data via risk-seeking policy gradients. arXiv:1912.04871.

Merci de nous envoyer un CV et une lettre de motivation, idéalement accompagnés des relevés de notes de M1, M2 (ou Bac+4 et Bac+5).

Profil du candidat :

Formation et compétences requises :
Machine learning, Python programming

Adresse d’emploi :
LISTIC, 5 chemin de bellevue, CS80439, 74944, Annecy-le-Vieux

Master thesis/Engineer internship – Machine learning for time series prediction in environmental sciences
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT Université de Tours
Durée : up to 6 Months
Contact : nicolas.ragot@univ-tours.fr
Date limite de publication : 2025-03-01

Contexte :
The JUNON project, driven by the BRGM, is granted from the Centre-Val de Loire region through ARD program (« Ambition Recherche Développement ») which goal is to develop a research & innovation pole around environmental resources (agriculture, forest, waters…). The main goal of JUNON is to elaborate digital services through large scale digital twins in order to improve the monitoring, understanding and prediction of environmental resources evolution and phenomena, for a better management of natural resources. Digital twins will allow to virtually reproduce natural processes and phenomena using combination of AI and environmental tools.
JUNON will focus on the elaboration of digital twins concerning quality and quantity of ground waters, as well as emissions of greenhouse gases and pollutants with health effects, at the scale of geographical area corresponding to the North part of the Centre-Val-de-Loire region.

Sujet :
The Master Thesis/internship position will be focused on the prediction of water resources and pollutants in the air.
The goal will be to benchmark state of the art time series approaches and to propose new methods adapted to the specificities of the environmental data studied (multivariate time series). The benchmark on water resources relies on complex data with different seasonality and frequencies. Forecasting must be from short term to long term predictions. Regarding air pollutants, the benchmark is still to be elaborated.

Profil du candidat :
Academic level equivalent to a Master 2 in progress or Engineer in its last year in computer science

Formation et compétences requises :
– a good experience in data analysis and machine learning (in python) is required
– some knowledge and experiences in deep learning and associated tools is required
– some knowledge in time series analysis and forecasting will be highly considered
– curiosity and ability to communicate and share your progress and to make written reports and presentations
– ability to propose solutions
– autonomy and good organization skills

Adresse d’emploi :
Computer Science Lab of the Université de Tours (LIFAT), Pattern Recognition and Image Analysis Group (RFAI)
64 av. Jean Portalis
37200 Tours

Document attaché : 202412060859_Fiche de poste stage Junon.pdf

Modèle de langue à base de connaissance experte pour l’extraction d’information médicale à partir de données non structurées.
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Institut de Recherche en Informatique de Toulouse
Durée : 5-6 mois
Contact : yohann.chasseray@irit.fr
Date limite de publication : 2025-03-01

Contexte :
Le stage sera réalisé au sein de l’équipe SIG, dans le département Gestion de Données de l’Institut de Recherche en Informatique de Toulouse (IRIT). L’IRIT est un laboratoire de recherche constitué de chercheurs en informatique, développant notamment des travaux autour du traitement automatique du langage, de la gestion des données, des connaissances et de l’extraction d’informations.
Le stage sera localisé sur le Campus de Castres, dans les locaux de l’école d’ingénieurs ISIS, qui forme des ingénieurs en informatique dans le domaine de la santé numérique. Des déplacements à Toulouse dans les locaux de l’IRIT sont à prévoir.

Sujet :
Les grands modèles de langue qui n’ont de cesse de se perfectionner représentent un outil puissant pour la compréhension fine des connaissances dans un contexte général mais également de manière plus spécialisée, dans des domaines métier spécifiques comme celui de la santé médicale. Notamment, les grands modèles de langue (LLMs) constituent une base solide pour la détection d’entités nommées (NER) ou de relation (RE) qui sont des tâches majeures pour le traitement des données médicales.
L’objectif de ce stage est donc de proposer des méthodes d’extraction d’entités nommées s’appuyant à la fois sur les LLMs (Phi-3 [1], BERT [2]) et sur des ontologies médicales (SNOMED CT [3], UMLS [4]), qui renferment des informations sémantiques précises sur les entités et relations recherchées. Pour cela, deux approches sont envisagées, s’appuyant toutes les deux sur les grands modèles de langues :
(A) Une approche qui utilise le contexte, permettant de guider un modèle de langue génératif en sélectionnant les types d’entités les plus pertinents dans une ontologie pour l’extraction d’entités nommées ou de relations.
(B) Une approche plus intégrée, visant cette fois à inclure directement la représentation ontologique au cours d’une étape de fine-tuning d’un modèle de langue et à interroger directement le modèle, sans fournir de contexte préalable.
En fonction des avancées, les résultats pourront faire l’objet d’une soumission à la conférence CLEF 2025 (https://clef2025.clef-initiative.eu/).

Profil du candidat :
Etudiant(e) en formation de niveau Bac+4/5, avec une spécialisation en Informatique ou Data Science et présentant des compétences en analyse, traitement et représentation de données.

Formation et compétences requises :
Les compétences suivantes seront fortement appréciées pour mener à bien les missions associées au sujet de stage :
• Bonnes connaissances en programmation (Python) et traitement automatique du langage.
• Connaissances de base sur les ontologies et bases de connaissances.
• Familiarités avec les modèles d’apprentissage automatique en général et le modèle transformer en particulier.

Adresse d’emploi :
Campus Universitaire, Rue Firmin Oulès, 81104 Castres
yohann.chasseray@irit.fr

Document attaché : 202501051355_Offre_de_stage_ISIS_IRIT.pdf

Predictive Safety Shields for Reinforcement Learning Based Controllers
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : U2IS, Ensta Paris
Durée : 6 months
Contact : elena.vanneaux@ensta-paris.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
Context Reinforcement learning (RL) has been widely adopted in robotics for its ability to learn from
interaction with the environment through feedback. It enables robots to adapt to environmental changes
and optimize their behavior according to performance criteria not known in advance [6]. However, to use
RL-based controllers for safety-critical tasks, one should also ensure that nothing ”bad” occurs during the
training and deployment of RL agents. Indeed, autonomous vehicles should never drive off the highway,
robotic prostheses should never force their users’ joints past their range of motion, and drones should
never fall out of the sky. The vulnerability of standard RL-based controllers to failures has spurred
significant growth in research on safe RL in the past decade [2].
In this internship, we will focus on provably safe RL, that provides hard safety guarantees for both
training and operation [7]. Provably safe RL approaches can be categorized into preemptive and postposed shielding [1]. In the preemptive method, the agent can only choose from actions that have been
a priori verified as safe. However, if a preemptive shield is too conservative, i.e., it identifies only a
few actions from the action space as safe, the agent’s capabilities for exploring the environment are
significantly reduced, which can lead to lower overall performance [3]. In post-posed shielding, the
safety filter monitors the RL agent behavior. If the agent wants to take an unsafe action, the shield
replaces it with a fallback strategy. Post-posed shields are usually more computationally efficient than
preemptive. Also, they are often easier to use in dynamic environments, which we want to investigate in
this internship. Still, in dangerous scenarios, a shield forces the system to use a predetermined safe but
likely sub-optimal policy [1]. Hence, while guaranteeing safety, shielding often contradicts task efficiency.
This internship aims to balance safety and performance by developing provably safe RL algorithms with
the agent’s guaranteed near-optimal behavior.
In our proof-of-concept work [5], we propose a predictive safety shield for model-based reinforcement learning agents in discrete space. The safety shield updates the Q-function locally based on safe
predictions, which originate from a safe simulation of the environment model. This shielding approach
improves performance while maintaining hard safety guarantees. Our experiments on grid-world environments demonstrate that even short prediction horizons can be sufficient to identify the optimal path.
We observe that our approach is robust to distribution shifts, e.g., between simulation and reality, without requiring additional training. This internship aims to extend the proposed approach to dynamically
changing environments [4].

Goals The goals of the internship consist of
• exploring the state-of-the-art safety shields for reinforcement learning algorithms
• proposing a shield that ensures safe behavior in dynamically changing environments.
• testing the proposed approach in GridWorld and PacMan environments

References
[1] Mohammed Alshiekh, Roderick Bloem, R¨udiger Ehlers, Bettina K¨onighofer, Scott Niekum, and Ufuk
Topcu. Safe reinforcement learning via shielding. Proceedings of the AAAI Conference on Artificial
Intelligence, 32, 08 2017.
[2] Lukas Brunke, Melissa Greeff, Adam W. Hall, Zhaocong Yuan, Siqi Zhou, Jacopo Panerati, and
Angela P. Schoellig. Safe learning in robotics: From learning-based control to safe reinforcement
learning. Annual Review of Control, Robotics, and Autonomous Systems, 5(1):411–444, 2022.
[3] Kai-Chieh Hsu, Haimin Hu, and Jaime F. Fisac. The safety filter: A unified view of safety-critical
control in autonomous systems. Annual Review of Control, Robotics, and Autonomous Systems,
7(1):47–72, July 2024.
[4] Nils Jansen, Bettina K¨onighofer, Sebastian Junges, Alex Serban, and Roderick Bloem. Safe reinforcement learning using probabilistic shields (invited paper). Schloss Dagstuhl – Leibniz-Zentrum
f¨ur Informatik, 2020.
[5] Pin Jin. A safety filter for rl algorithms based on a game-theoretic mpc approach, 2024. PRE –
Research Project, ENSTA.
[6] Jens Kober and Jan Peters. Reinforcement Learning in Robotics: A Survey, pages 9–67. Springer
International Publishing, Cham, 2014.
[7] Hanna Krasowski, Jakob Thumm, Marlon M¨uller, Lukas Sch¨afer, Xiao Wang, and Matthias Althoff.
Provably safe reinforcement learning: Conceptual analysis, survey, and benchmarking. Transactions
on Machine Learning Research, 2023. Survey Certification.

Profil du candidat :

Formation et compétences requises :
Profile of a candidate. For this position, you should meet the following requirements:
• enrollment in a Master’s program or equivalent in computer science, applied mathematics science,
engineering, or related disciplines;
• rigorous knowledge in formal verification, control design, and reinforcement learning;
• excellent programming skills (Python);
• proficiency in spoken and written English;
The candidate will have to submit the documents following:
• a cover letter;
• a resume;
• a copy of diplomas, bachelor’s and master’s degree transcripts.
In case of a successful internship, a Ph.D. offer in ENSTA Paris might be proposed.

Adresse d’emploi :
828 Bd des Maréchaux, 91120 Palaiseau

Document attaché : 202412061053_Safety_for_AI__M2.pdf

Stage M2 – Change point detection in temporal graphs
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Univ-Littoral
Durée : 6 months
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2025-03-01

Contexte :
Temporal graphs, representing interactions over time, are crucial for analyzing datasets in areas like Industry 4.0, cybersecurity, and social networks. Temporal graphs often exhibit periods of distinct activity regimes, making change point (CP) detection vital for tasks such as fault detection and prediction. However, the sparsity and irregularity of real-world temporal graphs make CP detection highly challenging, as current algorithms struggle to extract accurate patterns.

Sujet :
The internship aims to build upon recent works that allow to transform temporal graphs upon a spectral domain where comparing different periods of a temporal graph is easier. Yet such transform relies on the choose of graph and signal dictionaries that must be properly chosen to attain satisfactory detection accuracy. For signal dictionaries, we aim to compare different choices, like Haar, Walsh, and Boolean-based dictionaries, which are adapted to the binary and sparse nature of temporal graphs. For graph dictionaries, we aim to build custom dictionaries with user-defined motifs.

Profil du candidat :
This internship is directed at students with various backgrounds (computer science, data science, signal processing,
complex systems) but with a strong interest in data science and graphs. Interest in the theoretical aspects of machine learning and in Python development will a plus.

Formation et compétences requises :
Ing3 or M2 students

Adresse d’emploi :
Saint Omer, France

Document attaché : 202412060909_Data2Laws___M2_Internship.pdf

Stage M2 – Machine Learning Framework for Temporal Graph Exploration
Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – ULCO
Durée : 6 mois
Contact : esteban.bautista-ruiz@lip6.fr
Date limite de publication : 2025-03-01

Contexte :
Dans les systèmes de transport avec trajets programmés (trains, avions, bus, etc.), des questions fondamentales se posent : existe-t-il un itinéraire permettant de visiter tous les arrêts ? Quel est le plus rapide ? Comment maximiser le nombre de lieux visités dans un temps limité ? Ces problématiques relèvent du Temporal Graph Exploration Problem (TEXP), qui consiste à trouver un chemin temporel permettant de visiter tous les sommets d’un graphe aussi vite que possible. Bien que crucial pour la logistique, la cybersécurité ou la détection de fraudes, le TEXP est un problème NP-difficile, ce qui rend le calcul de solutions exactes impraticable pour de grands graphes.

Des algorithmes heuristiques et d’approximation existent pour résoudre le TEXP, mais ils ont du mal à trouver un bon compromis entre vitesse et qualité des solutions. Les Graph Neural Networks (GNNs) se sont montrés efficaces pour résoudre des problèmes combinatoires sur des graphes statiques, et des versions plus récentes permettent maintenant de gérer les graphes temporels. Pourtant, ces outils n’ont pas encore été utilisés pour aborder le TEXP.

Sujet :
Nous visons à aborder le problème TEXP sous l’angle de l’apprentissage automatique en nous appuyant sur un cadre récent non supervisé pour l’optimisation combinatoire. Plus précisément, nous cherchons à (1) exploiter ce cadre pour concevoir une fonction de perte, basée sur la méthode probabiliste d’Erdős, qui optimise les parcours respectant les contraintes temporelles ; et (2) explorer des architectures récentes qui font l’embedding des parcours temporels, offrant un biais plus adapté au TEXP que les GNN classiques.

Profil du candidat :
Étudiants en informatique, science des données, recherche opérationnelle, ou systèmes complexes, ayant un fort intérêt pour l’optimisation combinatoire et l’apprentissage automatique sur graphes.

Formation et compétences requises :

Pour postuler, merci d’envoyer un e-mail à

– esteban.bautista@univ-littoral.fr
– rym.guibadj@univ-littoral.fr

en joignant les documents suivants pour appuyer votre candidature :

• votre CV ;
• une lettre de motivation ;
• vos relevés de notes de la dernière année de Licence à la dernière année de Master (si disponible) ;
• deux lettres de recommandation ou les noms et moyens de contact de deux conseillers académiques.

Les candidatures seront examinées au fur et à mesure jusqu’à ce que le poste soit pourvu.

Adresse d’emploi :
LISIC laboratory – St Omer site

Document attaché : 202412051118_Internship_ML-Temporal-Graph-Exploration.pdf

Mar
15
Sat
2025
Offre de stage Master 2 : Constitution et analyse d’un corpus multimodal (parole–oculométrie) d’entretiens de bilan psychiatrique à des fins d’aide à l’évaluation médicale
Mar 15 – Mar 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IMT Atlantique / CHU Brest
Durée : 5 mois
Contact : yannis.haralambous@telecom-bretagne.eu
Date limite de publication : 2025-03-15

Contexte :
Lors des entretiens de bilan psychiatrique, les psychiatres s’appuient sur des signaux faibles afin d’élaborer un diagnostic et une prise en charge adaptée. Dans ce contexte, les outils d’aide à la décision peuvent apporter une aide décisive pour orienter le clinicien et améliorer la prise en charge.

On s’intéressera particulièrement dans le cadre de ce stage aux signaux liés aux discours et au regard de personnes à risque de souffrir de santé mentale. Le stage est ainsi interdisciplinaire, entre psychiatrie, traitement automatique de la langue et oculométrie. Son objectif est la mise en place d’une procédure d’acquisition et de traitement de corpus multimodal parole/oculométrie pour les entretiens de bilan psychiatrique. Le but est d’agréger les deux modalités pour obtenir des meilleures performances en matière de détection de comorbidités et avec l’espoir de pouvoir extraire, ultérieurement, de ces données des indicateurs de diagnostic précoce de pathologie(s).

Sujet :
Le stage procédera par les étapes suivantes.

1) La mise en place d’outils d’acquisition de corpus multimodal (enregistrement de la parole, transcription, mouvements oculaires).

2) L’enregistrement du corpus d’une dizaine d’entretiens de bilan psychiatriques (exécuté par le CHU).

3) La prise en main et l’application d’algorithmes déjà existants d’alignement de la transcription écrite et de la parole.

4) L’ajout de données oculométriques, tant au niveau des saccades oculaires qu’au niveau de la cible du regard.

5) Expérimentations et analyse sur le corpus en utilisant l’équipement mis en place, afin de repérer des réactions du patient, aux niveaux linguistique et oculométrique.

Les livrables attendus sont :

(a) Déploiement et adaptation de dispositifs et de logiciels (les chaînes d’acquisition et de traitement de données multimodales).

(b) Le corpus multimodal acquis, sous forme de ressource réutilisable.

(c) Code source et résultats issus de l’analyse du corpus pour la détection de comorbidités.

(d) Rapport de stage.

Profil du candidat :
Étudiant en M2 en traitement automatique de la langue ou en IA ou en sciences cognitives ou élève-ingénieur.

• Intérêt pour la recherche dans le domaine de la santé ;
• bonne expérience en programmation Python, en particulier en traitement des données ;
• aptitude à comprendre et à déployer des outils existants, à expérimenter en autonomie ;
• des connaissances ou une expérience préalable en traitement automatique de la langue et/ou en analyse de corpus seraient un avantage majeur.

Formation et compétences requises :

Adresse d’emploi :
ENCADRANTS
##########
Gábor Bella, IMT Atlantique
Yannis Haralambous, IMT Atlantique
Philippe Lenca, IMT Atlantique
Sorin Moga, IMT Atlantique
Laurent Navarro, École des Mines de Saint-Étienne
Christophe Lemey, CHU de Brest

CONTACTS
########
Envoyer votre CV, lettre de motivation, relevés de notes et tout autre document à

Yannis Haralambous, IMT Atlantique : yannis.haralambous@imt-atlantique.fr
Gábor Bella, IMT Atlantique : gabor.bella@imt-atlantique.fr

Représentation des grandeurs physiques dans le Web sémantique
Mar 15 – Mar 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Mines Saint-Étienne
Durée : 4-6 mois
Contact : antoine.zimmermann@emse.fr
Date limite de publication : 2025-03-15

Contexte :
Les grandeurs physiques constituent une part importante de ce qui est représenté dans les données scientifiques, les données médicales, les données industrielles, les données ouvertes et, dans une certaine mesure, diverses données privées.

Qu’il s’agisse de distances, de vitesses, de charges utiles dans les transports, de concentrations, de masses, de moles en chimie, de puissances, d’intensités, de tensions dans le secteur de l’énergie, de dimensions de meubles, de poids, de tailles de personnes, de durées, et bien d’autres encore dans le domaine de la santé, il est nécessaire de représenter les grandeurs physiques, de les stocker, de les traiter et de les échanger entre systèmes d’information, potentiellement à l’échelle mondiale, souvent sur l’internet et via le Web.

Sujet :
Dans ce stage, nous cherchons à définir précisément une manière de représenter sans ambiguïté les grandeurs physiques pour le Web des données. Plus précisément, nous étudierons les propositions faites pour encoder les grandeurs physiques dans le modèle de données standard du Web sémantique, RDF. Nous nous intéresserons particulièrement à l’utilisation d’un type de données dédié à cet encodage, probablement adapté de la proposition de Lefrançois & Zimmermann (2018) basée sur le standard UCUM.

Après avoir établi une définition rigoureuse du type de données (éventuellement de ses variantes, si pertinent), nous nous concentrerons sur l’implémentation d’un module capable de lire/écrire et de traiter les grandeurs physiques et leurs opérations au sein des API de manipulation de données RDF, pour la gestion, l’interrogation et le raisonnement sur des graphes de connaissances contenant des grandeurs physiques.

L’ambition est que, d’une part, la spécification devienne dans quelques années un standard de facto, avant peut-être de devenir un standard de jure ; et que, d’autre part, l’implémentation soit la référence permettant de comparer les niveaux de conformité d’autres implémentations futures.

Cette étude devrait conduire à la publication d’un article scientifique dans une revue scientifique à fort impact.

Détails du sujet et de comment candidater sur https://www.emse.fr/~zimmermann/Teaching/SemWeb/Internship/

Profil du candidat :
Master 2 en informatique voulant avoir une expérience en recherche, éventuellement dans le but de poursuivre des études doctorales.

Formation et compétences requises :
Compétences requises en Web sémantique (RDF, SPARQL, etc.).

Adresse d’emploi :
158 cours Fauriel
CS 62362
42023 Saint-Étienne Cedex 2
France

Mar
31
Mon
2025
Action Recognition by Knowledge Augmentation in Vision Language Model
Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Laboratoire ICube, Strasbourg
Durée : 6 mois
Contact : seo@unistra.fr
Date limite de publication : 2025-03-31

Contexte :
Action recognition from video is highly important for assistive care robots, as it enables them to understand and respond appropriately to the needs and activities of the people they assist. Recent DL models for action recognition are moving toward more data-efficient, interpretable, and computationally optimized frameworks: The combination of transformer architectures, spatio-temporal attention, multimodal fusion, and self-supervised learning, just to mention a few. Meanwhile, the recent emergence of large-scale pre-trained vision-language models (VLMs) has demonstrated remarkable performance and transferability to different types of visual recognition tasks, thanks to their generalizable visual and textual representations. It has been confirmed by our recent study, where our developed model learns and improves visual, textual, and numerical representations of patient gait videos based on a large-scale pre-trained Vision Language Model (VLM), for several classification tasks.

Sujet :
Motivated by these recent successes, we will extend our previous developed model and the multimodal representation for a new classification task – action recognition from video. Similarly to our previous method, we will adopt the prompt learning strategy, keeping the pre-trained VLM frozen to preserve its general representation and leverage the pre-aligned multi-modal latent space the prompt’s context with learnable vectors, which is initialized with domain-specific knowledge.

Profil du candidat :
− Solid programming skills in Python/C++
− Experience in Deep Learning (Transformer, CLIP, etc.)
− Good communication skills

Formation et compétences requises :

Adresse d’emploi :
2 Rue Marie Hamm
67000 Strasbourg

Document attaché : 202411071346_Stage-ActionRecognition.pdf

Analyse numérique de l’engagement d’apprenants dans des situations d’apprentissage en ligne
Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CReSTIC – Université de Reims Champagne-Ardenne
Durée : 4 à 6 mois
Contact : bart.lamiroy@loria.fr
Date limite de publication : 2025-03-31

Contexte :
Ce travail se place dans un projet de recherche en collaboration avec Santé Publique France.
Ce stage de Master se situe en amont et en parallèle des recherches menés dans le cadre de ce projet et consiste à choisir et mettre en place les outils adéquats en analyse statistique de données et d’extraction de connaissances à partir de traces d’interaction avec un site d’apprentissage en ligne afin de mesurer l’impact de l’outil de formation et de mesurer l’engagement des apprenants dans leur démarche.

Sujet :
Le but est d’établir des profils d’usagers à partir des interactions de ceux-ci avec une plateforme d’apprentissage en ligne, afin d’évaluer l’adéquation de l’outil numérique proposé, et de faire des préconisations pour son évolution à partir de données anonymisées.

• Il s’agira de concevoir et appliquer des outils d’analyse statistique des données et d’extraction de connaissances à partir des données de cette expérimentation.
• Des algorithmes d’analyse de données et de classification seront utiles pour mettre en exergue des corrélations, interdépendances ou autres similarités dans les parcours d’apprentissage.

Profil du candidat :

Formation et compétences requises :
La candidate ou le candidat a in niveau de formation M2 et une bonne connaissance en analyse de données numérique et de programmation. Elle ou il maîtrise Python ou R.
La curiosité, l’autonomie et le sens de travail en équipe seront également des facteurs déterminants.

Adresse d’emploi :
CReSTIC
UFR Sciences Exactes et Naturelles
Moulin de la Housse – BP 1039
51687 Reims CEDEX 2
https://crestic.univ-reims.fr/fr/accueil

Document attaché : 202412201243_Sujet Master 2.docx

Call for internship proposals, M2 PSL IASD
Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PSL University
Durée : 5 mois
Contact : pierre@senellart.com
Date limite de publication : 2025-03-31

Contexte :
Le M2 IASD est le parcours de deuxième année en Intelligence Artificielle et Science des Données du Master Informatique de l’Université PSL (porté par l’Université Paris-Dauphine, l’École Normale Supérieure et Mines Paris). Voir https://www.masteriasd.eu/fr/ pour plus d’information.

The IASD M2 is the second-year track on Artificial Intelligence and Data Science of the Master’s degree in Computer Science of PSL University (involving Université Paris-Dauphine, École Normale Supérieure, and Mines Paris). See https://www.masteriasd.eu/ for more information.

Sujet :
… [See below for English version] …

Le master IASD lance un appel à propositions de stages pour ses étudiants pour l’année académique 2024-2025. Les stages durent 5 mois, généralement d’avril à août. Les stages peuvent se dérouler dans des laboratoires ou services de recherche académiques ou industriels mais doivent être orientés vers la recherche.

Les propositions peuvent être soumises directement via le formulaire
  https://db.masteriasd.eu/internships/submit
et seront visibles sur le site web du M2 IASD

Propositions de stage

… [Voir ci-dessus pour la version française] …

The IASD M2 calls for internship proposals for its students for the 2024-2025 academic year. Internships last 5 months, typically, from April to August. Internships can be held in academic or industrial environments but must be oriented towards research.

Proposals can be submitted directly at
  https://db.masteriasd.eu/internships/submit
and will be displayed on IASD’s website

List of internships proposals

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
TBD

Deep representation of the Brain Image for the Analysis of Neurodegenerative diseases
Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Laboratoire ICube, Strasbourg
Durée : 6
Contact : seo@unistra.fr
Date limite de publication : 2025-03-31

Contexte :
Dementia with Lewy Bodies (DLB) and Alzheimer’s Disease (AD) are two common neurodegenerative diseases among elderly people. Both associated with abnormal deposits of proteins in the brain, the diagnosis of these diseases can be challenging, particularly in distinguishing between them, as they exhibit similar symptoms in their early stages. Brain MRI provides detailed images of brain structures, allowing for the identification of structural changes associated with neurodegenerative diseases. Deep learning has shown great promise in analysing these images, enabling accurate predictions and interpretations. At the center of it are the recent emerging large-scale pre-trained vision-language models (VLMs), which have demonstrated remarkable performance thanks to their generalizable visual and textual representations.

Sujet :
We will deploy a VLM to improve the accuracy and efficiency of brain image analysis, with a specific focus on classification and associated reasoning presented in text form. Our specific focus will be on the analysis and understanding of neurodegenerative diseases, Dementia with Lewy Bodies (DLB), Alzheimer’s Disease (AD), and/or Parkinson disease. We will base our study on our recent work, where the model we developed learns and refines visual, textual, and numerical representations of patient gait videos using a large-scale pre-trained Vision-Language Model (VLM) for several classification tasks.

Profil du candidat :
− Solid programming skills: Python/C++
− Experience in Deep Learning (Transformer, CLIP, etc.)
− Good communication skills

Formation et compétences requises :

Adresse d’emploi :
2 Rue Marie Hamm
67000 Strasbourg

Document attaché : 202411071344_Stage-DeBIAN.pdf

Estimating intracranial pressure by wide-band tympanometry signal analysis through neural networks
Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ImViA, Dijon, France & CHU Dijon, Fran
Durée : 6 mois
Contact : franck.marzani@u-bourgogne.fr
Date limite de publication : 2025-03-31

Contexte :
Wide-band tympanometry (WBT) is a routine and non-invasive clinical tool to estimate the micromechanical properties of the middle and inner ears. The system delivers a pure-tone signal into the ear at several frequencies and records the reflecting signal in the ear canal. Il also analyses the absorbance at different pressures in the ear canal (-300 to +300 daPa). It estimates the reflectance and the absorbance of the recorded sound and thus provides interesting indicators of tympanic membrane and ossicular chain mobility, and middle ear pressure. The ear is connected to the intracranial space through the inner ear structures. An increase in the intracranial pressure (ICP) changes the micromechanical properties of the middle ear and the WBT signal. The relation between intracranial pressure and WBT signal alterations is complex and poorly studied. The WBT signal varies between individuals and these 2 obstacles hamper the estimation of intracranial pressure by WBT. Monitoring the ICP is crucial in patients undergoing intracranial surgical procedures or in those with head trauma. The gold standard for measuring ICP is invasive pressure sensors placed inside the head. Developing non-invasive ICP measurements would be a significant breakthrough in the neurosurgical field.
We have undertaken a clinical study in the intensive care unit (Dijon hospital) for the measurement of ICP with the intracranial invasive system and multiple WBT recordings on both ears in 20 patients after head trauma or surgery. The database includes 1200 recordings with corresponding invasive ICP values (ground truth). Each WBT recording is composed of absorbance values for probe sound frequencies ranging from 120 to 8000 Hz and for ear canal pressures ranging from -300 to +300 daPa).

Sujet :
The aim of the study is to develop a neural network to analyze the data and to estimate the ICP in 3 categories of pressure (low, medium, high). As a first step, the person recruited will have to understand the physical meaning of the signals handled. He/she will then have to propose and implement a deep learning architecture capable of modeling the relation between ICP and WBT signals in order to meet the objective of estimating.
This study opens insights to the understanding of the mechanisms connecting the middle ear micromechanics and ICP.

Profil du candidat :
Master or engineering student in imaging, computer vision.
Strong skills in image analysis, AI, programming such as Python.
Interest in working as part of a team in an interdisciplinarity environment. Interest in healthcare applications.
Enthusiasm for research. Autonomy.

Formation et compétences requises :
Applicants are invited to submit their application to: Franck MARZANI (franck.marzani@u-bourgogne.fr) and Alexis BOZORG GRAYELI (alexis.bozorggrayeli@chu-dijon.fr).
Application must contain the following documents: cover letter, CV, transcript of the last 2 years, at least 2 reference letters or referral contacts.

Adresse d’emploi :
Laboratoire ImViA, Dijon, Université de Bourgogne