MaDICS

Huitième édition du Symposium MaDICS (les inscriptions sont ouvertes !)

Ce rendez-vous annuel rassemble la communauté MaDICS afin de mettre en lumière les avancées récentes en sciences des données, à travers un programme scientifique riche comprenant des conférences invitées (keynotes), des ateliers thématiques, des tables rondes et des sessions de posters.
Ces temps forts favorisent des échanges scientifiques à la fois stimulants et conviviaux.

Une Session Poster sera spécialement consacrée aux jeunes chercheuses et jeunes chercheurs souhaitant présenter leurs travaux en analyse et gestion de données et dans les domaines interdisciplinaires autour de la Science des Données. Cette session sera également l’occasion d’échanger avec des collègues académiques et des acteurs industriels sur les thématiques de recherche présentées.

Dates importantes :

Soumission de posters : au plus tard le ~~23 mars 2026~~ 2 avril 2026
Retour : 9 avril 2026
Date limite d’inscription : 30 avril 2026
Symposium : les 2 et 3 juin 2026 à Avignon

Nous vous invitons d’ores et déjà à réserver ces dates dans votre agenda et à vous inscrire !
Inscrivez-vous ici

Pour en savoir plus…

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…

Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.

Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus…
Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus…
Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus…
Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…

Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS

May

Thu

2025

Thèse INRIA, DGA, LERIA – Rennes / Angers

Tickets

May 15 – May 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Centre INRIA de l’Université de Rennes
Durée : 3 ans
Contact : nicolas.gutowski@univ-angers.fr
Date limite de publication : 2025-05-15

Contexte :
The project involves three partners: Inria, Leria and DGA TT.

Inria is the National Research Institute for Digital Science and Technology. This center for scientific excellence is currently directing the French Digital Programs Agency and is on the frontline of digitalization in Europe while conducting world-class research covering a wide range of disciplines: computer science, mathematics, and simulation software. International and industrial collaborations, ground-breaking research, software development, artificial intelligence, quantum- and cyber technologies and deep tech startups are the DNA of the institute. Inria ranks 16th worldwide at the AI Research ranking while being the number one European institute for frontier research in digital sciences.

LERIA (Laboratory for Computer Science Research in Angers) is a dynamic research unit of the University of Angers, bringing together around 40 members, including 23 faculty researchers and a vibrant community of PhD students and collaborators. Its scientific focus lies at the intersection of Artificial Intelligence and Optimization, with research spanning from theoretical models for knowledge representation and reasoning to advanced algorithms for solving complex combinatorial problems. Bridging fundamental research and real-world applications, LERIA actively contributes to both academic and industrial innovation in intelligent computing.

DGA TT (French Procurement Agency – Land Techniques) is the French defense center dedicated to supporting and evaluating all land-based military systems. Its teams specialize in combat systems, ergonomics, weaponry, protection, robotics, and vehicle dynamics. With key sites in Bourges and Angers, the Angers facility focuses on the characterization and real-world testing of military vehicles, including their dynamic behavior and resistance to harsh environments. Spanning over 150 hectares, the site offers specialized tracks and state-of-the-art facilities to simulate extreme mechanical and climatic conditions – ensuring that equipment performs reliably under the most demanding scenarios.

Recruiting team: The recruited researcher will join a multi-disciplinary team involving established, full-time research scientists of all ages, MSc, PhD and postdocs (~30 ppl). The training programme intends to prepare candidates for scientific positions, either in academia or industry, by working in a research-intensive environment which fosters both scientific excellence (world-class researchers and over 65 prestigious ERC grants) and entrepreneurship (over 200 startups launched and a dedicated Inria Startup Studio). You will also have access to an extensive portfolio of training courses on digital science and technology, scientific programming or Artificial Intelligence. The candidate will have the opportunity to share his time in Rennes and Angers, through a flexible programme. He will be recruited by Inria in the Beaulieu Scientific Campus of University of Rennes, Bretagne (France), a medium town (~220.000 inhabitants) close from Paris and from the sea, with an intense student life (25% of the population). and Angers (France’s top city to live in, 2022) and Rennes (1st student city in France, 2024, and 8th in Europe for quality of life, 2019) both offer an exceptional quality of life, a rich history, vibrant culture, and a thriving economy.

Sujet :
Apply here : https://jobs.inria.fr/public/classic/fr/offres/2025-08786

This PhD project aims for an advance in the simulation and design of metamaterials – engineered structures with unique physical properties surpassing natural materials. It aims to develop automated finite element methods to enhance numerical modeling, focusing on precision and efficiency in simulations while enabling predictive design of adaptive systems. The research targets critical defense technologies, including stealth, cloaking, and wave manipulation, with applications spanning multispectral furtivity, dynamic resilience, and active wave modulation, relevant to both defense and civilian contexts.

This PhD project, titled “Artificial Intelligence for Optimizing the Mechanical Resilience of Systems under Severe Vibratory Stress: Application to Fatigue Testing of Military Vehicles” aims to advance the methodologies of the NF X 50-144 standard, a key framework for environmental testing in mechanical engineering. The research will harness artificial intelligence (AI) to improve vibration analyses, offering new insights into the resilience of complex systems under extreme conditions, with a focus on defense applications.

Vibration analysis plays a vital role in ensuring the durability and reliability of military vehicles and their embedded systems, such as armament, communication, and sensor technologies. These systems face intense and variable vibrational stresses from diverse operational environments, including rugged terrains and dynamic scenarios, which current testing approaches, based on simplified assumptions, often fail to fully capture. This project will explore AI-driven solutions to address these challenges, enhancing the ability to predict fatigue and mechanical performance through advanced techniques like classification of non-stationary signals and innovative modeling and classification approaches.

The research will tap into the potential of AI tools, such as autoencoders and other learning frameworks, to process complex vibration data and uncover patterns which traditional methods overlook. By refining how we assess and interpret these signals, the project aims to deliver more robust and adaptable solutions for evaluating system behavior. As AI becomes a cornerstone of future defense technologies, this work will position you at the forefront of innovation, contributing to both scientific progress and strategic advancements in military resilience.

Offered in collaboration with Inria, the University of Angers, and DGA Land Techniques, this PhD provides a unique platform for candidates passionate about AI, mechanical engineering, and defense. The outcomes will directly enhance the reliability of military vehicles, with broader implications for industries like aerospace and automotive, potentially shaping standards used by leading organizations. Based between Rennes and Angers, the project combines access to cutting-edge resources with a multidisciplinary team, offering an exceptional opportunity to make a meaningful impact in a high-stakes field.

Profil du candidat :
MSc (or soon-to-be) graduates

Formation et compétences requises :
This PhD, blending AI and mechanical resilience for military vehicles, seeks motivated MSc (or soon-to-be) graduates with the following qualifications:

Graduation Topics: Ideal profiles are those with backgrounds in computational mechanics, AI/data science and/or advanced scientific computing. Candidates can come from various MSc-level curriculums involving signal processing, machine learning, computational mechanics (vibration, fatigue, or structural dynamics), vehicle engineering (e.g., mechatronics), physics or applied mathematics. Experience in implementing numerical methods in high-level programming languages (Matlab, Python, Julia, …) is essential.
Academic Excellence: Outstanding curriculum with top-class grades, reflecting a strong academic track record. Candidates are expected to possess outstanding problem-solving abilities and a proven aptitude for teamwork.
Computer Literacy: Proficiency in navigating advanced algorithms and theoretical concepts, with strong analytical skills.
Citizenship: Should be an EU citizen due to the defense-related nature of the project.
Passion and Drive: Enthusiasm for AI, defense applications, and advancing engineering solutions.

Adresse d’emploi :
Centre Inria de l’Université de Rennes
Campus universitaire de Beaulieu
Avenue du Général Leclerc
35042 Rennes Cedex

Categories: theses

May

Mon

2025

sujet de thèse : Clustering sous contraintes de séquences temporelles multivariées et hétérogènes – Application à des données hydrologiques

Tickets

May 19 – May 20 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : ICube Strasbourg
Durée : 3 ans
Contact : florence.leber@engees.unistra.fr
Date limite de publication : 2025-05-19

Contexte :
Cette thèse s’inscrit dans le champ de l’apprentissage non supervisé ou faiblement supervisé appliqué aux données temporelles. Le clustering / classification, qui consiste à partitionner l’ensemble des objets analysés en groupes ou clusters, est une des approches les plus employées et repose sur une mesure de similarité entre les objets. Plus particulièrement, le clustering de séquences soulève des problèmes liés à la mesure de similarité entre deux individus. Par exemple, dans le suivi des cours d’eau, certains phénomènes répondent à une fréquence annuelle liée au cycle naturel de l’eau, mais peuvent être décalés dans le temps du fait de l’éloignement géographique et de la météorologie locale. Or, la mesure de similarité doit pouvoir prendre en compte ces potentiels décalages ou légère distorsions dans le temps. De nombreuses méthodes ont été proposées dans la littérature pour prendre en compte ces spécificités par exemple, Dynamic Time Warpping, Longest Common SubSequence , ou plus récemment des représentations par shapeletsou par réseau de neurones.

Sujet :
L’objectif principal de la thèse est de développer de nouvelles approches pour mesurer la similarité entre deux séries temporelles multivariées en prenant en compte des valeurs manquantes distribuées de manière hétérogène dans le temps et entre les variables. Il s’agira de définir des solutions pour intégrer l’information temporelle (espacement entre deux pas de temps, fréquences temporelles des mesures, …) dans le calcul de la similarité. Nous nous intéresserons également à la manière d’intégrer la connaissance de l’expert via des annotations, aussi appelées contraintes (par exemple, proximité/éloignement entre deux individus sur la base d’informations externes), portant à la fois sur des liens temporels et spatiaux entre différents individus, afin d’améliorer la correspondance entre le clustering obtenu et les attentes de l’expert. Ces approches seront expérimentées sur les données de suivi des cours d’eau, qui soulèvent différentes difficultés, du fait de leur nombre, de leur diversité, et de leur hétérogénéité à la fois spatiale et temporelle. On s’intéressera en particulier aux questions suivantes :
– clustering de séquences constituées de vecteurs de paramètres, sachant que ces paramètres ne sont pas mesurés toujours en même temps
– prise en compte des contraintes temporelles (saisons) ou géographiques (régions hydrographiques)
– couplage des données physico-chimiques avec les données biologiques ou hydrologiques (temporalités différentes)
– exploration des limites des méthodes en nombre et taille de séquences

Profil du candidat :

— Master 2 en Informatique
— Formation en sciences des données, fouille de données, apprentissage.

Formation et compétences requises :

— Connaissances solides en apprentissage automatique et en modélisation de connaissances.
— Bonnes compétences en programmation en Python ou R.
— Bonnes compétences de communication et à l’écrit en anglais.
— Un intérêt pour le sujet d’application

Adresse d’emploi :
UMR ICube, 67400 Illkirch (banlieue sud de Strasbourg, accessible en tram)

Document attaché : 202503231357_Suite_Adqeau.pdf

Categories: theses

May

Thu

2025

Optimisation multi-objectifs de l’acquisition et de la modélisation de l’apparence des surfaces complexes par approches d’IA

Tickets

May 29 – May 30 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire d’Imagerie et Vision Artificielle (Im
Durée : 36 mois
Contact : alamin.mansouri@ube.fr
Date limite de publication : 2025-05-29

Contexte :
L’apparence visuelle d’une surface est le résultat de processus d’une grande complexité. D’une part il y a des phénomènes multi-physiques qui concernent l’interaction entre la surface observée et son environnement lumineux. D’autre part, les mécanismes psychovisuels intrinsèques au système visuel humain. Or, la maîtrise de l’apparence est un défi un enjeu important dans de nombreux domaines tels que l’industrie, notamment dans l’industrie du luxe, du cosmétique, de l’emballage, de l’aéronautique ou de l’automobile mais aussi des domaines culturels (patrimoine culturel numérique) ou les industries créatives où les besoins en termes de numérisation de l’apparence sont croissants.

Plusieurs méthodes ont été mises en œuvre afin de prendre en compte cet enjeu de la maîtrise de l’apparence des surfaces. L’approche la plus fréquente consiste à opérer une ou plusieurs étapes de contrôle de la qualité d’aspect des surfaces, en mettant en œuvre une analyse sensorielle visuo-tactile. Cette approche sensorielle est toujours aujourd’hui la référence en industrie même si elle est intrinsèquement et inévitablement subjective car elle réaliser par un contrôleur humain rendant le résultat difficilement répétable et/ou reproductible. L’approche instrumentale, qui vise à mettre en œuvre une mesure physique d’un ou plusieurs attributs agissant sur l’apparence des surfaces (rugosité avec ou sans contact, réflectance, brillance, etc.) est une autre façon de tenter de répondre à cet enjeu. L’idée de mettre en œuvre une numérisation de l’apparence des surfaces permet d’envisager la possibilité de pouvoir quantifier objectivement les attributs d’apparence et in fine, permettre le pilotage fonctionnel des processus de fabrication (dans le cadre industriel) ou la restauration/la sauvegarde des surfaces (dans le cadre du patrimoine) et de finition de surfaces.
Une de ces approches dites instrumentales est basée sur une technique d’imagerie qui se focalise sur la numérisation de la réflectance. La réflectance d’un point de surface peut être définie comme étant la proportion de lumière réfléchie par un point d’une surface relativement à une référence (souvent point blanc lambertien). Généralement, la réflectance peut être décrite par deux composantes principales : la composante angulaire et la composante spectrale. La première exprime la relation géométrique entre la source d’illumination, la surface observée et l’observateur/caméra. Quant à la deuxième, elle est liée à réflexion en fonction des longueurs d’onde. C’est en changeant la position spatiale de la source d’éclairage et en filtrant la lumière réfléchie selon les longueurs d’onde qu’on peut mesurer ces deux composantes.

La technique d’imagerie appelée Reflectance Transformation Imaging (RTI), permettant de mesurer la composant angulaire a connu un développement important dans le domaine du patrimoine culturel et se déploie progressivement dans le domaine industriel. La technique RTI est analogue à la manière dont l’humain inspecte instinctivement une surface. En effet, ce dernier, comme le font les contrôleurs humains lors d’une analyse sensorielle, fait miroiter la surface sous son environnement lumineux en effectuant des rotations de la surface changeant alors l’angle d’éclairage.
Du point de vue mise en œuvre, La technique RTI consiste en une caméra fixe orthogonale à la surface et un éclairage orienté vers la surface dont on fait varier la position (theta, phi) tout en restant à distance fixe de l’objet d’étude tel que montré dans les exemples de la Figure 2. Pour certains angles d’éclairage, des images sont acquises. On mesure alors en chaque image la réflectance angulaire locale de la surface. Ainsi à partir d’une acquisition RTI on obtient un lot d’images, qui permettront de reconstruire la scène avec une source de lumière virtuelle pour aider au contrôle visuel de la surface.

Problématiques

RTI est une technique d’imagerie multimodale produisant de grandes quantités de données complexes, notamment lorsqu’elle est combinée à d’autres modalités d’imagerie (Miuli-spectral, Photostéréométrie, variation de focus, etc.). Malgré de nombreuses recherches et avancées pour rendre l’acquisition, le traitement et l’analyse des données plus robuste et utile à l’utilisateur final, la technique RTI présente encore des limites.

En effet, les acquisitions RTI sont souvent réalisées en lumière blanche et les images enregistrées sont soit en niveau de gris soit en couleur (lorsqu’une caméra couleur est utilisée). Étant donné les limitations liées à l’information de l’intensité et l’information couleur, il est de plus en plus recours à des acquisitions multispectrales combinées avec une acquisition RTI. Se pose alors le problème de modélisation conjointe des informations spectrale et angulaires et leur exploitation aussi bien pour optimiser l’acquisition que pour les traitement subséquents (construction de la saillance, rendu, etc.

Par ailleurs, un paramètre important d’une acquisition RTI concerne les positions d’éclairage pour lesquelles on va acquérir des images. Ces positions sont généralement réparties de manière uniforme dans l’espace theta et phi et leur nombre est, selon le dispositif d’acquisition, soit fixe soit laissé à l’appréciation de l’opérateur qui effectue l’acquisition. Plusieurs problèmes sont alors soulevés par ces choix de paramètres. Premièrement, la disposition uniforme des angles d’éclairage n’est pas forcément adaptée à toutes les surfaces étudiées. Chaque surface, voire chaque point dans le cas de multi-matériaux, possède ses propres propriétés surfaciques, interagissant différemment avec l’environnement lumineux. La disposition uniforme des angles d’éclairage permet d’avoir un aperçu du comportement moyen de la surface mais ne permet pas d’avoir une mesure adaptée et optimisé à celle-ci. Deuxièmement, le nombre de positions d’éclairage influe beaucoup sur le temps d’acquisition. Or, certains domaines, tels que ceux de l’industrie, demande des temps de mesure très courts afin de répondre aux besoins de contrôle qualité en production où la vitesse est un critère primordial. Il serait ainsi important de réduire le temps de cycle d’acquisition des images RTI en optimisant le nombre et la distribution spatiale des positions d’éclairage tout en gardant la même qualité de données fournie à l’utilisateur final.

Sujet :
Approche

Les avancées dans le domaine de l’apprentissage automatique, en particulier les techniques basées sur les réseaux de neurones, ont révolutionné l’imagerie numérique, y compris l’imagerie non conventionnelle. Ces méthodes ont démontré leur pertinence et performance dans une variété de tâches telles que la segmentation, la détection, la localisation et le suivi, dans des domaines d’application divers tels que la médecine, la télédétection, le contrôle qualité et la bio-mécanique. Elles remplacent souvent des modèles analytiques exhaustifs, parfois complexes, par des modèles implicites construits à partir de données expérimentales labélisées complètement ou ou partiellement. Ces approches sont privilégiées lorsque les données d’entraînement sont disponibles et sont même indispensables lorsque les phénomènes sous-jacents sont complexes, caractérisés par une forte non-linéarité et/ou l’absence de modèles analytiques complets. C’est particulièrement le cas pour les applications de caractérisation de l’apparence en lien avec la perception visuelle, où les processus cognitifs sont complexes et multiphysiques.

Le travail de recherche portera sur l’optimisation multi-objectif du processus d’acquisition RTI spectrale pour le rendre rapide et adaptatif. La rapidité serait la conséquence d’une acquisition continue et l’adaptabilité implique de déterminer le nombre optimal de directions d’éclairage ainsi que leur répartition spatiale (chemin d’éclairage) pour chaque matériau ou type de surface. Pour cela nous investiguerons deux approches : la première est une approche supervisée ou semi-supervisée qui consiste en la création et l’entraînement d’un réseau de neurones profond sur des données réelles et simulées sur plusieurs matériaux permettant de déterminer les directions d’éclairage critiques.

En complément, une approche plus exploratoire intégrera les capacités des modèles d’IA générative à apprendre une représentation implicite de la BRDF à partir d’un échantillonnage partiel. Ces modèles permettront de généraliser la modélisation de l’apparence à de nouveaux matériaux avec peu de données, en inférant des comportements photométriques plausibles. L’IA générative jouera également un rôle dans la simulation et l’évaluation de scénarios d’acquisition, permettant de tester virtuellement différentes configurations sans avoir recours à une acquisition physique systématique.
La deuxième approche sera inspirée des techniques récentes en reconstruction 3D permettant l’estimation de poses et le rendu réaliste d’objets 3D à partir de quelques positions. Elle visera à reconstruire implicitement l’information spatiale et spectrale à partir de vues d’éclairage limitées, en utilisant des architectures de réseaux de neurones modifiées pour intégrer des contraintes physiques liées aux propriétés de réflexion des surfaces. Ces modèles pourraient, à terme, produire un rendu interactif temps réel de la réponse spectrale sous illumination variable.

Profil du candidat :
Être titulaire d’un Master 2 ou équivalent en vision par ordinateur, Image et intelligence artificielle.
Avoir des connaissances en imagerie de l’apparence et modèles physiques et graphiques associés.
Avoir des connaissances solides en programmation et architectures de réseaux de neurones.

Formation et compétences requises :
Être titulaire d’un Master 2 ou équivalent en vision par ordinateur, Image et intelligence artificielle.
Avoir des connaissances en imagerie de l’apparence et modèles physiques et graphiques associés.
Avoir des connaissances solides en programmation et architectures de réseaux de neurones.

Adresse d’emploi :
Laboratoire ImViA
Bâtiment I3M
16 Avenue Sully
21000 Dijon

Document attaché : 202505050920_Sujet Thèse contrat doctoral MESRI pour diffusion FR.pdf

Categories: theses

May

Sat

2025

sujet de these – Engagement et émotions pour la détection de contenus toxiques sur Internet

Tickets

May 31 – Jun 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : ONERA
Durée : 3 ans
Contact : valentina.dragos@onera.fr
Date limite de publication : 2025-05-31

Contexte :
A. Problématique générale et contexte
—————————————————
Le sujet de thèse aura pour objectif central l’étude de l’apport de traits linguistiques de nature sémantique dans la caractérisation et la détection de contenus en ligne de nature toxique (e.g. contenu haineux, contenu extrémiste, contenu discriminant). Plus précisément, les connaissances linguistiques examinées seront en lien : (i) d’une part avec l’analyse du degré d’engagement (e.g. « X est Y » vs. « je vous jure/j’ai la preuve que X est Y ») ; (ii) d’autre part avec l’analyse des émotions (e.g. « quel horrible personnage ! »).

Concernant le trait linguistique (i), la problématique de la thèse prend place au sein de travaux visant à examiner de quelle manière les émotions peuvent constituer un trait linguistique pertinent en vue de l’amélioration de systèmes d’identification automatique de discours haineux en ligne, visée encore largement inexplorée en traitement automatique des langues (TAL) [1] et ce alors que plusieurs études ont montré pourtant que la présence d’émotions – en particulier négatives – est un facteur favorable à la propagation de contenus sur Internet (e.g.[2], [3]). Concernant le trait linguistique (ii), la thèse prend place au sein de réflexions menées autour du fait que le degré d’engagement constitue un signe de radicalité et l’on sait que des positionnements radicaux sont de nature à être à plus diffusés que d’autres sur internet, contribuant potentiellement à un phénomène de désinformation [4].
Le sujet prend place dans le contexte sociétal actuel dans lequel sont perceptibles diverses menaces liées à l’adhésion de différentes catégories de personnes aux à des idéologies et mouvances extrémistes (e.g. extrême droite, masculinisme). L’utilisation des plateformes sociales, adoptées par un nombre croissant d’utilisateurs, constitue un vecteur important de diffusion de ces idéologies et la production massive de données disponibles en ligne a déclenché une importante activité de recherche autour de l’analyse de la subjectivité, entendue comme l’expression des goûts, opinions, croyances ou convictions des utilisateurs [5].

Sujet :
B. Objectifs scientifiques
——————————–
Les objectifs scientifiques s’organiseront autour de deux volets principaux : 1. La construction de ressources linguistiques sous la forme de corpus annotés selon les traits (i) et (ii) ainsi que la construction d’ontologies relevant globalement de la représentation de la subjectivité ;
2. Le développement de méthodes de détection automatique de contenus toxiques capables d’exploiter les connaissances modélisées par ces ressources.

1. Construction de ressources linguistiques
Plusieurs corpus représentatifs seront constitués pour décrire les contenus toxiques sur Internet. La construction du corpus s’appuiera sur une liste d’éléments (mots clés, patrons lexicaux) dont l’équipe d’accueil dispose actuellement grâce aux résultats de projets antérieurs, dont notamment FLYER (Artificial intelligence for extremist content analysis, projet ANR ASTRID 2019). Cette liste sera enrichie et mise à jour en explorant de nouvelles données collectées au cours de la thèse.
L’annotation des données sera réalisée en utilisant des schémas d’annotation existants, pour décrire des unités linguistiques émotionnelles [6] et pour décrire le degré d’engagement [7], [8].

On visera également ici à construire des ontologies décrivant la subjectivité, incluant les traits d’émotions et d’’engagement des utilisateurs, et s’appuyant là aussi sur des travaux existants [9], [10], [11] .

2. Développement de méthodes de détection automatique de contenus toxiques capables d’exploiter les connaissances modélisées en 1.

Ce deuxième volet des recherches concernera l’augmentation des plongements sémantiques grâce aux annotations en s’appuyant sur des travaux récents qui ont étendu les principes des plongements sémantiques en considérant les représentations des concepts. Ces études utilisent des graphes conceptuels, des ontologies ou taxonomies, et intègrent ainsi les relations conceptuelles définies de manière explicite par ces ressources. Plusieurs travaux ont d’ailleurs étudié comment l’utilisation de relations telles que la synonymie, l’antonymie ou l’hyperonymie permet d’améliorer la qualité des plongements sémantiques, c’est-à-dire la précision de la sémantique capturée par les représentations vectorielles [14].

Ce deuxième volet de recherches abordera également l’utilisation de la génération augmentée de récupération (Retrieval Augmented Generation – RAG) afin de faciliter l’exploration des dimensions sémantiques principalement visées (émotions et engagement du locuteur) dans les corpus. Cette technique optimise les résultats fournis par un grand modèle de langue (Large Language Model – LLM) en faisant appel à une base de connaissances externe aux sources de données ayant été utilisées pour entraîner le modèle avant de générer une réponse. L’utilisation d’une ontologie peut alors améliorer la pertinence des réponses fournies par un LLM [12].

Tandis que les LLMs et les plongements sémantiques sont construits à partir de connaissances génériques, l’objectif de la thèse est donc d’intégrer des connaissances spécifiques, issues d’ontologies et d’annotations linguistiques pour le traitement des contenus toxiques collectés en ligne. La thèse étudiera ensuite l’impact de cette intégration sur les performances des modèles. Les recherches permettront de développer des méthodes d’intelligence artificielle hybrides, au carrefour de la représentation des connaissances et de l’apprentissage automatique [13] ainsi que dans une réflexion renouvelée sur l’apport des connaissances linguistiques aux systèmes de détection de discours de haine [15].

Profil du candidat :
Eq. Master en Traitement Automatique des Langues (TAL) ou Ingénierie des Connaissances (IC) ou Ecole d’ingénieurs (maths/info)
– Bonnes compétences en programmation, notamment sous Python
– Des connaissances en annotation linguistique sémantique seront un vrai plus
Modalités de candidature
———————————-

Co-direction : Valentina DRAGOS (ONERA, Palaiseau)/ Delphine BATTISTELLI (MoDyCo, Nanterre)
Salaire : 2488€/brut mensuel
Début : septembre 2025
Nationalité européenne requise
Date limite de candidature : 15 avril 2025

Dossier de candidature à envoyer au plus tard le 15 avril 2025 aux deux encadrantes ci-dessus désignées :
CV, lettre de motivation, relevés de notes du M1 et du M2, le nom d’un.e référent.e à contacter

Formation et compétences requises :
Eq. Master en Traitement Automatique des Langues (TAL) ou Ingénierie des Connaissances (IC) ou Ecole d’ingénieurs (maths/info)

Adresse d’emploi :
ONERA
6 Chem. de la Vauve aux Granges,
91120 Palaiseau

Document attaché : 202503241401_THESE_ONERA.pdf

Categories: theses

Jun

Sun

2025

Personalized, Adaptive, and Collaborative Recommender System for Physical Activity to Support Healthy Aging

Tickets

Jun 1 – May 31 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Hubert Curien Lab (UMR5516, Computer Sciences) & L
Durée : 3 years
Contact : mathias.gery@univ-st-etienne.fr
Date limite de publication : 2025-06-01

Contexte :
See attached document

Sujet :
This PhD project aims to design a personalized recommendation system for physical activity tailored to older adults. The objective is to provide individualized exercise programs based on users’ physical capacities, preferences, environment, and feedback (e.g., perceived exertion, fatigue), ensuring safe progression while improving adherence and the effectiveness of home-based physical activity.
The algorithm will combine personalized, adaptive (evolving over time), and collaborative (learning from users with similar profiles) features. The project is interdisciplinary, at the intersection of computer sciences (AI, recommender systems) and exercise physiology.

Profil du candidat :
See attached document

Formation et compétences requises :
The candidate will preferably hold a Master’s degree (or equivalent) in Computer Science.
Applications from students with a Master in Sports Science (STAPS) and strong skills in programming or algorithms will also be considered.
The candidate is expected to show a strong interest in sport, adapted physical activity, and/or health. French language skills are not mandatory, but the candidate must be willing to learn French. In any case, the ability to communicate in English is required.

Adresse d’emploi :
Hubert Curien Lab
UMR CNRS 5516, campus Manufacture, Saint-Étienne

Laboratoire Interuniversitaire de Biologie de la Motricité
Campus Santé, Saint-Étienne

Document attaché : 202505221256_phd_person-age_CNRS.pdf

Categories: theses

Learning to localize anomalies and optimize itineraries through an AI framework for combinatorial optimization in temporal graphs

Tickets

Jun 1 – Jun 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Univ. Littoral Côte d’Opale
Durée : 3 years
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2025-06-01

Contexte :
Many complex systems — such as the Internet, transportation networks, and financial systems — produce data that naturally takes the form of temporal graphs, where each link between nodes is time-stamped. Temporal graphs allow us to model and analyze interactions over time, such as network traffic between computers, scheduled trips between stations, or transactions between bank accounts. A common challenge in working with such graphs is identifying subsets of the temporal graph that optimize certain properties, like density, cost, duration, etc. These tasks are essential for applications such as anomaly detection, cybersecurity, or route planning, but they typically involve NP-hard combinatorial problems, making them impractical to solve exactly.

This PhD project explores a new direction for tackling these problems using artificial intelligence. While heuristic methods exist, they often struggle to balance speed and accuracy in temporal graph settings. In contrast, recent advances show that AI models can be trained to solve combinatorial problems on static graphs efficiently, yet their potential remains largely unexplored in the temporal graph setting. This project aims to bridge that gap by developing AI-based methods that learn to solve combinatorial optimisation problems emerging on temporal graphs.

Sujet :
This PhD project aims to explore the potential of machine learning methods as a means to solve combinatorial optimization problems on temporal graphs. We target three specific goals:

Goal 1: End-to-end learning framework.
We aim to design a framework that trains neural models to directly map problem instances to solutions in temporal graphs. While such approaches exist for static graphs, our challenge is to extend them to the temporal setting by defining suitable loss functions and training strategies.

Goal 2: A novel filter-based architecture.
We plan to develop a neural architecture that treats optimization as a filtering task — discarding irrelevant links to isolate the optimal subgraph. Building on spectral methods and recent work in temporal graph signal processing, we will explore how filters can be effectively defined and learned in a frequency-structural domain.

Goal 3: High-impact applications.
We will validate our methods on two key applications:

– Anomaly localization: Many systems detect anomalies but fail to pinpoint their origin. We aim to learn to localize anomalies without relying on assumptions about their structure.

– Temporal graph exploration: In transportation networks, finding optimal exploration routes is NP-hard. Our goal is to develop practical AI-based methods that scale better than current approximations.

Profil du candidat :
We look for highly motivated candidates with relevant experience in computer science, graph algorithms, and/or
deep learning. Experience in Python programming and operations research will be a plus.

—— Application ——-

Interested candidates are invited to send an e-mail to

• esteban.bautista@univ-littoral.fr
• rym.guibadj@univ-littoral.fr
• gilles.roussel@univ-littoral.fr

while attaching the documents that can support their application:

• your resume;
• a cover letter;
• your transcripts from the last year of B.Sc to the last year of M.Sc. (if the latter is already available);
• two reference letters or the names and means of contact of two academic advisers.

Applications will be reviewed on a rolling basis until the position is filled.

Formation et compétences requises :

Adresse d’emploi :
LISIC Laboratory – Université du Littoral Côte d’Opale – Site Saint-Omer (Hautes de France), France

Document attaché : 202504141925_PhD_COTEG.pdf

Categories: theses

Tensor Decompositions for Interpretable Machine Learning on Temporal Graphs

Tickets

Jun 1 – Jun 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Univ. Littoral Côte d’Opale
Durée : 3 years
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2025-06-01

Contexte :
Many real-world systems — such as industrial IoT networks, online marketplaces, and social platforms — produce data that naturally forms temporal graphs, where each interaction represents who interacted with whom, and when. Temporal graphs offer a powerful way to capture the evolving structure of complex systems and are key to detecting critical phenomena like fraud, cyberattacks, or the spread of misinformation. However, building machine learning tools for temporal graphs remains a major challenge, as common notions of similarity — essential for tasks like classification, prediction, or anomaly detection — are not easily defined in this context.

This PhD project tackles that challenge by developing interpretable methods to compare temporal graphs. The core idea is to use tensor decompositions, which naturally represent temporal graphs as three-dimensional arrays and break them down into simpler/elementary building blocks. Such temporal graph “atoms” can be leveraged to identify what fundamental building blocks are common and different across temporal graph instances, resulting in a set of tools that not only enhance machine learning on temporal graphs but also offer insights into the underlying patterns driving complex systems.

Sujet :
This PhD project aims to lay the foundation for interpretable machine learning on temporal graphs by developing similarity metrics that reveal meaningful patterns across time-evolving systems. To achieve this, we pursue three main goals:

Goal 1: A new tensor decomposition for temporal graphs.
We will develop a decomposition method tailored to the unique challenges of temporal graphs — including their binary and sparse nature, multi-scale patterns, and varying node sets or time intervals. Existing approaches fall short in capturing these aspects jointly. Our method will extend recent advances in geometric and coupled decompositions to extract shared and distinct motifs across graphs.

Goal 2: Similarity metrics, machine learning tasks, and toolbox.
Using our decomposition, we will define interpretable metrics that compare temporal graphs based on their structure, dynamics, and scale. These metrics will power machine learning algorithms for clustering, segmentation, change detection, and prediction. All methods will be implemented in a unified Python toolbox.

Goal 3: Applications to real-world data.
We will validate our methods on two domains. On Wikipedia, we aim to uncover patterns behind successful collaborations by analyzing contributor interactions. In Industry 4.0 settings, we will detect abnormal behaviors in sensor networks to identify faults or cyberattacks.

Profil du candidat :
We look for highly motivated candidates with relevant experience in computer science, data science, and graph machine learning. Experience in Python programming and signal processing will be a plus.

Interested candidates are invited to send an e-mail to
• esteban.bautista@univ-littoral.fr
• laurent.brisson@imt-atlantique.fr
• matthieu.puigt@univ-littoral.fr
while attaching the documents that can support their application:
• your resume;
• a cover letter;
• your transcripts from the last year of B.Sc to the last year of M.Sc. (if the latter is already available)
• two reference letters or the names and means of contact of two academic advisers.

Applications will be reviewed on a rolling basis until the position is filled.

Formation et compétences requises :

Adresse d’emploi :
LISIC Laboratory – Université du Littoral Côte d’Opale – Site Saint-Omer (Hautes-de-France), France

Document attaché : 202504141906_PhD_Data2Laws.pdf

Categories: theses

Jun

Mon

2025

Construction et exploitation de dictionnaires de composants au travers de l’IA générative

Tickets

Jun 2 – Jun 3 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIAS ISAE-ENSMA et CRITT Informatique
Durée : 3 ans
Contact : baron@ensma.fr
Date limite de publication : 2025-06-02

Contexte :
Le CRITT Informatique (Centre Régional d’Innovation et de Transfert de Technologie) est une structure dédiée au transfert de technologie, labellisée CRT (Centre de Ressources Technologiques) au niveau national par le ministère de la Recherche. Ces centres ont été créés pour accompagner les entreprises dans leur développement et leur transformation technologique.

Dans ce contexte, le CRITT Informatique est régulièrement sollicité par des entreprises du domaine industrielle (aéronautique, ferroviaire, militaire, etc.) pour les accompagner dans la création de dictionnaires de composants, facilitant ainsi les échanges entre les entreprises. Ces dictionnaires de composants appelés des ontologies peuvent s’appuyer sur des standards comme par exemple OntoML (ISO 13584-32). Un travail de mapping est réalisé pour définir les ontologies à partir des concepts et des données de l’entreprise en accord avec ces standards. Ce travail est coûteux en temps, car la compréhension des données métiers est souvent complexe et nécessite alors l’analyse de nombreux documents structurés et non structurés lorsqu’ils sont disponibles.

L’utilisation des IA génératives de type LLM (Large Language Model) pourrait assister les équipes du CRITT dans la construction des ontologies. C’est pourquoi le CRITT a sollicité le LIAS (Laboratoire Informatique et d’Automatique pour les Systèmes), qui travaille déjà sur l’application des LLM aux données historiques et sur le mapping de ces données pour construire des ontologies. Plus spécifiquement, les travaux du LIAS dans le cadre du projet ANR Digitalis (https://digitalis.humanities.science) s’appuient sur un modèle conceptuel répandu CDOC-CRM ainsi que sur des IA génératives commerciales, comme GPT. L’utilisation de ces IA générative facilite le travail, car elles possèdent déjà une connaissance du modèle CDOC-CRM.

Sujet :
Un des enjeux principaux de cette thèse est de considérer que l’IA générative ne possède pas de connaissance préalable du modèle qui définit la structure de l’ontologie. Il est possible d’explorer l’extension des connaissances de ces IA génératives en s’appuyant, par exemple, sur le contenu du standard OntoML. Ainsi, un objectif à envisager serait d’utiliser la technique RAG (Retrieval Augmented Generation) pour alimenter en contexte la phase d’interrogation de l’IA générative. Toutefois, cette solution se heurte souvent à des problèmes de contextes insuffisants ou trop importants pour que l’IA générative puisse répondre efficacement. Ces problèmes de contexte ont été abordés au LIAS dans un autre domaine : les bases de connaissances sémantiques. Cette piste de recherche permettrait d’affiner le contexte à transmettre à l’IA générative et d’expliquer les raisons d’un manque ou d’un excès de contexte.

Dans un souci de confidentialité des données traitées par les IA génératives, souvent exigée par les entreprises, l’inférence sur site (on-premise) des IA génératives représente un autre défi. Le défi du déploiement et de la qualité des résultats des modèles d’IA générative inférés est d’assurer une performance équivalente à celle des solutions commerciales. Par ailleurs, l’inférence sur site permettra d’étudier l’efficacité énergétique des solutions mise en oeuvre, car le CRITT Informatique doit répondre aux exigences régionales en la matière.

Le cadre de cette thèse Cifre regroupe des problématiques de recherche liées à la construction d’ontologies via des IA génératives. Les besoins du CRITT Informatique incluent également le développement d’outils informatiques pour faciliter la mise en oeuvre des recherches obtenues dans cette thèse.

Profil du candidat :
Le candidat devra être titulaire d’un Master 2 ou d’un diplôme d’ingénieur

Formation et compétences requises :
Le candidat devra posséder des connaissances en développement logiciel et manipulation de modèles d’IA générative. Un bon niveau en français et en anglais est nécessaire.

Adresse d’emploi :
Laboratoire LIAS – ISAE-ENSMA
Téléport 2 – 1 avenue Clément Ader
BP 40109
86961 Chasseneuil
France

Document attaché : 202505080828_2025_lias_idd_critt_cifre_thesis_fr.pdf

Categories: theses

Jun

Thu

2025

Vers la découverte automatique de zones d’intérêt (ZOI) dans le domaine du transport maritime

Tickets

Jun 5 – Jun 6 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS
Durée : 36 mois
Contact : etienne.thuillier@univ-amu.fr
Date limite de publication : 2025-06-05

Contexte :
Le transport maritime assure 90% des échanges mondiaux de biens et marchandises. D’un point de vue environnemental, il est de loin le moyen de transport le plus efficient à la tonne de marchandise transportée, bien qu’il doive lui aussi relever le défi de réduire significativement ses émissions. Aujourd’hui l’industrie maritime a initié une profonde transformation qui nécessite un effort important d’innovation et de recherche de la part de l’ensemble des acteurs de l’industrie pour lever les verrous technologiques et scientifiques actuels.

Le projet TNTM (Transformation Numérique du Transport Maritime) s’intègre dans ce contexte d’optimisation de l’industrie maritime et se propose d’agir sur l’ensemble des acteurs aussi bien en mer que sur terre, pour réussir le pari d’un transport moins-carboné voire décarboné. Ainsi, un des axes pour parvenir à ces objectifs est l’excellence opérationnelle qui vise à optimiser l’usage des navires.
Cette excellence opérationnelle est basée sur deux innovations majeures, la première innovation est celle de l’IoT et des données, encore très peu présentes sur les navires et les conteneurs maritimes. La deuxième innovation est liée à l’utilisation d’algorithmes d’optimisation pour améliorer la chaîne logistique maritime du transport par conteneur, en intégrant les dernières avancées de la recherche opérationnelle, des méthodes d’optimisation, de la simulation et du traitement de données (machine learning, etc.). C’est dans ce cadre que se situe cette thèse.

Aujourd’hui, de multiples acteurs différents (sites de chargements et déchargements, transporteurs, terminaux, etc.) sont impliqués dans le transport d’un conteneur. Chaque passage de responsabilité entre deux acteurs crée un risque de mauvaise exécution du plan de transport et cette chaîne logistique est désynchronisée. Il n’existe souvent aucune contextualisation dynamique du plan de voyage du conteneur, et ce, même en ayant connaissance des données issues du conteneur intelligent. Par exemple, les zones d’intérêts géographiques (ZOI) du plan de voyage sont créés manuellement par les utilisateurs et les clients. Autre exemple, des surveillances et des extractions manuelles des données sont réalisées quotidiennement pour fournir des alertes et des informations au client face à des événements inattendus.

Sujet :
Le contexte scientifique de cette thèse relève du Trajectory (Data) Mining, i.e., un ensemble de techniques visant à explorer, analyser, et fouiller des données spatio-temporelles issues des trajectoires d’objets mobiles. Différentes problématiques sont associées à ce domaine, comme par exemple l’analyse exploratoire, le clustering de trajectoires, la classification, la détection d’anomalies, etc.
Parmi les nombreuses problématiques liées à ce domaine, nous nous focaliserons dans cette thèse sur : (1) la reconstruction géographique des trajectoires à partir de données de géopositionnement de conteneurs maritimes, et (2) l’enrichissement sémantique des trajectoires, notamment par l’identification dynamique de ZOI.
Il existe de nombreux modèles mathématiques pour reconstruire des trajectoires à partir du clustering ou de l’identification de patterns dans des données spatio-temporelles. L’algorithme DBscan, et ses variantes, sont souvent les plus utilisés car bien adaptés aux traces de positionnement fournies par les technologies GNSS (Global Navigation Satellite System) ou aux données issues des télécommunications ou du radiopositionnement (Call Detail Records, indoor-positioning, etc.). Le challenge ici réside dans l’application de tels modèles à des données à grosse granularité temporelle comme celles utilisées dans le projet TNTM et qui sont des données AIS (Automatic Identification System).
Concernant l’enrichissement sémantique des trajectoires, le problème consiste à représenter et exploiter un ensemble d’informations contextuelles telles que la détection du mode de transport, le motif et le contexte de déplacement, la découverte des zones d’intérêts, etc. Dans le cadre de cette thèse nous nous limiterons à la détection automatique des ZOI et à leur classification. L’extraction de ZOI à partir de données spatio-temporelles se base généralement sur les algorithmes de reconstruction des trajectoires. On observe toutefois un recours accru aux données issues des connaissances terrain (données sursol, connaissance métier, etc.) pour enrichir et affiner la reconstruction de telles zones. C’est sur ce dernier point que nous concentrerons nos efforts pour développer un modèle de classification des ZOI.
Les principaux objectifs du projet de thèse sont les suivants :
* Analyser la qualité des données issues des conteneurs intelligents.
* Concevoir un modèle de représentation des trajectoires.
* Identifier les ZOI et leur emprise spatiale à partir des trajectoires spatio-temporelles des conteneurs.
* Classifier ces ZOI en fonction des informations contextuelles et des connaissances métier de notre partenaire industriel dans le projet TNTM.

Profil du candidat :
* Titulaire d’un master 2 ou diplome d’ingénieur en informatique

Formation et compétences requises :
* Solides compétences en apprentissage automatique (machine learning)
* Solides compétences en programmation objet et bases de données (python est un plus)
* Bonne expérience en statistiques
* Connaissances sur les SIG
* Bonne communication orale et écrite en français et anglais

Adresse d’emploi :
Laboratoire LIS, Marseille (Campus St Jérôme)

Document attaché : 202205091335_Thesis_TNTM.pdf

Categories: theses

Jun

Fri

2025

Advancing Volcanic Mechanism Classification with Neural Networks and Synthetic Aperture Radar (SAR) Displacement Data

Tickets

Jun 6 – Jun 7 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LISTIC/LMVLMV
Durée : 36 mois
Contact : yajing.yan@univ-smb.fr
Date limite de publication : 2025-06-06

Contexte :

Sujet :
Satellite based remote sensing offers a unique source of information to monitor the environnement, with fine spatial resolution, wide coverage and frequent revisit. This enables addressing the challenge of natural hazard monitoring and forecasting, which has a significant societal impact.

The inverse modeling of surface displacement is one of the major techniques of exploring the subsurface feature of volcanoes. In this Ph.D thesis, we consider the classification of volcanic mechanisms from Interferometry Synthetic Aperture Radar (InSAR) surface displacement estimations. This work is challenging, because surface displacement fields lack distinct features that can reliably distinguish different volcanic mechanisms at depth. We will begin with a blind supervised learning experiment based on synthetic simulations and frugal machine learning models (e.g. random forest) in order to validate the proof-of-concept (Indeed, Cayol et al. 2014 proposed a tedious approach based on a manual decision tree). Afterwards, we can take two approaches: on one hand, increasing the model expressivity, such as transitioning to frugal deep learning models, with the aim of improving classification accuracy; on the other hand, incorporating multimodal input to the model. This includes using directional displacement gradient’s value and sign, as well as horizontal/vertical displacement ratio to complement displacement values, based on expert’s knowledge. Furthermore, inspired by the approach adopted by volcanologists for a similar task – recognizing key physical parameters of fracture displacement (such as faults, magma intrusions, or sheared intrusions), as well as the dip and depth of the fracture and the ratio of host rock stress exerted on the fracture – we aim to train deep learning models to extract physical features. By incorporating physics-informed loss functions, we seek to enhance the universality of solutions proposed by previous deep learning models. Real InSAR displacement measured at the Piton de la Fournaise volcano since 1998 and previously analyzed through Monte Carlo inversions (Dumont et al. 2022) will be used for further validation in real applications.

Selected references :

Cayol V., Carry T., Michon L, Chaput M., Famin V., Bodart O., Froger J.L., Romagnoli C. (2014), Sheared sheet intrusions as mechanism for lateral flank displacement on basaltic volcanoes: Applications to Réunion Island volcanoes, Journal of Geophysical Research, 119, 7607-7635.

Dumont, Q., Cayol, V., Froger, J. L., & Peltier, A. (2022). 22 years of satellite imagery reveal a major destabilization structure at Piton de la Fournaise. Nature communications, 13(1), 2649.

Profil du candidat :
The Ph.D candidate should have good skills in machine learning or volcanology.

Formation et compétences requises :

Adresse d’emploi :
LISTIC, Annecy
LMV, Clermont-Ferrand

Categories: theses

Jun

Sun

2025

Analyse Spectrale des Graphes de Barab ́asi-Albert par les Matrices Al ́eatoires et Applications `a la M ́edecine Personnalis ́ee en Radiologie Mammaire

Tickets

Jun 15 – Jun 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LIST3N/UTT et Université de Sfax
Durée : 36 mois
Contact : malika.kharouf@utt.fr
Date limite de publication : 2025-06-15

Contexte :
Cette thèse vise à développer une approche d’analyse spectrale des graphes de Barabasi- Albert (BA) à l’aide de la théorie des matrices aléatoires et à appliquer ces techniques à la médecine personnalisée en radiologie mammaire. L’objectif est d’exploiter les caractéristiques spectrales des réseaux complexes pour améliorer la détection et la classification des anomalies en imagerie médicale, notamment dans le cadre du diagnostic du cancer du sein.

Sujet :
Nous examinerons les propriétés spectrales des graphes BA afin d’extraire des motifs exploitables pour l’analyse des images médicales. La distribution des valeurs propres des matrices d’adjacence sera explorée afin de détecter les schémas structurels caractéristiques des graphes, en mettant en évidence les réseaux fortement connectés susceptibles de refléter des anomalies.
Lien entre signatures spectrales et anomalies médicales:
L’utilisation de la théorie des matrices aléatoires nous permettra de modéliser et de mieux comprendre les variations spectrales associées aux différents types de tumeurs mammaires. En analysant les perturbations dans la structure spectrale des graphes, nous serons en mesure de détecter des motifs anormaux liés aux pathologies médicales.
Développement d’un modèle de fusion multimodale dynamique:
En combinant les informations extraites des graphes avec des techniques avancées d’apprentissage automatique, nous proposerons un système de fusion multimodale adaptatif, capable d’ajuster dynamiquement les données en fonction de leur pertinence clinique. Ce système exploitera les propriétés spectrales pour réduire la redondance et concentrer l’analyse sur
les modalités les plus informatives.
Techniques de détection et d’intelligence artificielle:
Nous utiliserons des techniques de détection d’anomalies basées sur l’analyse spectrale et l’intelligence artificielle, telles que les autoencodeurs variationnels et les réseaux neuronaux profonds. Ces approches permettront d’améliorer la capacité du modèle à différencier les images normales et anormales, en exploitant les signatures spectrales extraites.
Validation clinique du modèle:
Notre approche sera validée sur des données hospitalières réelles issues du CHU de Sfax, permettant une vérification rigoureuse des performances du modèle et de son utilité clinique. L’impact de notre modèle sur l’optimisation des protocoles de diagnostic sera également examiné.

Profil du candidat :
Master 2 Mathématiques Appliquées, spécialisé en Statistique, ou formation équivalente de type école d’ingénieurs. Des compétences en informatique et logiciel de statistique sont fortement souhaitées (Python et/ou R).

Formation et compétences requises :
Master 2 Statistique ou équivalent école d’ingénieurs

Adresse d’emploi :
Université de technologie de Troyes et université de Sfax

Document attaché : 202505160654_ThèseStat-Cotutelle-UTT-Sfax.pdf

Categories: theses

Learning-based Module for Neighborhood Design to Solve Discrete Graphical Models

Tickets

Jun 15 – Jun 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC UMR 6072
Durée : 36 mois
Contact : abdelkader.ouali@unicaen.fr
Date limite de publication : 2025-06-15

Contexte :
Cf. document attaché

Sujet :
Cf. document attaché

Profil du candidat :
Cf. document attaché

Formation et compétences requises :
Cf. document attaché

Adresse d’emploi :
Université de Caen Normandie (Caen, Normandy, France: GREYC, Campus Côte de Nacre).

Document attaché : 202505060848_GMLAS-PhD-25.pdf

Categories: theses

Jun

Tue

2025

High-dimensional learning for automatic and robust target detection in hyperspectral imagery

Tickets

Jun 24 – Jun 25 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIST3N
Durée : 3 ans
Contact : alexandre.baussard@utt.fr
Date limite de publication : 2025-06-24

Contexte :

Sujet :
voir le descriptif de la thèse “High-dimensional learning for automatic and robust target detection in hyperspectral imagery” dans le fichier attaché

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Université de Technologie de Troyes

Document attaché : 202504241217_PhD_target_detection_hyperspectral_imagery.pdf

Categories: theses

Jun

Thu

2025

Machine learning-assisted discovery and study of solar structure behaviors / Découverte et étude assistées par apprentissage automatique des comportements des structures solaires

Tickets

Jun 26 – Jun 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire d’Informatiques et des Systèmes, Univ
Durée : 36 mois
Contact : adeline.paiement@lis-lab.fr
Date limite de publication : 2025-06-26

Contexte :
The PhD will be supervised by Adeline Paiement at Laboratoire d’Informatique et des Systèmes (LIS). This project is part of an existing and very active partnership with the LESIA laboratory at Paris Observatory.

The PhD will take place in the LIS Toulon laboratory. The PhD student will have access to the computing resources of LIS, and in particular to its high-performance computing cluster. The PhD will be integrated into and will complement the ANR JCJC PRESAGE (PREdicting Solar Activity using machine learning on heteroGEneous data) project (Oct. 2021 – Feb. 2027, partnership with Jean Aboudarham at LESIA). It will exploit and adapt the machine learning methods being developed within PRESAGE for the analysis of multimodal observations.

**************************
La thèse sera dirigée par Adeline Paiement, MdC HDR au Laboratoire d’Informatique et des Systèmes (LIS). Ce projet s’inscrit dans un partenariat existant et très actif avec le laboratoire LESIA à l’Observatoire de Paris.

La thèse se déroulera dans le laboratoire LIS Toulon. Le doctorant aura accès aux ressources de calcul du LIS, et notamment à son cluster calcul haute performance. La thèse s’intégrera dans et complétera le projet ANR JCJC PRESAGE (PREdicting Solar Activity using machine learning on hétéroGEneous data) (oct. 2021 – fév. 2027, partenariat avec Jean Aboudarham au LESIA). Elle exploitera et adaptera les méthodes de machine learning en cours de développement dans le cadre de PRESAGE pour l’analyse des observations multimodales.

Sujet :
Solar activity events appear to be strongly associated with the evolution of solar structures, which are objects in the solar atmosphere that differ from the “quiet” atmosphere and appear, evolve, and disappear over a period of a few days to months. The exact mechanisms of solar activity and the links between solar activity events and solar structures are still poorly understood.

We hypothesize that solar structures can have typical behaviors, both isolated and in interaction with other structures and with solar activity events. Such patterns of behavior have never been researched. Our goal is to discover them, if they exist, using machine learning methods.

Solar structures are traditionally studied individually and using only one observation modality at a time. This greatly limits the possibilities of discovering behavior patterns. Using machine learning tools, this project will carry out the first longitudinal study of a large number of structures. In addition, it will co-exploit multimodal and heterogeneous observations of the sun that reveal different facets of the Sun.

The expected results of this exploratory project are: 1) to obtain information on the existence of typical behaviors for solar structures, 2) to model these behaviors and provide a physical interpretation, 3) to link behaviors and their anomalies to solar activity events. These behavioral models would open up the prospect of a better understanding and prediction of solar activity events, with applications in particular for space weather.

**************************
Les événements d’activité solaire semblent être fortement associés à l’évolution des structures solaires, qui sont des objets de l’atmosphère solaire qui diffèrent de l’atmosphère « calme » et qui apparaissent, évoluent et disparaissent sur une période de quelques jours à mois. Les mécanismes exacts de l’activité solaire et les liens entre les événements d’activité solaire et les structures solaires sont encore mal compris.

Nous émettons l’hypothèse que les structures solaires peuvent avoir des comportements types, à la fois isolés et en interaction avec d’autres structures et avec les événements d’activité solaire. De tels modèles de comportement n’ont jamais été recherchés. Notre objectif est de les découvrir, s’ils existent, à l’aide de méthodes d’apprentissage automatique.

Les structures solaires sont traditionnellement étudiées individuellement et à l’aide d’une seule modalité d’observation à la fois. Cela limite grandement les possibilités de découverte de comportements. Grâce aux outils d’apprentissage automatique, ce projet va réaliser la première étude longitudinale d’un grand nombre de structures. De plus, il co-exploitera des observations multimodales et hétérogènes du soleil qui en révèlent différentes facettes.

Les résultats attendus de ce projet exploratoire sont : 1) obtenir des informations sur l’existence de comportements typiques pour les structures solaires, 2) modéliser ces comportements et en fournir une interprétation physique, 3) relier les comportements et leurs anomalies à des événements d’activité solaire. Ces modèles de comportement ouvriraient la perspective d’une meilleure compréhension et prédiction des événements d’activité solaire, avec des applications notamment pour la météorologie spatiale.

Profil du candidat :
MSc in computer science, data science, or physics, with strong experience in programming. Experience in machine learning and/or solar physics would be appreciated.

**************************
Master 2 ou diplôme d’ingénieur en informatique, science des données, ou physique, avec expérience forte en programmation exigée, et expérience souhaitable en apprentissage automatique et/ou physique solaire.

Formation et compétences requises :

Adresse d’emploi :
Laboratoire LIS, Université de Toulon, campus de La Garde
Av. de l’Université
83130 La Garde

Document attaché : 202506132029_announcement.pdf

Categories: theses

Multi-modal explainable machine learning for exploring consciousness recovery of comatose patients

Tickets

Jun 26 – Jun 27 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS
Durée : 3 ans
Contact : stefan.duffner@insa-lyon.fr
Date limite de publication : 2025-06-26

Contexte :

Sujet :
Multi-modal explainable machine learning for exploring consciousness recovery of comatose patients

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
LIRIS INSA Lyon et CRNL, Université Lyon 1

Document attaché : 202506122101_Fiche_de_poste_agoracoma_phd.pdf

Categories: theses

Jun

Mon

2025

Apprentissage profond pour la prédiction des interactions non-covalentes entre molécules

Tickets

Jun 30 – Jul 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC (Caen) ou CARMeN(Rouen) ,à discuter avec le
Durée : 3 ans
Contact : luc.brun@ensicaen.fr
Date limite de publication : 2025-06-30

Contexte :
Les laboratoires GREYC (Informatique) et CARMeN (chimie théorique) collaborent dans le cadre d’une bourse de thèse CNRS entre les instituts de chimie et d’informatique, L’accueil principal du doctorant pourra être discuté avec ce dernier la thèse se déroulant de toute façon dans le cadre d’une collaboration étroite entre les deux laboratoires. La bourse de thèse permet de financer outre le salaire du doctorant, un certain nombre de frais annexes tels que des déplacements.

Sujet :
La prédiction de liaisons non covalentes dans une molécule est un processus complexe qui nécessite de calculer l’évolution de la position de chacun des atomes des celle-ci au cours du temps. Ce processus peut être effectué à l’aide de logiciel de chimie quantique très coûteux en calcul, ce qui limite ce type de prédiction à des jeux réduits de petites molécules.

L’objet de la thèse est de concevoir des méthodes de prédiction plus efficace en remplaçant l’étape de simulation par une étape d’apprentissage à l’aide d’apprentissage profond sur graphes.

Profil du candidat :
Diplômé d’un diplôme d’ingénieur ou d’un master en informatique, l’étudiant doit être à l’aise en programmation python et dans la lecture d’articles avec un contenu scientifique. Il devra également être autonome et approfondir de lui-même les pistes de recherche qui lui seront indiquées. On s’attend à ce qu’il soit force de proposition au terme de la première année de thèse.

Formation et compétences requises :
Diplômé d’un diplôme d’ingénieur ou de master en Informatique avec une spécialisation en apprentissage profond. Des compétences en graphes et des bases en chimie seraient appréciées sans être des prérequis.

Adresse d’emploi :
GREYC
6 boulevard du Maréchal Juin,
14050 Caen

Laboratoire COBRA
Bâtiment IRCOF – 1, rue Tesnière
76821 Mont-Saint-Aignan cedex

À discuter avec l’étudiant

Document attaché : 202504031311_these_rouen.pdf

Categories: theses

Bayesian Estimate of Galaxy Cluster Masses for Improved Cosmological Parameter Inference

Tickets

Jun 30 – Jul 1 all-day

Offre en lien avec l’Action/le Réseau : DatAstro/Doctorants

Laboratoire/Entreprise : CRIStAL / Univ. Lille
Durée : 36 months
Contact : jenny.sorce@univ-lille.fr
Date limite de publication : 2025-06-30

Contexte :
This PhD thesis proposal focuses on improving galaxy cluster mass estimation to enhance cosmological parameter inference, in order to address critical challenges such as the S8 cosmological parameter discrepancy. By leveraging multi-wavelength observations, advanced statistical techniques including Bayesian inference and machine learning to solve this inverse problem, the project aims to refine relations between the cluster mass and their observable properties, reduce data dimensionality, and efficiently process large datasets. Anticipated outcomes include innovative Bayesian hierarchical models, optimized data reduction algorithms, and a robust inference pipeline for generating a high-fidelity galaxy cluster mass catalog towards testing cosmological models.

Sujet :
The standard cosmological model successfully describes the Universe’s large-scale structure and evolution. Observational evidence, including the cosmic microwave background (CMB) and the hierarchical distribution of galaxies in the cosmic web, provides strong support for this model. These data suggest that dark matter and dark energy dominate the Universe, together constituting approximately 95% of its total content.
Despite its success, this model faces challenges. For instance, the value derived for the S8 parameter, which characterizes the matter distribution on certain scales, differs by three standard deviations when using galaxy cluster counts instead of CMB observations. Resolving this tension is critical to determine whether new physics theories are required, or systematic errors in data analysis pipelines need to be accounted for.
Galaxy clusters are a key tool to address these challenges. As the largest gravitationally bound structures in the Universe, their number and masses are closely related to the underlying cosmology. Accurately estimating their masses and number across diverse environments and redshifts is essential to test the standard model and refine our understanding of the Universe.
This PhD project focuses on developing Bayesian hierarchical models to improve the estimation of galaxy cluster masses. By leveraging multi-wavelength observations, advanced data reduction, and machine learning techniques, this research will provide more precise mass estimates, refine scaling relations, and facilitate the inference of cosmological parameters from large datasets.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
UMR CRIStAL
Université de Lille – Campus scientifique
Bâtiment ESPRIT
Avenue Henri Poincaré
59655 Villeneuve d’Ascq

Document attaché : 202503181504_main.pdf

Categories: theses

Offre de thèse – Fact-checking multimédia, multimodal et explicable

Tickets

Jun 30 – Jul 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT (Laboratoire d’Informatique Fondamentale et
Durée : 3 ans
Contact : frederic.rayar@univ-tours.fr
Date limite de publication : 2025-06-30

Contexte :
Cette offre de thèse s’inscrit dans le cadre du projet « Fact Checking » mené depuis 2021 entre le laboratoire LIFAT et l’équipe PRIM (chercheurs en Science de l’Information et de la Communication). Le fact checking, ou vérification de fait, consiste à vérifier la véracité des faits présentés dans les médias par des personnalités publiques ou autres organisations.

De nombreux travaux de recherches ont été et sont en train d’être menéspour répondre à l’enjeu majeur de la désinformation, notamment depuis l’avènement des technologies de deep-fake et d’IA génératives. Ce phénomène de désinformation massive est observable dans plusieurs domaines : on peut citer en particulier la sphère politique (« political discourse »), le changement climatique ou encore le domaine de santé (« COVID-19 misinformation »).

Cette thèse vise à la conception et à l’évaluation de nouvelles techniques de détection multimodale (vidéo, image, audio, texte) dans du contenu multimédia (vidéo, audio).

Sujet :
Cette thèse vise à la conception et à l’évaluation de nouvelles techniques de détection multimodale (vidéo, image, audio, texte) dans du contenu multimédia (vidéo, audio).

Pour ce faire, la thèse explorera l’utilisation de concepts d’IA à différents niveaux « Audio-visual Active Speaker identification » (ASD), « Multimodal Named Entity recognition » (MNER), « Retrieval-Augmented Generation » (RAG), etc., et l’exploitation d’une base de données de fait vérifiés existante (base de données issue de travaux précédents ou benchmark existants).

Par ailleurs, compte-tenu de l’impact sociétal de ces travaux, un fort accent sera mis sur l’explicabilité des algorithmes multimodaux proposés, en agrégant différentes solutions : récupération d’information tierces via la recherche d’information, génération textuelle, visualisation d’élément saillant dans les images/vidéos, isolation des séquences d’intérêt dans les pistes audio/vidéos, etc.

Enfin, durant la réalisation de ces travaux de recherche, il s’agira aussi de tenir compte des verrous théoriques et empiriques de l’acception des citoyens d’un tel outil via les notions d’interactions avec les outils développés, et de visualisation interactive et d’ergonomie. Ces aspects seront abordés via une collaboration avec des chercheurs en sciences de l’information et de la communication ou des journalistes et fact-checkers.

Profil du candidat :
M2 en informatique ou diplôme d’ingénieur
Bonnes connaissances en Machine Learning et Intelligence Artificielle
Bonnes connaissances en programmation indispensables
Des compétences en développement web sont souhaitables
Bonnes capacités de communication et de rédaction, en particulier en anglais

Formation et compétences requises :

Adresse d’emploi :
Laboratoire d’Informatique LIFAT
Équipe RFAI (Reconnaissance des Formes et Analyse d’Images)
64 avenue Jean Portalis – 37200 – Tours

Document attaché : 202502101508_2025_PhD_lifat_v3.pdf

Categories: theses

PhD Offer on GNN and XAI in Caen (GREYC Lab)

Tickets

Jun 30 – Jul 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC UMR 6072
Durée : 3 ans
Contact : bruno.cremilleux@unicaen.fr
Date limite de publication : 2025-06-30

Contexte :
Cf. document attaché

Sujet :
Cf. document attaché

Profil du candidat :
Cf. document attaché

Formation et compétences requises :
Cf. document attaché

Adresse d’emploi :
Université de Caen Normandie (Caen, Normandy, France: GREYC, Campus Côte de Nacre) :

Document attaché : 202504291608_TheseXAIforGraphDataAugmentation_EpitaGREYC.pdf

Categories: theses

PhD Offer on Pattern Sampling Under User Constraints in Caen (GREYC Lab)

Tickets

Jun 30 – Jul 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC UMR 6072
Durée : 36 mois
Contact : abdelkader.ouali@unicaen.fr
Date limite de publication : 2025-06-30

Contexte :
Cf. document attaché.
See attached document.

Sujet :
Cf. document attaché.
See attached document.

Profil du candidat :
Cf. document attaché.
See attached document.

Formation et compétences requises :
Cf. document attaché.
See attached document.

Adresse d’emploi :
Université de Caen Normandie (Caen, Normandy, France: GREYC, Campus Côte de Nacre).

Document attaché : 202505042125_FIDD-PhD-25.pdf

Categories: theses

May – June 2025 May – Jun 2025

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Présentation Générale

Manifestations à venir

Actions, Ateliers et Groupes de Travail :