Génération de données continues et conditionnelles : application aux séries temporelles

When:
15/02/2026 all-day
2026-02-15T01:00:00+01:00
2026-02-15T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : IRIT (Institut de Recherche en Informatique de Tou
Durée : 5 mois
Contact : hugo.boisaubert@irit.fr
Date limite de publication : 2026-02-15

Contexte :
La génération de données synthétiques « en continu » est un challenge important pour différentes applications telles que la simulation ou la prédiction, et dans de nombreux domaines en Industrie 4.0 comme en Santé numérique. Cette génération doit en outre être fidèle autant que
possible aux données réelles ce qui complexifie ce challenge.

Sujet :
Différentes méthodes ont été développées dans ce cadre et pour ces différents types de données. Dans ce stage, même si une compréhension des grandes tendances d’approches proposées indépendamment du type de données est primordiale, un focus particulier sera apporté sur la génération de série temporelle.
Parmi les approches pour ce type de données nous pouvons citer notamment les GAN mais également les approches plus récentes basées sur les modèles LLM. Cependant, selon les contextes applicatifs,
cette génération doit être conditionnée par des « évènements/contraintes ». En effet, ces évènements impliquent une adaptation au fur et à mesure du temps des données générées (exemple : un changement
météo qui aura un impact sur la prédiction de la consommation énergétique). Différentes approches ont été développées pour prendre en compte ces conditions (instantané, fenêtre temporelle, contraintes. . .) dans la génération de données synthétiques.

Les objectifs du stages sont multiples :
1. Construire un état de l’art général des approches récentes [1] sur le domaine de la génération de données conditionnelles en faisant un focus particulier sur la génération conditionnelle de séries
temporelles univariées (TSLLM, TSFM) [2, 4, 5] ;

2. Sur la base de cette étude, au moins deux modèles seront sélectionnés et implantés pour réaliser différentes versions d’un générateur de série temporelle conditionnel. Pour cela l’apprentissage
sera réalisé sur la base de données type « données physiologiques » disponibles. Les données issues notamment du jeu de données MOVER[3] pourront être mobilisées. ;

3. Enfin, suite à la définition d’un protocole expérimental et de l’identification de métriques adaptées, une comparaison objective de ces modèles sera proposée ;

Profil du candidat :
Profil des candidat·e·s Étudiant·e en cycle master ou ingénieur, en Informatique ou mention similaires.

Formation et compétences requises :

Capacités attendues : En complément du niveau de formation défini dans le profil, les éléments
suivants sont souhaitables dans le profil des candidats :
— Capacité de réflexion et d’analyse d’un problème, définition d’un protocole et mise en place d’expérimentations ;
— Rigueur en programmation (Python) et capacité à générer de la documentation, avec usage des outils standard (Git, Doctest, Sphinx ou équivalents) ;
— Maitrise des outils et techniques de l’apprentissage automatique ;
— Capacités de synthèse d’information et à rendre compte de son travail régulièrement ;
— Capacité à produire efficacement des documents de communication scientifique.

Adresse d’emploi :
IUT de Castres – 5 allée du Martinet – 81100 Castres

Document attaché : 202601291558_stage_m2_2026_data_generation-1.pdf