MaDICS

Huitième édition du Symposium MaDICS

Ce rendez-vous annuel rassemble la communauté MaDICS afin de mettre en lumière les avancées récentes en sciences des données, à travers un programme scientifique riche comprenant des conférences invitées (keynotes), des ateliers thématiques, des tables rondes et des sessions de posters.
Ces temps forts favorisent des échanges scientifiques à la fois stimulants et conviviaux.

Une Session Poster sera spécialement consacrée aux jeunes chercheuses et jeunes chercheurs souhaitant présenter leurs travaux en analyse et gestion de données et dans les domaines interdisciplinaires autour de la Science des Données. Cette session sera également l’occasion d’échanger avec des collègues académiques et des acteurs industriels sur les thématiques de recherche présentées.

Dates importantes :

Soumission de posters : au plus tard le 23 mars 2026
Retour : 9 avril 2026

Symposium : les 2 et 3 juin 2026 à Avignon

Nous vous invitons d’ores et déjà à réserver ces dates dans votre agenda

Pour en savoir plus…

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…

Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.

Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus…
Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus…
Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus…
Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…

Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS

Mar

Sat

2025

Few-Shot Learning of Wheel Patterns for Matching Relief-Printed Decorations on Medieval Ceramic Sherds

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PRISME laboratory
Durée : 5 – 6 months
Contact : yassine.nasser@univ-orleans.fr
Date limite de publication : 2025-03-01

Contexte :
Archaeologists often face challenges in matching the relief-printed patterns found on ceramic sherds discovered during excavations. Identifying sherds created with the same patterning tool (wheel) plays a crucial role in understanding ancient trade networks and provides valuable insights into past civilizations. Traditional methods involve manually stamping the motifs followed by a meticulous visual analysis to verify if these patterns were produced by the same wheel, a process that is not only time-consuming but also labor-intensive. Recent advances in artificial intelligence present a unique opportunity to revolutionize fields like archaeology by automating recognition processes, thereby accelerating discoveries and improving analysis precision.
This internship is a continuation of the PRIA REMIA research project (Pattern Recognition through Artificial Intelligence), developed in partnership between the PRISME laboratory, LIFO, and the Archaeological Service of the City of Orléans. In this context, we aim to develop an automated/intelligent system to assist archaeologists in identifying relief-printed decorations on medieval ceramic shards.

Sujet :
Internship Objectives :
In this context, the internship aims to build on previous work in preprocessing and segmentation by proposing innovative approaches. The primary tasks will focus on:
 – Exploring state-of-the-art methods in few-shot learning, similarity learning, deep clustering, and texture transformer models.
 – Developing a novel method for identifying and clustering ceramic sherds decorated with the same wheel.
 – Integrating the developed solution into the existing system.
 – Drafting documentation for the developed solution.

Profil du candidat :
Required degree level: Bachelor’s + 4 or equivalent
Preferred degree: Master’s in IA, mathematics, applied mathematics, or computer science, or equivalent, with a strong motivation for applied research.

Formation et compétences requises :
Required Skills
 – Strong programming skills in Python, including proficiency with deep learning and machine learning frameworks (e.g., PyTorch, TensorFlow, Scikit-learn).
 – Familiarity with Deep Learning & Computer Vision, including Vision Transformers, Contrastive Learning, Similarity Learning, Clustering, and Texture Analysis.
 – Solid understanding of mathematics, especially in linear algebra and optimization.
 – Strong analytical, modeling, and writing skills.

Adresse d’emploi :
Polytech Orléans, 12 rue de Blois 45100 Orléans, France

Document attaché : 202412051055_M2 Internship 2024-2025 .pdf

Categories: Stages

IA contrainte par la physique pour la modélisation en sciences naturelles

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISTIC
Durée : 4-6 mois
Contact : yajing.yan@univ-smb.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
En sciences naturelles, la modélisation des phénomènes physiques constitue un sujet difficile. Les formules existantes ne suffisent parfois pas à représenter adéquatement les mécanismes complexes (notamment ceux non observables). Il arrive également que ces formules existantes ne correspondent pas parfaitement aux observations issues de données. Ces
problèmes ont été rencontrés par exemple dans les suivis de la concentration des polluants, des étalements de végétation, et des coulées de lave. Dans ce stage, nous nous concentrons
sur la modélisation volcanique. En volcanologie, les scientifiques disposent des mesures de déplacements en surface induits par une source volcanique en profondeur et utilisent ces
mesures pour estimer les paramètres physiques d’un modèle volcanique. Dans un premier temps, nous partons d’un modèle simple sous forme d’une expression analytique, le modèle Mogi. Dans ce modèle le déplacement en surface est directement
induit par un changement rapide du volume de la chambre magmatique qui se situe à une profondeur donnée. Dans ce modèle, les deux paramètres clés sont la variation du volume et
la profondeur de la chambre magmatique. L’objectif du stage consiste à utiliser les méthodes de régression symbolique pour affiner le modèle Mogi car il reste une vision simplifiée de la
physique sous-jacente. La régression symbolique devrait alors permettre d’affiner ce modèle directement à partir des données. La pertinence de l’approche et la sensibilité de la modélisation à la variété de l’activité volcanique sur différents sites volcaniques pourront être mesurées et comparées au modèle Mogi original. En s’appuyant sur des travaux basés sur l’IA classique développés au laboratoire sur l’inversion de modèles géophysiques, 3 types de données sont disponibles pour créer un cadre expérimental et de validation : 1) déplacements simulés à partir du modèle Mogi 2) déplacements simulés plus un bruit ajouté 3) déplacements réels sur des volcans africains. Cette étude sera étendue à un modèle volcanique plus sophistiqué, par exemple, le modèle Okada qui décrit le mécanisme de fonctionnement d’un volcan avec plus de paramètres et s’appuyant sur des équations différentielles.

Références :
– Tenachi, W., et al. (2023). Physical Symbolic Optimization. arXiv:2312.03612.
– Albino, F., & Biggs, J. (2021). Magmatic processes in the East African Rift system: insights from a 2015–2020 Sentinel‐1 InSAR survey. Geochemistry, Geophysics, Geosystems, 22(3), e2020GC009488.
– Dzurisin, D. (2007), Volcano Deformation: Geodetic Monitoring Techniques. Mogi, K. (1958), Bull. Earthq. Inst. U. Tokyo, 36, 99‐134
– Lopez-Uroz L, Yan Y., Benoit A., Albino F., Bouygues P., Giffard-Roisin S., Pinel V., Exploring Deep Learning for Volcanic Source Inversion, IEEE Transactions on Geosciences & Remote Sensing.
– Petersen, B. K., et al. (2019). Deep symbolic regression: Recovering mathematical expressions from data via risk-seeking policy gradients. arXiv:1912.04871.

Merci de nous envoyer un CV et une lettre de motivation, idéalement accompagnés des relevés de notes de M1, M2 (ou Bac+4 et Bac+5).

Profil du candidat :

Formation et compétences requises :
Machine learning, Python programming

Adresse d’emploi :
LISTIC, 5 chemin de bellevue, CS80439, 74944, Annecy-le-Vieux

Categories: Stages

Master thesis/Engineer internship – Machine learning for time series prediction in environmental sciences

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT Université de Tours
Durée : up to 6 Months
Contact : nicolas.ragot@univ-tours.fr
Date limite de publication : 2025-03-01

Contexte :
The JUNON project, driven by the BRGM, is granted from the Centre-Val de Loire region through ARD program (« Ambition Recherche Développement ») which goal is to develop a research & innovation pole around environmental resources (agriculture, forest, waters…). The main goal of JUNON is to elaborate digital services through large scale digital twins in order to improve the monitoring, understanding and prediction of environmental resources evolution and phenomena, for a better management of natural resources. Digital twins will allow to virtually reproduce natural processes and phenomena using combination of AI and environmental tools.
JUNON will focus on the elaboration of digital twins concerning quality and quantity of ground waters, as well as emissions of greenhouse gases and pollutants with health effects, at the scale of geographical area corresponding to the North part of the Centre-Val-de-Loire region.

Sujet :
The Master Thesis/internship position will be focused on the prediction of water resources and pollutants in the air.
The goal will be to benchmark state of the art time series approaches and to propose new methods adapted to the specificities of the environmental data studied (multivariate time series). The benchmark on water resources relies on complex data with different seasonality and frequencies. Forecasting must be from short term to long term predictions. Regarding air pollutants, the benchmark is still to be elaborated.

Profil du candidat :
Academic level equivalent to a Master 2 in progress or Engineer in its last year in computer science

Formation et compétences requises :
– a good experience in data analysis and machine learning (in python) is required
– some knowledge and experiences in deep learning and associated tools is required
– some knowledge in time series analysis and forecasting will be highly considered
– curiosity and ability to communicate and share your progress and to make written reports and presentations
– ability to propose solutions
– autonomy and good organization skills

Adresse d’emploi :
Computer Science Lab of the Université de Tours (LIFAT), Pattern Recognition and Image Analysis Group (RFAI)
64 av. Jean Portalis
37200 Tours

Document attaché : 202412060859_Fiche de poste stage Junon.pdf

Categories: Stages

Modèle de langue à base de connaissance experte pour l’extraction d’information médicale à partir de données non structurées.

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Institut de Recherche en Informatique de Toulouse
Durée : 5-6 mois
Contact : yohann.chasseray@irit.fr
Date limite de publication : 2025-03-01

Contexte :
Le stage sera réalisé au sein de l’équipe SIG, dans le département Gestion de Données de l’Institut de Recherche en Informatique de Toulouse (IRIT). L’IRIT est un laboratoire de recherche constitué de chercheurs en informatique, développant notamment des travaux autour du traitement automatique du langage, de la gestion des données, des connaissances et de l’extraction d’informations.
Le stage sera localisé sur le Campus de Castres, dans les locaux de l’école d’ingénieurs ISIS, qui forme des ingénieurs en informatique dans le domaine de la santé numérique. Des déplacements à Toulouse dans les locaux de l’IRIT sont à prévoir.

Sujet :
Les grands modèles de langue qui n’ont de cesse de se perfectionner représentent un outil puissant pour la compréhension fine des connaissances dans un contexte général mais également de manière plus spécialisée, dans des domaines métier spécifiques comme celui de la santé médicale. Notamment, les grands modèles de langue (LLMs) constituent une base solide pour la détection d’entités nommées (NER) ou de relation (RE) qui sont des tâches majeures pour le traitement des données médicales.
L’objectif de ce stage est donc de proposer des méthodes d’extraction d’entités nommées s’appuyant à la fois sur les LLMs (Phi-3 [1], BERT [2]) et sur des ontologies médicales (SNOMED CT [3], UMLS [4]), qui renferment des informations sémantiques précises sur les entités et relations recherchées. Pour cela, deux approches sont envisagées, s’appuyant toutes les deux sur les grands modèles de langues :
(A) Une approche qui utilise le contexte, permettant de guider un modèle de langue génératif en sélectionnant les types d’entités les plus pertinents dans une ontologie pour l’extraction d’entités nommées ou de relations.
(B) Une approche plus intégrée, visant cette fois à inclure directement la représentation ontologique au cours d’une étape de fine-tuning d’un modèle de langue et à interroger directement le modèle, sans fournir de contexte préalable.
En fonction des avancées, les résultats pourront faire l’objet d’une soumission à la conférence CLEF 2025 (https://clef2025.clef-initiative.eu/).

Profil du candidat :
Etudiant(e) en formation de niveau Bac+4/5, avec une spécialisation en Informatique ou Data Science et présentant des compétences en analyse, traitement et représentation de données.

Formation et compétences requises :
Les compétences suivantes seront fortement appréciées pour mener à bien les missions associées au sujet de stage :
• Bonnes connaissances en programmation (Python) et traitement automatique du langage.
• Connaissances de base sur les ontologies et bases de connaissances.
• Familiarités avec les modèles d’apprentissage automatique en général et le modèle transformer en particulier.

Adresse d’emploi :
Campus Universitaire, Rue Firmin Oulès, 81104 Castres
yohann.chasseray@irit.fr

Document attaché : 202501051355_Offre_de_stage_ISIS_IRIT.pdf

Categories: Stages

Predictive Safety Shields for Reinforcement Learning Based Controllers

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : U2IS, Ensta Paris
Durée : 6 months
Contact : elena.vanneaux@ensta-paris.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
Context Reinforcement learning (RL) has been widely adopted in robotics for its ability to learn from
interaction with the environment through feedback. It enables robots to adapt to environmental changes
and optimize their behavior according to performance criteria not known in advance [6]. However, to use
RL-based controllers for safety-critical tasks, one should also ensure that nothing ”bad” occurs during the
training and deployment of RL agents. Indeed, autonomous vehicles should never drive off the highway,
robotic prostheses should never force their users’ joints past their range of motion, and drones should
never fall out of the sky. The vulnerability of standard RL-based controllers to failures has spurred
significant growth in research on safe RL in the past decade [2].
In this internship, we will focus on provably safe RL, that provides hard safety guarantees for both
training and operation [7]. Provably safe RL approaches can be categorized into preemptive and postposed shielding [1]. In the preemptive method, the agent can only choose from actions that have been
a priori verified as safe. However, if a preemptive shield is too conservative, i.e., it identifies only a
few actions from the action space as safe, the agent’s capabilities for exploring the environment are
significantly reduced, which can lead to lower overall performance [3]. In post-posed shielding, the
safety filter monitors the RL agent behavior. If the agent wants to take an unsafe action, the shield
replaces it with a fallback strategy. Post-posed shields are usually more computationally efficient than
preemptive. Also, they are often easier to use in dynamic environments, which we want to investigate in
this internship. Still, in dangerous scenarios, a shield forces the system to use a predetermined safe but
likely sub-optimal policy [1]. Hence, while guaranteeing safety, shielding often contradicts task efficiency.
This internship aims to balance safety and performance by developing provably safe RL algorithms with
the agent’s guaranteed near-optimal behavior.
In our proof-of-concept work [5], we propose a predictive safety shield for model-based reinforcement learning agents in discrete space. The safety shield updates the Q-function locally based on safe
predictions, which originate from a safe simulation of the environment model. This shielding approach
improves performance while maintaining hard safety guarantees. Our experiments on grid-world environments demonstrate that even short prediction horizons can be sufficient to identify the optimal path.
We observe that our approach is robust to distribution shifts, e.g., between simulation and reality, without requiring additional training. This internship aims to extend the proposed approach to dynamically
changing environments [4].

Goals The goals of the internship consist of
• exploring the state-of-the-art safety shields for reinforcement learning algorithms
• proposing a shield that ensures safe behavior in dynamically changing environments.
• testing the proposed approach in GridWorld and PacMan environments

References
[1] Mohammed Alshiekh, Roderick Bloem, R¨udiger Ehlers, Bettina K¨onighofer, Scott Niekum, and Ufuk
Topcu. Safe reinforcement learning via shielding. Proceedings of the AAAI Conference on Artificial
Intelligence, 32, 08 2017.
[2] Lukas Brunke, Melissa Greeff, Adam W. Hall, Zhaocong Yuan, Siqi Zhou, Jacopo Panerati, and
Angela P. Schoellig. Safe learning in robotics: From learning-based control to safe reinforcement
learning. Annual Review of Control, Robotics, and Autonomous Systems, 5(1):411–444, 2022.
[3] Kai-Chieh Hsu, Haimin Hu, and Jaime F. Fisac. The safety filter: A unified view of safety-critical
control in autonomous systems. Annual Review of Control, Robotics, and Autonomous Systems,
7(1):47–72, July 2024.
[4] Nils Jansen, Bettina K¨onighofer, Sebastian Junges, Alex Serban, and Roderick Bloem. Safe reinforcement learning using probabilistic shields (invited paper). Schloss Dagstuhl – Leibniz-Zentrum
f¨ur Informatik, 2020.
[5] Pin Jin. A safety filter for rl algorithms based on a game-theoretic mpc approach, 2024. PRE –
Research Project, ENSTA.
[6] Jens Kober and Jan Peters. Reinforcement Learning in Robotics: A Survey, pages 9–67. Springer
International Publishing, Cham, 2014.
[7] Hanna Krasowski, Jakob Thumm, Marlon M¨uller, Lukas Sch¨afer, Xiao Wang, and Matthias Althoff.
Provably safe reinforcement learning: Conceptual analysis, survey, and benchmarking. Transactions
on Machine Learning Research, 2023. Survey Certification.

Profil du candidat :

Formation et compétences requises :
Profile of a candidate. For this position, you should meet the following requirements:
• enrollment in a Master’s program or equivalent in computer science, applied mathematics science,
engineering, or related disciplines;
• rigorous knowledge in formal verification, control design, and reinforcement learning;
• excellent programming skills (Python);
• proficiency in spoken and written English;
The candidate will have to submit the documents following:
• a cover letter;
• a resume;
• a copy of diplomas, bachelor’s and master’s degree transcripts.
In case of a successful internship, a Ph.D. offer in ENSTA Paris might be proposed.

Adresse d’emploi :
828 Bd des Maréchaux, 91120 Palaiseau

Document attaché : 202412061053_Safety_for_AI__M2.pdf

Categories: Stages

Stage M2 – Change point detection in temporal graphs

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Univ-Littoral
Durée : 6 months
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2025-03-01

Contexte :
Temporal graphs, representing interactions over time, are crucial for analyzing datasets in areas like Industry 4.0, cybersecurity, and social networks. Temporal graphs often exhibit periods of distinct activity regimes, making change point (CP) detection vital for tasks such as fault detection and prediction. However, the sparsity and irregularity of real-world temporal graphs make CP detection highly challenging, as current algorithms struggle to extract accurate patterns.

Sujet :
The internship aims to build upon recent works that allow to transform temporal graphs upon a spectral domain where comparing different periods of a temporal graph is easier. Yet such transform relies on the choose of graph and signal dictionaries that must be properly chosen to attain satisfactory detection accuracy. For signal dictionaries, we aim to compare different choices, like Haar, Walsh, and Boolean-based dictionaries, which are adapted to the binary and sparse nature of temporal graphs. For graph dictionaries, we aim to build custom dictionaries with user-defined motifs.

Profil du candidat :
This internship is directed at students with various backgrounds (computer science, data science, signal processing,
complex systems) but with a strong interest in data science and graphs. Interest in the theoretical aspects of machine learning and in Python development will a plus.

Formation et compétences requises :
Ing3 or M2 students

Adresse d’emploi :
Saint Omer, France

Document attaché : 202412060909_Data2Laws___M2_Internship.pdf

Categories: Stages

Stage M2 – Machine Learning Framework for Temporal Graph Exploration

Tickets

Mar 1 – Mar 2 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – ULCO
Durée : 6 mois
Contact : esteban.bautista-ruiz@lip6.fr
Date limite de publication : 2025-03-01

Contexte :
Dans les systèmes de transport avec trajets programmés (trains, avions, bus, etc.), des questions fondamentales se posent : existe-t-il un itinéraire permettant de visiter tous les arrêts ? Quel est le plus rapide ? Comment maximiser le nombre de lieux visités dans un temps limité ? Ces problématiques relèvent du Temporal Graph Exploration Problem (TEXP), qui consiste à trouver un chemin temporel permettant de visiter tous les sommets d’un graphe aussi vite que possible. Bien que crucial pour la logistique, la cybersécurité ou la détection de fraudes, le TEXP est un problème NP-difficile, ce qui rend le calcul de solutions exactes impraticable pour de grands graphes.

Des algorithmes heuristiques et d’approximation existent pour résoudre le TEXP, mais ils ont du mal à trouver un bon compromis entre vitesse et qualité des solutions. Les Graph Neural Networks (GNNs) se sont montrés efficaces pour résoudre des problèmes combinatoires sur des graphes statiques, et des versions plus récentes permettent maintenant de gérer les graphes temporels. Pourtant, ces outils n’ont pas encore été utilisés pour aborder le TEXP.

Sujet :
Nous visons à aborder le problème TEXP sous l’angle de l’apprentissage automatique en nous appuyant sur un cadre récent non supervisé pour l’optimisation combinatoire. Plus précisément, nous cherchons à (1) exploiter ce cadre pour concevoir une fonction de perte, basée sur la méthode probabiliste d’Erdős, qui optimise les parcours respectant les contraintes temporelles ; et (2) explorer des architectures récentes qui font l’embedding des parcours temporels, offrant un biais plus adapté au TEXP que les GNN classiques.

Profil du candidat :
Étudiants en informatique, science des données, recherche opérationnelle, ou systèmes complexes, ayant un fort intérêt pour l’optimisation combinatoire et l’apprentissage automatique sur graphes.

Formation et compétences requises :

Pour postuler, merci d’envoyer un e-mail à

– esteban.bautista@univ-littoral.fr
– rym.guibadj@univ-littoral.fr

en joignant les documents suivants pour appuyer votre candidature :

• votre CV ;
• une lettre de motivation ;
• vos relevés de notes de la dernière année de Licence à la dernière année de Master (si disponible) ;
• deux lettres de recommandation ou les noms et moyens de contact de deux conseillers académiques.

Les candidatures seront examinées au fur et à mesure jusqu’à ce que le poste soit pourvu.

Adresse d’emploi :
LISIC laboratory – St Omer site

Document attaché : 202412051118_Internship_ML-Temporal-Graph-Exploration.pdf

Categories: Stages

Mar

Sat

2025

Offre de stage Master 2 : Constitution et analyse d’un corpus multimodal (parole–oculométrie) d’entretiens de bilan psychiatrique à des fins d’aide à l’évaluation médicale

Tickets

Mar 15 – Mar 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IMT Atlantique / CHU Brest
Durée : 5 mois
Contact : yannis.haralambous@telecom-bretagne.eu
Date limite de publication : 2025-03-15

Contexte :
Lors des entretiens de bilan psychiatrique, les psychiatres s’appuient sur des signaux faibles afin d’élaborer un diagnostic et une prise en charge adaptée. Dans ce contexte, les outils d’aide à la décision peuvent apporter une aide décisive pour orienter le clinicien et améliorer la prise en charge.

On s’intéressera particulièrement dans le cadre de ce stage aux signaux liés aux discours et au regard de personnes à risque de souffrir de santé mentale. Le stage est ainsi interdisciplinaire, entre psychiatrie, traitement automatique de la langue et oculométrie. Son objectif est la mise en place d’une procédure d’acquisition et de traitement de corpus multimodal parole/oculométrie pour les entretiens de bilan psychiatrique. Le but est d’agréger les deux modalités pour obtenir des meilleures performances en matière de détection de comorbidités et avec l’espoir de pouvoir extraire, ultérieurement, de ces données des indicateurs de diagnostic précoce de pathologie(s).

Sujet :
Le stage procédera par les étapes suivantes.

1) La mise en place d’outils d’acquisition de corpus multimodal (enregistrement de la parole, transcription, mouvements oculaires).

2) L’enregistrement du corpus d’une dizaine d’entretiens de bilan psychiatriques (exécuté par le CHU).

3) La prise en main et l’application d’algorithmes déjà existants d’alignement de la transcription écrite et de la parole.

4) L’ajout de données oculométriques, tant au niveau des saccades oculaires qu’au niveau de la cible du regard.

5) Expérimentations et analyse sur le corpus en utilisant l’équipement mis en place, afin de repérer des réactions du patient, aux niveaux linguistique et oculométrique.

Les livrables attendus sont :

(a) Déploiement et adaptation de dispositifs et de logiciels (les chaînes d’acquisition et de traitement de données multimodales).

(b) Le corpus multimodal acquis, sous forme de ressource réutilisable.

(d) Rapport de stage.

Profil du candidat :
Étudiant en M2 en traitement automatique de la langue ou en IA ou en sciences cognitives ou élève-ingénieur.

• Intérêt pour la recherche dans le domaine de la santé ;
• bonne expérience en programmation Python, en particulier en traitement des données ;
• aptitude à comprendre et à déployer des outils existants, à expérimenter en autonomie ;
• des connaissances ou une expérience préalable en traitement automatique de la langue et/ou en analyse de corpus seraient un avantage majeur.

Formation et compétences requises :

Adresse d’emploi :
ENCADRANTS
##########
Gábor Bella, IMT Atlantique
Yannis Haralambous, IMT Atlantique
Philippe Lenca, IMT Atlantique
Sorin Moga, IMT Atlantique
Laurent Navarro, École des Mines de Saint-Étienne
Christophe Lemey, CHU de Brest

CONTACTS
########
Envoyer votre CV, lettre de motivation, relevés de notes et tout autre document à

Yannis Haralambous, IMT Atlantique : yannis.haralambous@imt-atlantique.fr
Gábor Bella, IMT Atlantique : gabor.bella@imt-atlantique.fr

Categories: Stages

Représentation des grandeurs physiques dans le Web sémantique

Tickets

Mar 15 – Mar 16 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Mines Saint-Étienne
Durée : 4-6 mois
Contact : antoine.zimmermann@emse.fr
Date limite de publication : 2025-03-15

Contexte :
Les grandeurs physiques constituent une part importante de ce qui est représenté dans les données scientifiques, les données médicales, les données industrielles, les données ouvertes et, dans une certaine mesure, diverses données privées.

Qu’il s’agisse de distances, de vitesses, de charges utiles dans les transports, de concentrations, de masses, de moles en chimie, de puissances, d’intensités, de tensions dans le secteur de l’énergie, de dimensions de meubles, de poids, de tailles de personnes, de durées, et bien d’autres encore dans le domaine de la santé, il est nécessaire de représenter les grandeurs physiques, de les stocker, de les traiter et de les échanger entre systèmes d’information, potentiellement à l’échelle mondiale, souvent sur l’internet et via le Web.

Sujet :
Dans ce stage, nous cherchons à définir précisément une manière de représenter sans ambiguïté les grandeurs physiques pour le Web des données. Plus précisément, nous étudierons les propositions faites pour encoder les grandeurs physiques dans le modèle de données standard du Web sémantique, RDF. Nous nous intéresserons particulièrement à l’utilisation d’un type de données dédié à cet encodage, probablement adapté de la proposition de Lefrançois & Zimmermann (2018) basée sur le standard UCUM.

Après avoir établi une définition rigoureuse du type de données (éventuellement de ses variantes, si pertinent), nous nous concentrerons sur l’implémentation d’un module capable de lire/écrire et de traiter les grandeurs physiques et leurs opérations au sein des API de manipulation de données RDF, pour la gestion, l’interrogation et le raisonnement sur des graphes de connaissances contenant des grandeurs physiques.

L’ambition est que, d’une part, la spécification devienne dans quelques années un standard de facto, avant peut-être de devenir un standard de jure ; et que, d’autre part, l’implémentation soit la référence permettant de comparer les niveaux de conformité d’autres implémentations futures.

Cette étude devrait conduire à la publication d’un article scientifique dans une revue scientifique à fort impact.

Détails du sujet et de comment candidater sur https://www.emse.fr/~zimmermann/Teaching/SemWeb/Internship/

Profil du candidat :
Master 2 en informatique voulant avoir une expérience en recherche, éventuellement dans le but de poursuivre des études doctorales.

Formation et compétences requises :
Compétences requises en Web sémantique (RDF, SPARQL, etc.).

Adresse d’emploi :
158 cours Fauriel
CS 62362
42023 Saint-Étienne Cedex 2
France

Categories: Stages

Mar

Mon

2025

Action Recognition by Knowledge Augmentation in Vision Language Model

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Laboratoire ICube, Strasbourg
Durée : 6 mois
Contact : seo@unistra.fr
Date limite de publication : 2025-03-31

Contexte :
Action recognition from video is highly important for assistive care robots, as it enables them to understand and respond appropriately to the needs and activities of the people they assist. Recent DL models for action recognition are moving toward more data-efficient, interpretable, and computationally optimized frameworks: The combination of transformer architectures, spatio-temporal attention, multimodal fusion, and self-supervised learning, just to mention a few. Meanwhile, the recent emergence of large-scale pre-trained vision-language models (VLMs) has demonstrated remarkable performance and transferability to different types of visual recognition tasks, thanks to their generalizable visual and textual representations. It has been confirmed by our recent study, where our developed model learns and improves visual, textual, and numerical representations of patient gait videos based on a large-scale pre-trained Vision Language Model (VLM), for several classification tasks.

Sujet :
Motivated by these recent successes, we will extend our previous developed model and the multimodal representation for a new classification task – action recognition from video. Similarly to our previous method, we will adopt the prompt learning strategy, keeping the pre-trained VLM frozen to preserve its general representation and leverage the pre-aligned multi-modal latent space the prompt’s context with learnable vectors, which is initialized with domain-specific knowledge.

Profil du candidat :
− Solid programming skills in Python/C++
− Experience in Deep Learning (Transformer, CLIP, etc.)
− Good communication skills

Formation et compétences requises :

Adresse d’emploi :
2 Rue Marie Hamm
67000 Strasbourg

Document attaché : 202411071346_Stage-ActionRecognition.pdf

Categories: Stages

Analyse numérique de l’engagement d’apprenants dans des situations d’apprentissage en ligne

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CReSTIC – Université de Reims Champagne-Ardenne
Durée : 4 à 6 mois
Contact : bart.lamiroy@loria.fr
Date limite de publication : 2025-03-31

Contexte :
Ce travail se place dans un projet de recherche en collaboration avec Santé Publique France.
Ce stage de Master se situe en amont et en parallèle des recherches menés dans le cadre de ce projet et consiste à choisir et mettre en place les outils adéquats en analyse statistique de données et d’extraction de connaissances à partir de traces d’interaction avec un site d’apprentissage en ligne afin de mesurer l’impact de l’outil de formation et de mesurer l’engagement des apprenants dans leur démarche.

Sujet :
Le but est d’établir des profils d’usagers à partir des interactions de ceux-ci avec une plateforme d’apprentissage en ligne, afin d’évaluer l’adéquation de l’outil numérique proposé, et de faire des préconisations pour son évolution à partir de données anonymisées.

• Il s’agira de concevoir et appliquer des outils d’analyse statistique des données et d’extraction de connaissances à partir des données de cette expérimentation.
• Des algorithmes d’analyse de données et de classification seront utiles pour mettre en exergue des corrélations, interdépendances ou autres similarités dans les parcours d’apprentissage.

Profil du candidat :

Formation et compétences requises :
La candidate ou le candidat a in niveau de formation M2 et une bonne connaissance en analyse de données numérique et de programmation. Elle ou il maîtrise Python ou R.
La curiosité, l’autonomie et le sens de travail en équipe seront également des facteurs déterminants.

Adresse d’emploi :
CReSTIC
UFR Sciences Exactes et Naturelles
Moulin de la Housse – BP 1039
51687 Reims CEDEX 2
https://crestic.univ-reims.fr/fr/accueil

Document attaché : 202412201243_Sujet Master 2.docx

Categories: Stages

Call for internship proposals, M2 PSL IASD

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PSL University
Durée : 5 mois
Contact : pierre@senellart.com
Date limite de publication : 2025-03-31

Contexte :
Le M2 IASD est le parcours de deuxième année en Intelligence Artificielle et Science des Données du Master Informatique de l’Université PSL (porté par l’Université Paris-Dauphine, l’École Normale Supérieure et Mines Paris). Voir https://www.masteriasd.eu/fr/ pour plus d’information.

The IASD M2 is the second-year track on Artificial Intelligence and Data Science of the Master’s degree in Computer Science of PSL University (involving Université Paris-Dauphine, École Normale Supérieure, and Mines Paris). See https://www.masteriasd.eu/ for more information.

Sujet :
… [See below for English version] …

Le master IASD lance un appel à propositions de stages pour ses étudiants pour l’année académique 2024-2025. Les stages durent 5 mois, généralement d’avril à août. Les stages peuvent se dérouler dans des laboratoires ou services de recherche académiques ou industriels mais doivent être orientés vers la recherche.

Les propositions peuvent être soumises directement via le formulaire
https://db.masteriasd.eu/internships/submit
et seront visibles sur le site web du M2 IASD

Propositions de stage

… [Voir ci-dessus pour la version française] …

The IASD M2 calls for internship proposals for its students for the 2024-2025 academic year. Internships last 5 months, typically, from April to August. Internships can be held in academic or industrial environments but must be oriented towards research.

Proposals can be submitted directly at
https://db.masteriasd.eu/internships/submit
and will be displayed on IASD’s website

List of internships proposals

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
TBD

Categories: Stages

Deep representation of the Brain Image for the Analysis of Neurodegenerative diseases

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Laboratoire ICube, Strasbourg
Durée : 6
Contact : seo@unistra.fr
Date limite de publication : 2025-03-31

Contexte :
Dementia with Lewy Bodies (DLB) and Alzheimer’s Disease (AD) are two common neurodegenerative diseases among elderly people. Both associated with abnormal deposits of proteins in the brain, the diagnosis of these diseases can be challenging, particularly in distinguishing between them, as they exhibit similar symptoms in their early stages. Brain MRI provides detailed images of brain structures, allowing for the identification of structural changes associated with neurodegenerative diseases. Deep learning has shown great promise in analysing these images, enabling accurate predictions and interpretations. At the center of it are the recent emerging large-scale pre-trained vision-language models (VLMs), which have demonstrated remarkable performance thanks to their generalizable visual and textual representations.

Sujet :
We will deploy a VLM to improve the accuracy and efficiency of brain image analysis, with a specific focus on classification and associated reasoning presented in text form. Our specific focus will be on the analysis and understanding of neurodegenerative diseases, Dementia with Lewy Bodies (DLB), Alzheimer’s Disease (AD), and/or Parkinson disease. We will base our study on our recent work, where the model we developed learns and refines visual, textual, and numerical representations of patient gait videos using a large-scale pre-trained Vision-Language Model (VLM) for several classification tasks.

Profil du candidat :
− Solid programming skills: Python/C++
− Experience in Deep Learning (Transformer, CLIP, etc.)
− Good communication skills

Formation et compétences requises :

Adresse d’emploi :
2 Rue Marie Hamm
67000 Strasbourg

Document attaché : 202411071344_Stage-DeBIAN.pdf

Categories: Stages

Estimating intracranial pressure by wide-band tympanometry signal analysis through neural networks

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ImViA, Dijon, France & CHU Dijon, Fran
Durée : 6 mois
Contact : franck.marzani@u-bourgogne.fr
Date limite de publication : 2025-03-31

Contexte :
Wide-band tympanometry (WBT) is a routine and non-invasive clinical tool to estimate the micromechanical properties of the middle and inner ears. The system delivers a pure-tone signal into the ear at several frequencies and records the reflecting signal in the ear canal. Il also analyses the absorbance at different pressures in the ear canal (-300 to +300 daPa). It estimates the reflectance and the absorbance of the recorded sound and thus provides interesting indicators of tympanic membrane and ossicular chain mobility, and middle ear pressure. The ear is connected to the intracranial space through the inner ear structures. An increase in the intracranial pressure (ICP) changes the micromechanical properties of the middle ear and the WBT signal. The relation between intracranial pressure and WBT signal alterations is complex and poorly studied. The WBT signal varies between individuals and these 2 obstacles hamper the estimation of intracranial pressure by WBT. Monitoring the ICP is crucial in patients undergoing intracranial surgical procedures or in those with head trauma. The gold standard for measuring ICP is invasive pressure sensors placed inside the head. Developing non-invasive ICP measurements would be a significant breakthrough in the neurosurgical field.
We have undertaken a clinical study in the intensive care unit (Dijon hospital) for the measurement of ICP with the intracranial invasive system and multiple WBT recordings on both ears in 20 patients after head trauma or surgery. The database includes 1200 recordings with corresponding invasive ICP values (ground truth). Each WBT recording is composed of absorbance values for probe sound frequencies ranging from 120 to 8000 Hz and for ear canal pressures ranging from -300 to +300 daPa).

Sujet :
The aim of the study is to develop a neural network to analyze the data and to estimate the ICP in 3 categories of pressure (low, medium, high). As a first step, the person recruited will have to understand the physical meaning of the signals handled. He/she will then have to propose and implement a deep learning architecture capable of modeling the relation between ICP and WBT signals in order to meet the objective of estimating.
This study opens insights to the understanding of the mechanisms connecting the middle ear micromechanics and ICP.

Profil du candidat :
Master or engineering student in imaging, computer vision.
Strong skills in image analysis, AI, programming such as Python.
Interest in working as part of a team in an interdisciplinarity environment. Interest in healthcare applications.
Enthusiasm for research. Autonomy.

Formation et compétences requises :
Applicants are invited to submit their application to: Franck MARZANI (franck.marzani@u-bourgogne.fr) and Alexis BOZORG GRAYELI (alexis.bozorggrayeli@chu-dijon.fr).
Application must contain the following documents: cover letter, CV, transcript of the last 2 years, at least 2 reference letters or referral contacts.

Adresse d’emploi :
Laboratoire ImViA, Dijon, Université de Bourgogne

Categories: Stages

Estimating intracranial pressure by wide-band tympanometry signal analysis through neural networks

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ImViA, Dijon, France & CHU Dijon, Fran
Durée : 6 mois
Contact : franck.marzani@u-bourgogne.fr
Date limite de publication : 2025-03-31

Adresse d’emploi :
Laboratoire ImViA, Dijon, Université de Bourgogne

Categories: Stages

Metalearning for Healthcare: Exploring Hierarchical Representations with Poincaré Variational Auto-Encoders

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC, Univ. Évry Paris-Saclay/MIT
Durée : 6
Contact : massinissa.hamidi@univ-evry.fr
Date limite de publication : 2025-03-31

Contexte :
Context
This project will lead to concrete machine learning empirical insights intended to be exploited in the larger context of IHU Prometheus, a multi-year large-scale research and training institute for understanding sepsis disease. The student will also have the opportunity to get involved in ongoing collaboration with the IMES at MIT.

Sujet :
Project description

Machine learning is increasingly used in healthcare applications to assist medical staff in diagnosing their patients and providing tailored medications. Many real datasets in healthcare are hierarchically structured. However, traditional machine learning models map the data to Euclidean latent space, which cannot efficiently handle tree-like structures. This is the case with variational auto-encoders (VAEs), a powerful type of machine learning model that is widely used for generative purposes. In particular, they allow capturing explainable factors of variation, an important property that we seek in healthcare applications. In this project, we are interested in exploring the benefits of hierarchical representations for healthcare applications with a particular kind of VAEs which are embedded in hyperbolic spaces [1, 2].

As a starting point, we will take a look at this paper “Continuous Hierarchical Representations with Poincaré Variational Auto-Encoders” [1] and adapt it to a healthcare application. The goal is to leverage meta-knowledge [3] about the learning problem, for example, the hierarchical structure of the labels to improve the learning process. In particular, we are interested in assessing what happens for the learning process and the learned representations when choosing appropriate parameterizations (here, leveraging the hierarchical structure of the target labels) compared to when we simply map data to the Euclidean latent space, i.e., flatten the target labels and ignoring their hierarchical structure. Other VAEs that feature hyperbolic embedded spaces, such as [2, 4, 5] will also be explored and compared to basic Euclidean embedded space in terms of performances, representational properties, and learning bounds.

The experiments will be performed on the MIMIC-IV dataset [6], a freely available real-world dataset encompassing electronic health records of patients admitted to intensive care units. The idea is to adapt one of the healthcare learning problems featured in MIMIC-IV dataset to a hierarchical representation learning problem.

We seek to publish the obtained results in machine learning and machine learning for healthcare related workshops or conference venues.

Contact
Massinissa HAMIDI
Maître de conférences
IBISC Laboratory, Univ. Évry Paris-Saclay massinissa.hamidi@univ-evry.fr

Li-wei H. LEHMAN
Research Scientist
Massachusetts Institute of Technology lilehman@mit.edu

Bibliography
[1] Mathieu E, Le Lan C, Maddison CJ, Tomioka R, Teh YW. Continuous hierarchical representations with poincaré variational auto-encoders. Advances in neural information processing systems. 2019;32.

[2] Bose, Joey, et al. “Latent variable modelling with hyperbolic normalizing flows.” International conference on machine learning. PMLR, 2020.

[3] Hamidi, Massinissa. Metalearning guided by domain knowledge in distributed and decentralized applications. Diss. Université Paris-Nord-Paris XIII, 2022.

[4] Davidson, Tim R., et al. “Hyperspherical variational auto-encoders.” 34th Conference on Uncertainty in Artificial Intelligence 2018, UAI 2018. Association For Uncertainty in Artificial Intelligence (AUAI), 2018.

[5] Cho, Seunghyuk, Juyong Lee, and Dongwoo Kim. “Hyperbolic VAE via latent Gaussian distributions.” Advances in Neural Information Processing Systems 36 (2024).

[6] A. E. Johnson, L. Bulgarelli, L. Shen, A. Gayles, A. Shammout, S. Horng, T. J. Pollard, S. Hao, B. Moody, B. Gow, et al. Mimic-iv, a freely accessible electronic health record dataset. Scientific data, 10(1):1, 2023.

Profil du candidat :
Niveau Master, MSc ou Programme Grande Ecole

Formation et compétences requises :

Adresse d’emploi :
23 Bd de France-Georges Pompidou, 91037 Évry-Courcouronnes

Document attaché : 202412191341_2425-UPSay-MIT-internship-Metalearning-Poincare-VAE.pdf

Categories: Stages

Offre de stage M2 – Projet CALYPSO (Clinique et AnaLYses PSychiatriques Objectives)

Tickets

Mar 31 – Apr 1 all-day

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Laboratoire CRIStAL (Université de Lille)
Durée : 12 semaines minimum
Contact : mathilde.regue@univ-lille.fr
Date limite de publication : 2025-03-31

Contexte :
Le projet CALYPSO : Vers une psychiatrie de précision
CALYPSO est un projet de recherche interdisciplinaire de l’Université de Lille qui réunit des chercheurs en intelligence artificielle, psychiatrie, psychologie et neurosciences issus du laboratoire CRIStAL, du centre Lille Neuroscience et Cognition et du SCALab. Le projet CALYPSO vise à identifier des marqueurs objectifs des troubles psychiatriques pour améliorer la précision des diagnostics, la prédiction du pronostic et de la réponse aux traitements, et personnaliser les interventions.

Contexte sociétal du projet :

Les troubles psychiatriques touchent aujourd’hui près d’une personne sur huit dans le monde, faisant de la santé mentale un enjeu majeur de santé publique. Cette situation s’intensifie face aux crises globales qui amplifient la prévalence des troubles tels que la dépression et le trouble de stress post-traumatique (TSPT). Bien que la recherche en psychiatrie ait permis des avancées significatives, les mécanismes sous-jacents à ces troubles demeurent encore peu voire pas connus, et les découvertes peinent souvent à se traduire dans la pratique clinique.

Quelques chiffres… L’ampleur des troubles visés par CALYPSO

*300 millions : Nombre de personnes affectées par la dépression dans le monde
*70 % : Proportion des individus exposés à des événements potentiellement traumatiques au cours de leur vie
*24 % : Prévalence du TSPT suite à un événement traumatique

Description du projet CALYPSO :

Le projet CALYPSO vise à enrichir la définition des troubles psychiatriques grâce à des marqueurs objectifs, rendus possibles par les technologies d’intelligence artificielle et de vision par ordinateur. Les marqueurs objectifs incluent des indicateurs mesurables et quantifiables tels que les expressions faciales, les tonalités de voix, les comportements moteurs, et les données physiologiques (par exemple, rythme cardiaque, respiration). En permettant d’étudier des groupes de patients plus homogènes, ces avancées offriraient une voie vers des traitements plus ciblés, ouvrant ainsi de nouvelles perspectives pour répondre aux besoins spécifiques de chaque patient.

Sujet :
Missions du stage:

Durant ce stage, l’étudiant ou l’étudiante s’intéressera au développement de méthodes de machine learning adaptées au projet.

Ses missions seront :

*Développer et mettre en œuvre un algorithme d’analyse pour un des marqueurs objectifs enregistrés (expressions faciales / mouvements du visage / vitesse de déplacement / analyse de la voix…).
*Utiliser des techniques d’apprentissage automatique pour identifier des sous-groupes de patients en fonction des marqueurs objectifs.
*Effectuer des évaluations expérimentales des algorithmes et techniques développés.
*Discuter avec des équipes interdisciplinaires pour intégrer les résultats dans la pratique clinique.

Profil du candidat :
Étudiant ou étudiante en M2 dans un Master en informatique, en intelligence artificielle, ou dans un domaine connexe.

Formation et compétences requises :
*Connaissance en vision par ordinateur, apprentissage automatique et intelligence artificielle.
*Connaissance de travail avec des ensembles de données à grande échelle et de réalisation d’évaluations expérimentales.
*Compétences en programmation en Python. Une connaissance des bibliothèques de vision par ordinateur telles que OpenCV, TensorFlow, PyTorch ou similaires serait un avantage.
*Compétences analytiques et en résolution de problèmes.

Adresse d’emploi :
Infos pratiques :
La durée du stage sera de minimum 12 semaines.
Le projet sera encadré par les Pr. Mohamed Daoudi (UMR 9189 CRIStAL – Computer Science et AI), Pr Ali Amad (UMR-S 1172 et CHU de Lille –Psychiatrie) et Dr Fabien D’Hondt (UMR-S 1172 – Neurosciences).
Le stagiaire sera principalement localisé dans les locaux du laboratoire CRIStAL, campus Cité Scientifique et ponctuellement au centre Lille Neuroscience et Cognition.

Contact : Pour postuler à cette offre, merci d’envoyer un CV ainsi qu’une lettre de présentation à : mathilde.regue@univ-lille.fr

Document attaché : 202412190951_Offre de stage M2 – Projet CALYPSO.pdf

Categories: Stages

Apr

Thu

2025

Développement d’une application web pour traiter et stocker les données d’histologie Raman stimulée.

Tickets

Apr 3 – Apr 4 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut Fresnel
Durée : Flexible
Contact : andre@fresnel.fr
Date limite de publication : 2025-04-03

Contexte :
L’histologie joue un rôle crucial dans le diagnostic des tumeurs cérébrales, car elle implique l’extraction et l’analyse d’un échantillon de tissu. La méthode classique pour l’analyse des biopsies est la coloration à l’hématoxyline et à l’éosine (H&E), qui aide les experts à identifier les tissus cancéreux, mais qui peut prendre beaucoup de temps. Une technique alternative, plus rapide, appelée Histologie Raman Stimulée (SRH) est apparue, produisant des images comparables à la coloration H&E. Cette technique permet d’imager les liaisons chimiques CH2 et CH3, et la soustraction de ces deux canaux (CH3-CH2) est utilisée pour mettre en évidence les noyaux des tissus. Ces images sont ensuite traitées, assemblées et mises en correspondance avec un code couleur de type H&E à l’aide d’outils de colorisation virtuel.

Sujet :
Le candidat devra modifier et améliorer une application web existante qui effectue les différents traitements aux images brutes afin de générer des images SRH de haute qualité. La tâche principale consiste à concevoir et à construire une nouvelle application robuste axée uniquement sur la coloration virtuelle en garantissant des performances et une réactivité élevée.

Profil du candidat :
Développement d’applications web, en particulier dans le domaine de l’analyse d’images ou dans des domaines connexes.
Maîtrise des technologies frontales et dorsales (par exemple, HTML, CSS, JavaScript, Python).
Expérience avec SQL ou un autre système de gestion de base de données (MongoDB).
Expérience avec des bibliothèques de traitement d’images (par exemple, OpenCV, Scikit-image).
Appétence pour la résolution de problèmes informatiques et souci du détail.
Forte aptitude de communication et travail en équipe.

Formation et compétences requises :
Etudiant de Bac+2 à Bac+5 en informatique ayant un fort intérêt pour le développement web.

Adresse d’emploi :
Institut Fresnel, 52 Av. Escadrille Normandie Niemen, 13013 Marseille

Document attaché : 202409031543_offre_stage_interface Web.pdf

Categories: Stages

Apr

Fri

2025

Amélioration de la performance des modèles d’apprentissage fédéré à l’Aide de métaheuristiques

Tickets

Apr 4 – Apr 5 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LAMSADE – Dauphine PSL
Durée : 4 à 6 mois
Contact : sana.mrabet@dauphine.psl.eu
Date limite de publication : 2025-04-04

Contexte :
L’apprentissage fédéré (Federated Learning, FL) est une approche de l’apprentissage machine décentralisé où les modèles sont entraînés localement sur plusieurs appareils sans partager les données brutes, préservant ainsi la confidentialité et réduisant les coûts de communication. Ce paradigme est de plus en plus utilisé dans des domaines sensibles comme la santé, la finance ou encore les appareils connectés. Cependant, il pose des défis uniques, notamment :
• L’hétérogénéité des données entre les participants,
• L’optimisation efficace des modèles sur des ensembles de données distribués et déséquilibrés,
• La communication coûteuse entre les participants et le serveur central.

Sujet :
Ce sujet vise à développer des approches innovantes pour améliorer la performance des modèles d’apprentissage fédéré. Il s’agira d’explorer des méthodes hybrides mêlant l’intégration de méta-heuristiques (ex. : colonies de fourmis, algorithmes génétiques) pour :
• Identifier dynamiquement les sous-ensembles d’appareils participant à chaque cycle, maximisant ainsi la performance globale du modèle tout en respectant les contraintes du système.
• Optimiser la sélection dynamique des modèles locaux contribuant efficacement à la performance globale.
• Optimiser les stratégies d’agrégation des poids pour gérer le déséquilibre des données et améliorer la convergence.

Profil du candidat :
L’offre s’adresse à un étudiant en M2 ou équivalent en Informatique, avec bonnes connaissances en Machine Learning et en programmation Python.

Formation et compétences requises :

Adresse d’emploi :
LAMADE – Université Paris Dauphine – PSL
Place du Maréchal de Lattre de Tassigny – 75775 PARIS Cedex 16

Document attaché : 202501131418_Projet master recherche – FL – 2025.pdf

Categories: Stages

Reconnaissance et Suivi de Démarche à Travers des Vidéos Multi-Vues

Tickets

Apr 4 – Apr 5 all-day

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC
Durée : 5 mois
Contact : alexis.mortelier@unicaen.fr
Date limite de publication : 2025-04-04

Contexte :
La reconnaissance de démarche est une technique biométrique utilisée pour identifier ou suivre une personne en analysant ses mouvements. Ce domaine trouve des applications dans la sécurité, la surveillance, et l’interaction homme-machine. Cependant, les défis restent nombreux, notamment dans des environnements réels où des variations d’angle de caméra, de vêtements ou de conditions d’éclairage peuvent affecter la robustesse des algorithmes.

Ce stage s’inscrit dans les travaux récents sur l’analyse et le suivi de démarche en exploitant des approches modernes basées sur des données spatio-temporelles et des modèles d’apprentissage automatique. Des études comme celles sur OpenGait, Gait Parsing Sequence (GPS) et la reconnaissance en conditions de changement de vêtements fournissent des bases pour ce sujet

Sujet :
Pour ce stage, votre objectif sera de développer un système capable de reconnaître une personne à partir de sa démarche, indépendamment des variations de vêtements ou d’angles de caméra, et de suivre cette personne à travers plusieurs vidéos en exploitant des caractéristiques robustes et discriminantes.

Vous commencerez par explorer les méthodes existantes. Analysez les approches actuelles en reconnaissance de démarche, notamment des solutions comme GaitSet, GPS et OpenGait. Étudiez les ensembles de données pertinents, tels que GREW, CASIA-B, et Gait3D, pour comprendre les défis et les méthodologies en vigueur. Identifiez les limites des solutions actuelles et les opportunités d’amélioration.

Ensuite, vous concevrez et implémenterez un pipeline de reconnaissance basé sur des architectures modernes, telles que les réseaux convolutionnels 3D ou les transformers. Intégrerez des mécanismes spécifiques pour traiter les changements d’apparence (par exemple, les variations de vêtements) et les variations d’angles. Vous utiliserez des frameworks comme PyTorch ou TensorFlow pour entraîner et optimiser votre modèle, en veillant à garantir robustesse et efficacité.

Après le développement, vous évaluerez votre modèle en réalisant des tests approfondis sur des ensembles de données publics. Comparerez ses performances avec les méthodes de l’état de l’art, en termes de précision, de robustesse et de temps de calcul. Vous identifierez les points forts et faibles de votre approche pour orienter d’éventuelles améliorations.

Enfin, vous documenterez votre travail en rédigeant un rapport détaillé en présentant les méthodologies utilisées, les résultats obtenus, et proposerez des pistes d’amélioration.

N’oubliez pas d’intégrer des idées pour des applications pratiques, notamment dans des contextes en temps réel. Soyez méthodique, rigoureux et force de proposition tout au long de ce stage.

Profil du candidat :
Master/Ingénieur dernière année en informatique, traitement du signal et des images, biométrie

Formation et compétences requises :
– apprentissage profond (modèles spatio-temporels, CNN, transformers).
– traitement d’images
– familiarité avec les concepts de biométrie ou d’analyse de mouvement serait un plus.
– compétences en programmation Python, OpenCV, Tensorflow, PyTorch.

Adresse d’emploi :
laboratoire GREYC site de Caen (Campus 2, 6 boulevard maréchal juin) et/ou Saint-Lô (IUT GON, 120 Rue de l’Exode, 50000 Saint-Lô)

Document attaché : 202501141533_Stage_M2__2025_biométrie_SAFE.pdf

Categories: Stages

March – April 2025 Mar – Apr 2025

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Présentation Générale

Manifestations à venir

Actions, Ateliers et Groupes de Travail :