Modèle de langue à base de connaissance experte pour l’extraction d’information médicale à partir de données non structurées.

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Institut de Recherche en Informatique de Toulouse
Durée : 5-6 mois
Contact : yohann.chasseray@irit.fr
Date limite de publication : 2025-03-01

Contexte :
Le stage sera réalisé au sein de l’équipe SIG, dans le département Gestion de Données de l’Institut de Recherche en Informatique de Toulouse (IRIT). L’IRIT est un laboratoire de recherche constitué de chercheurs en informatique, développant notamment des travaux autour du traitement automatique du langage, de la gestion des données, des connaissances et de l’extraction d’informations.
Le stage sera localisé sur le Campus de Castres, dans les locaux de l’école d’ingénieurs ISIS, qui forme des ingénieurs en informatique dans le domaine de la santé numérique. Des déplacements à Toulouse dans les locaux de l’IRIT sont à prévoir.

Sujet :
Les grands modèles de langue qui n’ont de cesse de se perfectionner représentent un outil puissant pour la compréhension fine des connaissances dans un contexte général mais également de manière plus spécialisée, dans des domaines métier spécifiques comme celui de la santé médicale. Notamment, les grands modèles de langue (LLMs) constituent une base solide pour la détection d’entités nommées (NER) ou de relation (RE) qui sont des tâches majeures pour le traitement des données médicales.
L’objectif de ce stage est donc de proposer des méthodes d’extraction d’entités nommées s’appuyant à la fois sur les LLMs (Phi-3 [1], BERT [2]) et sur des ontologies médicales (SNOMED CT [3], UMLS [4]), qui renferment des informations sémantiques précises sur les entités et relations recherchées. Pour cela, deux approches sont envisagées, s’appuyant toutes les deux sur les grands modèles de langues :
(A) Une approche qui utilise le contexte, permettant de guider un modèle de langue génératif en sélectionnant les types d’entités les plus pertinents dans une ontologie pour l’extraction d’entités nommées ou de relations.
(B) Une approche plus intégrée, visant cette fois à inclure directement la représentation ontologique au cours d’une étape de fine-tuning d’un modèle de langue et à interroger directement le modèle, sans fournir de contexte préalable.
En fonction des avancées, les résultats pourront faire l’objet d’une soumission à la conférence CLEF 2025 (https://clef2025.clef-initiative.eu/).

Profil du candidat :
Etudiant(e) en formation de niveau Bac+4/5, avec une spécialisation en Informatique ou Data Science et présentant des compétences en analyse, traitement et représentation de données.

Formation et compétences requises :
Les compétences suivantes seront fortement appréciées pour mener à bien les missions associées au sujet de stage :
• Bonnes connaissances en programmation (Python) et traitement automatique du langage.
• Connaissances de base sur les ontologies et bases de connaissances.
• Familiarités avec les modèles d’apprentissage automatique en général et le modèle transformer en particulier.

Adresse d’emploi :
Campus Universitaire, Rue Firmin Oulès, 81104 Castres
yohann.chasseray@irit.fr

Document attaché : 202501051355_Offre_de_stage_ISIS_IRIT.pdf

Postdoctoral researcher, IGDR, Rennes, France: use of deep learning and simulation to extract geometric parameters of filaments in microscopy images.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institute of Genetics and Development of Rennes
Durée : 24 months
Contact : helene.bouvrais@univ-rennes.fr
Date limite de publication : 2025-03-01

Contexte :
We wish to welcome a highly motivated postdoctoral researcher in our multi-disciplinary team at the Institute of Genetics and Development of Rennes (https://igdr.univ-rennes.fr/en/). Research in the team focuses on the robustness of cell division through fluorescence microscopy and quantitative biophysical approaches, using the nematode model organism Caernorhabditis elegans. The ongoing development of an automated microscope allows the team to extend its studies to human cell lines in culture, without synchronization, a key requirement for the studying division robustness.

Sujet :
The recruited postdoctoral researcher will be an integral part of the on-going research project, funded by the ANR and focused on the study of the regulatory role of microtubule rigidity in cell division. He/she will work on the development of a tool based on artificial intelligence to extract microtubule curvatures from 3D fluorescence microscopy images. In particular, the candidate will use synthetic image generation through simulation (e.g., Cytosim) and deep learning techniques. For this, he/she will have access to local computing servers as well as remote ones (e.g., Jean Zay). Filament curvature measurements will help reveal potential disruptions in microtubule rigidity during genetic perturbation or across cell lines with deregulated expression of candidate proteins involved in regulating microtubule rigidity.

Profil du candidat :

Formation et compétences requises :
– Hold a PhD degree in computer science, machine learning or applied mathematics.
– Have strong theoretical and practical skills in deep learning.
– Master programming languages such as Python.
– Have proven experience in implementing deep learning in image analysis.
– Be able to work collaboratively within a research team ; be a team player.
– Have strong organizational and communication skills, including the ability to express oneself and write in English.
– Ability to work independently.
– Have an interest in working in a multidisciplinary environment (cellular biology, fluorescence microscopy, soft matter physics, bioinformatics)

Adresse d’emploi :
IGDR (Institute of Genetics and Developemnt of Rennes), CNRS, Univ. Rennes, UMR 6290
2 avenue du Professeur Léon Bernard, 35000 Rennes cedex, France

Document attaché : 202501031145_Annonce_post-doc_informatique_ANR_Micenn_EN.pdf

Estimating intracranial pressure by wide-band tympanometry signal analysis through neural networks

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ImViA, Dijon, France & CHU Dijon, Fran
Durée : 6 mois
Contact : franck.marzani@u-bourgogne.fr
Date limite de publication : 2025-03-31

Contexte :
Wide-band tympanometry (WBT) is a routine and non-invasive clinical tool to estimate the micromechanical properties of the middle and inner ears. The system delivers a pure-tone signal into the ear at several frequencies and records the reflecting signal in the ear canal. Il also analyses the absorbance at different pressures in the ear canal (-300 to +300 daPa). It estimates the reflectance and the absorbance of the recorded sound and thus provides interesting indicators of tympanic membrane and ossicular chain mobility, and middle ear pressure. The ear is connected to the intracranial space through the inner ear structures. An increase in the intracranial pressure (ICP) changes the micromechanical properties of the middle ear and the WBT signal. The relation between intracranial pressure and WBT signal alterations is complex and poorly studied. The WBT signal varies between individuals and these 2 obstacles hamper the estimation of intracranial pressure by WBT. Monitoring the ICP is crucial in patients undergoing intracranial surgical procedures or in those with head trauma. The gold standard for measuring ICP is invasive pressure sensors placed inside the head. Developing non-invasive ICP measurements would be a significant breakthrough in the neurosurgical field.
We have undertaken a clinical study in the intensive care unit (Dijon hospital) for the measurement of ICP with the intracranial invasive system and multiple WBT recordings on both ears in 20 patients after head trauma or surgery. The database includes 1200 recordings with corresponding invasive ICP values (ground truth). Each WBT recording is composed of absorbance values for probe sound frequencies ranging from 120 to 8000 Hz and for ear canal pressures ranging from -300 to +300 daPa).

Sujet :
The aim of the study is to develop a neural network to analyze the data and to estimate the ICP in 3 categories of pressure (low, medium, high). As a first step, the person recruited will have to understand the physical meaning of the signals handled. He/she will then have to propose and implement a deep learning architecture capable of modeling the relation between ICP and WBT signals in order to meet the objective of estimating.
This study opens insights to the understanding of the mechanisms connecting the middle ear micromechanics and ICP.

Profil du candidat :
Master or engineering student in imaging, computer vision.
Strong skills in image analysis, AI, programming such as Python.
Interest in working as part of a team in an interdisciplinarity environment. Interest in healthcare applications.
Enthusiasm for research. Autonomy.

Formation et compétences requises :
Applicants are invited to submit their application to: Franck MARZANI (franck.marzani@u-bourgogne.fr) and Alexis BOZORG GRAYELI (alexis.bozorggrayeli@chu-dijon.fr).
Application must contain the following documents: cover letter, CV, transcript of the last 2 years, at least 2 reference letters or referral contacts.

Adresse d’emploi :
Laboratoire ImViA, Dijon, Université de Bourgogne

Analyse numérique de l’engagement d’apprenants dans des situations d’apprentissage en ligne

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CReSTIC – Université de Reims Champagne-Ardenne
Durée : 4 à 6 mois
Contact : bart.lamiroy@loria.fr
Date limite de publication : 2025-03-31

Contexte :
Ce travail se place dans un projet de recherche en collaboration avec Santé Publique France.
Ce stage de Master se situe en amont et en parallèle des recherches menés dans le cadre de ce projet et consiste à choisir et mettre en place les outils adéquats en analyse statistique de données et d’extraction de connaissances à partir de traces d’interaction avec un site d’apprentissage en ligne afin de mesurer l’impact de l’outil de formation et de mesurer l’engagement des apprenants dans leur démarche.

Sujet :
Le but est d’établir des profils d’usagers à partir des interactions de ceux-ci avec une plateforme d’apprentissage en ligne, afin d’évaluer l’adéquation de l’outil numérique proposé, et de faire des préconisations pour son évolution à partir de données anonymisées.

• Il s’agira de concevoir et appliquer des outils d’analyse statistique des données et d’extraction de connaissances à partir des données de cette expérimentation.
• Des algorithmes d’analyse de données et de classification seront utiles pour mettre en exergue des corrélations, interdépendances ou autres similarités dans les parcours d’apprentissage.

Profil du candidat :

Formation et compétences requises :
La candidate ou le candidat a in niveau de formation M2 et une bonne connaissance en analyse de données numérique et de programmation. Elle ou il maîtrise Python ou R.
La curiosité, l’autonomie et le sens de travail en équipe seront également des facteurs déterminants.

Adresse d’emploi :
CReSTIC
UFR Sciences Exactes et Naturelles
Moulin de la Housse – BP 1039
51687 Reims CEDEX 2
https://crestic.univ-reims.fr/fr/accueil

Document attaché : 202412201243_Sujet Master 2.docx

Estimating intracranial pressure by wide-band tympanometry signal analysis through neural networks

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ImViA, Dijon, France & CHU Dijon, Fran
Durée : 6 mois
Contact : franck.marzani@u-bourgogne.fr
Date limite de publication : 2025-03-31

Contexte :
Wide-band tympanometry (WBT) is a routine and non-invasive clinical tool to estimate the micromechanical properties of the middle and inner ears. The system delivers a pure-tone signal into the ear at several frequencies and records the reflecting signal in the ear canal. Il also analyses the absorbance at different pressures in the ear canal (-300 to +300 daPa). It estimates the reflectance and the absorbance of the recorded sound and thus provides interesting indicators of tympanic membrane and ossicular chain mobility, and middle ear pressure. The ear is connected to the intracranial space through the inner ear structures. An increase in the intracranial pressure (ICP) changes the micromechanical properties of the middle ear and the WBT signal. The relation between intracranial pressure and WBT signal alterations is complex and poorly studied. The WBT signal varies between individuals and these 2 obstacles hamper the estimation of intracranial pressure by WBT. Monitoring the ICP is crucial in patients undergoing intracranial surgical procedures or in those with head trauma. The gold standard for measuring ICP is invasive pressure sensors placed inside the head. Developing non-invasive ICP measurements would be a significant breakthrough in the neurosurgical field.
We have undertaken a clinical study in the intensive care unit (Dijon hospital) for the measurement of ICP with the intracranial invasive system and multiple WBT recordings on both ears in 20 patients after head trauma or surgery. The database includes 1200 recordings with corresponding invasive ICP values (ground truth). Each WBT recording is composed of absorbance values for probe sound frequencies ranging from 120 to 8000 Hz and for ear canal pressures ranging from -300 to +300 daPa).

Sujet :
The aim of the study is to develop a neural network to analyze the data and to estimate the ICP in 3 categories of pressure (low, medium, high). As a first step, the person recruited will have to understand the physical meaning of the signals handled. He/she will then have to propose and implement a deep learning architecture capable of modeling the relation between ICP and WBT signals in order to meet the objective of estimating.
This study opens insights to the understanding of the mechanisms connecting the middle ear micromechanics and ICP.

Profil du candidat :
Master or engineering student in imaging, computer vision.
Strong skills in image analysis, AI, programming such as Python.
Interest in working as part of a team in an interdisciplinarity environment. Interest in healthcare applications.
Enthusiasm for research. Autonomy.

Formation et compétences requises :
Applicants are invited to submit their application to: Franck MARZANI (franck.marzani@u-bourgogne.fr) and Alexis BOZORG GRAYELI (alexis.bozorggrayeli@chu-dijon.fr).
Application must contain the following documents: cover letter, CV, transcript of the last 2 years, at least 2 reference letters or referral contacts.

Adresse d’emploi :
Laboratoire ImViA, Dijon, Université de Bourgogne

Metalearning for Healthcare: Exploring Hierarchical Representations with Poincaré Variational Auto-Encoders

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC, Univ. Évry Paris-Saclay/MIT
Durée : 6
Contact : massinissa.hamidi@univ-evry.fr
Date limite de publication : 2025-03-31

Contexte :
Context
This project will lead to concrete machine learning empirical insights intended to be exploited in the larger context of IHU Prometheus, a multi-year large-scale research and training institute for understanding sepsis disease. The student will also have the opportunity to get involved in ongoing collaboration with the IMES at MIT.

Sujet :
Project description

Machine learning is increasingly used in healthcare applications to assist medical staff in diagnosing their patients and providing tailored medications. Many real datasets in healthcare are hierarchically structured. However, traditional machine learning models map the data to Euclidean latent space, which cannot efficiently handle tree-like structures. This is the case with variational auto-encoders (VAEs), a powerful type of machine learning model that is widely used for generative purposes. In particular, they allow capturing explainable factors of variation, an important property that we seek in healthcare applications. In this project, we are interested in exploring the benefits of hierarchical representations for healthcare applications with a particular kind of VAEs which are embedded in hyperbolic spaces [1, 2].

As a starting point, we will take a look at this paper “Continuous Hierarchical Representations with Poincaré Variational Auto-Encoders” [1] and adapt it to a healthcare application. The goal is to leverage meta-knowledge [3] about the learning problem, for example, the hierarchical structure of the labels to improve the learning process. In particular, we are interested in assessing what happens for the learning process and the learned representations when choosing appropriate parameterizations (here, leveraging the hierarchical structure of the target labels) compared to when we simply map data to the Euclidean latent space, i.e., flatten the target labels and ignoring their hierarchical structure. Other VAEs that feature hyperbolic embedded spaces, such as [2, 4, 5] will also be explored and compared to basic Euclidean embedded space in terms of performances, representational properties, and learning bounds.

The experiments will be performed on the MIMIC-IV dataset [6], a freely available real-world dataset encompassing electronic health records of patients admitted to intensive care units. The idea is to adapt one of the healthcare learning problems featured in MIMIC-IV dataset to a hierarchical representation learning problem.

We seek to publish the obtained results in machine learning and machine learning for healthcare related workshops or conference venues.

Contact
Massinissa HAMIDI
Maître de conférences
IBISC Laboratory, Univ. Évry Paris-Saclay massinissa.hamidi@univ-evry.fr

Li-wei H. LEHMAN
Research Scientist
Massachusetts Institute of Technology lilehman@mit.edu

Bibliography
[1] Mathieu E, Le Lan C, Maddison CJ, Tomioka R, Teh YW. Continuous hierarchical representations with poincaré variational auto-encoders. Advances in neural information processing systems. 2019;32.

[2] Bose, Joey, et al. “Latent variable modelling with hyperbolic normalizing flows.” International conference on machine learning. PMLR, 2020.

[3] Hamidi, Massinissa. Metalearning guided by domain knowledge in distributed and decentralized applications. Diss. Université Paris-Nord-Paris XIII, 2022.

[4] Davidson, Tim R., et al. “Hyperspherical variational auto-encoders.” 34th Conference on Uncertainty in Artificial Intelligence 2018, UAI 2018. Association For Uncertainty in Artificial Intelligence (AUAI), 2018.

[5] Cho, Seunghyuk, Juyong Lee, and Dongwoo Kim. “Hyperbolic VAE via latent Gaussian distributions.” Advances in Neural Information Processing Systems 36 (2024).

[6] A. E. Johnson, L. Bulgarelli, L. Shen, A. Gayles, A. Shammout, S. Horng, T. J. Pollard, S. Hao, B. Moody, B. Gow, et al. Mimic-iv, a freely accessible electronic health record dataset. Scientific data, 10(1):1, 2023.

Profil du candidat :
Niveau Master, MSc ou Programme Grande Ecole

Formation et compétences requises :

Adresse d’emploi :
23 Bd de France-Georges Pompidou, 91037 Évry-Courcouronnes

Document attaché : 202412191341_2425-UPSay-MIT-internship-Metalearning-Poincare-VAE.pdf

Offre de stage M2 – Projet CALYPSO (Clinique et AnaLYses PSychiatriques Objectives)

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Laboratoire CRIStAL (Université de Lille)
Durée : 12 semaines minimum
Contact : mathilde.regue@univ-lille.fr
Date limite de publication : 2025-03-31

Contexte :
Le projet CALYPSO : Vers une psychiatrie de précision
CALYPSO est un projet de recherche interdisciplinaire de l’Université de Lille qui réunit des chercheurs en intelligence artificielle, psychiatrie, psychologie et neurosciences issus du laboratoire CRIStAL, du centre Lille Neuroscience et Cognition et du SCALab. Le projet CALYPSO vise à identifier des marqueurs objectifs des troubles psychiatriques pour améliorer la précision des diagnostics, la prédiction du pronostic et de la réponse aux traitements, et personnaliser les interventions.

Contexte sociétal du projet :

Les troubles psychiatriques touchent aujourd’hui près d’une personne sur huit dans le monde, faisant de la santé mentale un enjeu majeur de santé publique. Cette situation s’intensifie face aux crises globales qui amplifient la prévalence des troubles tels que la dépression et le trouble de stress post-traumatique (TSPT). Bien que la recherche en psychiatrie ait permis des avancées significatives, les mécanismes sous-jacents à ces troubles demeurent encore peu voire pas connus, et les découvertes peinent souvent à se traduire dans la pratique clinique.

Quelques chiffres… L’ampleur des troubles visés par CALYPSO

*300 millions : Nombre de personnes affectées par la dépression dans le monde
*70 % : Proportion des individus exposés à des événements potentiellement traumatiques au cours de leur vie
*24 % : Prévalence du TSPT suite à un événement traumatique

Description du projet CALYPSO :

Le projet CALYPSO vise à enrichir la définition des troubles psychiatriques grâce à des marqueurs objectifs, rendus possibles par les technologies d’intelligence artificielle et de vision par ordinateur. Les marqueurs objectifs incluent des indicateurs mesurables et quantifiables tels que les expressions faciales, les tonalités de voix, les comportements moteurs, et les données physiologiques (par exemple, rythme cardiaque, respiration). En permettant d’étudier des groupes de patients plus homogènes, ces avancées offriraient une voie vers des traitements plus ciblés, ouvrant ainsi de nouvelles perspectives pour répondre aux besoins spécifiques de chaque patient.

Sujet :
Missions du stage:

Durant ce stage, l’étudiant ou l’étudiante s’intéressera au développement de méthodes de machine learning adaptées au projet.

Ses missions seront :

*Développer et mettre en œuvre un algorithme d’analyse pour un des marqueurs objectifs enregistrés (expressions faciales / mouvements du visage / vitesse de déplacement / analyse de la voix…).
*Utiliser des techniques d’apprentissage automatique pour identifier des sous-groupes de patients en fonction des marqueurs objectifs.
*Effectuer des évaluations expérimentales des algorithmes et techniques développés.
*Discuter avec des équipes interdisciplinaires pour intégrer les résultats dans la pratique clinique.

Profil du candidat :
Étudiant ou étudiante en M2 dans un Master en informatique, en intelligence artificielle, ou dans un domaine connexe.

Formation et compétences requises :
*Connaissance en vision par ordinateur, apprentissage automatique et intelligence artificielle.
*Connaissance de travail avec des ensembles de données à grande échelle et de réalisation d’évaluations expérimentales.
*Compétences en programmation en Python. Une connaissance des bibliothèques de vision par ordinateur telles que OpenCV, TensorFlow, PyTorch ou similaires serait un avantage.
*Compétences analytiques et en résolution de problèmes.

Adresse d’emploi :
Infos pratiques :
La durée du stage sera de minimum 12 semaines.
Le projet sera encadré par les Pr. Mohamed Daoudi (UMR 9189 CRIStAL – Computer Science et AI), Pr Ali Amad (UMR-S 1172 et CHU de Lille –Psychiatrie) et Dr Fabien D’Hondt (UMR-S 1172 – Neurosciences).
Le stagiaire sera principalement localisé dans les locaux du laboratoire CRIStAL, campus Cité Scientifique et ponctuellement au centre Lille Neuroscience et Cognition.

Contact : Pour postuler à cette offre, merci d’envoyer un CV ainsi qu’une lettre de présentation à : mathilde.regue@univ-lille.fr

Document attaché : 202412190951_Offre de stage M2 – Projet CALYPSO.pdf

Appel à communications – ORASIS (9-13 juin 2025) : journées francophones des jeunes chercheurs en vision par ordinateur

Date : 2025-06-09 => 2025-06-13
Lieu : Le Croisic

====================================================
Appel à communications

ORASIS 2025 : 9-13 juin 2025 au Croisic
Date limite de soumission : 14 février 2025
Site web : https://orasis2025.sciencesconf.org/
====================================================
La 20ème édition d’ORASIS, journées francophones des jeunes chercheurs en vision par ordinateur sera organisée 9 au 13 juin 2025 au Domaine de Port aux Rocs au Croisic. Cette édition est organisée par l’équipe Vision-AD avec Thibault Napoléon du LabISEN et en étroite collaboration avec Ayoub KARINE (MCF à l’Université Paris Cité depuis 09/2024).

Ce colloque vise à réunir de jeunes chercheurs francophones (doctorants et jeunes docteurs) issus de la communauté de la vision par ordinateur ou de domaines connexes, avec l’ambition de favoriser, dans une ambiance conviviale, les échanges entre les participants. Les journées seront rythmées par des sessions plénières, des sessions posters et par plusieurs conférenciers invités.

Liste des orateurs invités :
– Catherine Borremans, IFREMER
– Patrick Le Callet, Nantes Université
– Sébastien Lefèvre, Université Bretagne Sud
– Olivier Lézoray, Université Caen Normandie
– Alice Othmani, Université Paris-Est Créteil
– Lauréat du prix de thèse AFRIF

Dates importantes :
– Ouverture de la soumission des articles : 13 janvier 2025
– Fermeture de la soumission des articles : 14 février 2025
– Notification aux auteurs : 2 avril 2025
– Version finale des articles :18 avril 2025
– Ouverture des inscriptions : 3 avril 2025
– Inscription non majorée : Avant le 2 mai 2025
– Dates de la conférence : 9 – 13 Juin 2025

Liste des thèmes :
– vision et géométrie
– vision dynamique et asservissement visuel
– vision active (stratégie de perception et d’action)
– vision robotique
– réalité virtuelle
– modélisation 3D
– analyse du mouvement et de scènes
– suivi visuel
– modèles déformables
– reconnaissance
– apprentissage
– classification
– interprétation
– indexation multimédia
– segmentation
– compression

Pour toute question sur ce colloque, merci de nous envoyer un email : orasis2025@sciencesconf.org

En vous souhaitant nombreux au Croisic !

======

Ayoub Karine (MCF à l’Université Paris Cité)
Thibault Napoléon (EC à l’ISEN Brest)
Pour le comité d’organisation de la conférence ORASIS 2025

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Annotation sémantique de documents multi/cross lingues par apprentissage frugal non supervisé

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Pôle uiversitaire Léonard de Vinci, DVRC, La défen
Durée : 6 mois
Contact : n.mellouli@iut.univ-paris8.fr
Date limite de publication : 2025-02-28

Contexte :
Les données textuelles envahissent nos quotidiens personnels et professionnels. La recherche de documents pertinents répondant à des besoins métier devient une tâche très fastidieuse et nécessite un investissement en termes d’effort humain à annoter ces documents pour pouvoir les exploiter correctement. L’annotation sémantique de documents multimodaux est un sujet de recherche brûlant que nous proposons d’attaquer selon l’angle des résumés extractifs. Nous supposons qu’une annotation ou une étiquette n’est pas suffisante pour indexer sémantiquement un document. En revanche, un résumé peut représenter collectivement les informations les plus importantes ou les plus pertinentes du contenu d’origine. Par conséquent, toute opération qui émane de l’exploration des documents d’origines telles que la classification, la recherche, la segmentation, ou encore la catégorisation des documents peut être effectuée sur la base du résumé dès lors que ce dernier soit fidèle à l’information d’origine. Ce niveau de fidélité peut être évalué par le biais de différentes métriques qui seront sélectionnées d’une manière automatique en fonction de la tâche.

Sujet :
L’évaluation des systèmes de traitement automatique de la langue a toujours été un défi majeur pour les chercheurs. En effet ces tâches reposant sur des compétences abstraites de haut niveau, avant d’être difficile à réaliser elles sont tout simplement difficile à évaluer.
Par exemple, afin d’évaluer un simple système de résumé automatique de texte, il est nécessaire de demander à des experts de créer des résumés à la main. Cependant, contrairement à une tâche d’annotation d’images certes fastidieuse mais simple, dans le cas du résumé, l’expert doit comprendre finement les documents sources afin d’en générer une synthèse fidèle. Une fois ces résumés de référence obtenus, il est nécessaire de développer une méthodologie afin de pouvoir évaluer la qualité des résumés générés automatiquement.

La métrique la plus utilisée ROUGE2(Lin, 2004) va simplement compter le nombre de bi-grammes commun entre le résumé de référence et le résumé automatique. Plus un résumé aura de bigrammes communs avec le résumé de référence plus le système sera considéré comme performant. Avec l’essor de l’apprentissage profond, ces métriques ont été améliorées par exemple avec le BERTScore(Zhang & Al, 2020) qui permet de comparer les phrases au niveau vectoriel et ainsi identifier des phrases sémantiquement proches même si elles diffèrent complètement syntaxiquement (par l’usage de synonyme par exemple). Certaines méthodes vont encore plus loin en faisant complètement abstraction de toute annotation de référence. C’est le cas de la métrique BARTScore (Weizhe & Al, 2021). Celles-ci ont été testées dans différentes applications et pour différentes tâches. Dans ce travail, nous visons leur exploitation pour une tâche d’extraction de résumés à partir de documents thématiques. Deux contextes applicatifs seront étudiés dans le cadre de ce stage. Ce travail portera sur le tourisme et s’intéresse particulièrement à l’analyse des sentiments des visiteurs basés sur les données collectées à partir de hotel.com, TripAdvisor, Booking, etc.
Les hypothèses suivantes que nous souhaitons explorer dans ce stage sont comme suit :

1) Ces métriques permettent de construire des résumés extractifs synthétiques pertinents et porteurs de sens. Cependant le cadre méthodologique de ces métriques ne permet pas d’expliquer le processus d’extraction. Or si nous cherchons à annoter sémantiquement les documents via les résumés, il est nécessaire de tracer la pertinence des mots/ phrases.

2) Via les métriques, la quantification de l’hallucination des LLM sera étudiée.

3) Ces métriques indépendantes de toute annotation peuvent être adaptées au cas de résumés génératifs de documents textuels et amorcer une boucle automatique d’amélioration de ces modèles.

4) Ces métriques peuvent être étendues aux cas de résumés génératifs textuels d’images en se basant sur les prompts et sur les commentaires associés aux images.

En perspective, ce travail pourra être envisagé pour l’étendre au résumé d’images en s’inspirant de ces mêmes métriques

Profil du candidat :
Master 2 Recherche en IA-NLP,

Formation et compétences requises :
Les compétences attendues :
Le stagiaire sera en mesure de comprendre l’état de l’art récent sur les métriques d’évaluation et l’apprentissage frugal. De proposer une implémentation modulaire de ces métriques et de les tester sur des jeux de données de benchmark pour se comparer mais également de construire un jeu de données images et textes pour tester les limites de nos hypothèses.

Adresse d’emploi :
Campus Cyber, 5-7, Rue Bellini, 92800 Puteaux

Document attaché : 202412181042_SujetStagede5A_2024_2025_DVRC.pdf

Robust Tensor Networks Algorithms for Quantum Computing

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CRISTAL et PhLAM
Durée : 36 mois
Contact : remy.boyer@univ-lille.fr
Date limite de publication : 2025-02-28

Contexte :
Abstract: Quantum computing is at the cutting edge of technological innovation, offering the potential to solve complex problems that classical “binary” computers cannot address. Ten- sor algebra, with its comprehensive mathematical framework, offers crucial tools for modeling and approximating large multidimensional datasets. This thesis seeks to investigate the interplay between tensor networks and quantum computing by proposing original, robust (to decoherence of qubits) quantum algorithms that utilize tensor structures to improve computational efficiency and capabilities. This research requires a multidisciplinary understanding of quantum physics and linear algebra. This thesis topic will benefit from the complementary expertises of Remy Boyer (CRISTAL/SIGMA) for the multilinear algebra aspect and Giuseppe Patera (PhLAM, Quantum Information team) for the quantum physics aspect.

Key-words: quantum processor, low-rank decomposition, tensor network, qubits, coherence, curse of dimensionality

Contact: For application, please contact
• Remy BOYER, University of Lille, CRISTAl Lab. , remy.boyer@univ-lille.fr
• Giuseppe PATERA, University of Lille, PhLAM Lab. , giuseppe.patera@univ-lille.fr

Sujet :
Why quantum processors are attractive solutions ?

1. Quantum processors are based on the superposition principle [1]. In brief, unlike classical bit-based processor where the information is encoded in two states “0 excluding 1” or “1 excluding 0”, quantum bits (qubits) |0⟩ and |1⟩ can exist in multiple states simultaneously according to a linear combination of the qubits alphabet α|0⟩ + β|1⟩

2. Quantum processors are based on the entanglement principle. Qubits can be entangled or correlated, meaning the state of one qubit is directly related to the state of another, regardless of a phase parameter. Consequently, α and β cannot be reduced to a probabilistic point of view as the qubit probabilities but include the relative interdependence in the form of a phase-relation between the two states |0⟩ and |1⟩. This means that knowing the state of one qubit allows to instantly deduce the state of the other.
The two above principles (superposition and entanglement) allow quantum algorithms to perform many calculations in parallel. This leads to potential speed-ups for many important problems.

Tensor-based processing
Tensor algebra is a powerful mathematical framework [6] that extends the concepts of scalars, vectors, and matrices to higher dimensions, known as tensors. Tensor algebra allows the compact (i.e. low-rank) representation of massive data in multidimensional arrays. The applications are for instance Physics, Machine Learning, Data Science, Computer Graphics, Robotics and Control Systems, etc.

Multi-Linear algebra and quantum systems

1. Entanglement and Singular Value Decomposition (SVD) are strongly linked [3]. SVD gives the degree of communication between two subsystems and the entanglement is measured by the number of nonzero singular values of a particular matrix associated to the reshaping of the quantum state.

2. TNs and quantum computing are highly interconnected concepts [2]. They provide an efficient way to graphically represent complex quantum states into connected core tensors (3-order tensors). A quantum state of multiple qubits can be expressed as a graph of core tensors, capturing entanglements between qubits in a more compact form. Some quantum algorithms can benefit from the structure of tensor networks. For example, Matrix Product States (MPS) [7] and Projected Entangled Pair States (PEPS) utilize tensor networks to efficiently represent and manipulate quantum.

Quantum architecture and decoherence
A typical Quantum architecture is composed by three main steps:

1. Data encoding via Tensor Networks (quantum state preparation),

2. data processing (multi-qubit quantum gates),

3. measurement (quantum state tomography).
The proposed work will be mainly focused on step 1 with respect to the constraints of the two other steps. A major drawback of the quantum framework is the decoherence of qubits. Qubits are highly susceptible to environmental interference, which can cause them to lose their quantum state or also their coherence. This phenomenon is known as decoherence [10]. Briefly, decoherent quantum computing is classical “bit”-based computing.

Research Objectives
1. Investigate TN in the context of the curse of dimensionality: One of the objectifs of this work is to explore the interest of the different TN topologies focusing on their capability to mitigate the “curse of dimensionality” [4].

2. Develop novel on-line/streaming algorithms: Batch-mode processing is quite inefficient for streaming data. So, there is a need to propose adaptive (over time) implementation of TN [8].

3. Propose new TN-based algorithm robust to qubits decoherence. Robustness allows to increase the number of qubits in a quantum system while maintaining performance (“scal- ability”).

4. The SVD is the basic building block of TN algorithms. Recently, randomized methods [9] also known under the name of “compressed sensing” [5] allow to speed-up the SVD at the price of a bounded error.

References
[1] A. Steane, Quantum computing. Reports on Progress in Physics, 61(2), 117, 1998.
[2] R. Orus, Tensor networks for complex quantum systems. Nature Reviews Physics, 1(9), 2019.
[3] R. Orus, A practical introduction to tensor networks: Matrix product states and projected entangled pair states, Annals of Physics, Vol. 349, 2014.
[4] A. Cichocki; N. Lee; I. Oseledets; A.-H. Phan; Q. Zhao; D. P. Mandic, Tensor Networks for Dimensionality Reduction and Large-scale Optimization, Foundations and Trends in Machine Learning, Vol. 9, No. 4-5, 2016.
[5] D.L. Donoho, Compressed sensing, IEEE Transactions on IT. 52 (4), 2006.
[6] T. G. Kolda and B. W. Bader, Tensor Decompositions and Applications, SIAM REVIEW, Vol. 51, No. 3, 2009.
[7] Y. Zniyed, R. Boyer, A. De Almeida, and G. Favier. A TT-based hierarchical framework for decomposing high-order tensors. SIAM Journal on Scientific Computing, vol. 42, 2020.
[8] L. T. Thanh, K. Abed-Meraim, N. L. Trung and R. Boyer, “Adaptive Algorithms for Track- ing Tensor-Train Decomposition of Streaming Tensors,” 28th European Signal Processing Conference (EUSIPCO), 2021.
[9] N. Halko, P.G. Martinsson, and J.A. Tropp, Finding structure with randomness: Probabilistic algorithms for constructing approximate matrix decompositions. SIAM review, 53(2), 2011.
[10] M. L., Hu, and H. Fan, Robustness of quantum correlations against decoherence. Annals of Physics, 327(3), 2012.

Profil du candidat :
This research requires a multidisciplinary understanding of quantum physics and linear algebra.

Formation et compétences requises :

Adresse d’emploi :
Campus Scientifique de Lille

Document attaché : 202412170930_phd_tensor_quantum.tex