
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LASTIG, Univ Gustave Eiffel, IGN-ENSG
Durée : 5 mois
Contact : nathalie-f.abadie@ign.fr
Date limite de publication : 2023-02-01
Contexte :
Ce stage s’inscrit dans le projet ANR SODUCO qui vise à étudier l’évolution de la structure spatiale de Paris en lien avec les pratiques sociales de la population, sur la période allant de la Révolution Française au début du 20ème siècle. Le projet exploite deux types de sources historiques rassemblées en deux corpus:
• un corpus spatial : plans et cadastres, qui représentent les structures urbaines (rues, bâti, etc.)
• un corpus social : “annuaires du commerce”, sorte de “pages jaunes” avant l’heure, qui contiennent les noms, statuts sociaux, activités professionnelles et adresses d’une partie des parisiens.
Un premier stage a permis de proposer une approche pour l’appariement des entrées représentant un même commerce d’une année à l’autre. Cette dernière a été appliquée aux métiers de la photographie, qui représentent une faible portion du corpus des annuaires.
Sujet :
Ce sujet de stage comporte un objectif méthodologique principal : proposer et mettre en œuvre une approche reproductible et qui passe à l’échelle pour identifier des relations d’équivalence entre les principales entités nommées extraites dans les annuaires du commerce parisien du XIXe siècle et qui représentent un même élément du monde réel.
Il comporte trois objectifs applicatifs: produire trois graphes spatio-temporels permettant le suivi des commerces, des adresses et des activités parisiennes au XIXe siècle.
Profil du candidat :
Master 2 ou troisième année d’école d’ingénieur en informatique, ou en géomatique.
Formation et compétences requises :
– Données spatio-temporelles,
– Résolution d’entités nommées, liage, appariement,
– Graphes de connaissances géohistoriques,
– Développement Python,
– Un intérêt pour l’histoire sociale est un plus.
Adresse d’emploi :
Institut National de l’Information Géographique et Forestière
73 avenue de Paris
94160 Saint-Mandé
Document attaché : 202212072201_SoDUCo2022NELInternship.pdf
Offre en lien avec l’Action/le Réseau : DOING/– — –
Laboratoire/Entreprise : LIFO – Equipe Systems and Data Security
Durée : 5 à 6 mois
Contact : adrien.boiret@insa-cvl.fr
Date limite de publication : 2023-02-01
Contexte :
Cette offre s’inscrit dans le cadre du projet Semantic Networks of Data: Utility and Privacy (SENDUP) qui étudie la sécurité et la vie privée sur les bases de données sous forme de graphes (e.g. RDF) soumises à des contraintes sémantiques.
Sujet :
Data safety and privacy are concerns currently receiving intense attention, notably through the introduction of GDPR reglementations that aim to ensure data collection, treatment, and publication never trespass on a person’s right to privacy.
The notion of differential privacy (DP) grew popular as a yardstick
of privacy for data publication processes, where a database containing sensitive information can still answer queries without compromising privacy.
The guaranty provided by DP is that it is difficult to differentiate between a graph and one of its neighbours (i.e. the same graph differing on exactly one information) when observing the answer to a query. This is a convincing guaranty of privacy, as it means that a graph yields results so similar to its neighbours’, that an attacker cannot deduce with certainty any specific information
in a graph.
However, this guaranty works best under the assumption
that any graph has neighbours to “hide behind”. If a graph is isolated from any of its neighbours, then the guaranty provided by DP weakens.
We posit that such situations can arise if the graph databases we consider are known to follow structural constraints (e.g. “every patient has a doctor”) or semantic constraints (e.g. “Dr Wilson is an oncologist”). If all possible graphs must follow specific rules, then it is possible that some graphs have no neighbours that an attacker could confuse them with.
In this internship, we aim to formalise and evaluate through experimentation the damage that prior knowledge of a target graph’s schema can make on the privacy of a DP-guarantying process.
Profil du candidat :
Etudiant en Master Bac+5 en Informatique ou équivalent.
Intérêt pour les bases de données sous forme de graphes et la sécurité des données.
Capable de travailler seul et en équipe.
Formation et compétences requises :
Etudiant en Master Bac+5 en Informatique ou équivalent.
Capacité à lire et écrire des documents scientifiques en anglais.
Capacité à coder dans un langage de programmation (préférence pour Java).
Adresse d’emploi :
INSA Centre Val de Loire, 88 boulevard Lahitolle 18022 Bourges
Document attaché : 202212081435_Stage_SDS_SemanticAttack.pdf
Offre en lien avec l’Action/le Réseau : SimpleText/– — –
Laboratoire/Entreprise : Centre Européen de Réalité Virtuelle (ENIB) / HCTI
Durée : 5-6 mois
Contact : liana.ermakova@univ-brest.fr
Date limite de publication : 2023-02-01
Contexte :
Ce stage participe au projet JOKER qui vise à faire progresser l’automatisation de la traduction des jeux de mots en fournissant un corpus parallèle (c’est à dire multilingue) approprié [1].
Alors que la traduction moderne est fortement aidée par des outils technologiques, pratiquement aucun n’a de support spécifique pour les jeux de mots. En effet, la plupart des outils de traduction basés sur l’IA nécessitent une qualité et une quantité de données d’entraînement (par exemple, des corpus parallèles) qui ont toujours fait défaut pour les jeux de mots. L’objectif du projet JOKER est de construire automatiquement un corpus parallèle de jeux de mots en entraînant un classificateur basé sur l’IA à détecter automatiquement les instances de jeux de mots et à les aligner avec leurs traductions.
Références
[1] L. Ermakova et al., « Overview of JOKER@CLEF 2022: Automatic Wordplay and Humour Translation Workshop », in Experimental IR Meets Multilinguality, Multimodality, and Interaction, Cham, 2022, p. 447‑469.
Version ouverte: https://ceur-ws.org/Vol-3180/
Sujet :
Objectifs du stage (liste indicative):
– Détection des jeux de mots: Une première étape de détection sera de traiter les données de sources électroniques (pdf, html etc) variées sélectionnées pour vous (romans, essais, etc.) pour augmenter les corpus disponibles, avec des méthodes d’intelligence artificielle.
– Alignement des traductions avec les algorithmes traditionnels ou avec les modèles neuronaux
Interprétation des jeux de mots en français et en anglais
– Augmentation des corpus monolingues
Environnement technique (liste indicative):
– Python, Pandas, NLTK, expressions régulières
– bibliothèques pour traiter différents formats de fichiers (pdf, epub,…)
– De grands modèles pré-entraînés:
Google mT5 (https://github.com/google-research/multilingual-t5)
BLOOM (https://huggingface.co/bigscience/bloom)
Profil du candidat :
– M1 informatique ou équivalent;
– intérêt pour les projets de recherche;
– la maîtrise de la langue française et anglaise est souhaitable;
– les connaissances de Python, Pandas, expressions régulières sont souhaitables;
– le sens de l’humour est souhaitable.
Formation et compétences requises :
– M1 informatique ou équivalent;
– la maîtrise de la langue française et anglaise est souhaitable;
– les connaissances de Python, Pandas, expressions régulières sont souhaitables.
Adresse d’emploi :
Centre Européen de Réalité Virtuelle (ENIB), 25 rue Claude Chappe, Plouzané, France
Document attaché : 202212081524_Stage JOKER 2023 (1).pdf
Offre en lien avec l’Action/le Réseau : DOING/– — –
Laboratoire/Entreprise : LIFO – Equipe Systems and Data Security
Durée : 5 à 6 mois
Contact : adrien.boiret@insa-cvl.fr
Date limite de publication : 2023-02-01
Contexte :
Cette offre s’inscrit dans le cadre du projet Semantic Networks of Data: Utility and Privacy (SENDUP) qui étudie la sécurité et la vie privée sur les bases de données sous forme de graphes (e.g. RDF) soumises à des contraintes sémantiques.
Sujet :
Data safety and privacy are concerns currently receiving intense attention, notably through the introduction of GDPR reglementations that aim to ensure data collection, treatment, and publication never trespass on a person’s right
to privacy.
The notion of differential privacy (DP) grew popular as a yardstick
of privacy for data publication processes, where a database containing sensitive information can still answer queries without compromising privacy.
To facilitate the creation of processes that guaranty DP in graph databases, one method is projection, that limits the degree of graphs by selecting for each node a bounded number of edges.
However, if the choice of edges to maintain is arbitrary, the impact of this method on the accuracy of the published results
is too variable to guarantee accuracy.
In this internship, we aim to develop methods that allow the priorization of certain edges above others in the projection process, as to improve the accuracy of query results. This optimization would be based on prior knowledge of one
or several queries we know to be of interest.
Profil du candidat :
Etudiant en Master Bac+5 en Informatique ou équivalent.
Intérêt pour les bases de données sous forme de graphes et la sécurité des données.
Capable de travailler seul et en équipe.
Formation et compétences requises :
Etudiant en Master Bac+5 en Informatique ou équivalent.
Capacité à lire et écrire des documents scientifiques en anglais.
Capacité à coder dans un langage de programmation (préférence pour Java).
Adresse d’emploi :
INSA Centre Val de Loire, 88 boulevard Lahitolle 18022 Bourges
Document attaché : 202212081426_SDS_Stage_Pertinence.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIFAT – Université de Tours
Durée : 5 à 6 mois
Contact : cyril.derunz@univ-tours.fr
Date limite de publication : 2023-02-04
Contexte :
Ce stage s’inscrit dans le cadre de la tâche visualisation de données du projet JUNON. Le sujet de la tâche est le suivant.
L’analyse des données environnementales est un enjeu majeur pour l’étude des dynamiques des phénomènes environnementaux dans leur territoire (spatialité). Afin de mieux appréhender ces phénomènes et faciliter leur observation, il semble important de fournir une suite automatisée de traitements allant de l’analyse au rendu visuel. Relever ce défi est essentiel afin de limiter la charge cognitive des experts impliqués dans l’exploration interactive tout en offrant des informations de contextualisation des phénomènes observés/observables pour une meilleure explicabilité.
Cette dernière est importante tant pour les experts que pour les décideurs notamment pour l’analyse des risques (e.g. sécheresse, inondations, pollutions). Il s’agira de proposer des outils visuels permettant une exploration spatiale et temporelle de données permettant de naviguer dans les données issues des capteurs (e.g. capteurs piézométriques) selon plusieurs vues complémentaires tout en ayant à disposition directe des données contextualisant leur analyse. Les outils proposeront aussi des tableaux de bords différenciés pour les décideurs mettant en évidence les possibles risques. Nous souhaitons dans cette tâche répondre aux verrous scientifiques liés aux données environnementales autour de la détection automatique de signaux faibles pour l’identification de phénomènes émergents, de l’explicabilité des phénomènes par la construction de résumés visuels informant sur les possibles facteurs, de la gestion des flux de données et donc le choix des données et des agrégations.
Sujet :
Les données à visualiser sont des séries temporelles multivariées géolocalisées décrivant un territoire. Elles peuvent représenter de gros volume de données. Nous cherchons à construire des méthodes de regroupement prenant en considération les relations spatiales et topologiques.
Objectifs du stage :
État de l’art sur la visualisation et le clustering de séries spatio-temporelles.
Proposition d’un prototype adapté aux données du projet JUNON.
Profil du candidat :
Etudiant.e en master ou en école d’ingénieur en informatique (bac +5 prioritairement, ou bac +4).
Formation et compétences requises :
Etudiant en master ou école d’ingénieur en informatique.
Des connaissances en visualisation, information géographique, analyse de série de données temporelles ou spatiotemporelles sont des plus.
Adresse d’emploi :
34 avenue Portalis, 37000 Tours
ou
3 place Jean Jaures 41000 Blois
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LAMSADE – PSL Research University – Universit{
Durée : 4 à 6 mois
Contact : maude.manouvrier@lamsade.dauphine.fr
Date limite de publication : 2023-02-09
Contexte :
{Data dependencies : relationships or connections between different variables in a dataset. Understanding these dependencies is crucial and has a number of applications.
{Data profiling for Machine Learning: Understanding data dependencies is critical for creating accurate and effective machine learning models. The quality of the input data has a direct impact on the accuracy of the model, and understanding data dependencies helps ensure that the data is suitable for use in machine learning.
Data mining: Data dependencies can help you identify patterns and relationships in the data that may not be immediately obvious. These patterns can be used to make predictions and classify data, making it useful in various data mining tasks such as association rule mining and clustering.
Sujet :
This internship will build upon the recent research in data dependency mining in dynamic settings. As a member of a dynamic team, the student will be exploring innovative ways to compute data dependencies in situations where the data is transformed through a data preparation pipeline. The goal is to assess the impact of this preparation process on the dependencies within the data, as well as its overall quality.
The subject of data dependencies is a critical and fascinating aspect of machine learning and AI, providing students with the opportunity to gain practical skills and explore cutting-edge technologies that are shaping the future of the field. The demand for professionals with skills in machine learning and AI is growing rapidly, and understanding data dependencies is a valuable skill for anyone looking to build a career in this field in both academia and industry. On this point, it is worth noting that the internship is likely to lead to a PhD on a related topic.
Profil du candidat :
We seek for excellent and highly motivated student with a background in Computer Science
having good knowledge of database theory and good programming skills (Python or Java).
Please send the following material in a single PDF document before February 20th, 2023:
– fully detailed CV,
– academic records (master’s degree or equivalent),
– recommendation(s) and supporting letter(s).
Formation et compétences requises :
Background in Computer Science
Good knowledge of database theory and good programming skills (Python or Java).
Adresse d’emploi :
LAMSADE – PSL Research University – Universit{‘e} Paris-Dauphine, Paris, France
Document attaché : 202302091126_IntershipLamsadeDataDependencieInPiplines.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : ETIS UMR 8051
Durée : 6 mois
Contact : maria.malek@cyu.fr
Date limite de publication : 2023-02-21
Contexte :
Nous explorons dans nos travaux actuels portant sur l’analyse des médias sociaux, la combinaison de méthodes classiques d’exploration d’opinion avec l’analyse des réseaux sociaux et son impact sur la formation et la propagation d’opinion afin de construire un modèle d’opinion cohérent.
Afin d’étudier l’impact des utilisateurs influents (nœuds influents), nous intégrons dans un premier temps plusieurs facteurs d’influence extraits du réseau dans le processus d’exploration d’opinions. Ces facteurs sont généralement calculés en utilisant différentes mesures de centralité comme le degré, la proximité, l’intermédiarité, la centralité PageRank, etc.
Nous définissons et étudions ensuite la notion de la stabilité d’opinion au sein des réseaux égocentriques autour des influenceurs et au sein des communautés détectées, notre objectif étant de détecter la modification d’opinion pour les deux types de sous-réseaux.
Nous analysons les communautés obtenues afin de comprendre les opinions émergeantes à partir de ces communautés non seulement en fonction des profils utilisateurs mais aussi en fonction d’éléments topologiques. Nous souhaitons également proposer des indicateurs concernant la stabilité des opinions et d’autres liés à leurs changements.
Sujet :
Le but de stage est de proposer et d’intégrer une méthode d’explicabilité dans les algorithmes d’analyse d’opinions afin de produire des explications émergeantes qui combinent des informations nodales (comme le profil d’utilisateur) et topologiques extraites de la structure du graphe de propagation des opinions.
En intégrant une méthode d’explicabilité adéquate, nous souhaitons rendre plus compréhensible également les résultats concernant la polarité de l’opinion trouvée au niveau des utilisateurs et au niveau des groupes. De même, le modèle doit être capable d’expliquer les changements d’opinion détectés en lien avec les informations extraites du réseau de propagation et les séquences d’actions entreprises (par exemple : tweets, retweets, réponses) menant à ce changement.
Profil du candidat :
Master 2 ou dernière année d’école d’ingénieur
Formation et compétences requises :
Bonne connaissance en Machine Learning et en programmation Python.
Adresse d’emploi :
2 Av. Adolphe Chauvin, 95300 Pontoise, bâtiment A, 5 étage étage, laboratoire ETIS.
Document attaché : 202302210943_Stage_ETIS_M2_Explicabilite_AnalyseOpinion.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire d’Informatique et Systèmes LIS – UMR C
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@univ-amu.fr
Date limite de publication : 2023-02-28
Contexte :
Dans le cadre d’un projet collaboratif de recherche biomédicale sur l’endocardite infectieuse (EI) nous souhaitons développer une approche par réseaux profonds (deep-learning) pour la segmentation d’images de microscopie électronique à balayage dans le but d’analyser l’ultrastructure de valves cardiaques. Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes, expert dans l’analyse d’image, et le laboratoire Mephi, expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité. L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. Malgré l’amélioration des stratégies diagnostiques et thérapeutiques, l’incidence et la gravité de la maladie semblent rester inchangées au fil des ans. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon. Par une approche innovante par MEB, a démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux. Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse
Sujet :
L’objectif du stage est de développer une méthode à base de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Pour cela, il s’agira dans un 1er temps de définir la meilleure stratégie de segmentation en tenant compte des différentes résolutions disponibles. Dans un 2nd temps il s’agira de choisir une architecture de réseaux de neurones profonds avec un « pipeline » de traitements adaptés.
Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale. La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées.
Formation et compétences requises :
Une formation de master ou ingénieur avec des compétences en traitement d’images est attendue. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées.
Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’) ou dans ceux de l’équipe MEPHI de l’IHU Méditerranée Infection, selon les besoins.
Aix-Marseille Université – Bâtiment Polytech GI,
Campus scientifique de St Jérôme – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20
Document attaché : 202211181337_Sujet_Master2_SegmentationDL-SEM_2023.pdf
Offre en lien avec l’Action/le Réseau : DOING/– — –
Laboratoire/Entreprise : SAMOVAR – Télécom SudParis
Durée : 6 mois
Contact : julien.romero@telecom-sudparis.eu
Date limite de publication : 2023-02-28
Contexte :
In this internship, we propose to study the problem of financial forecasting, i.e., predicting the future variation of the price of a financial instrument, using deep learning. The student will work on a new data source with a finer granularity than existing datasets. Because of the difficulty of obtaining data, previous works focused on price prediction at the scale of a day, a week, or a month. Our new dataset contains intraday information. Therefore, we can predict the price within a day and use multi-scale analysis. Besides, our new dataset contains different kinds of financial instruments (FOREX, crypto, options, futures) and additional information about the companies (description, financial reports, dividends).
Sujet :
The intern will start with state-of-the-art methods used for financial forecasting. The goal will be to study the existing datasets and models and to find their limitations. In parallel, they will get used to the structure of the data. Then, we will propose a new method to compare to other baselines. The end goal of this project is to publish a paper at an international conference.
Profil du candidat :
The intern should be involved in a master’s program and have a good knowledge of machine learning, deep learning, and data processing. A good understanding of Python and the standard libraries used in data science (scikit-learn, PyTorch, pandas) is also expected. A previous experience with finance is appreciated but not required for this internship.
Formation et compétences requises :
The intern should be involved in a master’s program and have a good knowledge of machine learning, deep learning, and data processing. A good understanding of Python and the standard libraries used in data science (scikit-learn, PyTorch, pandas) is also expected. A previous experience with finance is appreciated but not required for this internship.
Adresse d’emploi :
19 place marguerite perey, 91120 Palaiseau
Document attaché : 202301301408_stage_finance.pdf
Offre en lien avec l’Action/le Réseau : MACLEAN/Doctorants
Laboratoire/Entreprise : David, UVSQ
Durée : 6 mois
Contact : mustapha.lebbah@uvsq.fr
Date limite de publication : 2023-02-28
Contexte :
voir le fichier pdf
Sujet :
voir le fichier pdf
Handling missing values based on Deep learning and Attention Mechanism
Profil du candidat :
End of engineering degree, M2 in data science, statistics and/or artificial intelligence. Good experience in programming, especially with the PyTorch/deeplearning4j framework.
Formation et compétences requises :
End of engineering degree, M2 in data science
Adresse d’emploi :
aboratoire David, UFR des sciences, 45 avenue des
Etats-Unis, 78035 Versailles
Document attaché : 202211080645_internshipuvsq.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LAMSADE
Durée : 3-6 mois
Contact : daniela.grigori@dauphine.fr
Date limite de publication : 2023-02-28
Contexte :
Emails play, in the personal and particularly in the professional context, a central role in activity management. Emails can be harvested and re-engineered for understanding and analyzing undocumented business process activities and their corresponding metadata. By applying ML and NLP techniques on emails, information about activities [8], their metadata and their organization into process instances can be derived. These mined data can be used by exiting process mining tools to discover and analyze the inherent business processes executed by exchanging messages. Process mining is a recent research topic that applies artificial intelligence and data mining techniques to process modelling and analysis [1,2].
Sujet :
The aim of this internship is to propose techniques for mining business activities and related data from emails in order to improve and extend our recent work [3-7] by applying machine learning techniques [9].
Profil du candidat :
We seek for excellent and highly motivated student with a background in Computer Science
having good knowledge of NLP, ML and good programming skills (Python).
Formation et compétences requises :
M2
Adresse d’emploi :
Université Paris Dauphine PSL
Document attaché : 202301310904_Proposition_stage_EmalMining_2023.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire d’Informatique et Systèmes, LIS UMR CN
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@univ-amu.fr
Date limite de publication : 2023-02-28
Contexte :
Les troubles de la statique pelvienne représentent un enjeu de santé publique. Ils regroupent un ensemble de pathologies associant une perte des rapports anatomiques normaux des organes pelviens, et une altération dramatique de la qualité de vie des malades. Ces pathologies sont handicapantes à des degrés variés mais leur physiopathologie reste encore mal connue ce qui complique leur prise en charge. De nouvelles séquences d’acquisition IRM, associées à une reconstruction adaptée, ont permis la visualisation 3D des organes en mouvement. Des résultats probants ont été récemment obtenus et publiés pour l’observation de la vessie (Figure) et il s’agit, dans le cadre du stage, de s’intéresser aux autres organes pelviens. Ce projet se développe en collaboration avec le CRMBM, pour la réalisation de séquences IRM ultra rapides adaptées à l’observation souhaitée.
Sujet :
Des acquisitions multi-planaires sont réalisées dans des plans non classiques ce qui complique la reconnaissance des organes. Ainsi la segmentation des principaux organes impliqués est une étape primordiale mais difficile. Des architectures de de réseaux de neurones seront évaluées en comparaison avec la référence, U-Net (Mask-RCNN, Retina-Net). Un modèle géométrique 3D des organes peut ensuite être recalé sur les contours segmentés. Il s’agit alors de proposer une stratégie qui optimise à la fois la séquence d’acquisition et les modèles géométriques des surfaces des organes observés. Ces modèles géométriques permettront alors une caractérisation quantitative des déformations. Les problématiques de recalage, de segmentation et de modèles 3D, au cœur du projet, seront abordées selon les compétences et préférences du stagiaire.
Profil du candidat :
Le candidat ou la candidate sera intéressé(e) par un projet pluridisciplinaire et par l’imagerie médicale. Les domaines abordés concernent les réseaux de neurones profonds, la segmentation d’IRM et la reconstruction 3D. Des compétences en mathématiques appliquées seront particulièrement appréciées. Une expérience de la programmation avec l’environnement python (PyTorch) est attendue. Le stage aura une durée de 4 à 6 mois avec la gratification d’usage.
Formation et compétences requises :
De formation master ou ingénieur avec des compétences en traitement des images.
Adresse d’emploi :
Le stage se déroulera à Marseille essentiellement au laboratoire d’informatique et des systèmes (LIS) dans l’équipe Images & Modèles sur le campus de St Jérome. Le LIS UMR 7020 fédère plus de 375 membres. La recherche y est structurée au sein de pôles (calcul, science des données, analyse et contrôle des systèmes, signal et image), et centrée sur les activités dans les domaines de l’informatique, de l’automatique, du signal et de l’image.
Aix-Marseille Université
Campus scientifique de St Jérôme – Bâtiment Polytech’ GI – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20
Document attaché : 202211181327_Sujet_Master2_DL&Reconstruction3D_2023.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LISTIC – Laboratoire d’Informatique, Systèmes, Tr
Durée : 4-6 mois
Contact : faiza.loukil@univ-smb.fr
Date limite de publication : 2023-02-28
Contexte :
L’énergie éolienne s’est développée rapidement ces dernières années et plusieurs solutions de prévision de la production des parcs éoliens basées sur l’apprentissage automatique apparaissent. Bien que ces modèles de prévision (Dione, 2018) (Aksoy, 2021) soient prometteurs, certains défis subsistent dans leur développement, notamment en matière de la perte de contrôle des données utilisées dans l’entraînement, de l’algorithme d’apprentissage automatique et de la
faible pertinence du modèle à cause de son caractère trop général.
Sujet :
L’apprentissage distribué, un paradigme de l’apprentissage automatique qui tend à s’imposer pour répondre aux problématiques de confidentialité des données et de décentralisation des calculs pour améliorer les performances, augmenter la précision et s’adapter à des données de masse. Il réduit les erreurs commises par la machine et aide les individus à prendre des décisions et des analyses éclairées à partir de grandes quantités de données. Ainsi, l’objectif de ce projet est la proposition d’un modèle d’apprentissage distribué pour la prévision de la production éolienne à l’aide d’un croisement entre des données de production provenant de parcs éoliens en France et des données de prévisions météorologiques.
Ce projet consiste à, dans un premier temps, étudier les solutions de prévision de la production éolienne par apprentissage automatique. Puis, dans un second temps, il vise à proposer une solution d’apprentissage distribué et comparer ses performances avec les solutions existantes. Les travaux qui porteront sur l’apprentissage distribué et les résultats issus de ce projet auront vocation à être le
plus générique possible de manière à pouvoir être réutilisés dans d’autres cas d’applications avec des données issus d’autres projets au sein du LISTIC.
Objectifs du stage :
1. L’étudiant.e étudiera l’état de l’art sur les solutions de prévision de la production éolienne par apprentissage automatique classique, en général et par apprentissage distribué, en particulier.
2. Il.elle développera une solution basée sur l’apprentissage distribué en s’appuyant sur des données de référence provenant de parcs éoliens situés en France.
3. Il.elle réalisera une analyse des performances du modèle proposé et une comparaison avec les solutions existantes. La valorisation des résultats obtenus fera l’objet d’une publication dans une conférence
internationale.
Références.
(Aksoy, 2021) Aksoy, B. &. (2021). Estimation of Wind Turbine Energy Production Value by Using Machine Learning Algorithms and Development of Implementation Program. Energy Sources, Part A: Recovery, Utilization, and Environmental Effects, 692-704.
(Dione, 2018) Dione, M. &.-L. (2018). Short-Term Forecast of Wind Turbine Production with Machine Learning Methods: Direct and Indirect Approach. International Conference on Time Series and Forecasting, 301-315.
Profil du candidat :
Connaissance en ingénierie des données et particulièrement en apprentissage distribué sont nécessaires.
Formation et compétences requises :
Master 2ème année / Ingénieur 5ème année.
Adresse d’emploi :
LISTIC – Polytech Annecy-Chambéry, Annecy-le-Vieux, France
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : CREATIS
Durée : 6 mois
Contact : michael.sdika@creatis.insa-lyon.fr
Date limite de publication : 2023-02-28
Contexte :
Contexte scientifique Dans le cadre d’une collaboration entre les laboratoire Ampère et CREATIS, nous
developpons un simulateur de chirurgie qui permettra l’apprentissage d’un geste à la fois courant et critique:
la ponction ventriculaire. Pour créer des patients virtuels pour le simulateur, nous devons repositionner
l’IRM d’un sujet quelconque sur l’IRM du sujet utilisé pour créer le crâne physique du simulateur (figure
1). Il faudra donc faire correspondre exactement les crânes des deux sujets tout en préservant l’anatomie du
patient virtuel.
Le recalage d’image est un outil permettant d’aligner des images entre elles. Par example sur la figure
2, elle permet de positionner, d’orienter voire de déformer les cerveaux des trois images de droite pour les
replacer dans le système de coordonnées de l’image de gauche. C’est souvent une étape préliminaire essentielle
pour l’étude de pathologie cérébrale basée sur l’imagerie.
Les outils classique de recalage sont souvent basée sur des approches itérative d’optimisation mathématique.
Ces méthodes donnent généralement de bons résultats mais peuvent parfois échouer. Pour palier à ce manque
de robustesse, de plus en plus de méthodes actuelles se basent sur des approches par pprentissage profond
[Boveiri].
Sujet :
Objectifs L’objectif du stage est d’abord de de mettre en place et d’entraı̂ner un réseau de neurones
permettant faire le recalage linéaire d’une image de cerveau sur un espace de référence standard. L’objectif
principale sera que l’estimation soit la plus robuste possible mais aussi que le réseau soit léger. On se basera
sur les résultats obtenus lors d’un stage précédent au cours duquel on se restreignait à des transformations
2D.
On devra ensuite faire la correspondance des crânes par un recalage déformable préservant l’anatomie du
patient. On pourra comparer ici les approches classique et par apprentissage.
Données: plusieurs jeux de données d’imagerie cérébrales publiques impliquant différentes pathologies,
protocoles d’acquisition et modalités sont déjà utilisés dans l’équipe et seront utilisés pour le stage. Une
solide procédure d’augmentation de données permettra d’améliorer encore la robustesse de notre méthode.
Profil du candidat :
Profil du Candidat Le candidat recruté devra avoir une formation dans un des domaines suivants et de
bonnes connaissances dans les deux autres:
• Deep learning
• Traitement d’images
• Mathématiques appliquées
Il devra aussi avoir de solides compétences en développement logiciel en pytorch et être en mesure
d’implémenter les méthodes proposées.
Merci d’envoyer vos candidatures avec CV, lettre de motivation, relevés de notes, lettres de recomman-
dation à michael.sdika[at]creatis.insa-lyon.fr.
Formation et compétences requises :
Profil du Candidat Le candidat recruté devra avoir une formation dans un des domaines suivants et de
bonnes connaissances dans les deux autres:
• Deep learnin)
• Traitement d’images
• Mathématiques appliquées
Il devra aussi avoir de solides compétences en développement logiciel en pytorch et être en mesure
d’implémenter les méthodes proposées.
Merci d’envoyer vos candidatures avec CV, lettre de motivation, relevés de notes, lettres de recomman-
dation à michael.sdika[at]creatis.insa-lyon.fr.
Adresse d’emploi :
Campus de la Doua, Villeurbanne
Document attaché : 202210221945_internship-registration-2023.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : ICube, Université de Strasbourg, CNRS
Durée : 6 mois
Contact : remi.allegre@unistra.fr
Date limite de publication : 2023-02-28
Contexte :
Le sujet proposé s’inscrit dans le contexte d’un projet de recherche de l’équipe Informatique Géométrique et Graphique du laboratoire ICube (Université de Strasbourg, CNRS) et de biophysiciens de l’Université Paris Diderot et de l’ENS Lyon. Le projet concerne l’étude des mouvements de croissance de plantes à partir de séquences de photographies prises depuis plusieurs points de vue.
Sujet :
Le sujet de stage porte sur l’estimation du flux optique et du flux de scène à partir à partir de séquences de photographies de plantes en croissance, en utilisant des approches par apprentissage profond.
Le sujet détaillé est disponible (en anglais) en suivant le lien ci-dessous :
https://igg.unistra.fr/People/allegre/Sujets/2022-2023-SuiviPlantes_Stage_M2_EN.pdf
Profil du candidat :
Un niveau M2 ou dernière année d’école d’ingénieur en informatique est requis, avec des connaissances de base en vision par ordinateur ou traitement d’images, ainsi qu’en apprentissage automatique.
Une ouverture vers le domaine d’application en biophysique est nécessaire pour pouvoir échanger avec les experts de la croissance des plantes.
Formation et compétences requises :
Un niveau M2 ou dernière année d’école d’ingénieur en informatique est requis, avec des connaissances de base en vision par ordinateur ou traitement d’images, ainsi qu’en apprentissage automatique.
Adresse d’emploi :
Le stage se déroulera dans les locaux de l’équipe Informatique Géométrique et Graphique du laboratoire ICube, situés sur le campus d’Illkirch, à proximité de Strasbourg (300 bd Sébastien Brant, 67412 Illkirch).
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Da Vinci Research Center(DVRC)
Durée : 6 mois
Contact : christophe.rodrigues@devinci.fr
Date limite de publication : 2023-03-01
Contexte :
L’utilisation de l’intelligence artificielle (IA) pour la cybersécurité ou plus spécifiquement pour la détection des logiciels malveillants est devenue un sujet de premier plan. Dans ce contexte, l’entreprise SitInCloud a développé Owlyshield, un des meilleurs modèles IA sur le marché pour la détection des rançongiciels, en disposant de plus de 115000 exécutables pour l’entraînement, un modèle avec plus de 3 millions(?)de paramètres et un taux de précision de 97%. Cependant, les logiciels malveillants ne cessent d’évoluer avec des techniques de plus en plus sophistiquées afin de déjouer les systèmes de détection.
Sujet :
L’objectif de ce stage est d’améliorer l’approche hybride qui combine l’analyse statique et l’analyse dynamique du code pour avoir des modèles plus fiables. L’analyse statique se base actuellement sur i) des caractéristiques extraites d’exécutables comme le nombre de sections, leurs tailles, les entropies, etc. et ii) des images qui représentent des exécutables.
Des biais existent sur les images utilisées pour les réseaux neuronaux convolutifs (CNN) car les exécutables de maliciels sont généralement plus petits et compressés. Quant à l’analyse comportemental ou dynamique, nous souhaitons extraire plus d’informations des séries temporelles, ce qui permettra une meilleure analyse du temps d’exécution du code. Enfin, une pondération des décisions statiques et dynamiques devrait être faite en fonction de la quantité de données comportementales disponibles.
Profil du candidat :
Candidat à l’aise avec le développement logiciel et intéressé par les techniques d’apprentissage profond.
Intéressé par la recherche en informatique, ce stage peut se poursuivre en thèse avec le partenariat de l’entreprise (SitInCloud).
Formation et compétences requises :
Deep Learning, Cybersécurité, Python, Rust, Analyse de programme
Adresse d’emploi :
Paris La Défense
Document attaché : 202301231103_SujetStageM2ApprocheHybrideDetectionRancongiciels.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIRMM/CIRAD
Durée : 6 mois
Contact : marianne.huchard@lirmm.fr
Date limite de publication : 2023-03-01
Contexte :
Le stage est réalisé dans le cadre de l’Institut de convergence # Digitag (https://www.hdigitag.fr/fr/).
Pour un producteur agricole, décider d’une pratique impose de considérer celles mises en place afin d’éviter de perturber l’équilibre du système. Il doit donc connaître la diversité des situations culturales. Par exemple, la littérature présente diverses solutions à base de plantes pour contrôler l’infestation d’une culture agricole par une population de bioagresseurs. Choisir une solution qui la repousserait peut la faire migrer vers une culture avoisinante peu attaquée. En comportant plus de 48000 descriptions d’utilisation de plantes à effet pesticide et antibiotique, la base Knomana [Silvie et al., 2021] peut permettre ce choix. Les plateformes logicielles RCAviz [Muller et al. 2022] et RCAvizIR permettent de naviguer dans cette base dont les connaissances ont été classées par l’Analyse de Concepts Relationnels. De façon à représenter fidèlement les données en plusieurs dimensions et faciliter leur interprétation par le producteur agricole, une solution consiste à les exprimer sous forme de règles d’implication multidimensionnelles, une méthode nouvelle issue de l’Analyse de Concepts Formels. Pour une relation ternaire connectant des bioagresseurs, des plantes qui les contrôlent et des cultures protégées, cette méthode permet par exemple d’énoncer les connaissances sous la forme « quand Bioag1 est contrôlé par plant1 sur culture1, alors Bioag1 est également contrôlé par plant2 sur culture1, et par plant3 sur culture2 ».
Sujet :
L’objectif du stage est de développer une approche et un prototype logiciel de visualisation de connaissances, exprimées sous forme de règles d’implication multidimensionnelles. Ces règles sont produites par un algorithme implémenté en Python. Nous développerons également une stratégie de présentation des règles à l’utilisateur incluant ses centres d’intérêt et d’après la sémantique du contenu des règles.
Profil du candidat :
Personne intéressée par l’ingénierie des connaissances, l’analyse visuelle (visual analytics) et à trouver des solutions alternatives aux pesticides et antibiotiques de synthèse pour l’agriculture biologique.
Formation et compétences requises :
Etudiante ou étudiant de Master 2 (informatique ou bioinformatique) ayant des compétences solides en programmation et en analyse de données.
Adresse d’emploi :
LIRMM, 161, rue Ada, 34095 Montpellier Cedex 05
Document attaché : 202210200644_SujetStage2022_2023.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIMOS at Institut Henri Fayol, Mines Saint-Étienne
Durée : 5 mois
Contact : antoine.zimmermann@emse.fr
Date limite de publication : 2023-03-01
Contexte :
Physical quantities form an important part of what is represented in scientific data, medical data, industry data, open data, and to some extent, various private data.
Whether it is distances, speeds, payloads in transportation, concentrations, masses, moles in chemistry, powers, intensities, voltages in the energy sector, dimensions of furniture, weights, heights of people, durations, and many others in health, there is a need to represent physical quantities, to store them, to process them, and to exchange them between information systems, potentially on a global scale, often on the Internet and via the Web.
Sujet :
In this internship, we seek to precisely define a way to unambiguously represent physical quantities for the Web of Data. More precisely, we will study the proposals made to encode physical quantities in the standard data model of the Semantic Web, RDF. We will be particularly interested in the use of a data type dedicated to this encoding, probably adapted from the proposal of Lefrançois & Zimmermann (2018) based on the UCUM standard.
Having established a rigorous definition of the data type (possibly its variants, if relevant), we will focus on implementing a module that can read/write and process physical quantities and their operations within the RDF data manipulation APIs, for the management, querying and reasoning with knowledge graphs containing physical quantities.
The ambition is that, on the one hand, the specification will become in a few years a de facto standard, before perhaps becoming a de jure standard; and that, on the other hand, the implementation will be the reference allowing to compare the compliance levels of other future implementations.
This study should lead to the publication of a scientific paper in a high impact scientific journal.
References
1. Maxime Lefrançois and Antoine Zimmermann (2018). The Unified Code for Units of Measure in RDF: cdt:ucum and other UCUM Datatypes. In The Semantic Web: ESWC 2018 Satellite Events – ESWC 2018 Satellite Events, Heraklion, Crete, Greece, June 3-7, 2018, Revised Selected Papers, volume 11155 of the Lecture Notes in Computer Science, pp196–201, Springer.
2. Gunther Shadow and Clement J. McDonald. The Unified Code for Units of Measure. Technical report, Regenstrief Institute, Inc, November 21 2017.
Complete description available at https://www.emse.fr/~zimmermann/Teaching/SemWeb/Internship/
Profil du candidat :
Interested in the definition of specifications and their implementation.
Interested in research activities.
Formation et compétences requises :
Master 2 in computer science
Knowledge of Semantic Web technologies
Java programming
Preferably good writing skills
Adresse d’emploi :
École des mines de Saint-Étienne, bâtiment espace Fauriel, 29 rue Ponchardier, Saint-Étienne. https://www.openstreetmap.org/node/2794933485
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : simon.madec@cirad.fr
Date limite de publication : 2023-03-06
Contexte :
Ce stage de Master s’inscrit dans le cadre du projet SCOSSA du programme TOSCA du CNES et dans la thématique générale de la sécurité alimentaire en Afrique de l’Ouest considérée comme l’un des enjeux majeurs de développement de la région.
Dans ce contexte, des données recueillies au travers d’enquêtes ménage représentent aujourd’hui une source d’informations fondamentales pour calculer les indicateurs de sécurité alimentaire qui sont ensuite utilisés en routine par différentes organisations. Ces indicateurs sont particulièrement difficiles à mettre en place dans les zones de conflit où les enquêtes ne peuvent se dérouler normalement.
Des études récentes se sont intéressées à l’estimation de ces indices à partir de données géospatiales et hétérogènes, en proposant des méthodes fondées sur l’utilisation des techniques avancées de science des données, et plus précisément d’apprentissage automatique et profond [1]. Ces approches permettent d’expliquer une part de la variation de la consommation alimentaire insuffisante et peut surpasser un modèle utilisant la prévalence comme estimation.
Des limitations existent encore et concernent notamment l’explicabilité des modèles (apprentissage par machine) ainsi que les performances et la validation de ces modèles face à des situations inédites : régions concernées par des conflits armés, périodes de crises économiques/inflation.
Sujet :
Au sein de l’UMR TETIS et en lien avec les équipes MISCA et ATTOS, l’objectif de ce stage est d’améliorer la performance des modèles d’apprentissage qui permettent d’estimer les indicateurs de consommation alimentaire.
Une première tâche sera la collecte et la mise en lien de données hétérogènes d’ordre économique et en lien avec les situations de conflits dans les régions d’intérêts [2].
Une deuxième étape sera d’analyser les résultats de simulation pour différentes entrées (données statique et non statique, d’ordre agronomique/ météorologique / économique…).
Des tests seront aussi réalisés sur d’autres régions / avec des données issues de nouvelles enquêtes [3].
[1] Deléglise, Hugo, et al. “Food security prediction from heterogeneous data combining machine and deep learning methods.” Expert Systems with Applications 190 (2022): 116189.
[2] Andree, Bo Pieter Johannes. “Estimating Food Price Inflation from Partial Surveys.” World Bank, Washington, DC (2021).
[3] https://microdata.worldbank.org/index.php/catalog/3768#metadata-version
Profil du candidat :
Compétences du candidat/e :
Connaissances/goût pour la programmation
Intérêt pour l’analyse de données
Rigueur scientifique
Curiosité et ouverture d’esprit
Capacité d’analyses, rédactionnelles et de synthèse
Informations complémentaires :
Durée de 6 mois, à partir de février 2023
Le stage se déroulera au CIRAD, dans l’UMR TETIS (Territoire, Environnement, Télédétection et Information Spatiale), située dans les locaux de la Maison de la Télédétection à Montpellier.
Encadrement
Simon Madec / Roberto Interdonato
Envoyer un CV et une lettre de motivation avant le 31/12/2022 à : simon.madec@cirad.fr
Formation et compétences requises :
Compétences du candidat/e :
Connaissances/goût pour la programmation
Intérêt pour l’analyse de données
Rigueur scientifique
Curiosité et ouverture d’esprit
Capacité d’analyses, rédactionnelles et de synthèse
Adresse d’emploi :
Maison de la Télédetection, 500 Rue Jean François Breton, 34090, Montpellier
Document attaché : 202212051459_Document.pdf
Offre en lien avec l’Action/le Réseau : – — –/Innovation
Laboratoire/Entreprise : XLIM, university of Poitiers
Durée : 5/6 months
Contact : olfa.ben.ahmed@univ-poitiers.fr
Date limite de publication : 2023-03-06
Contexte :
Alzheimer’s Disease (AD) is the most comment form of dementia. Neuroimaging data is an integral part of the clinical assessment providing a way for clinicians to detect brain abnormalities for AD diagnosis. Patients with AD suffer from the cognitive decline that leads to brain neurons and synaptic loss (i.e., memory loss, difficulty with problem-solving, etc.). Although there is currently no cure for AD, there are available medications that can slow down disease progression and improve the patient lifestyle. Recent studies on bio-markers research have demonstrated that the AD pathology is now suspected to start a long time before the manifestation of the clinical symptoms and even before brain damage. Hence, diagnosis of AD at earlier stages is of great clinical importance so that cognitive functions would be improved by medications and the spread of the disease would be prevented. Mild Cognitive Impairment (MCI) is an intermediary stage condition between healthy people and AD.
Detecting MCI subjects provide a potential window for early AD detection. However, MCI subjects’ detection remain a challenging clinical problem as it lies on a spectrum between NC and manifest AD. Therefore, identifying efficient bio-markers for early AD stages detection helps in establishing diagnosis and treatment strategies without delay. Over the last decades, imaging bio makers derived from anatomical Structural with machine learning techniques has been widely studied to assess brain atrophy for AD detection and prediction [1]. In addition to structural changes, metabolic changes in some brain regions could be a good biomarker for early AD detection [2]. However, the structural brain atrophy is not detectable at an early stage of the disease (namely for Mild Cognitive Impairment (MCI) and Mild Alzheimer’s Disease (MAD). Indeed, potential biological bio-markers have been proved their ability to early detect brain abnormalities related to AD before brain structural damage and clinical manifestation. Magnetic Resonance Spectroscopy (MRS) is a non-invasive technique providing a complementary approach to brain metabolism in vivo, during conventional MRI examination. MRS provides biological information of brain tissues at the molecular level allowing detecting brain abnormalities while MRI remains normal.
Sujet :
The goal of this internship is to:
• develop new deep learning based models for spectroscopy data classification for early AD detection, namely the MCI class detection.
• propose and implement a method for 1D Class Activation Map (CAM) generation for the 1D spectroscopy data for model interpretation. This task will the of a recently achieved work in our team [3]. The obtained 1D CAM should highlight the contributions of different MRS metabolites in the classification tasks. Data used in this internship are provided by CHU of Poitiers. In addition to the on MRS data, this data set contains multi-modal data of patients affected by different stages of AD (healthy elderly subjects, Mild Cognitive Impairment (MCI) and AD subjects)
Possibility to continue with a PhD proposal (starting in September/October 2023) in Artificial intelligence for medical images analysis
Location : XLIM (Site de Futuroscope), university of Poitiers in collaboration with the CHU of Poitiers
Tentative start date February/march 2023
Profil du candidat :
• Master 2 in computer vision, image processing, machine learning or any related field
Application : Send CV + transcripts and 2 reference letters to olfa.ben.ahmed@univ-poitiers.fr
Formation et compétences requises :
• Strong programming skills in python and deep learning frameworks (TensorFlow, pytorch)
Adresse d’emploi :
Location : XLIM (Site de Futuroscope), university of Poitiers in collaboration with the CHU of Poitiers
