
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Inria Paris, Centre de Recherche des Cordeliers et
Durée : 36 mois
Contact : adrien.coulet@inria.fr
Date limite de publication : 2022-09-15
Contexte :
La considération combinée des connaissances de l’état de l’art (la littérature scientifique, les bases de données biologiques expertes, etc.) et les entrepôts de données cliniques doivent permettre de structurer, puis d’enrichir les connaissances actuelles sur les maladies auto-immunes qui sont actuellement trop compartimentées entre spécialités médicales.
Sujet :
Objectifs concrets de la thèse :
– extraction et analyse des connaissances de l’état de l’art à partir de la littérature et des bases de données expertes (notamment PubMed, OrphaNet, HPO, IGMT),
– extraction et analyse des données des entrepôts de données de santé pour valider les connaissances extraites de la littérature et les compléter par de nouvelles (EDS, BNDMR),
– construire et publier deux ressources de référence de façon ouverte et FAIR : un thésaurus des auto-anticorps, et une cartographie sous forme de graphes de connaissances qui relient pathologies auto-immunes, signes cliniques observés et présence d’auto-anticorps,
– comparaison entre les connaissances d’origines diverses.
Profil du candidat :
autonomie, esprit d’équipe, intérêt pour le domaine de la santé, excellentes compétences relationnelles et sociales
Formation et compétences requises :
compétences techniques (Python, SQL, R), expérience préalable en sciences de données ou en traitement automatique du langage appréciée
Adresse d’emploi :
A PariSanté Campus (75015 Paris) et l’Institut Cochin (75014 Paris). L’inscription sera faite dans l’Ecole Doctorale ED386 de l’Université Paris Cité.
Document attaché : 202205111417_PhD opportunity on Data Intelligence_vf.pdf
Offre en lien avec l’Action/le Réseau : MACLEAN/– — –
Laboratoire/Entreprise : IMT Atlantique, AI Chair OceaniX
Durée : 36 mois
Contact : ronan.fablet@imt-atlantique.fr
Date limite de publication : 2022-09-15
Contexte :
Two PhD positions are open in the framework of AI Chair OceaniX (https://cia-oceanix.github.io/). The PhD candidates will be hosted on IMT Atlantique campus in Brest by the newly created INRIA team Odyssey (https://team.inria.fr/odyssey).
Sujet :
The open PhD scholarships will address:
– Learning Reduced-Order Ocean Forecasting Models
– Learning-based calibration of ocean carbon models using emerging data from new observing devices and platforms
More information can be found at: https://cia-oceanix.github.io/vacancies
Profil du candidat :
Applications are encouraged from candidates with a MSc./engineer degree in applied math/data science/AI with interest in ocean science or a MSc./engineer in geoscience and a strong interest in data science and deep learning.
Formation et compétences requises :
Background in machine learning and data science.
Adresse d’emploi :
IMT Atlantique, Brest
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire/Entreprise : PRISME / BRGM
Durée : 36 months
Contact : yves.lucas@univ-orleans.fr
Date limite de publication : 2022-09-15
Contexte :
The aim of this thesis is to evaluate the contribution of artificial intelligence to better assess the vulnerability of assets facing natural hazards, by unfolding impact scenarios in a multi-risk and multi-scale perspective. The highly multimodal and heterogeneous character of remote sensing data (visible, IR, hyperspectral, lidar, radar, topography, spectral libraries of materials ….) to characterize a territory, brings out a new methodological challenge: to develop network architectures adapted for the classification and semantic segmentation of these massive and complex data. This thesis work is also in synergy with the actions carried out at BRGM (H2020 COCLICO, VIGIRISKS, ANR RICOCHET projects) and the ANR-IA where joint work has been initiated between PRISME and BRGM
Sujet :
Complete description is available in the attached file.
Profil du candidat :
The candidate should have obtained a Master’s degree in computer science. Autonomy, scientific rigor and a strong motivation for the proposed subject will be undeniable assets to successfully complete the thesis.
Candidates must send the following documents in a single pdf file :
CV + cover letter + Master grades – optional letters of recommendation.
Contacts:
yves.lucas@univ-orleans.fr
a.hohmann@brgm.fr
c.negulescu@brgm.fr
Formation et compétences requises :
The candidate should have a broad knowledge of image processing, including deep learning techniques and their implementation in software and hardware. Fundamental notions in remote sensing are also required. Fluency in English is essential.
Adresse d’emploi :
Polytech Orléans · 12, rue de Blois, BP 6744 · 45067 cedex 2 Orléans , France
BRGM 3 avenue Claude-Guillemin, BP 36009 45060 Orléans Cedex 02 France
Document attaché : 202205111304_these_BRGM_PRISME_annonce_MADICS.pdf
Offre en lien avec l’Action/le Réseau : RoCED/– — –
Laboratoire/Entreprise : équipe Traitement du Signal du laboratoire CReSTIC
Durée : CIFRE, 3.5 ans
Contact : valeriu.vrabie@univ-reims.fr
Date limite de publication : 2022-09-18
Contexte :
Les architectures de Deep Learning utilisées pour des tâches de localisation et de classification à partir d’images ont principalement évolué dans deux directions différentes : la 1re vise à optimiser les performances et la 2nde à réduire les temps de calcul. Dans le 1er cas, de nouvelles architectures de type CNN de plus en plus denses ou de nouvelles alternatives par exemple CapsNet ont permis d’améliorer les performances [Men22]. En revanche, ces architectures nécessitent des ressources de calcul importantes et des bases de données étendues. Dans le 2e cas, différentes approches telles que pruning, l’utilisation d’opérateurs séparables en profondeur, etc. ont été proposées pour réduire la complexité des calculs, mais cela se fait au détriment des performances. D’autres approches alternatives de type hiérarchique ont été proposées récemment afin de pouvoir répondre simultanément aux deux objectifs [RPR21,Hel22].
D’un autre côté, la prise en compte d’autres données endogènes et exogènes, par exemple des images acquises avec d’autres caméras, des données météo, des informations complémentaires sur l’état sanitaire des plantes, etc. permet d’améliorer la robustesse des résultats. Cela est possible grâce à l’utilisation des architectures très denses ou d’un ensemble d’architectures dont les décisions sont fusionnées. Là aussi des approches alternatives permettant de fusionner des features intermédiaires permettent de réduire le temps de calcul ou d’améliorer les performances en fonction de la stratégie retenue [Yis21].
Dans les deux cas, l’apprentissage supervisé nécessite de larges bases de données annotées, tâche qui est difficile et couteuse en temps et en ressources. Les options de data augmentation sont souvent utilisées, mais ne permettent pas de créer suffisamment de diversité. Des approches génératives de type GAN permettent d’aller plus loin dans la création de nouvelles données pertinentes [Goo14]. Ces types d’approches se basent sur des données existantes et ne peuvent pas prendre en compte des problématiques réelles, par exemple des classes qui varient au cours du temps ou l’apparition de nouvelles classes. Par exemple, en viticulture, cela peut être dû à des changements des conditions météo ou traitements phytosanitaires ou bien à l’apparition de symptômes confondants induits par des carences ou par l’expression d’autres maladies. En robotique, cela peut être dû des changements de luminosité ou d’environnement.
Des approches potentiellement intéressantes ont été proposées pour résoudre en partie ces problématiques. Les approches de type reinforcement learning permettent au travers d’un système de récompense et pénalités de prendre en compte l’aspect adaptatif [Yad22]. Néanmoins, ces approches sont souvent utilisées avec un seul type d’architecture et principalement que pour la phase d’apprentissage. Les approches de type semi-supervisées, notamment d’active learning et self-supervised learning, permettent de prendre en compte l’apparition de nouvelles classes et de réduire le besoin en données annotées [WPW22]. Néanmoins, ces approches sont aussi principalement utilisées dans la phase d’apprentissage et sont très sensibles aux étapes initiales du processus. Des approches récentes de type continual learning permettent aussi de gérer le problème de nouvelles classes [KC21]. Elles sont par ailleurs adaptées à un environnement évolutif. Ces approches sont en revanche sensibles au phénomène de « catastrophic forgetting », c’est-à-dire la perte de toutes les connaissances acquises en amont lorsqu’on s’adapte à une nouvelle tâche ou une nouvelle classe. D’autre part, pour apporter un aspect dynamique au moment de l’inférence, elles se limitent à un espace de solutions restreint.
En pratique, par exemple pour des applications viticoles, une certaine cyclicité des classes est souvent observée en fonction des conditions exogènes (météo similaire certaines années, traitements phytosanitaires périodiques, etc.). D’autre part, les classes évoluent au cours du temps compte tenu de l’adaptation des plantes à l’environnement, de nouvelles apparaissent à la suite de changements climatiques.
[Goo14] I. J. Goodfellow et al., Generative Adversarial Networks, arXiv 2014, DOI: 10.48550/arXiv.1406.2661.
[Hel22] G. Heller, E. Perrin, V. Vrabie, C. Dusart, S. Le Roux: Grafting heterogeneous neural networks for a hierarchical object classification, IEEE Access, Jan. 2022: 12927 – 12940, DOI: 10.1109/ACCESS.2022.3144579
[KC21] J.-Y. Kim, D.-W. Choi, Split-and-Bridge: Adaptable Class Incremental Learning within a Single Neural Network, arXiv 2021, DOI: 10.48550/arXiv.2107.01349
[Men22] P. Mensah Kwabena et al., Capsule Networks – A survey, Journal of King Saud University – Computer and Information Sciences, 2022, 34(1):1295–1310 doi.org/10.1016/j.jksuci.2019.09.014
[RPR21] D. Roy, P. Panda, K. Roy, Tree-CNN: A Hierarchical Deep Convolutional Neural Network for Incremental Learning, arXiv 2019, DOI: 10.48550/arXiv.1802.05800
[Yad22] P. Yadav et al., A Survey on Deep Reinforcement Learning-based Approaches for Adaptation and Generalization, arXiv 2022, DOI: 10.48550/arXiv.2202.08444
[Yis21] H. Yizeng et al., Dynamic Neural Networks: A survey, arXiv 2021, DOI: 10.48550/arXiv.2102.04906
[WPW22] Z. Wen, O. Pizarro, S. Williams, Active Self-Semi-Supervised Learning for Few Labeled Samples Fast Training, arXiv 2022, DOI: 10.48550/arXiv.2203.04560
Sujet :
L’objectif de cette thèse est de développer des stratégies de détection et classification qui s’appuient et qui combinent les concepts de reinforcement learning, de continual learning et l’apprentissage semi-supervisé à la fois pour l’étape d’apprentissage, mais aussi pour la prise de décision au moment de l’étape de l’inférence. Cette dernière devra être faite idéalement sur un système embarqué (edge computing) ou au plus proche du capteur (fog computing), ce qui complexifie la tâche, tout comme l’utilisation conjointe de capteurs différents, par exemple de caméras multi-spectrales dans le domaine NIR et SWIR. Les résultats devront être robustes par rapport à des conditions d’acquisition variables (luminosité, etc.), à des facteurs exogènes (traitements phytosanitaires, carence, stress hydrique, etc.), mais aussi à des facteurs endogènes (dynamique de croissance, réponse immunitaire par rapport aux maladies, etc.). Ces stratégies devront être transférables à d’autres applications, par exemple de systèmes robotisés terrestres opérant à l’extérieur.
Profil du candidat :
• Motivation très importante, curiosité et autonomie
• Esprit d’initiative et d’analyse
• Méthode et rigueur dans le travail
• Bon relationnel et esprit d’entreprise
• Maitrise du français et de l’anglais indispensable
Formation et compétences requises :
• Formation bac +5 (école d’ingénieurs ou master) en data science, informatique ou mathématiques appliquées
• Connaissances avancées en intelligence artificielle, éprouvées dans un stage de fin d’études
• Des connaissances solides en Deep Learning sont un vrai plus
• Très bonne maîtrise du langage Python et à l’aise avec l’utilisation de frameworks type Keras, Pytorch et/ou Tensorflow pour implémenter et tester les diverses architectures
• Une expérience en programmation C++ sur systèmes embarqués serait un plus
Adresse d’emploi :
Thèse CIFRE :
– SEGULA MATRA Automotive, agence de Reims
– laboratoire CReSTIC de l’URCA, Campus Sciences, Reims (https://crestic.univ-reims.fr/fr/equipe/ts)
Informations pratiques :
• Pré-embauche : mi-octobre / début novembre 2022
• Début thèse : début mars 2023
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LAMSADE (Paris) / LIG (Grenoble)
Durée : 3 ans
Contact : alexandre.allauzen@dauphine.psl.eu
Date limite de publication : 2022-09-20
Contexte :
The ANR project E-SSL (Efficient Self-Supervised Learning for
Inclusive and Innovative Speech Technologies) will start on November
1st. Self-supervised learning (SSL) has recently emerged as one of the
most promising artificial intelligence (AI) methods as it becomes now
feasible to take advantage of the colossal amounts of existing
unlabeled data to significantly improve the results of
various systems.
Speech technologies are widely used in our daily life and are
expanding the scope of our action, with decision-making systems,
including in critical areas such as health or legal aspects. In these
societal applications, the question of the use of these tools raises
the issue of the possible discrimination of people according to
criteria for which society requires equal treatment, such as gender,
origin, religion or disability… Recently, the machine learning
community has been confronted with the need to work on the possible
biases of algorithms, and many works have shown that the search for
the best performance is not the only goal to pursue [1]. For instance,
recent evaluations of ASR systems have shown that performances can
vary according to the gender but these variations depend both on data
used for learning and on models [2]. Therefore such systems are
increasingly scrutinized for being biased while trustworthy speech
technologies definitely represents a crucial expectation.
Sujet :
Both the question of bias and the concept of fairness have now become
important aspects of AI, and we now have to find the right threshold
between accuracy and the measure of fairness. Unfortunately, these
notions of fairness and bias are challenging to define and
theirmeanings can greatly differ [3].
The goals of this PhD position are threefold:
– First make a survey on the many definitions of robustness, fairness
and bias with the aim of coming up with definitions and metrics fit
for speech SSL models
– Then gather speech datasets with high amount of well-described
metadata
– Setup an evaluation protocol for SSL models and analyzing the
results. The PhD position will be co-supervised by Alexandre Allauzen
(Dauphine Université PSL, Paris) and Solange Rossato and François
Portet (Université Grenoble Alpes). Joint meetings are planned on a
regular basis and the student is expected to spend time in both
places. Moreover, two other PhD positions are open in this
project. The students, along with the partners will closely
collaborate. For instance, specific SSL models along with evaluation
criteria will be developed by the other PhD students.
To apply, send a CV and a cover letter to A. Allauzen before September
the 12th
Profil du candidat :
Skills
– Master 2 in Natural Language Processing, Speech Processing, computer
science or data science.
– Good mastering of Python programming and deep learning framework.
– Previous experience in Self-Supervised Learning, acoustic modeling
or ASR would be a plus
– Very good communication skills in English
– Good command of French would be a plus but is not mandatory
Formation et compétences requises :
See skills.
Adresse d’emploi :
Université Paris-Dauphine / Laboratoire d’Informatique de Grenoble
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Université Paris-Dauphine – PSL, laboratoire LAMS
Durée : 3 ans
Contact : daniela.grigori@dauphine.fr
Date limite de publication : 2022-09-25
Contexte :
We have an opening for a PhD position with the objective to develop new solutions to help
data providers who wish to share their data to better understand it, and to choose the
best-suited data protection policies. T
The PhD thesis is part of an interdisciplinary project involving another PhD thesis on
data governance in the field of management sciences. We anticipate that the interaction
between the two doctoral students will lead to interdisciplinary contributions in addition
to computer science-focused solutions.
The PhD candidate will work in close collaboration with members of the data science
team of the Paris Dauphine University. The problems investigated and solutions developed
will be guided and validated within case studies in the fields of health and economics.
The successful candidate will enroll as a PhD student in the Computer Science department of the Paris Dauphine University-PSL(under the co-direction of Khalid Belhajjame and Daniela Grigori) and will become a member of the Data Science team of the same university. Paris Dauphine University is located in the city of Paris, and is a member of PSL (Paris Sciences et Lettres).
[1] https://dauphine.psl.eu/dauphine/dauphine-numerique
Sujet :
PhD position on Data Profiling, Protection and Sharing
he PhD Student will be investigating
techniques for mining, profiling and linking datasets that would help data providers to gain
insight into their data, to estimate its (economic) value, and to choose data protection
strategies that go beyond privacy protection to take into account the protection of
the data provider’s economic assets.
Profil du candidat :
We seek strongly motivated candidates prepared to dedicate to high quality research.
The candidate should have (or be close to obtaining) a Master’s degree or equivalent in
computer science or applied mathematics. Starting date Octomber/2022.
Interested candidates are invited to send the following to khalid.belhajjame@dauphine.fr and
daniela.grigori@lamsade.dauphine.fr
– academic CV
– academic transcripts of BSc and MSc
– one page motivation letter explaining why the candidate is suitable for the position
– contact details of two referees
Formation et compétences requises :
Master’s degree or equivalent in
computer science or applied mathematics
Adresse d’emploi :
Université Paris-Dauphine – PSL, laboratoire LAMSADE, Paris
Document attaché : 202209121630_PhD position on Data Profiling.txt
Offre en lien avec l’Action/le Réseau : – — –/Doctorants
Laboratoire/Entreprise : Sorbonne Universite – Institut des Systèmes intell
Durée : 36 mois
Contact : patrick.gallinari@sorbonne-universite.fr
Date limite de publication : 2022-09-30
Contexte :
Deep Learning is beginning to be explored for scientific computing in domains traditionally dominated by physics models (first principles) like earth science, climate science, biological science, etc. It is particularly promising in problems involving processes that are not completely understood, or computationally too complex to solve by running the physics inspired model. The direct use of pure machine learning approaches has however met limited successes for scientific computing. Hence, researchers from different communities have started to explore (i) how to integrate physics knowledge and data, and (ii) how to push the limits of current ML methods and theory; two challenging directions.
Sujet :
The global objective of the thesis is the development of new models leveraging observation or simulation data for the modeling of complex spatio-temporal dynamics characterizing physical phenomena such as those underlying earth-science and climate observations. The classical modeling tools for such dynamics in physics and applied mathematics rely on partial differential equations (PDE). Despite their successes in different areas, current ML based approaches are notably insufficient for such problems. Using ML for physics raises new challenging problems and requires rethinking fundamental ML ideas.
Three main research directions will be explored:
– Hybrid systems – Integrating Physics and Deep Learning. In many situations, there is available some prior physical knowledge provided by PDEs for characterizing the underlying phenomenon. A key issue is then how to combine this prior knowledge with information extracted from the data.
– Domain generalization for deep learning as dynamical models. Explicit physical models come with guarantees and can be used in any context (also called domain or environment) where the model is valid. This is not the case for DNNs, and we have no guarantee that they can be extrapolated to new physical environments.
– Learning at Multiple Scales. Modeling dynamical physical processes often requires considering multiple spatio-temporal scales. For example in climate, global phenomena are influenced by dynamics operating at a smaller scale. Similar problems occur e.g. in computational fluid dynamics. Learning at different scales is an open issue in ML.
Motivating problems and applications will come from climate science.
Profil du candidat :
Computer science or applied mathematics, Good technical skills in programming.
Formation et compétences requises :
Master in computer science or applied mathematics, Engineering school. Background and experience in machine learning. Good technical skills in programming.
Adresse d’emploi :
Sorbonne Université (S.U.), Pierre et Marie Campus in the center of Paris. The candidate will integrate the Machine Learning and Deep Learning for Information Accesss team at S.U. at the ISIR lab. (Institut des Systèmes Intelligents et de Robotique).
Document attaché : 202203010947_2022-PhD-Description-ML-Physics.pdf
Offre en lien avec l’Action/le Réseau : – — –/Innovation
Laboratoire/Entreprise : Institut Pascal, UMR6602 Université Clermont Auver
Durée : 3 ans
Contact : khalil.drissi@uca.fr
Date limite de publication : 2022-10-01
Contexte :
La détection et la localisation des réseaux de services publics en contexte urbain sont devenues un sujet d’intérêt majeur depuis quelques années. La norme (NF S 70-003) exige la reconnaissance des réseaux et une localisation précise à moins de 11 cm par des sociétés certifiées. D’après les retours d’expérience des unités techniques du Ministère de la Transition écologique, aucune solution ne répond actuellement à ce besoin de cartographie des réseaux sur une grande surface à un coût acceptable pour les collectivités.
Pour une telle entreprise, une cartographie précise des réseaux combinant des méthodes physiques, méthodes d’intelligences artificielles (IA) et technologies innovantes adaptées à l’hybridation, offre un avantage indéniable pour optimiser le travail en termes de temps et de coûts. Cette étape entraînera des gains de fiabilité et contribuera à réduire les risques liés aux réseaux sensibles.
Le projet ANR PROMETHEUS (ANR-21-CE22-0019-03) cherche à introduire une telle solution méthodologique et technologique non invasive, basée sur la technologie radar géophysique 3D, pour structurer la cartographie urbaine des réseaux enterrés.
La thèse de doctorat s’inscrit dans l’action WP2 de PROMETHEUS et porte sur la détection des canalisations enterrées et leur suivi dynamique. La réponse électromagnétique du signal radar SFR-3D peut être utilisée comme caractéristique pour l’identification et la classification des cibles enterrées.
Cette réponse se focalise entre autre autour des résonances naturelles complexes (CNR) de ces cibles, elle rend aussi compte de l’impact du sol et du radar considéré.
Nous proposons d’identifier ces CNR en appliquant la méthode haute résolution (Matrix Pencil Method) dans le domaine fréquentiel. Cette méthode est capable d’encoder ces CNR en faisant émerger des
clusters de pôles et de résidus que l’on cherchera à associer aux objets enterrés, et potentiellement à l’effet du sol et du radar considéré.
Il est important de rappeler que les signatures brutes issues des réponses électromagnétiques des cibles seront modifiées par l’effet du couplage entre le radar (et la topologie de ses antennes) et les
milieux de propagation ce qui suggère de combiner ces signatures modifiées à une approche par réseau de neurones profonds pour un encodage adhoc et un suivi dynamique adapté.
Par ailleurs, l’encadrement de l’université Gustave Eiffel fournira des données expérimentales issues du radar à sauts de fréquence multi-antennes, ces données seront l’entrée des modèles supervisés que l’on
se propose de fournir pour les autres actions.
Une interaction régulière devra être menée avec les autres actions du projet PROMETHEUS pour une progression efficiente de ce travail de thèse.
Sujet :
Le(a) doctorant(e) sera impliqué(e) dans le projet ANR-PROMETHEUS. Il (elle) pourra ainsi bénéficier d’échanges fructueux avec l’ensemble des chercheurs mais aussi avec l’autre doctorant(e) recruté(e) qui se focalisera sur le développement d’une approche complémentaire à celle du WP3 qui consiste à inverser les signaux radar et à estimer les caractéristiques physiques de réseaux enterrés.
1. L’étude bibliographique comprendra deux parties :
• Bibliographie sur les techniques d’auscultation dédiées à la détection et localisation des réseaux notamment les méthodes radars et les méthodes haute résolution utilisées en traitement du signal,
• Bibliographie sur les méthodes d’apprentissage et leur adaptation aux applications de génie civil notamment les techniques de Deep Learning appliquées aux signaux GPR.
2. Mise en oeuvre de l’imagerie par radar à pénétration de sol pour cartographier les structures souterraines (premier lit en profondeur) avec des cas d’études simples et contrôlés en laboratoire puis des cas complexes sur sites réels.
A partir de l’écho propre acquis lors de l’émission-réception d’un appareil GPR multi-antennes (données brutes de A-scan, B-scan et C-scan en amplitude et en phase dans le domaine fréquentiel), on se propose de construire un corpus de signatures à partir de Matrix Pencil Method (MPM). Cette signature sera composée des résonances naturelles complexes (RCN) du réseau cible souterrain, probablement
modifiées par l’effet du GPR et/ou du sol.
3. Classification des signatures modifiées par des méthodes d’intelligence artificielle. Cette classification s’appuiera sur différents scénarios dont on évaluera la performance numériquement par des modélisations FDTD :
• GPR et/ou sol sans réseau cible enterré à partir de données A-Scan,
• GPR et/ou sol avec réseau cible enterré à partir de données A-Scan.
4. Suivi des signatures à partir des données B-Scan et C-Scan et optimisation de la redondance issue des différents scénarios cités ci-dessus.
5. Production d’un encodage lisible des données de mesure.
Profil du candidat :
Il est attendu que les candidat(e)s à ce sujet de thèse aient des compétences en propagation des ondes électromagnétiques, en traitement du signal et en utilisation des méthodes de Deep Learning.
Des compétences en mesure seront nécessaires pour une meilleure compréhension physique des phénomènes mis en jeu et des choix des modèles à hybrider.
Formation et compétences requises :
Bac +5
Adresse d’emploi :
Institut Pascal,
UMR6602 Université Clermont Auvergne,
Clermont Auvergne INP,
CNRS Campus Universitaire des Cézeaux,
4 Avenue Blaise Pascal 63178 AUBIERE
Document attaché : 202206270702_Sujet_these_Prometheus_WP2.pdf
Offre en lien avec l’Action/le Réseau : – — –/Doctorants
Laboratoire/Entreprise : Laboratoire Auscultation, Modélisation et Expérime
Durée : 3 ans
Contact : amine.ihamouten@univ-eiffel.fr
Date limite de publication : 2022-10-01
Contexte :
Au sein d’Eurovia (Groupe Vinci), ETF est un acteur majeur de la conception, de la construction, du développement et de la maintenance d’infrastructures ferroviaires au service des citoyens en France et à l’international. La mission d’ETF est d’oeuvrer en faveur d’une mobilité ferroviaire sûre, rapide et respectueuse de l’environnement. Pour cela, les équipes d’ETF interviennent sur tous les types de réseaux ferrés : ligne à grande vitesse, ligne régionale, réseau portuaire et site industriel, réseau ferré urbain (tramway, métro).
En lien avec la régénération du réseau ferroviaire, SNCF-Réseau élabore, en fonction des besoins identifiés sur la base de diverses investigations in situ, des projets de Renouvellement de Voie et Ballast (RVB) des lignes existantes dans le but de leur redonner leurs performances nominales. Dans le cadre de ces projets, un certain nombre de prescriptions techniques relatives aux travaux à réaliser sont ainsi prescrites par SNCF Réseau qui confie ensuite la réalisation de ces derniers aux entreprises habilitées tel ETF.
Parmi ces prescriptions, celles relatives au renouvellement de la couche de ballast – opération consistant à dégarnir (i.e. excaver) les granulats anciens, « usés et pollués », puis à les remplacer par des granulats
neufs, « anguleux et sains » – peuvent poser un certain nombre de difficultés opérationnelles (respect de la profondeur de dégarnissage, respect de l’épaisseur de ballast sain, optimisation de l’apport de matériau neuf et de réemploi (à hauteur de 30 à 40 %), etc.). Ces différents écueils, dont l’origine apparait multiple (qualité et quantité des données d’entrée, temporalité des investigations par rapport aux travaux, présence d’objets enfouis, etc.), conduit in fine à des coûts directs et indirects importants pour ETF pouvant s’élever à plusieurs centaines de milliers d’euros (perte de rendement, usure / casse matérielle prématurée, immobilisation des ressources, pénalité de retard, etc).
Dans ce contexte, la problématique d’ETF est donc relative à l’identification et à l’anticipation de ces désagréments sur les futurs chantiers de RVB en vue de pouvoir, idéalement, s’en affranchir afin de limiter / maitriser les coûts associés. C’est avec ce dessein qu’ETF et l’Université Gustave Eiffel proposent conjointement ce sujet de thèse via une Convention Industrielle de Formation par la Recherche (CIFRE).
Sur la base d’un état de l’art préalablement réalisé, et de divers travaux antérieurs menés en interne au sein d’ETF, la technologie radar (à sauts de fréquence) a rapidement été identifiée comme une solution propice
à répondre aux attentes d’ETF (diagnostic non-destructif, vitesse d’auscultation, facilité d’intégration à l’environnement ferroviaire, etc.) ; en particulier lorsque cette technologie est couplée à des méthodes
automatiques de traitement et d’analyse répondant aux exigences de délais et de rendements opérationnels.
Cependant, dans son utilisation actuelle, cette méthode ne permet pas de répondre de manière optimisée à la problématique et nécessite un effort de recherche pour développer à une solution opérationnelle pour les équipes d’ETF.
Sujet :
Dans cette thèse, on se propose d’évaluer et de classifier les caractéristiques des couches de ballast par une analyse phénoménologique extra-fine du signal radar issu du Radar à Sauts de Fréquence (RSF) développé par le laboratoire Lames de l’université Gustave Eiffel. Cet objectif impliquera un investissement expérimental avec la réalisation de campagnes de mesures sur banc d’essais contrôlés. Cette thèse aura pour objectif en parallèle d’optimiser une approche croisée innovante basée sur le couplage entre la méthode d’inversion de formes d’onde et des méthodes d’apprentissage supervisé appliquées en approche globale aux signaux RSF. Ces travaux seront enfin appliqués à l’étude de plusieurs sites tests permettant d’évaluer à l’aveugle la pertinence des développements. L’objectif final consistera à développer une méthodologie complète basés sur les développements précédents intégrable aux activités opérationnelles d’ETF. Les différents points suivants seront abordés au cours de cette thèse :
1. Études bibliographique et paramétrique numérique :
• Méthodologies et techniques radar envisagées (état de l’art sur la physique et la propagation des ondes EM dans les milieux stratifiés, techniques d’Evaluation Non Destructives, modèles directs, problèmes
inverses, FWFI, FDTD et antennes),
• Classification par techniques d’apprentissages supervisées.
2. Mise en oeuvre d’un plan d’expérience conséquent en laboratoire de caractérisation de colmatage du ballast pour obtenir les premiers résultats en faisant varier certains paramètres (nombre de couches,
densité/granulométrie, épaisseur…). Confrontation des résultats obtenus sur des sites extérieurs tests.
3. Classification par méthodes d’apprentissages (semi-automatiques) :
• Binaire dans un premier temps : présence de couche de ballast pollué ou pas,
• Classification plus évoluée au regard de la nomenclature définie plus en amont dans la thèse (inférieur, dans l’intervalle ou supérieur au seuil/taux de colmatage préconisé et fixé entre autres par ETF).
4. Validation in situ des travaux par le développement d’un démonstrateur permettant de fournir une classification précise des couches de ballast et de pouvoir valider les exigences de normes.
5. Production d’un mémoire de thèse et valorisation des travaux dans le cadre de publications dans des journaux et conférences.
Profil du candidat :
Il est attendu que les candidat(e)s à ce sujet de thèse aient des compétences en propagation des ondes électromagnétiques, en traitement du signal et en utilisation des méthodes de Machine Learning.
Des compétences en génie civil et/ou en géophysique seront nécessaires pour une meilleure compréhension physique des phénomènes mis en jeu et des choix des modèles à hybrider.
Formation et compétences requises :
Bac+5 (Ecole d’ingénieur/Master Universitaire)
Adresse d’emploi :
Laboratoire Auscultation, Modélisation et Expérimentation sur les infraStructures de transport – Dépt. Matériaux et Structures (LAMES – MAST)
Université Gustave Eiffel, Campus de Nantes,
Allée des ponts et chaussées – CS 5004 44344
Bouguenais Cedex • FRANCE
Document attaché : 202206270752_Sujet_these_ASTEROIDE_ETF_UnivEiffel_AI-1.pdf
Offre en lien avec l’Action/le Réseau : – — –/Doctorants
Laboratoire/Entreprise : Laboratoire CEDRIC du CNAM à Paris et Laboratoire
Durée : 36 mois
Contact : guinaudeau@limsi.fr
Date limite de publication : 2022-10-23
Contexte :
Le projet ANR MALIN a pour objectif de rendre utilisables les manuels scolaires numériques par les enfants en situation de handicap. En effet, les manuels numériques actuellement disponibles nécessitent d’être adaptés pour être accessibles à ces enfants. Ces adaptations concernent aussi bien les aspects techniques que pédagogiques. Dans la plupart des cas, les manuels sont adaptés de façon artisanale et les délais de livraison peuvent être de plusieurs mois. Ces contraintes ne permettent pas de rendre efficiente l’inclusion scolaire des enfants en situation de handicap. L’objectif du projet ANR MALIN est donc de développer des solutions techniques afin d’aboutir à l’automatisation de l’adaptation des manuels scolaires numériques pour les rendre accessibles (accès, traitement et interaction avec les contenus) aux élèves en situation de handicap.
Le projet ANR repose sur une collaboration entre quatre laboratoires : LISN (Université Paris Saclay), MICS (Ecole CentraleSupelec), CEDRIC (CNAM), Inserm 1284 (CRI, Université de Paris). Le doctorant ou la doctorante travaillera en interaction avec des stagiaires de master, des ingénieurs et un autre doctorant associés au projet.
Sujet :
Le premier objectif est de concevoir des approches d’extraction automatique de la structure d’un manuel (leçons, blocs d’exercices [eux-mêmes composés de consignes, enoncés, exemples…], memo, synthèse…) et de son contenu multimédia (textes, images, dessins, graphiques, équations, courbes…) à partir des fichiers fournis par les éditeurs (ceux-ci sont le plus souvent au format pdf). Plusieurs approches seront à envisager : une approche d’adaptation et d’enrichissement de systèmes de structuration automatique de documents textuels (segmentation thématique, segmentation discursive) prenant en compte la spécificité et la multi-modalité des données traitées et une approche basée sur le traitement automatique des images visant à identifier les différents blocs en se basant sur les caractéristiques de l’image, connue sous le nom de « Document Layout Segmentation and Analysis » [1, 2]. Des approches récentes d’apprentissage profond seront testées sur des jeux de données annotées manuellement afin d’adapter des modèles existants et obtenir des résultats d’extraction satisfaisants.
Le second objectif est d’analyser le contenu de chaque bloc extrait dans l’étape précédente afin de les catégoriser en activités pédagogiques. Ainsi pour chaque exercice, il faudra déterminer quelle(s) activité(s) pédagogique(s) devra(ont) être mise(s) en œuvre pour le réaliser. Dans cet objectif, le doctorant ou la doctorante devra développer des techniques d’apprentissage spécifiques novatrices, supervisées ou non, à la rencontre entre le traitement du langage naturel et la linguistique d’une part et l’analyse de données multimédia d’autre part [3, 4]. Dans ce cas, les modalités visuelles et textuelles seront représentées dans un espace commun pour effectuer une classification multimodale. L’une des pistes à explorer consiste à employer des modèles appris sur des données et des problématiques similaires en français et de travailler sur l’adaptation (fine-tuning) de ces modèles à partir d’un petit jeu de données annotées [5, 6, 7].
Profil du candidat :
● Master en informatique ou TAL avec une spécialisation dans au moins un des domaines suivants :
○ traitement automatique des langues
○ apprentissage automatique
Formation et compétences requises :
● Maîtrise de Python (langage de prédilection du projet)
La connaissance des principales librairies d’apprentissage sera appréciée.
Adresse d’emploi :
Laboratoire CEDRIC du CNAM à Paris et Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) à Orsay
Document attaché : 202206230848_SujetThèseMALIN.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 3 ans
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2022-10-31
Contexte :
Le sujet de thèse proposé vise au croisement de deux disciplines principales : l’analyse de réseaux complexes et la modélisation des dynamiques spatiales. La modélisation des dynamiques spatiales est une approche privilégiée pour étudier les processus complexes d’interaction homme-environnement qui sont au centre des systèmes d’utilisation des terres (land use system).
Dans ce contexte, une nouvelle approche fondée sur le concept de graphe d’interaction a été développée au CIRAD/UMR TETIS, avec l’objectif de permettre un meilleur couplage des systèmes de modélisation avec des SIG (Système d’Information Géographique) et améliorer la modélisation des mécanismes qui sont influencés par des structures spatiales dynamiques. Le graphe d’interaction est un graphe (un ensemble de nœuds connectés par des arcs) dont les arcs peuvent porter des fonctions d’interaction. Un système représenté par des graphes d’interaction peut ainsi évoluer lorsque les fonctions d’interactions sont activées et que celles-ci modifient les entités connectées. Les éléments présents dans un espace géographique peuvent ensuite définir des relations spatiales, fonctionnelles, hiérarchiques et même sociales. La mise en œuvre de cette approche s’appuie sur le langage de modélisation Ocelet, et son environnement logiciel de développement (http://www.ocelet.org).
Les modèles développés avec Ocelet sont employés principalement pour simuler des dynamiques spatiales dans différents systèmes territoriaux complexes, comme par exemple, pour comparer plusieurs scénarios d’utilisation des terres. Ces modèles font généralement intervenir plusieurs graphes d’interaction dans des structures porteuses de connaissances du fonctionnement et de l’organisation du territoire. Jusqu’à présent, lors de déploiement de ces modèles, seuls les résultats de simulation sont analysés ; les graphes ne le sont pas, alors qu’ils sont une expression formelle de processus très divers qui interagissent dans le territoire. Ces analyses permettraient notamment d’expliciter les liens entre structure et fonctionnement du territoire, pour viser, à terme, la possibilité d’inférer des connaissances des processus à partir de l’exploration de données spatiales, comme celles issues d’images satellite.
Sujet :
L’objectif global de cette thèse est le développement de méthodologies innovantes, basées sur les techniques d’analyse de réseaux complexes, pour l’analyse des graphes d’interaction issus de la modélisation des dynamiques paysagères. Ce travail permettra d’exploiter de manière originale les modèles de simulation spatiale développés avec l’approche Ocelet, en permettant de créer de nouvelles connaissances à partir des graphes d’interaction modélisés et de ses dynamiques. Des algorithmes de classement, clustering, diffusion de l’information et prédiction des liens spécifiquement adaptés au contexte des relations caractéristiques (e.g., spatiales, fonctionnelles, hiérarchiques et sociales) entre les entités d’un système paysager pourront être développés. Ceci représentera une contribution significative aussi bien dans le domaine de l’analyse de réseaux et science des données, que dans celui de la modélisation et de l’analyse des dynamiques paysagères.
La première étape du travail de recherche est liée à la nécessité de comprendre comment les graphes d’interaction entre les éléments d’un paysage visible sur les images satellite, et qui expriment le fonctionnement du socio-écosystème présent dans le paysage, se traduisent dans la structure en réseau de ces graphes. La seconde étape consistera à développer et implémenter des méthodes d’analyse de réseaux complexes spécifiquement adaptés aux modèles pris en comptes en réponse à la question de recherche précédente. L’idée est d’obtenir une suite de méthodes d’analyse généralisables à différents contextes, qui pourront être ensuite intégrés dans la plateforme Ocelet. Pour mener ce travail, nous adopterons une démarche pluridisciplinaire, où les contributions méthodologiques proposées seront toujours soumises aux avis d’experts en modélisation spatiale des dynamiques paysagères.
Ces deux étapes seront menées d’abord sur une diversité de sites d’études pour lesquels des modèles ont déjà été développés, ou sont en cours de développement (e.g. au Burkina Faso, Sénégal, Mozambique, La Réunion, République du Congo). En particulier, cette thèse sera adossée à deux projets où TETIS est fortement impliquée, et qui mettra en œuvre des modèles spatiaux ambitieux (projet AFD/LUCCIA au Mozambique, pour aider à évaluer la stratégie nationale REDD+, et le projet PUDT Congo, pour aider à optimiser le réseau d’approvisionnement en bois-énergie d’une grande ville). Ensuite, un terrain en Afrique de l’Ouest, en lien avec la question de la sécurité alimentaire, sera privilégié. Des analyses plus contextualisées, plus en lien avec le terrain, seront menées avec une visée explicative des caractéristiques observées dans les réseaux.
Profil du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.
Formation et compétences requises :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.
Adresse d’emploi :
Maison de la télédétection, 500 Rue Jean François Breton, 34090 Montpellier
Document attaché : 202209200857_Analyse de réseaux complexes issus de graphes FINAL.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LaBRI (UMR 5800) et IMS (UMR 5218) Université de B
Durée : 3 ans
Contact : Guy.Melancon@u-bordeaux.fr
Date limite de publication : 2022-10-31
Contexte :
Les données sont souvent mises en avant comme potentiel vecteur de développement des organisations. Elles sont présentées comme outil compagnon du pilotage d’une organisation et de la construction de sa stratégie (Waller 2020). La littérature vantant les mérites du « pilotage par les données » est volumineuse, mais emprunte le plus souvent un style qui relève de la vulgarisation scientifique voire de la « propagande » destinée aux acteurs empressée de ne pas rater le rendez-vous d’une transformation qu’il peine à comprendre (Ernst & Young – Mourroux & Deballon 2021), McKinsey (Assur & Rowshankish 2022)…
Dans ce contexte, les aspects de gouvernance des données sont occultés par les questions plus opérationnelles de fouille et d’analyse des données afin d’éclairer la décision; ce sont en effet les usages des données qui intéressent la plupart des acteurs. Bien que la littérature sensibilise au besoin et au bénéfice de doter les organisations d’une gouvernance des données, la définition même de ce qu’est cette gouvernance, sa fonction et sa mise en place sont rarement décrites.
Cela dit, des initiatives sont prises par des organisations afin d’avancer sur le sujet; des définitions, empreintes de pragmatisme en émergent. Par ailleurs, le contexte réglementaire de l’ESRI (Enseignement Supérieur, Recherche et Innovation) apporte des éclairages, mais encore une fois plutôt sur les usages et sur les aspects qui concernent le système d’information, et dans un cadre beaucoup plus large que le seul contexte universitaire (« Cadre Commun d’Urbanisation du SI de l’Etat », v1.0, 2012) (Rapport au Premier Ministre 2016-2017).
La déclinaison du cadre réglementaire au niveau des universités n’est pas immédiate, compte tenu de l’autonomie dont elles disposent en matière stratégique, et des spécificités de leurs missions. La définition de la gouvernance des données, de son organisation et de son fonctionnement dans un établissement universitaire reste à notre sens à faire.
Sujet :
La gouvernance des données suit des ambitions d’un « pilotage par la donnée » de l’établissement, et des objectifs affichés de la politique d’ouverture des données de la recherche. La démarche exige de définir les principes d’une gouvernance guidant toutes initiatives produisant, consommant ou manipulant des données, quelle que soit leur nature, et une mise en cohérence d’initiatives se déployant sur toutes les missions de l’établissement et se déroulant à différentes échelles.
Incidemment, le développement de living labs verra naître des besoins de gestion de données propres à ces projets et constitue en quelque sorte un objet de recherche privilégié pour avancer sur le sujet de la gouvernance. Le lancement d’un projet de recherche action développant les fondements d’une gouvernance des données de l’établissement vient donc répondre au besoin d’une meilleure gestion du cycle de vie des données de ces initiatives, avant que de servir de socle pour définir une gouvernance au niveau de l’établissement.
L’objectif de cette recherche action est d’énoncer clairement les fondements de la gouvernance des données dans le contexte ESRI, et de produire une méthodologie robuste permettant à un établissement universitaire de se doter d’une telle gouvernance. Un corollaire immédiat est la définition au niveau de notre établissement d’une gouvernance des données adaptée à son contexte. La généralisation à tout établissement de l’ESRI, ou à tout le moins aux établissement de profils similaires (membres de UDICE, par exemple) pourra suivre.
Les approches de gouvernance des données sont encore peu documentées, et lorsqu’elles le sont, elles concernent le plus souvent le monde de l’entreprise. La complexité du contexte ESRI en fait une question complexe, certainement due à la multiplicité et l’enchevêtrement des missions de l’établissement, et la multiplicité des acteurs dans le contexte et l’écosystème universitaire.
Ainsi, en associant les perpectives des domaine des systèmes d’information et de la gouvernance de l’information, l’ambition est de proposer un fondement à la gouvernance des données pour un établissement ESRI.
Profil du candidat :
Le.la candidat.e recherché.e, de profil informatique et/ou sciences de l’information, doit montrer un goût pour les questions touchant aux données et aux systèmes d’information, tant d’un point de vue technique qu’organisationnel. Le déroulement du projet amènera le candidat à échanger avec des acteurs aux profils différents, chercheurs impliqués dans des projets soulevant des questions de gouvernance des données ou endossant une responsabilité au niveau institutionnel, par exemple.
Formation et compétences requises :
On peut attendre de la / du candidat.e une formation de type MIAGE ou dans le domaine de l’information et de la communication, par exemple, bien que tout autre profil ou parcours antérieur intéressant pourra être étudié.
Adresse d’emploi :
Université de Bordeaux
351 Cours de la Libération
33405 Talence
France
Document attaché : 202209191621_These_projet_GouD.pdf
Offre en lien avec l’Action/le Réseau : MACLEAN/Doctorants
Laboratoire/Entreprise : LISTIC (Université Savoie Mont-Blanc)
Durée : 3 years
Contact : guillaume.ginolhac@univ-smb.fr
Date limite de publication : 2022-11-01
Contexte :
Institutions: LISTIC, Université Savoie Mont-Blanc, L2S, Université Paris Saclay
Supervisors:
● M. Guillaume Ginolhac, guillaume.ginolhac@univ-smb.fr (04 50 09 65 83),
● Mme Yajing Yan, yajing.yan@univ-smb.fr (04 50 09 65 36),
● M. Nabil El Korso, elkorso.nabil.mohammed@gmail.com (01 40 97 41 39)
Funding: ANR REPED-SARIX project (already obtained)
Beginning date: October 2022
Keywords: SAR interferometry, robust statistics, recursive estimation, missing data imputation, time series
Sujet :
The systematic acquisition of and free access to Sentinel-1 A/B Synthetic Aperture Radar (SAR) images covering Europe every 6 days (every 12 days elsewhere) provide scientists with both opportunities and challenges for operational monitoring of Earth deformation by SAR image time series. Actually, the displacement estimation with SAR image time series has been well studied with the development of numerous multi-temporal Interferometry SAR (InSAR) methods, such as Small BAseline Subset, Permanent Scatterer Interferometry, SqueeSAR, Phase Linking methods, Multi-link InSAR, CAESAR, Least-Square estimator and EMI [1-4]. However, incremental methodological development still seems necessary to reply to the operational requirement, that is, the processing should be efficient and robust, and the results should be reliable.
1. Displacement times series estimation
Thanks to the aforementioned multi-temporal InSAR methods, the accuracy of the displacement velocity estimation has been revolutionized to millimeters per year. However, these methods are mainly retrospective analysis tools and do not allow efficient gradual integration of new SAR images that arrive over time, and it is necessary to restart part of or the whole displacement estimation processing chain, which would be prohibitively expensive in practice and does not answer the need for operational monitoring. In particular, the computational cost is significant when dealing with non-Gaussian data [5] in case of high-resolution SAR data. It is thus crucial to elaborate advanced recursive multi-temporal InSAR methods allowing for efficient gradual integration of new arriving SAR images. Some algorithms have already been developed in the literature, but they do not consider the non gaussianity of the data and their inherent structure [6,7].
In this Ph.D thesis, we aim to develop a novel robust and recursive multi-temporal InSAR approach for operational displacement estimation from SAR image time series. We consider the state-of-the-art Phase Linking approach as the baseline approach in which the sample covariance matrix of SAR image time series is fully exploited. First, we propose a sequential or recursive estimation of the covariance matrix of SAR images, considering the structure of the covariance matrix that is directly related to the decorrelation properties of the targets under observation. Second, we integrate temporal decorrelation models (with possible unknown parameters) providing prior information on the structure of the covariance matrix in the sequential or recursive estimation process to improve the efficiency. We then deploy the Expectation – Maximization (EM) algorithm to estimate jointly the unknown model parameters and the covariance matrix in an iterative way [9]. The displacement time series can be later obtained from the properly estimated covariance matrix.
2. Missing data imputation in SAR displacement time series
Missing data can exist in the displacement time series, mainly due to the coherence loss that results in unreliable displacement estimations. Data gaps can hinder the full understanding of the phenomenon under observation. It is then necessary to fill the gaps by using some data imputation techniques [10].
The second objective of this Ph.D consists of imputing missing data in displacement time series, with the missing data mechanism taken into account by assuming statistical laws and estimating the parameters that describe these statistical laws. We propose to develop a new approach based on the recent reference of [11].
We consider the ‘’Piton de la Fournaise’’ and Merapi volcano test sites as proving ground for the developed approach in this Ph.D thesis. Both descending and ascending Sentinel-1 A/B acquisitions are available. GPS measurements from permanent GNSS stations are also available for results comparison and validation.
References :
[1] A. M. Guarnieri and S. Tebaldini, (2008). On the exploitation of target statistics for sar interferometry applications. IEEE Transactions on Geoscience & Remote Sensing, 46(11) :3436–3443.
[2] P.S. Marinkovic, F. van Leijen, G. Ketelaar, R.F. Hanssen, (2005), Recursive data processing and data volume minimization for PS-InSAR, Proceedings. 2005 IEEE International Geoscience and Remote Sensing Symposium. DOI: 10.1109/IGARSS.2005.1525622
[3] S. Samiei-Esfahany, J.E. Martins, F. van Leijen, R.F. Hanssen, (2016), Phase estimation for distributed scatterers in InSAR stacks using integer least squares estimation, IEEE Transactions on Geosciences & Remote Sensing, vol.54, no.10, pp.5671-5687
[4] M. Schmitt, J.L. Schönberger and U. Stilla, (2014), Adaptive covariance matrix estimation for multi-baseline InSAR data stacks, IEEE Transactions on Geosciences & Remote Sensing, 52(11), pp.6807-6817.
[5] H. Vu, F. Brigui, A. Breloy, Y. Yan, G. Ginolhac, A new phase linking algorithm for multi-temporal INSAR based on the maximum likelihood estimator, IGARSS 2022
[6] H. Ansari, F. De Zan and R. Bamler, (2017), Sequential estimator: Towards efficient InSAR time series analysis, IEEE Transactions on Geosciences & Remote Sensing, 55(10), pp. 5637 – 5652.
[7] F. De Zan, (2020), Progressive InSAR phase estimation, https://arxiv.org/abs/2010.02533
[8] B. Mériaux, C. Ren, M. N. El Korso, A. Breloy and P. Forster, (2019), Robust Estimation of Structured Scatter Matrices in (Mis)matched Models, Signal Processing Journal, Elsevier, vol. 165, pp.163-174.
[9] S. Said, H. Hajri, L. Bombrun, B. Vemuri, (2018), Gaussian Distributions on Riemannian Symmetric Spaces: Statistical Learning With Structured Covariance Matrices, IEEE Transactions on Information Theory, 64(2), pp.752-772.
[10] Hippert-Ferrer A., Yan Y., Bolon P., EM-EOF: gap-flling in incomplete SAR displacement time series. IEEE Transactions on Geoscience and Remote Sensing, 2020.
[11] Sportisse, A., Boyer, C., & Josse, J. (2020). Estimation and imputation in probabilistic principal component analysis with missing not at random data. Advances in Neural Information Processing Systems, 33, 7067-7077.
Profil du candidat :
Profile of candidate: The Ph.D candidate should have good skills in mathematics/statistics and/or signal/image processing. Knowledge in SAR is appreciated.
Formation et compétences requises :
mathematics/statistics and/or signal/image processing master
Adresse d’emploi :
LISTIC (Annecy) and LSS (Paris Saclay)
Document attaché : 202208220654_SujetTheseMultiTemporalInSAR.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIB / RAILENIUM
Durée : 36 mois
Contact : ana-maria.roxin@u-bourgogne.fr
Date limite de publication : 2022-11-06
Contexte :
Les travaux de recherche menés dans le cadre de ce projet concernent le domaine général des systèmes ferroviaires.
Ces systèmes se caractérisent par des besoins critiques en termes de sûreté de fonctionnement, de contraintes métier, technologiques et opérationnelles liées à l’environnement du système (Debbech et al., 2018) à intégrer dès la phase de conception. Les pratiques de modélisation de ces systèmes sont guidées principalement par le retour d’expérience (REX), les standards d’ingénierie système (IEEE, 2017) et les normes du domaine d’application (CENELEC, 2017).
Néanmoins, le processus de modélisation des systèmes ferroviaires repose sur l’interaction entre acteurs pluridisciplinaires, chacun avec son propre jargon métier et son interprétation des connaissances métier en lien. Par conséquent, les connaissances du domaine ont autant d’interprétations que d’acteurs impliqués dans les échanges.
Cela maintient l’ambiguïté sémantique entre acteurs et induit des erreurs de conception.
Par rapport à ces limites et inconvénients, le projet de recherche concerné par cette thèse vise à étudier une approche permettant une interprétation cohérente, complète, unique et univoque des connaissances impliquées dans la modélisation des systèmes ferroviaires, et notamment dans les échanges entre acteurs. Plus particulièrement, il s’agit d’étudier comment peut être spécifiée une interopérabilité sémantique (Roxin, 2018) entre les modèles conceptuels de données (CDM) ferroviaire, exprimées en UML (Unified Modeling Language), et l’architecture fonctionnelle, physique et logique du système.
Les contributions visées pour cette thèse concernent le domaine de la modélisation sémantique des données des systèmes ferroviaires et des contraintes métiers associés. Actuellement les approches de modélisation utilisées par ces acteurs (e.g. CapellaArcadia DSML, UML) ne sont pas interopérables d’un point de vue sémantique. Or cela conditionne la vérification des différentes phases du processus de modélisation ferroviaire, ainsi que du processus en lui-même.
Sujet :
Le verrou scientifique que nous souhaitons traiter dans cette thèse concerne la vérification du processus de modélisation ferroviaire (vérification d’erreurs, l’identification de propriétés dysfonctionnelles, etc.) par le biais d’approches sémantiques. Cette problématique se décline selon les 3 volets listés ci-dessous :
La conception et l’alignement de (méta-)modèles sémantiques – La construction d’ontologies est un procédé manuel long et fastidieux, car les domaines à modéliser sont parfois d’importantes sources de connaissances (et donc des concepts et des relations entre eux). De plus, le processus de construction d’ontologies nécessite le concours d’experts du domaine maîtrisant l’ensemble des connaissances à modéliser. Les travaux visés par cette thèse s’intéresseront à évaluer les modèles et les ontologies existantes, ainsi que déterminer si de nouveaux (méta-) modèles sémantiques doivent être construits,
L’adaptation sous forme de contraintes (règles) sémantiques de contraintes métier, technologiques et opérationnelles liées à l’environnement du système ferroviaire,
La conception de mécanismes de requête optimisés pouvant s’appliquer à(aux) ontologie(s) construites et alignées – Le projet de recherche vise l’automatisation des procédures de vérification des modélisations de systèmes ferroviaires, selon les besoins exprimés, notamment en termes de sûreté de fonctionnement. Cet objectif passe notamment par la formalisation d’un ensemble de connaissances de schémas de modèles et contraintes. Celles-ciseront adaptées en contraintes logiques par rapport à la base de connaissances constituée afin de vérifier le respect ou non de la contrainte associée.
Les résultats et les contributions de cette thèse seront validés par des ces d’études du domaine ferroviaire dans le but de répondre aux défis industriels du processus de développement de systèmes ferroviaires.
Profil du candidat :
Diplômé d’un master universitaire ou diplôme d’ingénieur, vous souhaitez poursuivre vers un doctorat dans le milieu ferroviaire.
Vous disposez de connaissances en ingénierie des connaissances (web sémantique, ontologies) et ingénierie système dirigée par les modèles (MBSE).
Formation et compétences requises :
Des compétences en programmation sont appréciées.
Des connaissances du domaine ferroviaire et du traitement de données sont un véritable plus.
Vous disposez d’un véritable intérêt pour la recherche et la production scientifique,
Vous êtes curieux et avez le sens de l’initiative.
Un bon niveau en anglais (lu et écrit) est exigé.
Expérience dans le poste : Minimum 1 an
Adresse d’emploi :
Poste basé à Villeneuve d’Ascq
Document attaché : 202210070941_[22-40] Doctorant – Interopérabilité sémantique des processus de modélisation de systèmes ferroviaires _ RAILENIUM.pdf
Offre en lien avec l’Action/le Réseau : – — –/Doctorants
Laboratoire/Entreprise : Laboratoire CEDRIC/ ALEKSO Cyber Consulting
Durée : 3ans
Contact : ilham.lammari@lecnam.net
Date limite de publication : 2022-11-30
Contexte :
La réponse à un incident avéré est un processus critique actionné par des experts en sécurité du SOC qui, bien que disposant actuellement d’une panoplie d’outils, doivent mobiliser, sous pression temporelle, un large éventail de connaissances et de compétences leur permettant de choisir le plan qui minimiserait au maximum l’impact de l’incident. De plus, pour l’exercice de leurs tâches, les analystes doivent souvent naviguer dans une panoplie d’outils et voir même être suffisamment performants dans plusieurs langages de script. Pour pallier cet inconvénient et surmonter la courbe d’apprentissage des outils individuels, des plateformes SOAR sont disponible sur le marché mais qui malheureusement sont financièrement inaccessibles pour des petites structures. De plus, l’adoption de telles plateformes oblige les entreprises à avoir les compétences nécessaires pour le développement et la maintenance des playbooks. En dépit de cette prolifération des systèmes avancés de cyberdéfense, l’amélioration des capacités de réponse des entreprises aux incidents reste jusqu’à nos jour un défi majeur dû, entre autres, (a) au manque de personnel de sécurité qualifié, (b) au taux de rotation élevé d’experts en sécurité compte tenu de la nature des tâches à effectuer et qui oblige les entreprises à dépenser beaucoup de ressources pour former de nouveaux experts, à la faible collaboration entre experts engendrée par la pression temporelle à laquelle ils sont confrontés et accentuée, dans certaines entreprises, par le manque d’outils collaboratifs.
Bien que la littérature sur la réponse aux incidents de sécurité soit riche, il n’y a, à notre connaissance aucun travail de recherche qui se focalise sur l’automatisation de la phase de confinement, d’éradication et de récupération
Sujet :
L’objectif de la thèse est donc de proposer un système d’aide à la décision permettant de supporter l’activité d’un expert de sécurité chargé de répondre à un incident avéré. Ce système devrait être amène à fournir des plans d’action mesurables en s’appuyant sur les données de contexte et sur des connaissances capitalisées au sein d’une ontologie de domaine dont la construction fait partie aussi de la thèse. Afin de garantir son évolutivité et sa portabilité, la conception du système projeté doit être dirigée par les modèles.
Profil du candidat :
Le candidat à cette thèse doit avoir :
– un Master 2 recherche en informatique (ou équivalent)
– des compétences en représentation des connaissances et/ou en web sémantique et/ou en modélisation conceptuelle des systèmes d’information.
– des compétences en programmation
Il doit aussi avoir une bonne maîtrise du français (oral et écrit) et de l’anglais (oral et écrit)
Des connaissances en cybersécurité et une expertise en R&D dans la cybersécurité seront un plus.
Formation et compétences requises :
Master 2 recherche en informatique (ou équivalent)
Adresse d’emploi :
ALEKSO Cyber Consulting à Le Plessis-Robinson
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : ICube, Strasbourg
Durée : 3 ans
Contact : jonathan.chardin@cephalgo.com
Date limite de publication : 2022-11-30
Contexte :
The thesis will be carried out in partnership between the company CEPHALGO (specialised in the development of hardware for the recording of EEG signals and their statistical study) under the supervision of Dr Jonathan Chardin and the ICube research laboratory under the supervision of Dr Thomas Lampert HDR, Chair of Data Science and AI (specialised in the development of machine learning and deep learning models). The candidate will share his/her time between the CEPHALGO company and the ICube research laboratory.
Keywords: Deep learning, Affective computing, Valence arousal model, Fourier transform, classifiers, machine learning, PCA, wavelets, statistical analysis.
Sujet :
We are looking for a candidate for a PhD thesis in the field of emotion recognition from electroencephalographic (EEG) signals. The objective of the thesis is to perform statistical analysis of EEG signals and to find correlations between quantities extracted from the raw signals and the emotions associated with the signals during their recording. The candidate will first acquire EEG signals from several users to build a study database. The thesis will then have two stages:
1. As a comparison method, a ‘classical’ analysis of the data will be performed. That is to perform any necessary pre-processing (filtering, elimination of bad signals, estimation of the quality of the signals and decomposition into brain waves, i.e. alpha, beta, theta, gamma waves…), make a statistical study on the data (extraction of quantities from the processed signals, i.e. Hjorth parameters, spectral entropy, moments…), and to find correlations between these different quantities and the emotions associated with the signals.
2. This will lead to the development of machine learning ( particularly deep learning) algorithms to associate EEG signals with their corresponding emotions based on state-of-the-art models (transformers, convolutional neural networks, etc).
Profil du candidat :
Desirable skills:
– Good knowledge of signal processing (Fourier transform, wavelet decomposition, spectrograms, etc.)
– Experience in working with EEG data or time-series would be a plus but not necessary
– Care for patients suffering from mental disorders
Formation et compétences requises :
Skills required:
– Master’s degree (M2) in Computer Science or similar with a strong mathematical component
– Experience in machine learning projects, preferably in addition to Deep Learning
– A solid knowledge of the python programming language and associated libraries (numpy, scipy, matplotlib)
– Project management skills when collaborating with other research partners
– Good interpersonal skills to interact with medical professionals and patients
– Adventurous towards the dynamic startup environment and scientific challenges
Adresse d’emploi :
CEPHALGO, Strasbourg
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 3 ans
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2022-12-15
Contexte :
Le sujet de thèse proposé vise au croisement de deux disciplines principales : l’analyse de réseaux complexes et la modélisation des dynamiques spatiales. La modélisation des dynamiques spatiales est une approche privilégiée pour étudier les processus complexes d’interaction homme-environnement qui sont au centre des systèmes d’utilisation des terres (land use system).
Dans ce contexte, une nouvelle approche fondée sur le concept de graphe d’interaction a été développée au CIRAD/UMR TETIS, avec l’objectif de permettre un meilleur couplage des systèmes de modélisation avec des SIG (Système d’Information Géographique) et améliorer la modélisation des mécanismes qui sont influencés par des structures spatiales dynamiques. Le graphe d’interaction est un graphe (un ensemble de nœuds connectés par des arcs) dont les arcs peuvent porter des fonctions d’interaction. Un système représenté par des graphes d’interaction peut ainsi évoluer lorsque les fonctions d’interactions sont activées et que celles-ci modifient les entités connectées. Les éléments présents dans un espace géographique peuvent ensuite définir des relations spatiales, fonctionnelles, hiérarchiques et même sociales. La mise en œuvre de cette approche s’appuie sur le langage de modélisation Ocelet, et son environnement logiciel de développement (http://www.ocelet.org).
Les modèles développés avec Ocelet sont employés principalement pour simuler des dynamiques spatiales dans différents systèmes territoriaux complexes, comme par exemple, pour comparer plusieurs scénarios d’utilisation des terres. Ces modèles font généralement intervenir plusieurs graphes d’interaction dans des structures porteuses de connaissances du fonctionnement et de l’organisation du territoire. Jusqu’à présent, lors de déploiement de ces modèles, seuls les résultats de simulation sont analysés ; les graphes ne le sont pas, alors qu’ils sont une expression formelle de processus très divers qui interagissent dans le territoire. Ces analyses permettraient notamment d’expliciter les liens entre structure et fonctionnement du territoire, pour viser, à terme, la possibilité d’inférer des connaissances des processus à partir de l’exploration de données spatiales, comme celles issues d’images satellite.
Laboratoire d’accueil :
Le doctorant ou la doctorante sera accueilli dans le laboratoire TETIS à Montpellier (France). Le laboratoire TETIS est une Unité Mixte de Recherche (UMR) entre INRAE, le CIRAD, AgroParisTech et le CNRS.
L’UMR TETIS mène des recherches méthodologiques sur la gestion de l’information spatiale. Une approche intégrée de la chaîne de l’information spatiale est mise en œuvre, de l’acquisition à son usage, en passant par son traitement et sa gestion.
Sujet :
L’objectif global de cette thèse est le développement de méthodologies innovantes, basées sur les techniques d’analyse de réseaux complexes, pour l’analyse des graphes d’interaction issus de la modélisation des dynamiques paysagères. Ce travail permettra d’exploiter de manière originale les modèles de simulation spatiale développés avec l’approche Ocelet, en permettant de créer de nouvelles connaissances à partir des graphes d’interaction modélisés et de ses dynamiques. Des algorithmes de classement, clustering, diffusion de l’information et prédiction des liens spécifiquement adaptés au contexte des relations caractéristiques (e.g., spatiales, fonctionnelles, hiérarchiques et sociales) entre les entités d’un système paysager pourront être développés. Ceci représentera une contribution significative aussi bien dans le domaine de l’analyse de réseaux et science des données, que dans celui de la modélisation et de l’analyse des dynamiques paysagères.
La première étape du travail de recherche est liée à la nécessité de comprendre comment les graphes d’interaction entre les éléments d’un paysage visible sur les images satellite, et qui expriment le fonctionnement du socio-écosystème présent dans le paysage, se traduisent dans la structure en réseau de ces graphes. La seconde étape consistera à développer et implémenter des méthodes d’analyse de réseaux complexes spécifiquement adaptés aux modèles pris en comptes en réponse à la question de recherche précédente. L’idée est d’obtenir une suite de méthodes d’analyse généralisables à différents contextes, qui pourront être ensuite intégrés dans la plateforme Ocelet. Pour mener ce travail, nous adopterons une démarche pluridisciplinaire, où les contributions méthodologiques proposées seront toujours soumises aux avis d’experts en modélisation spatiale des dynamiques paysagères.
Ces deux étapes seront menées d’abord sur une diversité de sites d’études pour lesquels des modèles ont déjà été développés, ou sont en cours de développement (e.g. au Burkina Faso, Sénégal, Mozambique, La Réunion, République du Congo). En particulier, cette thèse sera adossée à deux projets où TETIS est fortement impliquée, et qui mettra en œuvre des modèles spatiaux ambitieux (projet AFD/LUCCIA au Mozambique, pour aider à évaluer la stratégie nationale REDD+, et le projet PUDT Congo, pour aider à optimiser le réseau d’approvisionnement en bois-énergie d’une grande ville). Ensuite, un terrain en Afrique de l’Ouest, en lien avec la question de la sécurité alimentaire, sera privilégié. Des analyses plus contextualisées, plus en lien avec le terrain, seront menées avec une visée explicative des caractéristiques observées dans les réseaux.
Profil du candidat :
Caractéristiques attendues du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.
Formation et compétences requises :
Caractéristiques attendues du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.
Adresse d’emploi :
500 rue Jean François Breton, 34000, Montpellier
Document attaché : 202211181533_Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIP6, SU – Thales TRT
Durée : 36 mois
Contact : Claire.Laudy@thalesgroup.com
Date limite de publication : 2022-12-15
Contexte :
Les informations récoltées dans des contextes réels sont le plus souvent imparfaites, entachées d’imprécision et d’incertitude. L’objectif de la thèse est de développer de nouveaux outils permettant d’intégrer cette dimension imparfaite, d’une part dans la représentation de l’information, et d’autre part dans les mécanismes de manipulation de cette information, en particulier dans les opérations d’inférence qui en déduisent de nouvelles informations.
Sujet :
Le formalisme choisi pour les travaux de thèse est celui des graphes conceptuels pondérés, qui offrent la possibilité de représenter et de manipuler des informations à un niveau sémantique et de leur associer des informations complémentaires par l’ajout de poids qui augmentent encore leur expressivité.
Les travaux de thèse visent à développer ce cadre formel en caractérisant la sémantique associée à différentes formes d’imperfection potentielles et en examinant les contraintes et avantages associés, à la fois en termes théoriques et applicatifs. Un second axe a pour objectif de développer de nouvelles méthodes de fusion d’information dans ce formalisme, en particulier pour réaliser des opérations de filtrage et d’agrégation et pour traiter des tâches de recherche de motifs fréquents correspondant à des régularités d’intérêt dans les informations collectées.
Profil du candidat :
capacités d’analyse et de formalisation, curiosité scientifique
Formation et compétences requises :
Le/la candidat(e) doit posséder un master en intelligence artificielle/apprentissage automatique, avec des connaissances en logique formelle et représentation des connaissances. Le langage de programmation privilégié pour les travaux qui seront réalisés pendant la thèse est python.
Adresse d’emploi :
Thales TRT, (Massy-Palaiseau) et LIP6, Sorbonne Université, Jussieu (Paris)
Document attaché : 202210070743_theseThalesLIP6_graphesSemantiquesFlous.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Institut Denis Poisson (IDP), Université d’Orléan
Durée : 3 ans
Contact : diarra.fall@univ-orleans.fr
Date limite de publication : 2022-12-25
Contexte :
Spectral imaging finds applications in many different fields including remote sensing for Earth observation and in medicine.
In Earth observation, multiband imaging provides a detailed characterization of the observed scene by sensing the reflected electromagnetic spectrum in tens nay hundreds of spectral bands. This characterization can be leveraged for ecosystem monitoring, environmental suveillance or land cover mapping. However, multiband images face an unsurpassable trade-off which limits the intrinsic spatial resolution as spectral resolution increases. Several techniques have been developped in the remote sensing literature to overcome this limitation, namely spectral unmixing, subpixel mapping or pansharpening. All these tasks can be formulated as challenging inverse problems.
On the other hand, in medicine, functional near-infrared spectroscopy (fNIRS) is a noninvasive brain imaging technique used to measure evoked changes in cerebral blood oxygenation. Because it is more portable and less restrictive than other popular brain imaging such as functional magnetic resonance imaging (fMRI), fNIRS is widely used with children and other special populations. However, fNIRS has a lower spatial resolution compared to fMRI. Furthermore, the signals are corrupted by physiological noise and motion artefacts, and isolating the desired signals from the unwanted noises is a challenging inverse problem task.
Sujet :
Whatever the applicative contexts, the aforementioned restoration problems can be straighforwardly formulated in a Bayesian framework. Indeed the Bayesian paradigm provides a versatile statistical framework to formulate inverse problems. Formulating restoration problems within a Bayesian formalism allows the estimation to be endowed with an assessment of uncertainty, which is of great importance for several applications. However this formulation requires the definition of regularizations by introducing additional information to mitigate the lack of information brought by the observations. For ill-posed problems, the choice of the prior has a significant impact on the solution. Conventional approached generally use explicit priors designed to promote expected or desired properties of the signals and images to be restored. However, in practice, it can be difficult to explicitly define such a function that captures all the desired properties.
As an alternative, we propose to tackle these restoration problems in a Bayesian framework using implicitly priors specified by neural networks. For instance, implicit priors defined by the architecture of convolutional neural networks have been used in [1]. Variational auto-encoders proposed in [2] have been successfully used for learning priors in various imaging problems such as denoising and deblurring in [3]. Plug and play priors [4] appear also of great interest since they have have shown remarkably accurate results when combined with denoisers based on convolutional neural networks [5].
The proposed PhD thesis project aims at developing new Bayesian restoration methods for Earth observation and fNIRS data, using convolutional neural networks data-driven priors.
The proposed methods will be applied on hyperspectral mineralogical data from BRGM and acquired in the SOLSA H2020 project for rock analysis; and FNIRS data available at Centre Hospitalier Régional d’Orléans for studying human brain activity during motor execution.
More information : http://dobigeon.perso.enseeiht.fr/proposals/proposal_PhD_2022_AIiO.pdf
Profil du candidat :
Master or Engineering school student in applied mathematics, computer science or electrical engineering.
Formation et compétences requises :
The knowledge needed for this work includes a strong background in textbf{signal & image processing}, textbf{applied mathematics} (probability & statistics, optimization, etc.) and/or machine learning. Good scientific programming skills (e.g., Python or Matlab) and good communication skills in English, both written and oral are also expected.
Adresse d’emploi :
Institut Denis Poisson
Université d’Orléans
45100 Orléans
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LaTIM / LabSTICC
Durée : 36 mois
Contact : francois.rousseau@imt-atlantique.fr
Date limite de publication : 2022-12-31
Contexte :
Lab
La recherche à IMT Atlantique concerne près de 800 personnes, dont 290 enseignants et chercheurs et 300 doctorants, et porte sur les technologies du numériques, de l’énergie et de l’environnement. Il couvre toutes les disciplines (des sciences physiques aux sciences humaines et sociales en passant par celles de l’information et du savoir) et couvre tous les domaines des sciences et des technologies de l’information et de la communication.
La thèse se déroulera au laboratoire LaTIM (INSERM U1101), sur le campus de Brest, en collaboration avec le Lab-STICC (Brest).
Date de début : Octobre 2022
Financement : Union européenne (projet CEREBRO)
Sujet :
Description
Description du projet :
Le projet EIC Pathfinder CEREBRO (an electric Contrast medium for computationally intensive Electroencephalographies for high REsolution BRain imaging withOut skull trepanation) vise le développement d’une nouvelle modalité d’imagerie de l’anatomie et de l’activité électrophysiologique du cerveau, qui est essentielle pour de nombreuses applications, notamment la dosimétrie électromagnétique, la neurostimulation, les interfaces cerveau-ordinateur et le diagnostic de maladies telles que le cancer, l’épilepsie et la maladie de Parkinson.
L’imagerie de l’activité cérébrale peut être réalisée à l’aide d’un électroencéphalographe (EEG), mais en raison des effets de blindage du crâne, la résolution spatiale des relevés est limitée. Une solution fréquente pour surmonter ce problème consiste à implanter des électrodes directement sous le crâne (ECoG) ou sur le cortex. L’imagerie qui en résulte est de meilleure qualité, mais elle n’est que locale.
CEREBRO verra la conception et le design d’une nouvelle modalité d’imagerie basée sur un milieu de contraste électromagnétique qui permettra de contourner l’effet de blindage du crâne, permettant ainsi une imagerie à haute résolution spatiale de l’activité cérébrale dans son ensemble, tout en préservant la haute résolution temporelle des modalités d’imagerie directe de l’activité électrophysiologique.
Les informations qui seront rendues accessibles à la communauté médicale n’ont jamais été extraites auparavant et devraient permettre des percées importantes dans le domaine des neurosciences et des soins aux patients.
Description du sujet :
Ce travail de thèse vise à étendre les algorithmes statiques de source inverse en neuroimagerie au régime des hautes fréquences. Ces extensions reposeront sur le remplacement du “problème direct” statique par un problème dynamique (pour lequel le solveur sera spécifiquement développé). Les courants statiques sont remplacés par des courants oscillants et le potentiel est remplacé par le champ électromagnétique harmonique. Il s’agit clairement d’un cadre sans précédent pour la neuro-imagerie, mais la stabilité à haute fréquence est très attendue puisque le problème mathématique de la neuro-imagerie à haute fréquence pourrait être considéré comme une contrepartie vectorielle de l’imagerie de la source acoustique dans l’eau pour laquelle il existe des algorithmes de source inverse très efficaces.
Dans ce but, il s’agira d’implémenter des algorithmes de source inverse à haute fréquence utilisés par exemple en océanographie et de les utiliser en neuro-imagerie. Contrairement au cas statique qui est mathématiquement mal posé (pour des distributions de sources générales), les problèmes de sources inverses multifréquences sont bien posés. On s’attend donc à ce que l’imagerie en présence des micro-tiges, en plus de compenser les différences de RSB entre les lectures EEG invasives et non invasives, réduise également le caractère mal posé, ce qui permettra d’augmenter encore la précision.
Ce travail de thèse vise à apporter une contribution sur les méthodes de résolution de problèmes inverses à l’aide de techniques d’apprentissage profond. Il s’agira de mettre en place une formulation variationnelle pour l’estimation des propriétés électrophysiologies des tissus cérébraux à partir de données dans le cadre de l’apprentissage profond afin d’apprendre conjointement le terme de régularisation (a priori) et le solveur associé au problème de minimisation.
Profil du candidat :
Ingénieur ou M2 en apprentissage, mathématiques appliquées, traitement du signal et des images.
Formation et compétences requises :
Les compétences requises pour mener à bien ce travail concernent l’apprentissage machine, le traitement d’images, et les mathématiques appliquées. Des connaissances en informatique et en programmation (Python) seront également requises afin de développer les algorithmes associés.
Adresse d’emploi :
IMT Atlantique, Campus de Brest.
Document attaché : 202207050741_2022-Cerebro_french.pdf
