Apprentissage semi- et auto-supervisé exploitant du clustering avec connaissances

When:
31/01/2023 all-day
2023-01-31T01:00:00+01:00
2023-01-31T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFO
Durée : 6 mois
Contact : thi-bich-hanh.dao@univ-orleans.fr
Date limite de publication : 2023-01-31

Contexte :
La cartographie du potentiel minéral consiste principalement à déterminer le lien statistique entre un ensemble d’occurrences minérales (points) et une carte géologique (polygones) dans le but d’indiquer des zones favorables en termes de potentiel minier. La majorité de ces cartes de favorabilité sont générées par des techniques numériques, et notamment depuis quelques années par des méthodes d’intelligence artificielle. Cependant les méthodes actuelles comportent des défauts liés à la qualité des données, à la présence d’approximations infondées et à l’utilisation de méthodes supervisées sur des données majoritairement non annotées [1,2]. Nous nous intéressons à explorer de nouvelles pistes pour améliorer la précision de la cartographie prédictive du potentiel minéral par le couplage d’une part de l’intégration de connaissances géologiques dans des algorithmes de clustering afin d’obtenir des clusters mieux fondées géologiquement, et d’autre part de l’utilisation de méthodes d’apprentissage semi-supervisé ou auto-supervisé pour la construction de carte.

Ce sujet s’intègre dans le cadre du projet ANR Contrats doctoraux IA.iO Artificial Intelligence in Orléans: Learning from heterogeneous data and expert knowledge. Applications in geological and environmental sciences. Le stage sera encadré conjointement par des membres du LIFO et des membres du BRGM. Un financement de thèse est prévue suite à ce sujet.

Sujet :
L’objet du stage est d’étudier les deux volets :
utilisation de méthodes de clustering existantes et intégration de connaissances [3,4,5] en vue d’améliorer les données d’entrées des modèles de prédictivité minérales. Les connaissances géologiques sont des ontologies développées au BRGM.
étude de méthodes semi-supervisées ou auto-supervisées pour détecter des anomalies sur la carte géologique en tirant partie de l’apprentissage non-supervisé (clustering). Le résultat du clustering sera utilisé avec peu de données labellisées pour améliorer le modèle de prédiction d’apprentissage semi-supervisé ou auto-supervisé [6, 7].
Les solutions à étudier incluent l’apprentissage non-supervisé, et l’apprentissage profond avec faible supervision.

Travail attendu :
– Rapport d’étude des méthodes d’apprentissage non-supervisé sur les données géologiques.
– Rapport d’étude des méthodes auto- et semi- supervisées existantes tirant partie de l’apprentissage non-supervisé.
– Etude et implémentation d’une nouvelle méthode (ou amélioration d’une méthode existante)

Profil du candidat :
– Profil Informatique, machine learning ou mathématique appliquée.
– Capacité de synthèse et de rédaction permettant une restitution régulière, claire et efficace du travail effectué.

Formation et compétences requises :
Master et/ou école d’ingénieur en Mathématiques/Informatique

Adresse d’emploi :
Les candidats sont encouragés à nous contacter au plus tôt possible. Envoyez nous votre candidature à Thi-Bich-Hanh Dao (thi-bich-hanh.dao@univ-orleans.fr) en joignant votre dossier en un seul fichier pdf, comprenant un CV, une lettre de motivation et vos relevés de notes depuis le baccalauréat. Les documents peuvent être en anglais ou en français.

Document attaché : 202212150852_Stage-2023.pdf