Thèse CIFRE : Interprétation automatique de données géophysiques par techniques d’apprentissage

When:
01/12/2021 – 02/12/2021 all-day
2021-12-01T01:00:00+01:00
2021-12-02T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : MACLEAN/– — –

Laboratoire/Entreprise : LISTIC (USMB) et Géolithe
Durée : 3 ans
Contact : guillaume.ginolhac@univ-smb.fr
Date limite de publication : 2021-12-01

Contexte :
Le géoradar ou Ground Penetrating Radar (GPR) est une technologie permettant de sonder les sols à la recherche d’objets enfouis ou étudier la composition du sol (différentes couches constituantes et leurs proportions par exemple). Il s’agit d’un système radar émettant une onde électromagnétique pénétrant le sol et se réfléchissant sur les différents éléments le constituant. En captant les signaux réfléchis, on peut obtenir un signal appelé radargramme et qui est analysé pour étudier le sol en question. L’amélioration récente des technologies en termes d’antennes ont permis une réduction significative de la taille des géoradars. Ainsi il est envisageable de considérer un scénario de géoradar aéroporté (monté sur un drone) afin d’analyser les sols ainsi que les pans de montagnes de manière plus extensive.

Dans ce cadre, le projet s’intéresse à l’étude radargrammes obtenus en milieu montagneux dans le cadre de mission de protection contre les risques naturels gravitaires. Cette information est capitale pour prévoir la chute de rochers ainsi que des glissements de terrain dont la fréquence augmente avec le réchauffement climatique et éviter des dégâts potentiels aux infrastructures de montagne telles que les routes, ponts, bâtiments et autres infrastructures liés aux activités économiques telles que le tourisme. Le scénario du géoradar aéroporté étant éloigné du scénario classique du géoradar plaqué au sol, il est ainsi nécessaire de prendre en compte les spécificités de ce nouveau mode d’acquisition. Une transposition directe des outils de traitements développés pour le géoradar plaqué au sol n’est donc pas possible.

Le but général dans ce contexte est de détecter / classifier les différentes structures géologiques ou objets présents dans le sous-sol. Pour réaliser cette opération, Géolithe a l’intention d’utiliser des techniques d’intelligence artificielle (IA) nécessitant des données préalablement labélisées. Ce travail de labellisation a été initié au sein de l’entreprise et la base de données est mise à jour continuellement.

Sujet :
Malheureusement, il est très difficile d’appliquer directement les techniques d’IA à cause de plusieurs paramètres :
• Les images provenant des données GPR sont déjà dans le cas classique assez bruitées entrainant un rapport signal à bruit peu important. Ce problème est encore plus prononcé pour les géoradar aéroporté car ils sont situés plus loin de la surface. De plus, ces images GPR aéroportés comportent un certain nombre de données aberrantes qui peuvent réduire fortement la performance des algorithmes d’IA.
• La diversité des données est assez pauvre. En effet, une seule gamme de fréquence est utilisée et il n’y a pas d’information polarimétrique ce qui rend la distinction entre les objets délicate.
• Les données sont labélisées par des experts mais pour un non spécialiste, il n’est pas toujours évident de distinguer les différences et il est donc probable que la phase d’apprentissage soit cruciale pour bien distinguer les différentes réponses du sous-sol.
• Même si les données labélisées par géolithe sont importantes, elles seront sûrement insuffisantes pour entrainer un algorithme d’IA n’ayant pas été pré-entrainé.

Pour utiliser efficacement les techniques d’IA, il va falloir bien prendre en compte ces différentes problématiques et faire évoluer les algorithmes existants pour qu’ils s’adaptent à la caractéristique des données GPR. Plus particulièrement, il sera difficile d’utiliser les données brutes directement.

Les objectifs de la thèse sont doubles :
• Dans un premier temps il s’agit de trouver un espace de représentation des données (features) permettant de mieux faire ressortir les différences entre les différentes classes des données labélisées. On s’intéressera notamment à des représentations par matrices de covariances qui sont une solution apportant des bonnes performances dans des applications liées au radar
• Dans un second temps, l’objectif est de développer des algorithmes efficaces et adaptés à cet espace de représentation. Notamment, les features obtenues peuvent vivre un espace de représentation non-euclidien et il sera nécessaire de prendre en compte cet aspect à l’aide d’outils tels que la géométrie riemannienne.
• Considérer d’un point de vue théorique les réseaux ainsi obtenus et apporter de la robustesse dans les architectures utilisées face aux contraintes évoquées en imagerie GPR.

Profil du candidat :
Master recherche ou ingénieur avec une expérience en apprentissage statistique

Formation et compétences requises :
Intérêt pour les mathématiques appliquées (statistiques, algèbre linéaire)
Compétences : vision par ordinateur, statistiques, apprentissage automatique, notamment deep learning
Programmation : Python, frameworks de Deep Learning (Tensorflow, PyTorch)

Adresse d’emploi :
LISTIC, Annecy
Géolithe, Grenoble

Document attaché : 202109011525_Sujet these Geolithe.pdf