Génération automatique d’explications adaptées aux utilisateurs : évaluer et améliorer la confiance dans les modèles prédictifs et la connaissance du phénomène prédit

When:
05/07/2018 – 06/07/2018 all-day
2018-07-05T02:00:00+02:00
2018-07-06T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LIFAT Université de Tours
Durée : 3 ans
Contact : patrick.marcel@univ-tours.fr
Date limite de publication : 2018-07-05

Contexte :
Le BRGM étudie de nombreux phénomènes naturels liés au sous-sol : formation des gisements de ressources minérales, dynamique des nappes phréatiques, risques sismiques, alea des retraits gonflements des argiles, vulnérabilité des nappes aux pollutions de surface… Prédire certains de ces phénomènes présente des enjeux importants : de l’anticipation de crise à la gestion durable des ressources naturelles.

Sujet :
Nous nous intéressons dans cette thèse à l’apport des méthodes de machine learning, et notamment de deep learning, qui sont des modèles prédictifs généraux et a priori agnostiques d’un contexte d’utilisation, pour les problèmes de prédiction propres au BRGM.
Si ces modèles d’apprentissage prouvent chaque jour un peu plus leur supériorité en termes d’efficacité pour certaines tâches comme la reconnaissance d’images, la classification de texte ou la reconnaissance de la parole, ils se présentent, même lorsque l’utilisateur introduit de la connaissance, comme des « boites noires » : on ne sait pas pourquoi, in fine, une prédiction est faite.

Cette particularité constitue le verrou scientifique de cette thèse. Sa résolution s’inscrit dans un courant scientifique émergeant (“algorithm transparency”) et doit favoriser d’une part la confiance que l’on peut avoir dans ces modèles, i.e. s’assurer qu’une bonne prédiction est faite pour de bonnes raisons, et donc leur adoption, en particulier par les scientifiques du BRGM et, d’autre part l’émergence de nouvelles pistes d’explication des phénomènes modélisés, en exhibant les raisons sous-jacentes aux prédictions.

Le travail de thèse s’organisera en 3 étapes :
1. Obtenir des modèles prédictifs « boites noires » de certains phénomènes naturels sélectionnés,
2. Proposer une méthode de génération automatique d’explications des prédictions de ces modèles et enfin,
3. Mesurer l’apport de ces explications, en termes de confiance et de connaissance des utilisateurs des modèles.

Les deux dernières étapes sont largement liées aux utilisateurs du modèle et les approches proposées devront s’inspirer de méthodes « centrées utilisateur », comme celles déjà développées par le LIFAT. Par exemple, on pourra s’intéresser à l’impact de l’explication produite sur l’évolution de l’expertise de l’utilisateur. Une dernière perspective consiste à étudier la possibilité de créer une boucle vertueuse entre ces 2 étapes qui permettrait de revoir l’explication qui est faite d’un modèle tant que son appropriation par l’utilisateur n’est pas acquise.

Candidatures ouvertes jusqu’au 05 juillet 2018 en envoyant CV, lettre de motivation et derniers relevés de notes.

Contact : nicolas.labroche@univ-tours.fr, patrick.marcel@univ-tours.fr, V.Labbe@brgm.fr

Profil du candidat :
Master en informatique

Formation et compétences requises :
Master en informatique

Adresse d’emploi :
Université de Tours – Campus de Blois, Département Informatique, 3 place Jean Jaurès

Document attaché : Thèse-BRGM.pdf