Configuration Automatique de réseaux de neurones profonds, à l’aide de méthodes multi-Objectif

When:
01/04/2020 – 02/04/2020 all-day
2020-04-01T02:00:00+02:00
2020-04-02T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : CRIStAL équipe ORKAD
Durée : 3 ans
Contact : julie.jacques@univ-catholille.fr
Date limite de publication : 2020-04-01

Contexte :
ORKAD est une équipe de recherche du groupe thématique OPTIMA du laboratoire CRIStAL (Centre de Recherche en Informatique, Signal et Automatique de Lille) (UMR CNRS 9189) de l’Université de Lille.
L’objectif principal de l’équipe ORKAD est d’exploiter simultanément l’optimisation combinatoire et l’extraction de connaissances pour résoudre des problèmes d’optimisation. Bien que les deux domaines scientifiques se soient développés de manière plus ou moins indépendante, la synergie entre l’optimisation combinatoire et l’extraction de connaissances offre une opportunité d’améliorer les performances et l’autonomie des méthodes d’optimisation grâce à la connaissance et, d’autre part, de résoudre efficacement les problèmes d’extraction de connaissances grâce aux méthodes de recherche opérationnelles [Dhaenens-Jourdan2016]. Nos approches sont principalement basées sur l’optimisation combinatoire mono et multi-objective. Le groupe ORKAD a sur ses travaux des coopérations avec les hôpitaux de la région (CHRU et GHICL), des entreprises (Alicante, Meilleureassurance.com, OVH).
Les méthodes d’optimisation combinatoire présentent l’intérêt d’être rapides et d’explorer de grands espaces de recherche (de nombreuses combinaisons de facteurs) et permettent de gérer partiellement la volumétrie des données. Par exemple, l’algorithme MOCA-I [Jacques2013-a] et ses extensions [Vandromme2015], sont une première approche pour la classification des données hétérogènes et mal réparties par méthode d’optimisation. MOCA-I a été intégré dans un moteur de prédiction de profil patient avec succès permettant de recommander des patients à des inclusions dans des recherches cliniques. Sur l’étude NUTRISEP, il a permis de retrouver en 50 jours autant de patients que l’expert en 1000 jours. Parmi les profils proposés, on retrouve des profils non identifiés par l’expert initialement. MOCA-I a également été testé pour la détection de séjours concernant des patients porteurs de bactéries multi-résistantes (BMR). Il permet de détecter 11,5% de BMR supplémentaires, et 21% de SARM supplémentaires (Staphylococcus aureus résistant à la méticilline).

La généralisation de la collecte de données numériques fait que l’apprentissage automatique sur données massive reste à ce jour un sujet de recherche stratégique. D’un côté, les méthodes d’optimisation permettent déjà d’obtenir des résultats intéressants, sous forme de boîte blanche : les résultats sont facilement interprétables, mais au prix de nombreux calculs. D’autre part, les réseaux de neurones profonds commencent à bénéficier de moyens de calculs importants, comme par exemple des cœurs de calcul dédiés chez NVidia (Tensor Core). L’objectif de cette thèse est de déterminer comment les méthodes d’optimisation multi-objectif peuvent faciliter la configuration des hyperparamètres d’un réseau de neurones et améliorer son interprétabilité. Ce qui permettra de réunir les réseaux de neurones profonds, qui sont une approche boîte noire avec des résultats difficiles à interpréter, et les approches d’apprentissage par optimisation de type boîte blanche, sur lesquelles l’équipe ORKAD a déjà travaillé dans le passé. De plus, l’expérience d’ORKAD sur la configuration automatique d’algorithmes multi-objectifs [Blot2017a] pourra être capitalisée pour ce projet

Sujet :
Dans cette thèse, nous verrons ce que l’optimisation multi-objectif peut apporter aux réseaux de neurones profonds, pour combiner les avantages des deux méthodes : rapidité, qualité et interprétabilité des modèles générés.
Dans cette thèse nous nous intéresserons à deux aspects :

Le premier aspect concerne l’hyper-paramétrage automatique de réseaux de neurones profonds. La mise en place de réseaux de neurones profonds nécessite de déterminer empiriquement la valeur de nombreux hyper-paramètres (par exemple : choix de la fonction d’activation, nombre de couches ,…). Nous proposons d’utiliser des méthodes de configuration automatique d’algorithmes comme irace [López-Ibáñez2016] ou paramILS [Hutter2009] pour déterminer la configuration d’hyperparamètres idéale. L’apport du multi-objectif sera de trouver des configurations de réadaptées à des environnements différents. Il s’agira de générer des réseaux de neurones dont les caractéristiques sont adaptées au problème et à son environnement. Les réseaux de neurones générés pourront être par exemple des réseaux de neurones compacts et peu coûteux en temps CPU/ énergie, à exécuter sur des appareil mobiles comme des raspberry pour l’informatique géodistribuée (fog computing) ou des objets de santé connectés (montres de fitness, cardiofréquencemètre,…). Cette approche doit aussi permettre de proposer des réseaux de neurones qui pourront être utilisés sur des serveurs de calculs ou des architectures avec des coeurs de calcul dédiés (TensorCore).

Le second aspect concerne l’interprétabilité de l’intelligence artificielle (eXplainable Artificial Intelligence ou XAI). Le rapport du CCNE de 2018 (Comité consultatif national d’éthique) recommande l’utilisation de méthodes qui peuvent être facilement remises en question par le personnel médical. Les méthodes de type boîte blanche sont donc à privilégier, ce qui n’est pas le cas des réseaux de neurones profonds. Dans un premier temps l’objectif est d’étudier les approches émergentes telles que BreakDown [Staniak2019] qui permettent d’augmenter l’interprétabilité des réseaux de neurones. Dans un deuxième temps, en étudiant grâce à l’approche proposée précédemment comment les hyper-paramètres influent sur la qualité de l’interprétation. Cela permettra d’élaborer une nouvelle version de l’approche proposée, qui maximise à la fois la qualité de l’interprétation et la performance du réseau.

L’aspect interprétabilité sera enrichi par un cas d’utilisation réel avec l’un des partenaires d’ORKAD. Par le passé, de nombreux travaux ont été réalisés avec ORKAD et le GHICL lors de thèses ou de projets de recherche de type ANR. Dans un premier temps le cas d’utilisation permettra d’évaluer le besoin d’interprétation. Dans un second temps, ce cas d’utilisation permettra de vérifier l’apport de la méthode proposée.

Profil du candidat :
BAC + 5 en informatique
Bon niveau en programmation.

Formation et compétences requises :
BAC + 5 en informatique
C++ et/ou Python (TensorFlow, Scikit learn,…)
Une expérience en Machine Learning et/ou en optimisation combinatoire est un plus

Adresse d’emploi :
UMR CRIStAL
Université de Lille – Campus scientifique
Bâtiment ESPRIT
Avenue Henri Poincaré

Document attaché : sujet_mo_nn_xai_2020.pdf