Deep Interaction — Apprentissage par renforcement pour l’analyse et la comparaison de dessin de graphes

When:
01/04/2019 – 02/04/2019 all-day
2019-04-01T02:00:00+02:00
2019-04-02T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : Laboratoire Bordelais de Recherche en Informatique
Durée : Jusqu’à 6 mois
Contact : romain.giot@u-bordeaux.fr
Date limite de publication : 2019-04-01

Contexte :
Les graphes sont couramment utilisés dans différentes applications (analyse de réseaux sociaux, enchaînement de calculs, …) pour représenter des relations entre plusieurs entités. Il est nécessaire de les dessiner de façon non ambiguë pour les visualiser et comprendre les relations entre les différentes entités. En raison de leur complexité, il n’existe pas de méthode parfaite pour représenter un réseau.
Les algorithmes de dessin sont couramment évalués en demandant à plusieurs personnes d’effectuer différentes tâches de bas niveaux à partir d’une représentation, souvent interactive, du graphe ; plus elles sont efficaces pour les réaliser, meilleur est l’algorithme de dessin. Les méthodes modernes de dessin de graphes utilisent différentes heuristiques pour augmenter la qualité du dessin (et donc la performance des humains lors de la réalisation des tâches ciblées par ces heuristiques). Comme leur calcul peut être très coûteux, des méthodes d’apprentissage automatique commencent à être utilisées pour les approximer [HWP∗18]. De manière générale, des méthodes d’apprentissage automatique peuvent être utilisées pour réaliser certaines tâches de perception visuelles contraintes [HTP18]. Il est prévisible que les réseaux de neurones profonds soient de plus en plus utilisés pour évaluer les dessins produits par des machines (par exemple, pour produire plusieurs représentations différentes de la même donnée et sélectionner la plus pertinente) ou extraire de l’information depuis ces représentations (afin de vérifier que l’information que nous voulons coder dans le dessin soit bien présente).
L’apprentissage par renforcement permet à un agent d’interagir avec un environnement de façon à optimiser une récompense pouvant potentiellement être obtenue après un certain délai. Depuis quelques années, il est possible de calculer la fonction de calcul de récompense par un réseau de neurones profond afin de produire des systèmes suffisamment performants pour jouer à des jeux vidéos [MKS*13]. Notre hypothèse de travail est qu’une approche similaire peut être utilisée pour naviguer dans la représentation interactive du graphe afin d’y extraire de l’information pertinente.

Sujet :
Le but de ce stage est de mettre au point un système d’apprentissage profond par renforcement qui cherche à réaliser une tâche sur le dessin d’un graphe de façon à obtenir de meilleure performance que l’apprentissage standard prenant en entrée une image fixe. En effet, en étant capable d’interagir avec la représentation de l’image, l’agent va pouvoir collecter plus d’informations qu’avec une image fixe et se servir de cet ensemble d’informations pour effectuer sa prédiction finale.
Diverses interactions de l’agent sur la représentation interactive sont envisageables : zoom pour obtenir plus de détails sur une zone précise, pan pour se déplacer sur une zone précise, sélection d’un nœud pour mettre en évidence le voisinage.Des actions liées à sa représentation des données qu’il analyse seront nécessaires : ajout d’un nœud, positionnement d’un nœud, ajout d’un lien entre deux nœuds, etc… Nous espérons que l’agent agisse de façon similaire à un humain (zoom&pan pour naviguer dans un gros graphe, sélection d’un nœud pour mettre en évidence les voisins par exemple pour la recherche d’un chemin, …) pour réaliser des tâches de haut niveau [KPS2014] et qu’il éprouve des difficultés similaires aux humains en fonction de la représentation fournie en entrée. L’utilisation conjointe de réseaux de neurones récurrents [GSK*2017] peut être nécessaire pour réaliser le projet afin de garder en mémoire les différentes informations collectées lors de l’interaction.

Profil du candidat :
 Le candidat doit être à l’aise avec les langages de programmation Python et C++. Il doit posséder la curiosité et motivation nécessaires pour prendre en main les différentes bibliothèques de manipulation de réseaux de neurones profonds, de création d’agents et de visualisation d’information. Une expérience en apprentissage automatique est un véritable plus.

Formation et compétences requises :
Nous cherchons un étudiant en Master 2, ou dernière année d’école d’ingénieur, dans des domaines que l’informatique, l’ingénierie ou les sciences des données.

Adresse d’emploi :
Laboratoire Bordelais de Recherche en Informatique

Unité Mixte de Recherche CNRS (UMR 5800)
351, cours de la Libération F-33405 Talence cedex

Document attaché : StageDeepInteraction.pdf