Segmentation sémantique des nuages de point 3D via l’apprentissage profond

When:
12/07/2020 – 13/07/2020 all-day
2020-07-12T02:00:00+02:00
2020-07-13T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : L@bISEN Yncréa Ouest, Equipe Vision-AD
Durée : 3 ans
Contact : ayoub.karine@yncrea.fr
Date limite de publication : 2020-07-12

Contexte :
La compréhension et l’interprétation d’une scène 3D complexe est une tâche visuelle innée chez l’être humain qui peut être effectuée de manière instantanée et sans effort. Déléguer cette tâche à la machine afin de l’automatiser est un domaine qui a suscité la curiosité de plusieurs chercheurs de la communauté de la vision par ordinateur [1, 2, 3].

Dans la dernière décennie, les avancées technologiques ont permis l’acquisition d’un volume important et représentatif de scènes 3D réels sous forme de nuages de points. Parmi ces systèmes d’acquisition, on cite les scanners LIDAR (Light Detection And Ranging) et les caméras RGB-D (Red Green Blue – Depth). La segmentation de ces nuages de points en régions homogènes permet, ainsi, de générer une représentation sémantique de la scène observée. On s’intéressera plus précisément à l’interprétation des scènes d’intérieur (pièces, bureau…) et d’extérieur (bâtiments, villes, zones rurales…).

Sujet :
Les nuages de points 3D modélise une représentation parcimonieuse d’une scène ou d’un objet. Ces nuages de points sont souvent non-structurés et non-ordonnés. Autrement dit, il n’existe pas un moyen pour les regrouper directement dans une grille afin de les considérer étant des pixels d’une image 2D.

La segmentation sémantique d’une scène, représentée par un nuage de points 3D, consiste à affecter des classes à chaque point 3D. Cette tâche est établie en utilisant une méthode de classification souvent supervisée. Pour ce faire, l’approche classique consiste à classifier les descripteurs (souvent liés à la forme) extraits à partir des nuages de points. Récemment, la disponibilité de bases de données composées d’un nombre important de nuages de point 3D annotés (NPM3D, S3DIS, Paris-Lille 3D…) a rendu difficile l’adoption de ces méthodes classiques. Pour remédier à cette difficulté, plusieurs chercheurs ont opté pour l’utilisation de l’apprentissage profond et plus précisément les réseaux de neurones convolutifs (Convolutional Neural Networks, CNN). Cette méthode a prouvé sa performance dans plusieurs applications liées à l’image 2D. Elle se base sur des convolutions discrètes exigeant une structure sous forme de grilles de données. De ce fait, l’utilisation directe de cette méthode pour le cas des nuages 3D reste impossible. Pour remédier à cela, deux familles de méthodes sont proposées dans littérature [4, 5]. La première famille consiste à projeter les points dans un autre espace à travers lequel une convolution discrète est possible [6, 7]. Quant à la seconde famille, elle tente de modifier la méthode CNN pour prendre en considération la nature complexe des nuages de points [3, 8]. Dans le cadre de la présente thèse, nous nous focaliserons sur le deuxième type d’approche qui est en début d’investigation.

Profil du candidat :
Le ou la candidat(e) doit :
– Être titulaire d’un diplôme de Master et/ou Ingénieur, ou en cours de préparation, dans des domaines liés à l’informatique et la science de données

Formation et compétences requises :
Le ou la candidat(e) doit :
– Avoir un vif intérêt pour la recherche scientifique et être familier au moins avec l’un des outils/langages suivants (python, Keras, TensorFlow…)
– Avoir une aptitude au développement de prototypes
– Avoir de très bonnes connaissances théoriques et pratiques en Intelligence Artificielle, plus précisément en Deep Learning et en Vision par Ordinateur

Adresse d’emploi :
20 Rue Cuirassé Bretagne, 29200 Brest
ou
35 Avenue du Champ de Manœuvre, 44470 Carquefou

Document attaché : 202006090823_SujetCotutelle_ISENYncreaOuest.pdf