Thèse CIFRE (RENAULT-LIPN) : Clustering multi-blocs et visualisation analytique de données séquentielles massives issues de simulation du véhicule autonome

When:
30/09/2018 – 01/10/2018 all-day
2018-09-30T02:00:00+02:00
2018-10-01T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : Laboratoire d’Informatique de Paris-Nord (LIPN)
Durée : 3 ans
Contact : mustapha.lebbah@univ-paris13.fr
Date limite de publication : 2018-09-30

Contexte :
Dans un contexte en pleine mutation le monde automobile évolue rapidement : la voiture devient électrique, connectée et autonome. En particulier, l’Alliance Renault-Nissan, premier constructeur automobile mondial, relève le défi de concevoir des véhicules autonomes de niveau 4 (sur 5) SAE à l’horizon 2022.

Le déploiement de véhicules autonomes repose sur le développement de systèmes embarqués (lois de commande, capteurs, fusion de données et dynamique du véhicule) robustes et performants. Effectivement ils doivent rester robustes aux perturbations extérieures et aux défaillances. Ils doivent aussi être performants en face de critères de sécurité routière et de confort des passagers. Ces études doivent être effectuées sur un nombre important de scènes de roulage qui représente un échantillon représentatif de toutes les situations et conditions que peut rencontrer un véhicule autonome.

Devant ce nombre important de cas à étudier, le recours à la simulation numérique massive devient nécessaire. L’Alliance Renault-Nissan veut mettre en place un outil de simulation massive qui simule plusieurs centaines de Mkms par plan de simulation. Cette plateforme de simulation massive a pour vocation d’accompagner le développement de systèmes embarqués de leur conception jusqu’à leur validation fonctionnelle.

Sujet :
La plateforme de simulation massive permet de simuler des plans de simulation et de stocker un grand nombre de variables issues de plusieurs centaines de Mkms de roulage numérique. Ces raw data peuvent être de nature différente :

– Métadonnées qui caractérisent les scénarios, les véhicules et leur variabilité (~ 40 variables)

– Variables externes temporelles issues de l’environnement du véhicule autonome (~ 50 variables)

– Variables internes temporelles issues des modèles systèmes (lois de commande, capteurs, fusion de données et dynamique du véhicule) du véhicule autonome (plusieurs 1000 variables)

Cette plateforme intègrera une fonction d’analyse automatique des causes de dysfonctionnement du véhicule autonome. Pour ce faire deux niveaux d’analyse seront distingués. Le premier est une analyse par causes externes du dysfonctionnement, elle consiste en la description du dysfonctionnement en termes d’éléments externes au véhicule autonome tels que les caractéristiques de la route, les conditions météorologiques ou encore le comportement des autres véhicules. Le second est une analyse par causes internes du dysfonctionnement, elle consiste en la description du dysfonctionnement en termes de signaux internes échangés entre les différents modèles systèmes (lois de commande, capteurs, fusion de données et dynamique du véhicule) du véhicule autonome. Enfin la combinaison des analyses par causes externes et internes doit permettre l’identification de root causes de dysfonctionnement du véhicule autonome.

Afin de pouvoir représenter ce grand nombre de données et surtout mieux les comprendre, il faut faire appel à des techniques de fouille de données séquentielles et d’apprentissage statistique massivement distribué.

Les challenges suivants seront donc à relever :

1/ La visualisation analytique de grand volume de données est forcément plus complexe. Il faudra pouvoir envisager des techniques de projection et de visualisation à grande échelle

2/ Clustering multi-bloc de données séquentielles avec sélection de variables

3/ L’identification des root causes de dysfonctionnement du véhicule autonome

4/ Le traitement de volumes de données de simulation avec les nouvelles plateformes big-data

Profil du candidat :
Le candidat(e) doit avoir de bonnes notions en mathématique, statistiques et algorithmiques. Une expérience en traitement de données massives avec des plateformes innovantes est souhaitable.

Formation et compétences requises :
M2/ingénieur

Adresse d’emploi :
RENAULT Technocentre

Document attaché :