[Thèse CIFRE] Nettoyage automatisé de données avec des réseaux de neurones profonds

When:
30/06/2022 – 01/07/2022 all-day
2022-06-30T02:00:00+02:00
2022-07-01T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire I3S / Entreprise Himydata
Durée : 36 mois
Contact : lionel.fillatre@i3s.unice.fr
Date limite de publication : 2022-06-30

Contexte :
L’industrie 4.0 s’appuie sur la récupération et l’analyse de données provenant de nombreux capteurs et machines. La détection automatique non-supervisée d’anomalies dans ces données, suivie d’un nettoyage adéquat, est essentiel pour garantir le développement de cette nouvelle industrie. Ce projet de thèse souhaite développer un réseau de neurones profond pour effectuer ces détections et le nettoyage associé. L’architecture de ce réseau doit permettre de comprendre pourquoi le réseau nettoie, et donc modifie, une donnée. De cette façon, ce nettoyage automatisé sera explicable pour les utilisateurs impliqués.

La thèse sera réalisée avec le laboratoire I3S rattaché à l’Université Côte d’Azur et au CNRS et l’entreprise Himydata.

Sujet :
Le passage d’une industrie dite 3.0 à une industrie 4.0 se fait par la récupération de données en masse concernant les machines à l’aide de capteurs (positionnés à chaque étape du processus de production) qui sont les éléments de base des systèmes de contrôle et d’acquisition de données en temps réel. Cette quatrième révolution industrielle se caractérise aussi par la connexion des objets (ou machines) entre eux. Le but est d’obtenir une nouvelle génération d’usines connectées, robotisées et intelligentes afin de pouvoir surveiller sa production et donc d’améliorer la qualité et le temps de création des produits ainsi que d’optimiser les procédés. Cela va permettre aussi de réduire les temps d’arrêt en étant averti au préalable de l’état des machines.

Le but de l’entreprise Himydata associée à cette thèse est de rendre toutes ces données accessibles, compréhensibles et analysables par le plus grand nombre. Ce sont des bases de données complexes avec des données provenant de sources hétérogènes, possédant de nombreux attributs. Les règles sur ces données sont inconnues ou, dans le meilleur cas, très peu connues. De plus, les données provenant du monde réel sont bruitées et souvent corrompues. Ces effets peuvent avoir un impact important sur la compréhension des données, leur modélisation et sur les prises de décisions qui en découlent [1,2]. Ainsi, l’étape cruciale dans l’utilisation des données est la détection et le nettoyage des erreurs dans les données. En effet, en identifiant et en nettoyant les données « sales », il est possible d’obtenir une plus grande compréhension des données, d’améliorer les modèles se servant de ces dernières ou encore de prendre de meilleures décisions.

Profil du candidat :
Le candidat devra être titulaire d’un M2 ou grade équivalent au moment du recrutement.
Il devra aimer l’intelligence artificielle et l’apprentissage automatique.

Formation et compétences requises :
Apprentissage automatique (machine learning), réseau de neurones, probabilités et statistiques, Python (ou langage équivalent), autonomie, curiosité, esprit de synthèse.

Adresse d’emploi :
Université Côte d’Azur
Laboratoire I3S
Euclide B, 2000 Rte des Lucioles
06900 Sophia Antipolis

Document attaché : 202205162026_Sujet_These_Cifre_I3S_Himyadata_2022.pdf