Stage PFE: Moteur d’exploration Big Data des données de campagne de mensuration

When:
10/01/2021 all-day
2021-01-10T00:00:00+01:00
2021-01-11T00:00:00+01:00

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : Université de Technologie de Troyes
Durée : 6 mois
Contact : babiga.birregah@utt.fr
Date limite de publication : 2021-01-10

Contexte :
DiTeX est une un laboratoire commun de R&D en Data-Innovation pour l’industrie du Textile et de l’habillement (DiTeX) qui regroupe l’Université de Technologie de Troyes (UTT) et l’Institut Français Textile et Habillement (IFTH). Il a pour ambition d’explorer les nouvelles voies dans le domaine de la modélisation statistique et des Big Data pour l’analyse et la valorisation des données appliquées aux problèmes et aux données de l’habillement. L’un des axes de développement de nouveau services concerne la segmentation des données métier (matériaux, mensurations, morphologie, etc.) pour permettre une exploration exhaustive des panels.

Sujet :
Pour avoir une bonne connaissance des données et de leur « richesse intrinsèque », il est important de mettre en place un moteur d’exploration. Ce moteur devra intégrer des algorithmes de classification et de segmentation de profils de campagnes de mensuration. L’objectif à terme est de pouvoir mesurer la fiabilité en identifiant (voir prédire) les critères impactant pour préconiser des techniques d’enrichissement de données.
Vos missions:
– Création d’une data pipeline
– Dimensionnement et création de la plateforme d’exploration
– Mise en place d’algorithmes de de segmentation
– Mise en place d’un outil de prédiction de la qualité des données.

Profil du candidat :
Le profil recherché doit avoir de bonnes connaissances en :
– Statistiques,
– Data science ou Big Data
– Ingénierie de la donnée (plus globalement),
De plus le candidat doit être en fin de cursus ingénieur ou master ou mastère spécialisé en Mathématiques ou Informatiques. Elle/il doit être capable de mener à bien une mission de « data exploration », présenter et défendre ses résultats.

Formation et compétences requises :
Sur le plan technique :
– Très bonne maîtrise de Python pour le data science,
– Rigueur dans la création et la gestion de bases de données,
– Connaissance en DataLake.

Adresse d’emploi :
Equipe Modélisation et Sûreté des Systèmes (M2S)
Département Recherche Opérationnelle, Statistiques Appliquées, Simulation (ROSAS)
Université de Technologie de Troyes
12, rue Marie Curie
CS 42060 – 10004 Troyes Cedex