Stage PFE en Statistiques: Analyse de population – Imputation / redressement

When:
28/02/2021 all-day
2021-02-28T00:00:00+01:00
2021-03-01T00:00:00+01:00

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : Université de Technologie de Troyes
Durée : 6 mois
Contact : pierre.beauseroy@utt.fr
Date limite de publication : 2021-02-28

Contexte :
Ref. N° DTX 04122020 (à préciser dans l’objet votre mail de candidature + lettre de motivation)
Contexte
DiTeX est une un laboratoire commun de R&D en Data-Innovation pour l’industrie du Textile et de l’habillement (DiTeX) qui regroupe l’Université de Technologie de Troyes (UTT) et l’Institut Français Textile et Habillement (IFTH). Il a pour ambition d’explorer les nouvelles voies dans le domaine de la modélisation statistique et des Big Data pour l’analyse et la valorisation des données appliquées aux problèmes et aux données de l’habillement. L’un des axes de développement de nouveau services concerne l’exploitation des données métier (matériaux, mensurations, morphologie, etc.) pour permettre une exploration optimale des panels.

Sujet :
Dans la pratique, l’objectif est d’extraire du panel complet une population qui corresponde aux caractéristiques désirées d’une population cible (âge, sexe…) et de s’assurer que cette partie du panel est bien représentative de la population cible dans son ensemble. Pour ce faire, il est possible de s’appuyer sur des données tierces (INSEE…). Ces données tierces peuvent aussi apporter des informations complémentaires (non disponibles ou partiellement renseignées pour le panel), qu’il peut s’avérer utile d’exploiter.
L’étape de définition d’une population peut donc comporter une phase de choix des individus et de redressement de la population pour correspondre aux caractéristiques de la cible visée et l’apport d’information complémentaire pose la question de l’enrichissement des données de la population sélectionnée.
L’objet du stage et d’étudier ces deux aspects.

Vos missions:
– Faire un état de l’art sur le redressement des échantillons et sur l’enrichissement de données.
– Faire une première exploration des données de l’IFTH
– Identifier des données externes pertinentes pour l’enrichissement, et/ou le redressement
– Proposer des modalités de redressement et/ou d’enrichissement adaptées à une population cible définie dans le cadre d’un « cas d’école ».
– Proposer une stratégie d’évaluation de la pertinence de la population après redressement/enrichissement par rapport à la cible.

Profil du candidat :
Profil recherché et compétences :
Etre en fin de formation ingénieur ou master ou mastère spécialisé en Mathématiques ou Informatiques et avoir de bonnes connaissances en :
– Statistiques,
– Data science
– Ingénierie de la donnée (plus globalement),

Formation et compétences requises :
Elle/il doit être capable de mener à bien une mission de « data exploration », présenter et défendre ses résultats (esprit critique et de synthèse).
Sur le plan technique:
– Très bonne maîtrise de Python et/ou Matlab pour le data science,
– Outils statistiques

Adresse d’emploi :
Université de Technologie de Troyes
Equipe Modélisation et Sûreté des Systèmes (M2S)
Département Recherche Opérationnelle, Statistiques Appliquées, Simulation (ROSAS)
*** Affectation :
La/le candidat(e) retenu(e) aura à travailler dans une équipe mixte IFTH-UTT à Troyes.