Système d\’exploration et de recommandation pour les données de santé

When:
31/05/2016 – 01/06/2016 all-day
2016-05-31T02:00:00+02:00
2016-06-01T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : CReSTIC, Université de Reims
Durée : 3 ans
Contact : frederic.blanchard@univ-reims.fr
Date limite de publication : 2016-05-31

Contexte :
Cette thèse se déroulera au laboratoire CReSTIC de l’Université de Reims Champagne-Ardenne sous la direction de Michel Herbin (PR, CReSTIC, URCA) et sera co-encadrée par Frédéric Blanchard (MCF, CReSTIC, URCA). Le travail de thèse débutera en septembre 2016.

Dans le cadre de collaborations avec des réseaux et professionnels de santé, notre équipe a été amenée à travailler sur l’exploitation des données de santé ou de bien être. Ces données requièrent des développements méthodologiques spécifiques. Cette thèse s’inscrit dans ce contexte scientifique.

Sujet :
L’évolution des technologies du numérique engendre une explosion de masses de données disponibles, souvent hétérogènes et incomplètes, mais riches en informations. Dans certains domaines, les méthodes classiques de data mining et de machine learning ne sont pas en mesure de les exploiter efficacement.
Cette thèse propose de construire les briques méthodologiques et algorithmiques d’un système d’exploration et de recommandation, orienté-cas, destiné à l’exploration de données de santé.
L’approche proposée devra prendre en compte le caractère atypique ou inhabituel des données et favorisera l’émergence de nouvelles hypothèses, afin, par exemple, de faciliter la mise en œuvre de stratégies thérapeutiques personnalisées.
Les différentes contributions attendues prendront place dans un système de recommandation et permettront de :
– mettre en place des calculs spécifiques de similarités entre cas,
– caractériser la singularité et l’atypicité de différents cas,
– et visualiser les regroupements et les structurations qui guideront l’utilisateur dans l’exploration des données.

Le travail de développement se fera de préférence en R (et C/C++) sous forme de packages ouverts, afin de faciliter la reproductibilité des résultats et leur diffusion.

Profil du candidat :
Le candidat recherché doit être intéressé par la recherche en “data science” et disposer des compétences informatiques et mathématiques nécessaires.

Formation et compétences requises :
Le candidat sera issu d’une école d’ingénieur ou d’un master 2 (en mathématiques appliquées, statistiques ou informatique). De solides compétences en analyse de données et en machine learning sont nécessaires. La connaissance d’un langage pour le prototypage (R ou python) est requise, celle de C/C++ est un plus.

Adresse d’emploi :
CReSTIC/URCA
UFR Sciences Exactes et Naturelles
Moulin de la Housse – BP 1039
51687 REIMS Cedex 2

Document attaché :