Postdoc en intégration de données médicales

When:
25/08/2017 – 26/08/2017 all-day
2017-08-25T02:00:00+02:00
2017-08-26T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : I3S (Sophia Antipolis)
Durée : 2 ans
Contact : johan.montagnat@cnrs.fr
Date limite de publication : 2017-08-25

Contexte :
Le projet “Intégration et Analyse de Données Biomédicales” (IADB) est un projet de l’Idex UCA JEDI de l’Université Côte d’Azur. Il vise à améliorer le pronostique médical et l’assistance à la prise de décision dans le domaine clinique par des techniques d’analyse de masses de données. Il met en résonance des compétences en traitement de la langue naturelle (pour extraire une information symbolique des comptes rendus médicaux), en imagerie (pour l’extraction de biomarqueurs), en intégration de masses de données (pour amplifier la puissance statistique des processus d’analyse par l’intégration de très grandes cohortes médicales) et en apprentissage profond (pour classifier les données selon des indications pathologiques ou répondre à des questions cliniques).

Sujet :
L’une des problématiques abordées dans IADB est l’intégration et le chaînage de grands volumes de données médicales issus de plusieurs sources (bases de données médico-administratives des centres hospitaliers, informations extraites de compte-rendus d’hospitaliastion textuels, bases de données spécifiques d’études cliniques…), dont les schémas sont hétérogènes et susceptibles d’évoluer au cours du temps (schéma de résumé d’hospitalisation de l’ATIH, classifications et référentiels médicaux), à des fins d’interrogation pour le filtrage et la constitution de cohortes. L’extraction des informations depuis les bases ciblées pourra nécessiter l’inférence de propriétés à partir des données et des schémas utilisés.

Le sujet de ce postdoc consiste en l’étude des schémas et des représentations de données utilisées afin d’intégrer l’ensemble des informations disponibles dans une base fédérée, de permettre l’alignement sémantique et le filtrage des données pour générer des sources de données de procédures d’apprentissage. Des schémas de données NoSQL sont particulièrement considérés dans une première étape pour permettre l’intégration de données de natures très différentes et selon des schémas flexibles. Les standards du web sémantique seront considérés comme représentation pivot pour formaliser, aligner les données et permettre de raisonner sur ces données le cas échéant. Il devra ensuite être possible de sélectionner les données selon des critères spécifiques aux études médicales menées et d’en proposer une transformation propre à leur utilisation comme sources de données pour des réseaux de neurones profonds.

Profil du candidat :
Le ou la candidat(e) devra avoir une bonne expérience de l’intégration de données et du traitement de bases volumineuses. Une connaissance des schémas de données utilisés dans le domaine médical et une expérience des techniques d’apprentissage sont un plus.

Formation et compétences requises :
Travaux de référence dans le laboratoire:
[1] F. Michel, L. Djimenou, C. Faron-Zucker, J. Montagnat. “Translation of Heterogeneous Databases into RDF, and Application to the Construction of a SKOS Taxonomical Reference” in Web Information Systems and Technologies: 11th International Conference, WEBIST 2015, Revised Selected Papers, pages 275-296, Springer, 2016, 978-3-319-30995-8. http://hal.archives-ouvertes.fr/hal-01337308
[2] F. Michel, C. Faron-Zucker, J. Montagnat. “A Mapping-based Method to Query MongoDB Documents with SPARQL” in Proceedings of the 27th International Conference on Database and Expert Systems Applications (DEXA’16), Porto, Portugal, september 2016. http://hal.archives-ouvertes.fr/hal-01330146
[3] F. Michel, C. Faron-Zucker, J. Montagnat. “A Generic Mapping-Based Query Translation from SPARQL to Various Target Database Query Languages” in Proceedings of the 12th International Confenrence on Web Information Systems and Technologies (WEBIST 2016), Rome, Italy, April 2016. http://hal.archives-ouvertes.fr/hal-01280951
[4] F. Michel. “Integrating Heterogeneous Data Sources in the Web of Data”, Phd Thesis, Université Côte d’Azur, 226 pages, Sophia Antipolis, France, March 2017. https://hal.archives-ouvertes.fr/tel-01508602

Adresse d’emploi :
Laboratoire I3S
Sophia Antipolis

Document attaché :