Atelier Traitement Informatique des Données de Santé (2024)
Responsables
- Nicolas LACHICHE, ICube, INS2i
- Natalia GRABAR, STL, INSHS
- Christine SINOQUET, LS2N, INS2i
Correspondant ComDIR : Myriam Maumy-Bertrand
Thématiques
Données concernées
Mots clés
Contexte scientifique
Cette situation se reflète sur les productions scientifiques. Par exemple, le nombre de publications dédiées au traitement des données médicales en français reste faible [GG21].
Nous proposons l’atelier TIDS au sein du GDR MADICS dont l’objectif est de regrouper la communauté qui s’intéresse aux données de santé : chercheurs provenant de différentes disciplines, cliniciens, industriels, experts des institutions gouvernementales, associations de patients… Différents aspects des données de santé seront abordés dans notre atelier, en fonction des actions menées et des acteurs impliqués.
Cet atelier est le reflet du paysage actuel de la recherche. En effet, le domaine de santé attire l’attention de la communauté scientifique de l’IA depuis de nombreuses années. Il existe ainsi en France plusieurs initiatives, avec lesquelles nous prévoyons d’interagir :
- Les journées IA & Santé de la plateforme PFIA s’intéressent à tous les aspects liés à l’application de méthodes et technologies de l’IA aux données de santé. Les données de santé y occupent une place importante mais restent un moyen, sans devenir l’objet des études à part entière. La plateforme PFIA correspond à l’une des localisations possibles d’actions de notre atelier ;
- Les entrepôts de données de santé dans les CHU prennent de plus en plus d’ampleur car les CHU poursuivent l’objectif de fédérer leurs données afin d’avoir une vue globale et assurer des moyens pour les projets de recherche au sein des CHU. Cependant, ces efforts et réflexions restent souvent limités aux CHU, même si des journées de travail pour échanger sur les expériences locales sont organisées régulièrement entre les CHU. De plus, les données ne peuvent pas être diffusées aux partenaires non cliniques en dehors des CHU ;
- La Fédération Nationale Scientifique des Données en Santé (FNSDS) commence son activité le 9 novembre 2023. Il s’agit sans doute de l’initiative la plus proche de l’atelier TIDS que nous proposons au sein de MADICS. La différence principale est que la FNSDS est fondée par des cliniciens, alors que notre atelier sera animé par des chercheurs en informatique et SHS. Les points de vue sont forcément différents mais convergents à certains points. Des collaborations et actions communes seront proposées.
- La difficulté d’accès aux données de santé est connue et des accès s’ouvrent peu à peu, comme proposé par exemple par le Système National des Données de Santé (SNDS) https://www.cnrs.fr/fr/cnrsinfo/les-donnees-de-sante-ouvrent-des-perspectives-de-recherche. La procédure est longue, et peu de chercheurs ont pu en bénéficier jusqu’à maintenant.
Notre atelier TIDS est proche de deux ateliers de MADICS :
- DOING (2020-2024) s’intéresse au traitement automatique de données textuelles de différents domaines (médical, juridique, environnemental…). L’objectif est de transformer les données textuelles en données structurées. L’accent est mis sur le traitement et la transformation des données. Dans notre atelier, nous mettons l’accent sur l’accès aux données cliniques (textuelles, structurées, de laboratoire, images…) et leur traitement.
- ReProVirtuFlow (2016-2019) s’intéressait à la reproductibilité d’analyse de données biologiques à différents niveaux. Avec l’accès et la disponibilité des données cliniques, nous visons aussi la problématique de reproductibilité à travers des expériences et modèles.