Action Traitement Informatique des Données de Santé (2024)
Responsables
- Nicolas LACHICHE, ICube, INS2i
- Natalia GRABAR, STL, INSHS
- Christine SINOQUET, LS2N, INS2i
Correspondant ComDIR : Myriam Maumy-Bertrand
Thématiques
Dans ce cadre, les thématiques concernent les travaux sur :
- l’intégration de données, l’ingénierie des connaissances ou encore la recherche d’information sémantique,
- l’intégration de données de santé à des modèles de l’apprentissage automatique au sens large,
- l’adaptation d’algorithmes d’apprentissage aux spécificités des données de santé,
- la modélisation multi-échelle,
- la fédération de données.
Données concernées
Mots clés
Contexte scientifique
Cette situation impacte les avancées de la recherche et la production scientifique. Par exemple, le nombre de publications dédiées au traitement des données médicales en français reste faible.
Au sein du GDR MADICS, nous proposons l’Action TIDS, faisant suite à l’Atelier du même nom. L’objectif de cette action est de regrouper la communauté qui s’intéresse aux données de santé : chercheurs provenant de différentes disciplines, cliniciens, industriels, experts des institutions gouvernementales, associations de patients… Différents aspects des données de santé seront abordés dans notre Action, en fonction des activités abordées et des acteurs impliqués.
Cette Action est le reflet du paysage actuel de la recherche. En effet, le domaine de santé attire l’attention de la communauté scientifique de l’IA depuis de nombreuses années. Il existe ainsi en France plusieurs initiatives, avec lesquelles nous continuerons les interactions et/ou la collaboration :
- Les journées IA & Santé de la plateforme PFIA s’intéressent à tous les aspects liés à l’application de méthodes et technologies de l’IA aux données de santé. Les données de santé y occupent une place importante mais restent un moyen, sans devenir l’objet des études à part entière. La plateforme PFIA correspond à l’une des localisations possibles d’activités de notre Action.
- Les entrepôts de données de santé dans les CHU prennent de plus en plus d’ampleur car les CHU poursuivent l’objectif de fédérer leurs données afin d’avoir une vue globale et assurer des moyens pour les projets de recherche au sein des CHU. Cependant, ces efforts et réflexions restent souvent limités aux CHU, même si des journées de travail pour échanger sur les expériences locales sont organisées régulièrement entre les CHU. De plus, les données ne peuvent pas être diffusées aux partenaires non cliniques en dehors des CHU.
- La Fédération Nationale Scientifique des Données en Santé (FNSDS) a été créée le 9 novembre 2023. Le porteur de l’Atelier TIDS était présent à l’assemblée constituante. La FNSDS est une association programmée sur le long terme, disposant de peu de moyens pour soutenir l’animation. Au contraire, l’Action TIDS permet une animation sur 24 mois. Nous avons d’ailleurs déjà invité avec succès deux membres fondateurs de la FNSDS, qui ont présenté leurs travaux lors de la deuxième journée de séminaires de l’Atelier TIDS (16 octobre 2024, site Web), organisée à PariSanté Campus.
Des collaborations et actions communes seront proposées. - La difficulté d’accès aux données de santé est connue et des accès s’ouvrent peu à peu, comme proposé par exemple par le Système National des Données de Santé (SNDS) https://www.cnrs.fr/fr/cnrsinfo/les-donnees-de-sante-ouvrent-des-perspectives-de-recherche. La procédure est longue, et peu de chercheurs ont pu en bénéficier jusqu’à maintenant. Lors de la première journée de séminaires de l’Atelier TIDS (29 mai 2024, site Web), dans le contexte du Symposium MADICS à Blois, Thomas Guyet avait présenté l’organisation des données du SNDS et des utilisations possibles.
- Le HDH (Health Data Hub) a pour objectif de garantir un accès unifié et sécurisé aux données de santé. Récemment, le HDH s’est positionné comme un acteur intermédiaire d’accès au données SNDS. Le HDH s’occupe aussi du chaînage des SNDS avec d’autres bases de données, comme les causes médicales de décès (base du CépiDC(1) de l’Inserm) ou les données relatives au handicap (en provenance des MDPH(2) – données de la CNSA(3)). Lors de la première journée de séminaires de l’Atelier TIDS (29 mai 2024, site Web), dans le contexte du Symposium MADICS à Blois, un représentant du HDH a effectué une présentation de cette plateforme.
(1) Centre d’épidémiologie sur les causes médicales de décès
(2) Maison Départementale pour les Personnes Handicapées
(3) Caisse Nationale de Solidarité pour l’Autonomie
Dans ce contexte, lors de la deuxième journée de séminaires de l’Atelier TIDS, nous avons commencé à mettre en avant diverses initiatives pour mieux tirer profit des données de santé, à des fins d’exploitation secondaire pour la recherche.