TIDS

 

Atelier Traitement Informatique des Données de Santé (2024)

Responsables

Correspondant ComDIR : Myriam Maumy-Bertrand

Thématiques

Utilisation secondaire des données de santé, intégration de données, ingénierie des connaissances, recherche d’information sémantique, intégration de données de santé à des modèles de l’apprentissage automatique, adaptation d’algorithmes d’apprentissage aux spécificités des données de santé, modélisation multi-échelle, fédération de données.

Données concernées

données de santé, et plus particulièrement au dossier patient : des champs variés dans la perspective de l’histoire médicale du patient, les données textuelles, éventuellement des images.

Mots clés

Santé, aide à la décision, confidentialité

Contexte scientifique

Avec l’évolution récente de méthodes et technologies informatiques, de nouvelles perspectives dans le traitement de données médicales et cliniques s’ouvrent [BAY22, GM21]. Cependant, ces possibilités sont rapidement limitées par l’accès difficile aux données cliniques, à leur catégorisation et annotations. Cela constitue un point souvent bloquant dans les collaborations et la résolution de problèmes scientifiques : il existe des besoins réels du côté des cliniciens, il existe des réponses potentielles du côté des experts en traitement informatique de données mais la collaboration est impossible à cause de la spécificité des données cliniques [ORK22] et de la difficulté de leur diffusion, même dans le cadre de collaborations au sein des projets de recherche.

Cette situation se reflète sur les productions scientifiques. Par exemple, le nombre de publications dédiées au traitement des données médicales en français reste faible [GG21].

Nous proposons l’atelier TIDS au sein du GDR MADICS dont l’objectif est de regrouper la communauté qui s’intéresse aux données de santé : chercheurs provenant de différentes disciplines, cliniciens, industriels, experts des institutions gouvernementales, associations de patients… Différents aspects des données de santé seront abordés dans notre atelier, en fonction des actions menées et des acteurs impliqués.

Cet atelier est le reflet du paysage actuel de la recherche. En effet, le domaine de santé attire l’attention de la communauté scientifique de l’IA depuis de nombreuses années. Il existe ainsi en France plusieurs initiatives, avec lesquelles nous prévoyons d’interagir :

  • Les journées IA & Santé de la plateforme PFIA s’intéressent à tous les aspects liés à l’application de méthodes et technologies de l’IA aux données de santé. Les données de santé y occupent une place importante mais restent un moyen, sans devenir l’objet des études à part entière. La plateforme PFIA correspond à l’une des localisations possibles d’actions de notre atelier ;
  • Les entrepôts de données de santé dans les CHU prennent de plus en plus d’ampleur car les CHU poursuivent l’objectif de fédérer leurs données afin d’avoir une vue globale et assurer des moyens pour les projets de recherche au sein des CHU. Cependant, ces efforts et réflexions restent souvent limités aux CHU, même si des journées de travail pour échanger sur les expériences locales sont organisées régulièrement entre les CHU. De plus, les données ne peuvent pas être diffusées aux partenaires non cliniques en dehors des CHU ;
  • La Fédération Nationale Scientifique des Données en Santé (FNSDS) commence son activité le 9 novembre 2023. Il s’agit sans doute de l’initiative la plus proche de l’atelier TIDS que nous proposons au sein de MADICS. La différence principale est que la FNSDS est fondée par des cliniciens, alors que notre atelier sera animé par des chercheurs en informatique et SHS. Les points de vue sont forcément différents mais convergents à certains points. Des collaborations et actions communes seront proposées.
  • La difficulté d’accès aux données de santé est connue et des accès s’ouvrent peu à peu, comme proposé par exemple par le Système National des Données de Santé (SNDS) https://www.cnrs.fr/fr/cnrsinfo/les-donnees-de-sante-ouvrent-des-perspectives-de-recherche. La procédure est longue, et peu de chercheurs ont pu en bénéficier jusqu’à maintenant.

Notre atelier TIDS est proche de deux ateliers de MADICS :

  • DOING (2020-2024) s’intéresse au traitement automatique de données textuelles de différents domaines (médical, juridique, environnemental…). L’objectif est de transformer les données textuelles en données structurées. L’accent est mis sur le traitement et la transformation des données. Dans notre atelier, nous mettons l’accent sur l’accès aux données cliniques (textuelles, structurées, de laboratoire, images…) et leur traitement.
  • ReProVirtuFlow (2016-2019) s’intéressait à la reproductibilité d’analyse de données biologiques à différents niveaux. Avec l’accès et la disponibilité des données cliniques, nous visons aussi la problématique de reproductibilité à travers des expériences et modèles.

 

Visitez le site web de l’Atelier TIDS



Évènements à venir