ARQUADS

Action ARQUADS

Action de Recherche sur la Qualité des Données Scientifiques

Responsables

Thématiques

Informatique, Bases de données, Analyse de données, Gestion des données scientifiques

Données concernées

Données d’observations, Données expérimentales, Données de simulation, Données dérivées ou compilées, Données statistiques

Mots clés

Big Data, Données scientifiques, Qualité de données, Imperfections, Indicateurs de qualité, Réparation, Nettoyage de données, Détection d’anomalies

Contexte scientifique

Les missions principales de l’action s’inscrivent dans une nouvelle vision de l’étude de la qualité des données scientifiques dans l’ère “Big data”. Avec cet avènement, le problème de la qualité des données s’est exacerbé et de nouvelles dimensions de la qualité sont apparues. Il est donc urgent de mener de nouvelles réflexions sur cette problématique, par exemple, sur la révision de certaines indicateurs de qualité ou la proposition de nouveaux indicateurs, et sur les méthodes de nettoyage et de réparation des données afin d’améliorer le niveau de la qualité et ainsi, la fiabilité des décisions.

Notre action s’intéresse plus particulièrement à la qualité des données scientifiques issues de capteurs, d’observations, de simulations ou d’expérimentations dans les domaines de la biologie, l’astronomie, l’énergie, la physique/chimie, etc. Les imperfections dont souffre ce type de données sont nombreuses et variées, les plus importantes sont : l’incohérence, la présence de doublons, les typos, les données manquantes, incorrectes ou obsolètes.
L’exploitation de très grands volume de données avec une qualité “médiocre” pose alors de nombreux défis pour les scientifiques, experts du domaine, ainsi que pour la communauté de recherche en informatique. Parmi ces défis, on peut citer la nécessité d’identifier de nouvelles mesures de qualité dont la sémantique est claire et, non exclusivement, de nature statistique. Ces mesures devraient être en lien avec les avancées liées aux méthodes de nettoyage et de réparation à appliquer dans une étape ultime avant la prise de décision.

L’objectif principal de l’action que nous proposons dans le cadre du GDR est l’organisation et la mise en réseau d’une communauté interdisciplinaire de chercheurs et d’experts qui s’intéressent à la qualité des données scientifiques pour permettre une fertilisation croisée entre différents champs scientifiques et technologiques. Par ailleurs, toutes les avancées et réalisées par notre action seront directement mises à disposition des autres actions du GDR pour lesquels les données scientifiques connaissent des problèmes de qualité (par exemple, en astrophysique, sciences biomédicales, etc.).

Site de l’Action ARQUADS en cours de construction…


Évènements à venir