Action ARQUADS (2019-2019)
Action de Recherche sur la Qualité des Données Scientifiques
Responsables
- Allel HADJALI, LIAS/ENSMA EA 6315 , INS2i
- Angela BONIFATI, LIRIS UMR CNRS 5205, INS2i
- Laure BERTI-EQUILLE, LIF UMR CNRS 7279, INS2i
- Bastien RANCE, INSERM UMRS 1138, HEGP, AP-HP
Thématiques
Informatique, Bases de données, Analyse de données, Gestion des données scientifiques
Données concernées
Données d’observations, Données expérimentales, Données de simulation, Données dérivées ou compilées, Données statistiques
Mots clés
Big Data, Données scientifiques, Qualité de données, Imperfections, Indicateurs de qualité, Réparation, Nettoyage de données, Détection d’anomalies
Contexte scientifique
Les missions principales de l’action s’inscrivent dans une nouvelle vision de l’étude de la qualité des données scientifiques dans l’ère “Big data”. Avec cet avènement, le problème de la qualité des données s’est exacerbé et de nouvelles dimensions de la qualité sont apparues. Il est donc urgent de mener de nouvelles réflexions sur cette problématique, par exemple, sur la révision de certaines indicateurs de qualité ou la proposition de nouveaux indicateurs, et sur les méthodes de nettoyage et de réparation des données afin d’améliorer le niveau de la qualité et ainsi, la fiabilité des décisions.
Notre action s’intéresse plus particulièrement à la qualité des données scientifiques issues de capteurs, d’observations, de simulations ou d’expérimentations dans les domaines de la biologie, l’astronomie, l’énergie, la physique/chimie, etc. Les imperfections dont souffre ce type de données sont nombreuses et variées, les plus importantes sont : l’incohérence, la présence de doublons, les typos, les données manquantes, incorrectes ou obsolètes.
L’exploitation de très grands volume de données avec une qualité “médiocre” pose alors de nombreux défis pour les scientifiques, experts du domaine, ainsi que pour la communauté de recherche en informatique. Parmi ces défis, on peut citer la nécessité d’identifier de nouvelles mesures de qualité dont la sémantique est claire et, non exclusivement, de nature statistique. Ces mesures devraient être en lien avec les avancées liées aux méthodes de nettoyage et de réparation à appliquer dans une étape ultime avant la prise de décision.
L’objectif principal de l’action que nous proposons dans le cadre du GDR est l’organisation et la mise en réseau d’une communauté interdisciplinaire de chercheurs et d’experts qui s’intéressent à la qualité des données scientifiques pour permettre une fertilisation croisée entre différents champs scientifiques et technologiques. Par ailleurs, toutes les avancées et réalisées par notre action seront directement mises à disposition des autres actions du GDR pour lesquels les données scientifiques connaissent des problèmes de qualité (par exemple, en astrophysique, sciences biomédicales, etc.).
Visitez le site web de l’Action ARQUADS
– Organisation d’une journée sur la qualité des données scientifiques, 5 Juin 2018, Université d’Aix Marseille St Charles (3ème étage de la FRUMAM)
L’objectif de cette journée est de réunir les acteurs (académiques et industriels) qui s’intéressent à la question de la qualité des données. Cette journée sera l’occasion, d’une part, aux producteurs/propriétaires de données de présenter les problèmes de qualité auxquels ils sont confrontés et, d’autre part, aux chercheurs/doctorants/experts de partager leurs avancées scientifiques sur la qualité et réparation des données.
– Programme
Matin du 05/06
9h00 – 9h30 : Ouverture de la Journée ARQUADS
9h30 – 9h50 : Christian Surace (LAM, Marseille) : Qualité des données en astrophysique
9h50 – 10h30 : : Sarah Cohen Boulakia (LRI, Paris) : Qualité des données en sciences biomédicales
10h30 – 11h00 : Pause café
11h00 – 11h40 : Fatiha Sais (LRI, Paris) : Qualité des liens d’identité dans les graphes de connaissances
11h40 – 12h 30 : Présentations Courtes des Participants (5 à 10 mn par présentation) : première moitié
12h30-13h30 – Plateaux Repas
Après-midi du 05/06
13h30-14h40 : Session de Présentations Courtes des Participants (5 à 10 mn par participant) : seconde moitié
14h40-16h20 : Discussions sur les objectifs de l’action ARQUADS
16h20-16h30 : Clôture de la journée
– Inscription gratuite mais obligatoire
S’nscrire pour la journée de ARQUADS