La création du GDR MaDICS s’inscrit dans un monde en réseau qui génère un déluge de données de plus en plus difficile à appréhender par les humains. Ce déluge nous a amené à «l’âge du zettaoctet» (1021 octets), dans lequel les données sont désormais au cœur de nombreuses activités humaines et une mine d’or pour la découverte scientifique et la réalisation de services innovants.
Les outils scientifiques et technologiques actuels ne sont plus adaptés pour gérer et exploiter ces masses de données. Les réponses aux défis à relever ne pourront être obtenues sans une forte synergie entre les scientifiques de tous les instituts, établissements et entreprises collectant et exploitant des masses de données pour la santé publique, la médecine, le sport, la biologie, la physique, l’astrophysique, l’énergie, la défense, l’environnement, les sciences de l’univers, la cosmologie, l’environnement, les sciences humaines et sociales, etc.
MaDICS a pour objectif de mettre en place un écosystème afin de faire avancer les connaissances scientifiques et technologiques sur la collecte de grandes masses de données scientifiques, leur organisation, leur stockage et préservation, l’extraction de connaissances, la recherche et l’analyse statistique, l’interprétation et la visualisation pour la prise de décision et la production de valeur.
MaDICS fournit donc un cadre ouvert et flexible permettant à des scientifiques de rejoindre/proposer des activités interdisciplinaires positionnées dans un continuum «des données aux connaissances et à la prise de décision» dont le point de départ sont les masses de données en Sciences.
La figure ci-dessus synthétise ce continuum et donne une vision thématique du GDR :
- la collecte, le partage et le stockage des Données : filtrage et préparation des données, indexation, stockage de données dans le Cloud, intégration de données hétérogènes, préservation des données et des connaissances à long terme
- l’analyse et la valorisation des Données : modélisation et apprentissage statistique (paramétrique, non paramétrique, semi paramétrique, bayésien), optimisation, exploration et fouille de données, processus interactifs de découverte de connaissances dans des données
- Interaction avec les Données : formalisation, utilisation et raisonnement sur des connaissances liées souvent au domaine, visualisation, interrogation de masses de données ou de connaissances, aide à la prise de décision.
Les activités d’animation du GDR s’inscrivent dans ces thématiques qui ne sont pas figées. En effet dans un domaine interdisciplinaire en pleine construction, les thèmes peuvent évolués et les activités se trouvent souvent aux frontières ou au contraire transverses aux thèmes.
Les objectifs du GDR sont de :
- favoriser l’animation scientifique pour la communauté française en gestion et valorisation de masses de données et en exploitation de connaissances en Sciences,
- promouvoir, faciliter et dynamiser les échanges entre équipes de recherches académiques, de grands organismes, ainsi que de l’industrie,
- initier des actions de soutien et formation envers les doctorants, post-doctorants (mais pas seulement) sur les thématiques majeures qui seront identifiées,
- faciliter des études de prospective pour la communauté du GDR et le CNRS et identifier un pool d’experts pour différents organismes.
L’organisation du GDR se veut suffisamment souple pour qu’émerge des communautés impliquées des activités pouvant prendre des formes diverses et répondant aux objectifs ci-dessus. L’unité élémentaire de l’organisation du GDR est l’élément d’animation, associant des chercheurs, des ITA et des moyens sur une problématique recherche particulière (journées d’animation, groupes de réflexion, écoles, réseaux, …).
Pour atteindre ces objectifs rendez-vous dans les pages Actions, Manifestations et Réseaux.