BigData4Astro

 

Atelier BigData4Astro

Big Data for Astronomy

Responsables

Correspondant ComDIR : Sarah Cohen-Boulakia

Thématiques

Astrophysique, Informatique

Données concernées

Données d’observation en astronomie: images, catalogues, etc. issues principalement des grandes infrastructures de recherche ou de simulations numériques.

Mots clés

Big Data, astrophysique, workflow de traitement, requêtes, analyse statistique, analyse par apprentissage et d’intelligence artificielle, exploration, visualisation, benchmark, plateforme scientifique

Contexte scientifique

En astronomie, les besoins en traitement de données évoluent et se complexifient, au fur et à mesure que de nouvelles technologies d’observation et d’acquisition fournissent une vision plus nette et plus profonde du ciel, et au fur et à mesure que les techniques d’échantillonnage de données, de traitement d’images et d’apprentissage offrent de nouvelles perspectives pour la compréhension des observations. C’est un véritable bouleversement que connaît le domaine depuis une quinzaine d’années et qui va en s’amplifiant. Les instruments sont devenus extrêmement précis avec des capacités d’observation extraordinaires (e.g. LSST, CDD de 3,2 Gpixels) donnant accès à des relevés détaillés de tout ou partie du ciel avec des profondeurs variables, de l’Univers tout proche à l’Univers très lointain, juste après le Big Bang. L’étude d’objets isolés laisse de plus en plus place à une approche ensembliste où le cas d’étude est remplacé par une étude statistique globale permettant de déduire des lois générales (formation des planètes) ou de tester des théories cosmologiques (gravitation à grande échelle, énergie noire, matière noire). Les algorithmes de traitement d’images intègrent plus de modalités et plus de dimensions. L’étude de corrélations entre événements célestes nécessite des opérations spécifiques sur des tables de dimensions gigantesques (plusieurs centaines de variables et plusieurs milliards d’enregistrements). De façon générale, les traitements sur ces données sont souvent réalisés par une ingénierie ad hoc, mettant en œuvre une multitude d’outils informatiques et produisant des chaînes de traitements complexes, coûteuses en maintenance et peu propices à la réutilisation et l’évolution. Ces limites sont exacerbées par l’évolution rapide des modèles de calcul distribués (GPU, serveurs de données, MapReduce), ainsi que l’émergence de nouveaux algorithmes d’apprentissage et d’extraction de connaissances (datamining, machine learning, deep learning). Ce sont là des conditions qui peuvent constituer un frein à l’évolution des recherches en astronomie et en cosmologie.

L’objectif de cette action est de mobiliser une communauté interdisciplinaire autour de ces problèmes pour faire émerger des concepts, des modèles et des méthodes originales permettant une meilleure compréhension des traitements à réaliser sur les données astronomiques et une plus grande maîtrise des logiciels associés tant dans leur développement que dans leur maintenance et leur évolution.

Elle s’appuie sur une collaboration entre astrophysiciens qui génèrent et exploitent des données et des informaticiens dont l’expertise relève de la gestion de données massives et la visualisation.

 

Site de l’Atelier BigData4Astro en cours de construction…


Évènements à venir