
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS
Date : 2025-01-28
Lieu : Strasbourg
SiDoS : similarité de données séquentielles massives @ EGC 2025 (27 au 31 janvier à Strasbourg)
https://sites.google.com/view/sidos2025/home
Le 28/01/2025
Date limite de soumissions des papiers : 26/11/2024
Notification aux auteurs : 13/12/2024
Objectifs
De nombreux domaines nécessitent l’analyse de gros volumes de séquences de diverses complexités (en termes de périodicité, complétude, multivariée ou non, etc.) et en particulier de leur similarité. On peut citer les domaines aussi variés que le médical (e.g., stratification de patients, alignements de gènes), le social (analyse de trajectoires sémantiques), la science des données (génération et recommandation de pipelines d’exploration), etc.
SiDoS est le premier atelier portant sur l’optimisation du calcul de distances sur de gros volumes de données de type séquences. Ce thème est à la croisée des domaines HPC (calcul haute performance) et analyse et exploration de données.
Il recouvre différents défis scientifiques : prise en compte de la spécificité des données (séquences, séries, trajectoires, etc.), définition de méthodes de réduction de dimensionalité et indexation, parallélisation du calcul de similarité, adaptation d’approches existantes (par exemple, sur séries temporelles ou données spatio-temporelles), etc.
L’objectif de l’atelier est de structurer la communauté française traitant de séquences massives et du calcul de leur similarité. Il constitue un temps d’échange entre les membres des communautés traitement de la donnée et HPC.
Thèmes de l’atelier (liste non exhaustive)
Définition de similarité entre séquences, spécifique à un type de séquences
Algorithmes de clustering de séquences
Apprentissage de similarité entre séquences
Techniques de réduction de dimensionalité, indexation, hachage, … adaptées aux séquences
Modèles de parallélisme implicite pour l’étude de similarité entre séquences
Utilisation des architectures GPU pour optimiser le calcul de similarité
Modèle de parallélisme pour la similarité sur de larges volumes de données
Adaptation aux séquences des approches sur d’autres types de données (séries temporelles, données spatio-temporelles, etc.)
Présentation d’applications ou de banc d’essais faisant usage de similarité entre séquences
Soumissions
Deux types de soumissions seront possibles :
– Articles courts : de 2 pages à 4 pages maximum
– Articles longs : jusqu’à 12 pages
Les articles longs pourront inclure tout travail de recherche original, description d’application, expérimentation, résumé de papiers internationaux. Les articles courts sont réservés à la description de travaux en cours, de démonstration ou de déclaration d’intention.
Les articles soumis seront relus par 3 membres du comité de programme. Les soumissions devront être au format PDF exclusivement et devront utiliser le format RNTI latex : https://www.editions-rnti.fr/files/RNTI-202208.zip. Les soumissions se feront via easychair (lien à venir).
Comité de programme
Thomas Devogele (LIFAT)
Laurent d’Orazio (Université Rennes, IRISA)
Christel Dartigues-Pallez (Université Côte d’Azur)
Thomas Guyet (INRIA)
Nicolas Hiot (LIFO)
Nicolas Labroche (LIFAT)
Sébastien Limet, (LIFO)
Patrick Marcel (LIFO)
Emmanuel Melin (LIFO)
Sophie Robert (LIFO)
Veronika Peralta (LIFAT)
Organisation
Thomas Devogele, Nicolas Labroche, Veronika Peralta (LIFAT Tours)
Patrick Marcel, Sophie Robert (LIFO Orléans)
Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.
Annonce en lien avec l’Action/le Réseau : SIMDAC
Thème :
Analyse de données, calcul haute performance et données de santé
Présentation :
Ce colloque se veut le point de départ de la structuration d\’une communauté de recherche pluridisciplinaire travaillant sur l\’analyse de données par des études de similarités de gros volumes de données complexes. Il vise à rassembler des chercheurs intéressés par les verrous scientifiques soulevés par ces approches qu\’il s\’agisse de :
Méthodes théoriques (définition des similarités, algorithmes de jointure par similarité/ recherche par similarité, traitement d\’images,…)
Problématiques liées à la qualité et à la complexité des données (séquences vs séries, données manquantes, données non alignées)
Optimisation, calcul haute performance, parallélisation et accélération GPU
Nature des données et domaines d\’applications (santé, biologie, …)
L’organisation du colloque alterne entre exposés scientifiques couvrant ces différentes thématiques et temps d’échanges, notamment sous forme d’ateliers thématiques permettant de favoriser les discussions croisées et les rapprochements interdisciplinaires.
Le colloque se prolongera le lendemain matin par une réunion du groupe de travail, ouverte à tous les participants intéressés, afin de définir les prochaines actions collectives à mener dans ce cadre.
Du : 2025-06-24
Au : 2025-06-25
Lieu : Orléans
Site Web : https://sites.google.com/view/simdac-colloque-2025/accueil
Date : 2026-03-25 => 2026-03-27
Lieu : Cluj-Napoca, Romania
Dear colleagues,
We invite submissions to the HPCoSiMC special session at the PDP 2026 International Conference:
https://sites.google.com/view/hpcosimc-2026/
The HPCoSiMC special session addresses the growing need for efficient similarity computations on massive and complex sequence-type data. It highlights innovative strategies that harness modern parallel platforms to overcome two key bottlenecks: handling large-scale data volumes and managing computational complexity. Topics of interest include methods for exploiting advanced parallel architectures, algorithmic adaptations enabling scalable execution, and user-oriented approaches that simplify access to high-performance computing for non-experts.
The objective of this special session is to gather contributions addressing the challenges of similarity studies, particularly those arising from computational complexity and the massive volume of data involved. We encourage submissions on the following topics, which are not limited to the following:
* Parallelization models and algorithms for large-scale similarity analysis on massive datasets
* Leveraging accelerator architectures such as GPUs and FPGAs to optimize similarity computations
* Hybrid and heterogeneous computing approaches (multi-core, distributed-memory, GPU, accelerators) for similarity tasks
* Implicit parallelism models for similarity analysis on sequence-type data, workflow design, and optimization for large-scale similarity pipelines
* Tools and frameworks to make HPC-based similarity analysis accessible to non-specialists
* Benchmarking and performance evaluation of similarity algorithms on modern parallel architectures
* Dimensionality reduction and indexing methods for scalable similarity search
* Novel and emerging applications that benefit from similarity computations
* Embedding techniques for efficient similarity search
* New methods and metrics for measuring similarity across application domains
Important dates:
* Paper submission : November 28th 2025
* Author notification : January 5th 2026
* Camera-ready copy : January 26th 2026
Submission guidelines
Authors should submit a full paper not exceeding 8 pages in the IEEE Conference proceedings format (IEEEtran, double-column, 10pt) and follow format guidelines found at https://www.ieee.org/conferences/publishing/templates.html.
For submission, please refer to the Easychair submission system as indicated in the Main Conference webpage (https://www.pdp2026.org/submission/cfp), and make sure that you select the “High Performance Computing for Similarity on Massive & Complex data (HPCoSiMC)” track.
Double-bind review: the first page of the paper should contain only the title and abstract; in the reference list, references to the authors own work should appear as “omitted for blind review” entries.
A special issue in a peer-reviewed international journal is planned, featuring a selection of the best papers from the HPCoSiMC session.
We look forward to your submissions
Mike Gowanlock, Verónika Peralta and Sophie Robert (special session co-chairs)
Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.
