MDD 2026

When:
26/04/2026 – 03/05/2026 all-day
2026-04-26T02:00:00+02:00
2026-05-03T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau :

Thème :

Les bases de données pour les LLMs

Présentation :

Les modèles de langue, qu\’ils soient petits, moyens ou grands, sont désormais parmi nous et nous
sommes appelés à étudier le rôle des données dans la qualité de leurs résultats ainsi que notre
capacité à offrir des garanties sur leur utilisation. L’école MDD 2026 propose de couvrir les questions
liées à (1) la préparation et l’indexation des données pour l’entraînement de ces modèles, (2) la
provenance, l’explicabilité et l’interpretabilité de ces modèles, (3) le rôle de l\’humain et les interfaces en
langage naturel, et enfin (4) l’impact sociétal de ces modèles à travers l’étude de leur consommation
énergétique et la législation dans ce domaine. Ce programme, riche et multidisciplinaire, sera organisé
en conjonction avec l’ITN ARMADA, un réseau de formation axé autour de l’alignement des modèles
de langue avec les connaissances métier, à leur explicabilité et interpretabilité, à la validité de leurs
réponses,à leur fine-tuning, ainsi qu’à leur efficacité et efficience. Le projet ARMADA répond
notamment aux besoins cruciaux de l’UE en matière de réglementation de l’IA en formant des experts
susceptibles de conseiller les organismes européens sur l’adoption des modèles de langue. Ce réseau
rassemble huit organisations de sept pays, y compris la France, gérées par une équipe diversifiée de
chercheurs experts, afin de former un dispositif d’interopérabilité favorisant le partage des
connaissances et des compétences.
Le thème général, « Data Management for Language Models
» sera décliné en 8 grands thèmes : (1)
High-dimensional vector indexing and similarity search, (2) Data Reduction, (3) Data Provenance, (4)
Data modalities and explainable AI, (5) AI agents in human-AI collaboration, (6) Conversational NL
interfaces for data analysis, (7) AI regulation, (8) Green AI. De plus, nous organiserons un atelier sur la
rédaction scientifique, les sciences, les publications, et les données ouvertes, sur le partage et
archivage de ces données, sur la diffusion, et enfin sur la vulgarisation des résultats scientifiques.
Nous prévoyons d’organiser une séance dynamique de posters et un gong show pendant les pauses
café.

Du : 2026-04-26

Au : 2026-05-02

Lieu : Institut d\’Etudes Sxientifiques de Cargèse – Université de Corse

Site Web : https://TBD

Pour vous inscrire, vous devez déjà être membre du GDR MaDICS et identifié sur le site.
Inscrivez-vous maintenant !