Quatrième édition du Symposium MaDICS

When:
11/07/2022 – 12/07/2022 all-day
2022-07-11T00:00:00+02:00
2022-07-13T00:00:00+02:00
Where:
Lyon, Campus de la Doua

Présentation

La quatrième édition du Symposium MaDICS aura lieu en présentiel à Lyon sur le Campus de la Doua les 11 et 12 juillet 2022. Il a pour objectif de réunir la communauté MaDICS à l’occasion de conférences scientifiques invitées (Sihem Amer-Yahia et Anne-Cécile Orgerie, toutes deux médaillées du CNRS), de sessions dédiées aux Actions et Ateliers du GDR, mais également d’une demi-journée plus spécialement à destination des doctorants et jeunes chercheurs (cf Appel à posters)… et bien sûr de nombreux moments de convivialité !

Pour vous inscrire au Symposium vous devez vous inscrire à au moins une session (Action, Atelier ou Posters). Pour des raisons d’organisation, veuillez vous inscrire à toutes les actions et ateliers auxquelles vous souhaitez participer.

En espérant que vous serez nombreux pour partager ce moment ensemble.

Du : 2022-07-11
Au : 2022-07-12
Lieu : Lyon, Campus de la Doua (Comment venir, Plan du site)

Programme

Lundi 11 juillet 2022
10h00  Accueil
[Salles C2 et C2 – RdC]
10h30  Session d’ouverture
Introduction, présentation du GDR et questions
[Amphi Ampère – bâtiment Lippmann]
11h00  Keynote Sihem Amer-Yahia (LIG, médaille d’argent du CNRS)
Should we store or retrain ML models for data exploration?
[Amphi Ampère – bâtiment Lippmann]
12h00  Pause repas
14h00  Session Actions et Ateliers 1
Action DOING
Programme détaillé
Inscrivez-vous ici
[Salle C4 – RdC]
Action BigData4Astro
Programme détaillé
Inscrivez-vous ici
[Salle C5 – RdC]
Atelier FedSed
Programme détaillé
Inscrivez-vous ici
[Salle TD10 – 1er étage]
Atelier Musiscale
Programme détaillé
Inscrivez-vous ici
[Salle TD11 – 1er étage]
16h00  Pause
[Salles C1 et C2 – RdC]
16h15  Présentations de doctorants primés
[Amphi Ampère – bâtiment Lippmann]
Christina Khnaisser (Prix de cotutelle France-Québec)
Modéliser les connaissances cliniques et concevoir des bases de données pour les systèmes de santé apprenants

Pierre Monnin (Prix de thèse EGC 2022)
Appariement et fouille dans les graphes de connaissances du web de données : applications en pharmacogénomique

17h15  Gong Show
Flash talks possiblement enregistrés
[Amphi Ampère – bâtiment Lippmann]
18h00  Session posters avec cocktail
Liste des posters
Inscrivez-vous ici
[Salles C1 et C2 – RdC]
19h00  Fin de la journée
 
Mardi 12 juillet 2022
9h00  Keynote Anne-Cécile Orgerie (IRISA, médaille de bronze du CNRS)
Réduire la consommation énergétique des centres de données
[Amphi Ampère – bâtiment Lippmann]
10h00  Pause
[Amphi Ampère – bâtiment Lippmann]
10h15  Session Acttions et Ateliers 2
Action HELP
Programme détaillé
Inscrivez-vous ici
[Salle C4 – RdC]
Action MACLEAN
Programme détaillé
Inscrivez-vous ici
[Salle TD11 – 1er étage]
Atelier DSChem
Programme détaillé
Inscrivez-vous ici
[Salle TD10 – 1er étage]
Action MADONA
Programme détaillé
Inscrivez-vous ici
[Salle C5 – RdC]
12h15  Pause repas
14h00  Session Actions et Ateliers 3
Action MADONA
Programme détaillé
Inscrivez-vous ici
[Salle C5 – RdC]
Action SimpleText
Programme détaillé
Inscrivez-vous ici
[Salle TD10 – 1er étage]
Action RoCED
Programme détaillé
Inscrivez-vous ici
[Salle TD11 – 1er étage]
16h00  Fin du Symposium

Programme de l’Action DOING

[Salle C4 – RdC]

Lundi 11 juillet – 14h00-16h00
14h00 Présentation de la demi journée, Genoveva Vargas-Solar (CNRS – LIRIS)
14h10 Keynote : Aperçu général des langages de requêtes pour graphes à propriétés
Victor Marsault (CNRS, LIGM)
14h55 Traitement de textes par des requêtes data science: verrous et carte d’expertise
Mirian Halfeld Ferrari Alves (U. Orléans, LIFO) & Genoveva Vargas-Solar (CNRS, LIRIS)
15h10 Panel : Représentation du contenu et extraction de connaissances à partir des textes : les systèmes de gestion de graphes, l’intelligence artificielle et les approches sémantiques
Donatello Conte (Polytech Tours, LIFAT)
Agata Savary (Université Paris-Saclay, LISN)
Nathalie Hernandez (Université de Toulouse, IRIT)
Nicolas TRavers (ELSIV, Centre de Recharche Da Vinci)
16h00 Fin

Programme de l’Action BigData4Astro

[Salle C5 – RdC]

Lundi 11 juillet – 14h00-16h00
14h00 Présentation de la demi-journée
Karine Zeitouni (DAVID) et André Schaaff (CDS)
14h10 Future prospect in spectroscopic survey and data challenges
Roland Bacon (CRAL)
14h40 Exploration non supervisée des données : application aux données issues des véhicules autonomes
Mustapha Lebbah (LIPN)
15h10 Discussion, Besoins en formation (ANR CMA, Ecole AstroInfo, …)
15h25 Table ronde Data Lakes en astronomie ?
15h55 Prochains évènements
16h00 Fin

Programme de l’Atelier FedSed

[Salle TD10 – 1er étage]

Lundi 11 juillet – 14h00-16h00
14h00 Introduction, Marco Lorenzi
14h15 Privacy preserving machine learning, Melek Önen (EURECOM)
14h45 Blockchain-based federated learning for medecine, Imen Megdiche (IRIT, ISIS)
15h15 Fed-BioMed workshop
16h00 Fin

Programme de l’Atelier Musiscale

[Salle TD11 – 1er étage]

La demi-journée s’organisera autour de courtes présentations et d’une table ronde, sur le thème : “Similarités musicales à différentes échelles, différentes dimensions, différents domaines : modèles, besoins, usages”.

Lundi 11 juillet – 14h00-16h00
14h00 Présentation de l’Atelier, Florence Levé
14h10 Similarités, abstractions, corpus: audio, Sylvain Marchand
14h30 Similarités, abstractions, corpus: symbolique, Frédéric Bimbot
14h50 Similarités dans les corpus musicologiques, Intervenant à confirmer
15h10 Discussions : Besoins et usages de représentations multi-échelle des similarités musicales.
L’objectif des échanges sera de faire émerger les points de vue des différentes disciplines concernées et les priorités à établir.
16h00 Fin

Programme de l’Action HELP

[Salle C4 – RdC]

L’atelier HELP vise à proposer une vision trans-disciplinaire informatique / SHS de la problématique de l’explicabilité. Nous nous intéressons à une vision de bout-en-bout du problème d’explicabilité en ne se focalisant pas uniquement sur les modèles mais à l’impact de tous les éléments de la chaîne de traitement de données, partant de la qualité des données jusqu’à l’interaction avec l’utilisateur qui reçoit l’explication. Un point intéressant peut aussi considérer la propagation des biais d’explication d’une étape à une autre de la chaîne de traitement. L’atelier a pour vocation à devenir une plateforme d’échange pour la communauté autour de ces questions scientifiques et de favoriser l’émergence de projets communs.

Lundi 12 juillet – 10h15-12h15
10h15 Real use cases for XAI in insurance companies
Xavier Renard et Thibault Laugel
11h00 Lien entre qualité des données et explicabilité
Nikos Myrtakis et Vassilidis Christophides
11h20 XAI et médecine
Paul Monsarrat
11h40 Table ronde et clôture
12h15 Fin

Programme de l’Action MACLEAN

[Salle TD11 – 1er étage]

Lundi 12 juillet – 10h15-12h15
10h15 Ouverture de la session
10h25 Applications of deep learning in natural hazards and solid earth science using remote sensing
Sophie Giffard-Roisin (Laboratoire ISTerre, IRD)

Abstract: Solid earth has recently (finally!) gained benefit from the recent advances of machine learning such as in automatic detection of earthquake events in seismic recordings. Moreover, the use of remote sensing data (such as satellite optical and radar) as well as seismology and geodesy, have been important in solid earth sciences in the last decades, for example for estimating the ground motion during an earthquake, for estimating the ground state change after a volcanic eruption or landslide, or even for mapping active faults. This talk will focus on some new research works which aim to develop new data-based methods in order to improve, automatize and create new techniques for solid earth applications based on remote sensing. In particular, the goal is to see the variety of applied problems and how to develop a specific solution for each.

11h15 Explainable AI for Earth Observation
Alexandre Benoît (Laboratoire LISTIC)

Abstract: Earth Observation (EO), as for other domains, is subject to impressive advances thanks to the availability of abundant data and modern AI methods and more specifically deep neural networks. However, most of the available EO data is generally unlabelled, generally illustrates very local context with specific orientation, climate… such that the generalization behaviours of machine learning models can be limited. In addition, the implication of model inference applied to EO may lead to costly decisions (infrastructure design, modification, agricultural spreading…) such that automatic decisions should be justified or explained. In the era of deep learning-based models, opening those black boxes is a challenge in itself. In this presentation, we will present a variety of activities related to EO at LISTIC Lab with classical and AI-based models. This will lead to a focus on contributions related to explainable AI relying on 3 complementary directions : black box explanation, explanation by model design and redescription mining.

12h15 Fin

Programme de l’Atelier DSChem

[Salle TD10 – 1er étage]

Lundi 12 juillet – 10h15-12h15
10h15 Premiers pas de l’atelier Data Science for Chemistry
Dominique Douguet, Matthieu Montès, Nicolas Blanchard et Bertrand Cuissart
10h55 Application of the Generative Topographic Mapping approach to Big Chemical Data analysis
Gilles Marcou (Laboratoire de Chémoinformatique)
The Generative Topographic Mapping (GTM) is density-based model of a dataset. It optimizes the shape of a manifold to maximize the likelihood of a training set, according to a normal distribution centered on that manifold. Each instance of the dataset is therefore embedded as a density distribution over the manifold called responsibilities. As a corollary, a full dataset is represented summing the corresponding responsibilities. This concept allows for the generation of activity and property landscapes that are predictive classification and regression models, respectively, emerging from the GTM analysis.
Several use cases to answer big chemical data analysis tasks will be presented. First, the concept of ChemAtlas will be presented: a compendium of multi-scale maps covering over 700 biological properties from the ChEMBL database. Second, the use of kernel GTM for genomic data where the challenge is to manage data of very large dimensionality. Third, the use of GTM to sample the chemical space efficiently coupling the method with an auto-encoder.
11h35 Toward the discovery of the hidden features built by a GNN
Marc Plantevit (LRDE, LIRIS)
Dans cette présentation, nous considérerons l’explication de GNNs qui sont appliqués avec succès sur de nombreux problèmes de classification de graphes, notamment en chimie. Alors que les travaux existants expliquent la décision du modèle en s’appuyant sur la couche de sortie, nous verrons comment analyser les couches cachées pour identifier les attributs construits par le GNN.
Les règles d’activation ainsi construites permettent d’identifier des neurones co-activés pour une classe. Ces règles définissent ainsi des représentations internes ayant un impact fort sur la classification. Aussi intéressantes soient-elles, elles ne sont pas interprétables. Nous aborderons donc comment générer un graphe représentatif pour chaque règle. Nous présenterons quelques résultats expérimentaux sur des jeux de données bien connus (e.g., Mutagen, Aids). Enfin, nous discuterons les perspectives de ce travail
12h15 Fin

Programme de l’Action MADONA

[Salle C5 – RdC]

NADA 22 : 1er atelier pluridisciplinaire : narration de données, datajournalisme et engagement(s)

Lundi 12 juillet – 10h15-12h15
datajournalisme et engagement
10h15 Présentation de l’action MADONA
Marie Chagnoux (CEMTI) et Patrick Marcel (LIFAT)
10h30 Les données dans une formation en journalisme : retour d’une expérience
Olivier Trédan (ARENES)
11h00 Notebooks, l’engagement par la documentation
Raphaël Da Silva (journaliste free-lance et formateur)
11h15 Datajournalisme, feuilletonnage et engagement
Bertrand Enjalbal (Rue 89 Lyon)
11h30 L’engagement éditorial dans la constitution d’une base de données : deux exemples de réaffirmation de la responsabilité sociale du journalisme
Mélanie Lecha (UPHF)
11h45 Global turn de l’investigation journalistique et engagement collaboratif grâce aux technologies numériques : le cas de l’ICIJ
Angelina Toursel (UPHF) et Philippe Useille (UPHF)
12h15 Pause déjeuner
Lundi 12 juillet – 14h00-17h00
Narration et engagement
14h00 Observatoire du discours parlementaire
Lucas Piessat (ERIC), Julien Velcin (ERIC) et Gauthier Bravais (ERIC)
14h30 Expérimentations d’innovation sociales et mise en récit, présentation du laboratoire citoyen la Myne
Julien Beutter (La Myne)
14h45 Generating personalized data narrations from EDA notebooks
Patrick Marcel (LIFAT)
15h00 Les dispositifs d’engagement du lecteur dans la narration de données
Marie Chagnoux (CEMTI)
15h15 Discussion
16h00 Les suites de l’Action MADONA
17h00 Fin

Programme de l’Action SimpleText

[Salle TD10 – 1er étage]

Lundi 12 juillet – 14h00-16h00
14h00 Ouverture
Liana Ermakova (HCTI, UBO)
14h10 Text complexity & eye tracking (visio)
Olivier Augereau (Lab-STICC, ENIB)
14h30 Some experience on Incident Triaging with NLP Techniques in an Industrial Environment
Youcef REMIL (LIRIS, INSA Lyon / Infologic)
15h00 Beyond Just Words: Utilizing Additional Information in Document Readability Assessment (visio)
Adam Jatowt (University of Innsbruck, Austria)
15h40 Vocabulometer: a recommender system for learning language (visio)
Nicholas Journet (LaBRI, Université de Bordeaux)
16h00 Fin

Programme de l’Action RoCED

[Salle TD11 – 1er étage]

Lundi 12 juillet – 14h00-16h00
14h00 Ouverture
14h10 Raisonnement sur des requêtes avec agrégats temporels
Marie-Christine Rousset (LIG)
15h00 Règles pour le droit d’accès à des données pour la sécurité de la personne
Pierre-Yves Gicquel (IRIT)
15h20 Construction de graphes de connaissance à partir de textes avec une IA centrée-utilisateur
Hugo Ayats (IRISA)
15h40 Hybridation des méthodes d’apprentissage et Web sémantique pour l’optimisation et la planification de cultures maraîchères en agro-écologie
Baptise Darnala (LIRMM)
16h00 Fin

Liste des posters

[Salles C1 et C2 – RdC]

Exposant Laboratoire Titre
Pierre Andrieu LMO, LISN Obtenir des informations sur les gènes les plus associés à une maladie donnée
Nelly Barret INRIA, LIX Abstra: Data Descriptions out of Any Model
Alexis Blandin IRISA Représentation de newsletters en graphes
Eduardo Brandao LHC Physics-guided Machine Learning
Lisa Chabrier INRIA, LIRIS Regulatory interactions between genes and Gene Regulatory Networks (GRNs)
Marzieh Derakhshannia LIRMM Gestion et optimisation de l’architecture logistique de lacs de données
Hussein El Amouri iCube Interactive collaborative constrained clustering for remote sensing time series analysis
Faten El Outa LIFAT Un cadre pour façonner la narration de données
Pierre Faure-Giovagnoli LIRIS Évaluez l’Existence d’une Fonction dans votre Jeu de Donnée
Quentin Gabot Léonard de Vinci Tourists Profiling by Interest Analysis
Nicolas Hiot LIFO Base de données graphes avec informations incomplètes
Triss Jacquiot GREYC La découverte et l’apprentissage de connaissances expertes implicites pour adapter un algorithme de clustering collaboratif à l’usage de l’utilisateur
Gabriel Kasmi OIE Prévision de production d’energie renouvelable
Bilal Koteich IRENav Knowledge-Based Recommendation for On-Demand Mapping : Application to Nautical Charts
Tanguy Lefort IMAG Ambiguïté des étiquettes en classification et retours d’expert
Jules Leguy Leria Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire
Etienne Lehembre GREYC Selecting Outstanding Patterns Based on Their Neighbourhood
Loujain Liekah LIRIS Prediction Models on Medical Data
Madhulika Mohanty INRIA Scalable exhaustive connectivity search within graph queries
Alexis Mortelier GREYC analyse de données de e-sport
Hassan Noureddine IRENav Modélisation, gestion et traitement des données de trajectoires sémantiques en indoor et outdoor
Audrey Onfroy INSERM, IBENS Deciphering molecular mechanisms governing malignant transformation in Neurofibromatosis Type 1 (NF1) from single cell transcriptomic
Mélanie Piot LIST3N CANCER DU SEIN: Représentation du savoir : experts vs données
Arijus Pleska CRISTAL Neural language processing and federated learning under data privacy or fairness
Mina Rafla GREYC, Orange Labs Correction des biais dans le cadre de la modélisation de l’effet de traitement
Sébastien Rivault LIFO Parallélisme, équilibrage de charges et extensibilité dans le traitement des mégadonnées sur des systèmes à grande échelle
Antoine Saget iCube Apprentissage collaboratif multiparadigme pour l’analyse d’images de télédétection
Hugo Thimonier LISN Apprentissage Automatique et Interpretabilité : Application à la détection de fraude aux paiement par carte bancaire
Foutse Yuhgoh DRRC, CEDIRC A Technology Intelligence Recommendation System based on Multiplex Networks