Présentation
La quatrième édition du Symposium MaDICS aura lieu en présentiel à Lyon sur le Campus de la Doua les 11 et 12 juillet 2022. Il a pour objectif de réunir la communauté MaDICS à l’occasion de conférences scientifiques invitées (Sihem Amer-Yahia et Anne-Cécile Orgerie, toutes deux médaillées du CNRS), de sessions dédiées aux Actions et Ateliers du GDR, mais également d’une demi-journée plus spécialement à destination des doctorants et jeunes chercheurs (cf Appel à posters)… et bien sûr de nombreux moments de convivialité !
Pour vous inscrire au Symposium vous devez vous inscrire à au moins une session (Action, Atelier ou Posters). Pour des raisons d’organisation, veuillez vous inscrire à toutes les actions et ateliers auxquelles vous souhaitez participer.
En espérant que vous serez nombreux pour partager ce moment ensemble.
Du : 2022-07-11
Au : 2022-07-12
Lieu : Lyon, Campus de la Doua (Comment venir, Plan du site)
Programme
Lundi 11 juillet 2022 | |||
---|---|---|---|
10h00 | Accueil [Salles C1 et C2 – RdC] |
||
10h30 | Session d’ouverture Introduction, présentation du GDR et questions [Amphi Ampère – bâtiment Lippmann] |
||
11h00 | Keynote Sihem Amer-Yahia (LIG, médaille d’argent du CNRS) Should we store or retrain ML models for data exploration? [Amphi Ampère – bâtiment Lippmann] |
||
12h00 | Pause repas | ||
14h00 | Session Actions et Ateliers 1 | ||
Action DOING Programme détaillé [Salle C4 – RdC] |
Action BigData4Astro Programme détaillé [Salle C5 – RdC] |
||
Atelier FedSed Programme détaillé [Salle TD10 – 1er étage] |
Atelier Musiscale SESSION ANNULEE |
||
16h00 | Pause [Salles C1 et C2 – RdC] |
||
16h15 | Présentations de doctorants primés [Amphi Ampère – bâtiment Lippmann] Christina Khnaisser (Prix de cotutelle France-Québec) Modéliser les connaissances cliniques et concevoir des bases de données pour les systèmes de santé apprenants Pierre Monnin (Prix de thèse EGC 2022) |
||
17h15 | Gong Show Flash talks possiblement enregistrés [Amphi Ampère – bâtiment Lippmann] |
||
18h00 | Session posters avec cocktail Liste des posters [Salles C1 et C2 – RdC] |
||
19h00 | Fin de la journée | ||
Mardi 12 juillet 2022 | |||
9h00 | Keynote Anne-Cécile Orgerie (IRISA, médaille de bronze du CNRS) Réduire la consommation énergétique des centres de données [Amphi Ampère – bâtiment Lippmann] |
||
10h00 | Pause [Amphi Ampère – bâtiment Lippmann] |
||
10h15 | Session Acttions et Ateliers 2 | ||
Action HELP Programme détaillé [Salle C4 – RdC] |
Action MACLEAN Programme détaillé [Salle TD11 – 1er étage] |
||
Atelier DSChem Programme détaillé [Salle TD10 – 1er étage] |
Action MADONA Programme détaillé [Salle C5 – RdC] |
||
12h15 | Pause repas | ||
14h00 | Session Actions et Ateliers 3 | ||
Action MADONA Programme détaillé [Salle C5 – RdC] |
Action SimpleText Programme détaillé [Salle TD10 – 1er étage] |
||
Action RoCED Programme détaillé [Salle TD11 – 1er étage] |
|||
16h00 | Fin du Symposium |
Programme de l’Action DOING
[Salle C4 – RdC]
Lundi 11 juillet – 14h00-16h00 | |
---|---|
14h00 | Présentation de la demi journée, Genoveva Vargas-Solar (CNRS – LIRIS) |
14h10 | Keynote : Aperçu général des langages de requêtes pour graphes à propriétés Victor Marsault (CNRS, LIGM) |
14h55 | Traitement de textes par des requêtes data science: verrous et carte d’expertise Mirian Halfeld Ferrari Alves (U. Orléans, LIFO) & Genoveva Vargas-Solar (CNRS, LIRIS) |
15h10 | Panel : Représentation du contenu et extraction de connaissances à partir des textes : les systèmes de gestion de graphes, l’intelligence artificielle et les approches sémantiques Donatello Conte (Polytech Tours, LIFAT) Agata Savary (Université Paris-Saclay, LISN) Nathalie Hernandez (Université de Toulouse, IRIT) Nicolas TRavers (ELSIV, Centre de Recharche Da Vinci) |
16h00 | Fin |
Programme de l’Action BigData4Astro
[Salle C5 – RdC]
Lundi 11 juillet – 14h00-16h00 | |
---|---|
14h00 | Présentation de la demi-journée Karine Zeitouni (DAVID) et André Schaaff (CDS) |
14h10 | Future prospect in spectroscopic survey and data challenges Roland Bacon (CRAL) |
14h40 | Exploration non supervisée des données : application aux données issues des véhicules autonomes Mustapha Lebbah (LIPN) |
15h10 | Discussion, Besoins en formation (ANR CMA, Ecole AstroInfo, …) |
15h25 | Table ronde Data Lakes en astronomie ? |
15h55 | Prochains évènements |
16h00 | Fin |
Programme de l’Atelier FedSed
[Salle TD10 – 1er étage]
Lundi 11 juillet – 14h00-16h00 | |
---|---|
14h00 | Introduction, Marco Lorenzi |
14h15 | Privacy preserving machine learning, Melek Önen (EURECOM) |
14h45 | Blockchain-based federated learning for medecine, Imen Megdiche (IRIT, ISIS) |
15h15 | Fed-BioMed workshop |
16h00 | Fin |
Programme de l’Action HELP
[Salle C4 – RdC]
L’atelier HELP vise à proposer une vision trans-disciplinaire informatique / SHS de la problématique de l’explicabilité. Nous nous intéressons à une vision de bout-en-bout du problème d’explicabilité en ne se focalisant pas uniquement sur les modèles mais à l’impact de tous les éléments de la chaîne de traitement de données, partant de la qualité des données jusqu’à l’interaction avec l’utilisateur qui reçoit l’explication. Un point intéressant peut aussi considérer la propagation des biais d’explication d’une étape à une autre de la chaîne de traitement. L’atelier a pour vocation à devenir une plateforme d’échange pour la communauté autour de ces questions scientifiques et de favoriser l’émergence de projets communs.
Mardi 12 juillet – 10h15-12h15 | |
---|---|
10h15 | Real use cases for XAI in insurance companies Xavier Renard et Thibault Laugel |
11h00 | Lien entre qualité des données et explicabilité Nikos Myrtakis et Vassilidis Christophides |
11h20 | XAI et médecine Paul Monsarrat |
11h40 | Table ronde et clôture |
12h15 | Fin |
Programme de l’Action MACLEAN
[Salle TD11 – 1er étage]
Mardi 12 juillet – 10h15-12h15 | |
---|---|
10h15 | Ouverture de la session |
10h25 | Applications of deep learning in natural hazards and solid earth science using remote sensing Sophie Giffard-Roisin (Laboratoire ISTerre, IRD) Abstract: Solid earth has recently (finally!) gained benefit from the recent advances of machine learning such as in automatic detection of earthquake events in seismic recordings. Moreover, the use of remote sensing data (such as satellite optical and radar) as well as seismology and geodesy, have been important in solid earth sciences in the last decades, for example for estimating the ground motion during an earthquake, for estimating the ground state change after a volcanic eruption or landslide, or even for mapping active faults. This talk will focus on some new research works which aim to develop new data-based methods in order to improve, automatize and create new techniques for solid earth applications based on remote sensing. In particular, the goal is to see the variety of applied problems and how to develop a specific solution for each. |
11h15 | Explainable AI for Earth Observation Alexandre Benoît (Laboratoire LISTIC) Abstract: Earth Observation (EO), as for other domains, is subject to impressive advances thanks to the availability of abundant data and modern AI methods and more specifically deep neural networks. However, most of the available EO data is generally unlabelled, generally illustrates very local context with specific orientation, climate… such that the generalization behaviours of machine learning models can be limited. In addition, the implication of model inference applied to EO may lead to costly decisions (infrastructure design, modification, agricultural spreading…) such that automatic decisions should be justified or explained. In the era of deep learning-based models, opening those black boxes is a challenge in itself. In this presentation, we will present a variety of activities related to EO at LISTIC Lab with classical and AI-based models. This will lead to a focus on contributions related to explainable AI relying on 3 complementary directions : black box explanation, explanation by model design and redescription mining. |
12h15 | Fin |
Programme de l’Atelier DSChem
[Salle TD10 – 1er étage]
Mardi 12 juillet – 10h15-12h15 | |
---|---|
10h15 | Premiers pas de l’atelier Data Science for Chemistry Dominique Douguet, Matthieu Montès, Nicolas Blanchard et Bertrand Cuissart |
10h55 | Application of the Generative Topographic Mapping approach to Big Chemical Data analysis Gilles Marcou (Laboratoire de Chémoinformatique) The Generative Topographic Mapping (GTM) is density-based model of a dataset. It optimizes the shape of a manifold to maximize the likelihood of a training set, according to a normal distribution centered on that manifold. Each instance of the dataset is therefore embedded as a density distribution over the manifold called responsibilities. As a corollary, a full dataset is represented summing the corresponding responsibilities. This concept allows for the generation of activity and property landscapes that are predictive classification and regression models, respectively, emerging from the GTM analysis. Several use cases to answer big chemical data analysis tasks will be presented. First, the concept of ChemAtlas will be presented: a compendium of multi-scale maps covering over 700 biological properties from the ChEMBL database. Second, the use of kernel GTM for genomic data where the challenge is to manage data of very large dimensionality. Third, the use of GTM to sample the chemical space efficiently coupling the method with an auto-encoder. |
11h35 | Toward the discovery of the hidden features built by a GNN Marc Plantevit (LRDE, LIRIS) Dans cette présentation, nous considérerons l’explication de GNNs qui sont appliqués avec succès sur de nombreux problèmes de classification de graphes, notamment en chimie. Alors que les travaux existants expliquent la décision du modèle en s’appuyant sur la couche de sortie, nous verrons comment analyser les couches cachées pour identifier les attributs construits par le GNN. Les règles d’activation ainsi construites permettent d’identifier des neurones co-activés pour une classe. Ces règles définissent ainsi des représentations internes ayant un impact fort sur la classification. Aussi intéressantes soient-elles, elles ne sont pas interprétables. Nous aborderons donc comment générer un graphe représentatif pour chaque règle. Nous présenterons quelques résultats expérimentaux sur des jeux de données bien connus (e.g., Mutagen, Aids). Enfin, nous discuterons les perspectives de ce travail |
12h15 | Fin |
Programme de l’Action MADONA
[Salle C5 – RdC]
NADA 22 : 1er atelier pluridisciplinaire : narration de données, datajournalisme et engagement(s)
Mardi 12 juillet – 10h15-12h15 datajournalisme et engagement |
|
---|---|
10h15 | Présentation de l’action MADONA Marie Chagnoux (CEMTI) et Patrick Marcel (LIFAT) |
10h30 | Les données dans une formation en journalisme : retour d’une expérience Olivier Trédan (ARENES) |
11h00 | Notebooks, l’engagement par la documentation Raphaël Da Silva (journaliste free-lance et formateur) |
11h15 | Datajournalisme, feuilletonnage et engagement Bertrand Enjalbal (Rue 89 Lyon) |
11h30 | L’engagement éditorial dans la constitution d’une base de données : deux exemples de réaffirmation de la responsabilité sociale du journalisme Mélanie Lecha (UPHF) |
11h45 | Global turn de l’investigation journalistique et engagement collaboratif grâce aux technologies numériques : le cas de l’ICIJ Angelina Toursel (UPHF) et Philippe Useille (UPHF) |
12h15 | Pause déjeuner |
Mardi 12 juillet – 14h00-17h00 Narration et engagement |
|
14h00 | Observatoire du discours parlementaire Lucas Piessat (ERIC), Julien Velcin (ERIC) et Gauthier Bravais (ERIC) |
14h30 | Expérimentations d’innovation sociales et mise en récit, présentation du laboratoire citoyen la Myne Julien Beutter (La Myne) |
14h45 | Generating personalized data narrations from EDA notebooks Patrick Marcel (LIFAT) |
15h00 | Les dispositifs d’engagement du lecteur dans la narration de données Marie Chagnoux (CEMTI) |
15h15 | Discussion |
16h00 | Les suites de l’Action MADONA |
17h00 | Fin |
Programme de l’Action SimpleText
[Salle TD10 – 1er étage]
Mardi 12 juillet – 14h00-16h00 | |
---|---|
14h00 | Ouverture Liana Ermakova (HCTI, UBO) |
14h10 | Text complexity & eye tracking (visio) Olivier Augereau (Lab-STICC, ENIB) |
14h30 | Some experience on Incident Triaging with NLP Techniques in an Industrial Environment Youcef REMIL (LIRIS, INSA Lyon / Infologic) |
15h00 | Beyond Just Words: Utilizing Additional Information in Document Readability Assessment (visio) Adam Jatowt (University of Innsbruck, Austria) |
15h40 | Vocabulometer: a recommender system for learning language (visio) Nicholas Journet (LaBRI, Université de Bordeaux) |
16h00 | Fin |
Programme de l’Action RoCED
[Salle TD11 – 1er étage]
Mardi 12 juillet – 14h00-16h00 | |
---|---|
14h00 | Ouverture |
14h10 | Raisonnement sur des requêtes avec agrégats temporels Marie-Christine Rousset (LIG) |
15h00 | Règles pour le droit d’accès à des données pour la sécurité de la personne Pierre-Yves Gicquel (IRIT) |
15h20 | Construction de graphes de connaissance à partir de textes avec une IA centrée-utilisateur Hugo Ayats (IRISA) |
15h40 | Hybridation des méthodes d’apprentissage et Web sémantique pour l’optimisation et la planification de cultures maraîchères en agro-écologie Baptise Darnala (LIRMM) |
16h00 | Fin |
Liste des posters
[Salles C1 et C2 – RdC]
Exposant | Laboratoire | Titre |
---|---|---|
Pierre Andrieu | LMO, LISN | Obtenir des informations sur les gènes les plus associés à une maladie donnée |
Nelly Barret | INRIA, LIX | Abstra: Data Descriptions out of Any Model |
Alexis Blandin | IRISA | Représentation de newsletters en graphes |
Lisa Chabrier | INRIA, LIRIS | Regulatory interactions between genes and Gene Regulatory Networks (GRNs) |
Marzieh Derakhshannia | LIRMM | Gestion et optimisation de l’architecture logistique de lacs de données |
Faten El Outa | LIFAT | Un cadre pour façonner la narration de données |
Pierre Faure-Giovagnoli | LIRIS | Évaluez l’Existence d’une Fonction dans votre Jeu de Donnée |
Quentin Gabot | Léonard de Vinci | Tourists Profiling by Interest Analysis |
Nicolas Hiot | LIFO | Base de données graphes avec informations incomplètes |
Gabriel Kasmi | OIE | Prévision de production d’energie renouvelable |
Bilal Koteich | IRENav | Knowledge-Based Recommendation for On-Demand Mapping : Application to Nautical Charts |
Tanguy Lefort | IMAG | Ambiguïté des étiquettes en classification et retours d’expert |
Jules Leguy | Leria | Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire |
Etienne Lehembre | GREYC | Selecting Outstanding Patterns Based on Their Neighbourhood |
Madhulika Mohanty | INRIA | Scalable exhaustive connectivity search within graph queries |
Hassan Noureddine | IRENav | Modélisation, gestion et traitement des données de trajectoires sémantiques en indoor et outdoor |
Audrey Onfroy | INSERM, IBENS | Deciphering molecular mechanisms governing malignant transformation in Neurofibromatosis Type 1 (NF1) from single cell transcriptomic |
Mélanie Piot | LIST3N | CANCER DU SEIN: Représentation du savoir : experts vs données |
Arijus Pleska | CRISTAL | Neural language processing and federated learning under data privacy or fairness |
Mina Rafla | GREYC, Orange Labs | Correction des biais dans le cadre de la modélisation de l’effet de traitement |
Sébastien Rivault | LIFO | Parallélisme, équilibrage de charges et extensibilité dans le traitement des mégadonnées sur des systèmes à grande échelle |
Antoine Saget | iCube | Apprentissage collaboratif multiparadigme pour l’analyse d’images de télédétection |
Hugo Thimonier | LISN | Apprentissage Automatique et Interpretabilité : Application à la détection de fraude aux paiement par carte bancaire |
Foutse Yuhgoh | DRRC, CEDIRC | A Technology Intelligence Recommendation System based on Multiplex Networks |
Eduardo Brandao | LHC | Physics-guided Machine Learning |
Hussein El Amouri | iCube | Interactive collaborative constrained clustering for remote sensing time series analysis |
Loujain Liekah | LIRIS | Prediction Models on Medical Data |
Alexis Mortelier | GREYC | analyse de données de e-sport |