Quatrième édition du Symposium MaDICS

Calendar

When:

11/07/2022 – 12/07/2022 all-day

2022-07-11T00:00:00+02:00

2022-07-13T00:00:00+02:00

Where:

Lyon, Campus de la Doua

MaDICS

Présentation

La quatrième édition du Symposium MaDICS aura lieu en présentiel à Lyon sur le Campus de la Doua les 11 et 12 juillet 2022. Il a pour objectif de réunir la communauté MaDICS à l’occasion de conférences scientifiques invitées (Sihem Amer-Yahia et Anne-Cécile Orgerie, toutes deux médaillées du CNRS), de sessions dédiées aux Actions et Ateliers du GDR, mais également d’une demi-journée plus spécialement à destination des doctorants et jeunes chercheurs (cf Appel à posters)… et bien sûr de nombreux moments de convivialité !

Pour vous inscrire au Symposium vous devez vous inscrire à au moins une session (Action, Atelier ou Posters). Pour des raisons d’organisation, veuillez vous inscrire à toutes les actions et ateliers auxquelles vous souhaitez participer.

En espérant que vous serez nombreux pour partager ce moment ensemble.

Du : 2022-07-11
Au : 2022-07-12
Lieu : Lyon, Campus de la Doua (Comment venir, Plan du site)

Programme

Lundi 11 juillet 2022
10h00	Accueil [Salles C1 et C2 – RdC]
10h30	Session d’ouverture Introduction, présentation du GDR et questions [Amphi Ampère – bâtiment Lippmann]
11h00	Keynote Sihem Amer-Yahia (LIG, médaille d’argent du CNRS) Should we store or retrain ML models for data exploration? [Amphi Ampère – bâtiment Lippmann]
12h00	Pause repas
14h00	Session Actions et Ateliers 1
	Action DOING Programme détaillé [Salle C4 – RdC]	Action BigData4Astro Programme détaillé [Salle C5 – RdC]
	Atelier FedSed Programme détaillé [Salle TD10 – 1er étage]	Atelier Musiscale SESSION ANNULEE
16h00	Pause [Salles C1 et C2 – RdC]
16h15	Présentations de doctorants primés [Amphi Ampère – bâtiment Lippmann] Christina Khnaisser (Prix de cotutelle France-Québec) Modéliser les connaissances cliniques et concevoir des bases de données pour les systèmes de santé apprenants Pierre Monnin (Prix de thèse EGC 2022) Appariement et fouille dans les graphes de connaissances du web de données : applications en pharmacogénomique
17h15	Gong Show Flash talks possiblement enregistrés [Amphi Ampère – bâtiment Lippmann]
18h00	Session posters avec cocktail Liste des posters [Salles C1 et C2 – RdC]
19h00	Fin de la journée

Mardi 12 juillet 2022
9h00	Keynote Anne-Cécile Orgerie (IRISA, médaille de bronze du CNRS) Réduire la consommation énergétique des centres de données [Amphi Ampère – bâtiment Lippmann]
10h00	Pause [Amphi Ampère – bâtiment Lippmann]
10h15	Session Acttions et Ateliers 2
	Action HELP Programme détaillé [Salle C4 – RdC]	Action MACLEAN Programme détaillé [Salle TD11 – 1er étage]
	Atelier DSChem Programme détaillé [Salle TD10 – 1er étage]	Action MADONA Programme détaillé [Salle C5 – RdC]
12h15	Pause repas
14h00	Session Actions et Ateliers 3
	Action MADONA Programme détaillé [Salle C5 – RdC]	Action SimpleText Programme détaillé [Salle TD10 – 1er étage]
	Action RoCED Programme détaillé [Salle TD11 – 1er étage]
16h00	Fin du Symposium

Programme de l’Action DOING

[Salle C4 – RdC]

Lundi 11 juillet – 14h00-16h00
14h00	Présentation de la demi journée, Genoveva Vargas-Solar (CNRS – LIRIS)
14h10	Keynote : Aperçu général des langages de requêtes pour graphes à propriétés Victor Marsault (CNRS, LIGM)
14h55	Traitement de textes par des requêtes data science: verrous et carte d’expertise Mirian Halfeld Ferrari Alves (U. Orléans, LIFO) & Genoveva Vargas-Solar (CNRS, LIRIS)
15h10	Panel : Représentation du contenu et extraction de connaissances à partir des textes : les systèmes de gestion de graphes, l’intelligence artificielle et les approches sémantiques Donatello Conte (Polytech Tours, LIFAT) Agata Savary (Université Paris-Saclay, LISN) Nathalie Hernandez (Université de Toulouse, IRIT) Nicolas TRavers (ELSIV, Centre de Recharche Da Vinci)
16h00	Fin

Programme de l’Action BigData4Astro

[Salle C5 – RdC]

Lundi 11 juillet – 14h00-16h00
14h00	Présentation de la demi-journée Karine Zeitouni (DAVID) et André Schaaff (CDS)
14h10	Future prospect in spectroscopic survey and data challenges Roland Bacon (CRAL)
14h40	Exploration non supervisée des données : application aux données issues des véhicules autonomes Mustapha Lebbah (LIPN)
15h10	Discussion, Besoins en formation (ANR CMA, Ecole AstroInfo, …)
15h25	Table ronde Data Lakes en astronomie ?
15h55	Prochains évènements
16h00	Fin

Programme de l’Atelier FedSed

[Salle TD10 – 1er étage]

Lundi 11 juillet – 14h00-16h00
14h00	Introduction, Marco Lorenzi
14h15	Privacy preserving machine learning, Melek Önen (EURECOM)
14h45	Blockchain-based federated learning for medecine, Imen Megdiche (IRIT, ISIS)
15h15	Fed-BioMed workshop
16h00	Fin

Programme de l’Action HELP

[Salle C4 – RdC]

L’atelier HELP vise à proposer une vision trans-disciplinaire informatique / SHS de la problématique de l’explicabilité. Nous nous intéressons à une vision de bout-en-bout du problème d’explicabilité en ne se focalisant pas uniquement sur les modèles mais à l’impact de tous les éléments de la chaîne de traitement de données, partant de la qualité des données jusqu’à l’interaction avec l’utilisateur qui reçoit l’explication. Un point intéressant peut aussi considérer la propagation des biais d’explication d’une étape à une autre de la chaîne de traitement. L’atelier a pour vocation à devenir une plateforme d’échange pour la communauté autour de ces questions scientifiques et de favoriser l’émergence de projets communs.

Mardi 12 juillet – 10h15-12h15
10h15	Real use cases for XAI in insurance companies Xavier Renard et Thibault Laugel
11h00	Lien entre qualité des données et explicabilité Nikos Myrtakis et Vassilidis Christophides
11h20	XAI et médecine Paul Monsarrat
11h40	Table ronde et clôture
12h15	Fin

Programme de l’Action MACLEAN

[Salle TD11 – 1er étage]

Mardi 12 juillet – 10h15-12h15
10h15	Ouverture de la session
10h25	Applications of deep learning in natural hazards and solid earth science using remote sensing Sophie Giffard-Roisin (Laboratoire ISTerre, IRD) Abstract: Solid earth has recently (finally!) gained benefit from the recent advances of machine learning such as in automatic detection of earthquake events in seismic recordings. Moreover, the use of remote sensing data (such as satellite optical and radar) as well as seismology and geodesy, have been important in solid earth sciences in the last decades, for example for estimating the ground motion during an earthquake, for estimating the ground state change after a volcanic eruption or landslide, or even for mapping active faults. This talk will focus on some new research works which aim to develop new data-based methods in order to improve, automatize and create new techniques for solid earth applications based on remote sensing. In particular, the goal is to see the variety of applied problems and how to develop a specific solution for each.
11h15	Explainable AI for Earth Observation Alexandre Benoît (Laboratoire LISTIC) Abstract: Earth Observation (EO), as for other domains, is subject to impressive advances thanks to the availability of abundant data and modern AI methods and more specifically deep neural networks. However, most of the available EO data is generally unlabelled, generally illustrates very local context with specific orientation, climate… such that the generalization behaviours of machine learning models can be limited. In addition, the implication of model inference applied to EO may lead to costly decisions (infrastructure design, modification, agricultural spreading…) such that automatic decisions should be justified or explained. In the era of deep learning-based models, opening those black boxes is a challenge in itself. In this presentation, we will present a variety of activities related to EO at LISTIC Lab with classical and AI-based models. This will lead to a focus on contributions related to explainable AI relying on 3 complementary directions : black box explanation, explanation by model design and redescription mining.
12h15	Fin

Programme de l’Atelier DSChem

[Salle TD10 – 1er étage]

Mardi 12 juillet – 10h15-12h15
10h15	Premiers pas de l’atelier Data Science for Chemistry Dominique Douguet, Matthieu Montès, Nicolas Blanchard et Bertrand Cuissart
10h55	Application of the Generative Topographic Mapping approach to Big Chemical Data analysis Gilles Marcou (Laboratoire de Chémoinformatique) The Generative Topographic Mapping (GTM) is density-based model of a dataset. It optimizes the shape of a manifold to maximize the likelihood of a training set, according to a normal distribution centered on that manifold. Each instance of the dataset is therefore embedded as a density distribution over the manifold called responsibilities. As a corollary, a full dataset is represented summing the corresponding responsibilities. This concept allows for the generation of activity and property landscapes that are predictive classification and regression models, respectively, emerging from the GTM analysis. Several use cases to answer big chemical data analysis tasks will be presented. First, the concept of ChemAtlas will be presented: a compendium of multi-scale maps covering over 700 biological properties from the ChEMBL database. Second, the use of kernel GTM for genomic data where the challenge is to manage data of very large dimensionality. Third, the use of GTM to sample the chemical space efficiently coupling the method with an auto-encoder.
11h35	Toward the discovery of the hidden features built by a GNN Marc Plantevit (LRDE, LIRIS) Dans cette présentation, nous considérerons l’explication de GNNs qui sont appliqués avec succès sur de nombreux problèmes de classification de graphes, notamment en chimie. Alors que les travaux existants expliquent la décision du modèle en s’appuyant sur la couche de sortie, nous verrons comment analyser les couches cachées pour identifier les attributs construits par le GNN. Les règles d’activation ainsi construites permettent d’identifier des neurones co-activés pour une classe. Ces règles définissent ainsi des représentations internes ayant un impact fort sur la classification. Aussi intéressantes soient-elles, elles ne sont pas interprétables. Nous aborderons donc comment générer un graphe représentatif pour chaque règle. Nous présenterons quelques résultats expérimentaux sur des jeux de données bien connus (e.g., Mutagen, Aids). Enfin, nous discuterons les perspectives de ce travail
12h15	Fin

Programme de l’Action MADONA

[Salle C5 – RdC]

NADA 22 : 1er atelier pluridisciplinaire : narration de données, datajournalisme et engagement(s)

Mardi 12 juillet – 10h15-12h15 datajournalisme et engagement
10h15	Présentation de l’action MADONA Marie Chagnoux (CEMTI) et Patrick Marcel (LIFAT)
10h30	Les données dans une formation en journalisme : retour d’une expérience Olivier Trédan (ARENES)
11h00	Notebooks, l’engagement par la documentation Raphaël Da Silva (journaliste free-lance et formateur)
11h15	Datajournalisme, feuilletonnage et engagement Bertrand Enjalbal (Rue 89 Lyon)
11h30	L’engagement éditorial dans la constitution d’une base de données : deux exemples de réaffirmation de la responsabilité sociale du journalisme Mélanie Lecha (UPHF)
11h45	Global turn de l’investigation journalistique et engagement collaboratif grâce aux technologies numériques : le cas de l’ICIJ Angelina Toursel (UPHF) et Philippe Useille (UPHF)
12h15	Pause déjeuner
Mardi 12 juillet – 14h00-17h00 Narration et engagement
14h00	Observatoire du discours parlementaire Lucas Piessat (ERIC), Julien Velcin (ERIC) et Gauthier Bravais (ERIC)
14h30	Expérimentations d’innovation sociales et mise en récit, présentation du laboratoire citoyen la Myne Julien Beutter (La Myne)
14h45	Generating personalized data narrations from EDA notebooks Patrick Marcel (LIFAT)
15h00	Les dispositifs d’engagement du lecteur dans la narration de données Marie Chagnoux (CEMTI)
15h15	Discussion
16h00	Les suites de l’Action MADONA
17h00	Fin

Programme de l’Action SimpleText

[Salle TD10 – 1er étage]

Mardi 12 juillet – 14h00-16h00
14h00	Ouverture Liana Ermakova (HCTI, UBO)
14h10	Text complexity & eye tracking (visio) Olivier Augereau (Lab-STICC, ENIB)
14h30	Some experience on Incident Triaging with NLP Techniques in an Industrial Environment Youcef REMIL (LIRIS, INSA Lyon / Infologic)
15h00	Beyond Just Words: Utilizing Additional Information in Document Readability Assessment (visio) Adam Jatowt (University of Innsbruck, Austria)
15h40	Vocabulometer: a recommender system for learning language (visio) Nicholas Journet (LaBRI, Université de Bordeaux)
16h00	Fin

Programme de l’Action RoCED

[Salle TD11 – 1er étage]

Mardi 12 juillet – 14h00-16h00
14h00	Ouverture
14h10	Raisonnement sur des requêtes avec agrégats temporels Marie-Christine Rousset (LIG)
15h00	Règles pour le droit d’accès à des données pour la sécurité de la personne Pierre-Yves Gicquel (IRIT)
15h20	Construction de graphes de connaissance à partir de textes avec une IA centrée-utilisateur Hugo Ayats (IRISA)
15h40	Hybridation des méthodes d’apprentissage et Web sémantique pour l’optimisation et la planification de cultures maraîchères en agro-écologie Baptise Darnala (LIRMM)
16h00	Fin

Liste des posters

[Salles C1 et C2 – RdC]

Exposant	Laboratoire	Titre
Pierre Andrieu	LMO, LISN	Obtenir des informations sur les gènes les plus associés à une maladie donnée
Nelly Barret	INRIA, LIX	Abstra: Data Descriptions out of Any Model
Alexis Blandin	IRISA	Représentation de newsletters en graphes
Lisa Chabrier	INRIA, LIRIS	Regulatory interactions between genes and Gene Regulatory Networks (GRNs)
Marzieh Derakhshannia	LIRMM	Gestion et optimisation de l’architecture logistique de lacs de données
Faten El Outa	LIFAT	Un cadre pour façonner la narration de données
Pierre Faure-Giovagnoli	LIRIS	Évaluez l’Existence d’une Fonction dans votre Jeu de Donnée
Quentin Gabot	Léonard de Vinci	Tourists Profiling by Interest Analysis
Nicolas Hiot	LIFO	Base de données graphes avec informations incomplètes
Gabriel Kasmi	OIE	Prévision de production d’energie renouvelable
Bilal Koteich	IRENav	Knowledge-Based Recommendation for On-Demand Mapping : Application to Nautical Charts
Tanguy Lefort	IMAG	Ambiguïté des étiquettes en classification et retours d’expert
Jules Leguy	Leria	Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire
Etienne Lehembre	GREYC	Selecting Outstanding Patterns Based on Their Neighbourhood
Madhulika Mohanty	INRIA	Scalable exhaustive connectivity search within graph queries
Hassan Noureddine	IRENav	Modélisation, gestion et traitement des données de trajectoires sémantiques en indoor et outdoor
Audrey Onfroy	INSERM, IBENS	Deciphering molecular mechanisms governing malignant transformation in Neurofibromatosis Type 1 (NF1) from single cell transcriptomic
Mélanie Piot	LIST3N	CANCER DU SEIN: Représentation du savoir : experts vs données
Arijus Pleska	CRISTAL	Neural language processing and federated learning under data privacy or fairness
Mina Rafla	GREYC, Orange Labs	Correction des biais dans le cadre de la modélisation de l’effet de traitement
Sébastien Rivault	LIFO	Parallélisme, équilibrage de charges et extensibilité dans le traitement des mégadonnées sur des systèmes à grande échelle
Antoine Saget	iCube	Apprentissage collaboratif multiparadigme pour l’analyse d’images de télédétection
Hugo Thimonier	LISN	Apprentissage Automatique et Interpretabilité : Application à la détection de fraude aux paiement par carte bancaire
Foutse Yuhgoh	DRRC, CEDIRC	A Technology Intelligence Recommendation System based on Multiplex Networks
Eduardo Brandao	LHC	Physics-guided Machine Learning
Hussein El Amouri	iCube	Interactive collaborative constrained clustering for remote sensing time series analysis
Loujain Liekah	LIRIS	Prediction Models on Medical Data
Alexis Mortelier	GREYC	analyse de données de e-sport

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Quatrième édition du Symposium MaDICS

Présentation

Programme

Programme de l’Action DOING

Programme de l’Action BigData4Astro

Programme de l’Atelier FedSed

Programme de l’Action HELP

Programme de l’Action MACLEAN

Programme de l’Atelier DSChem

Programme de l’Action MADONA

Programme de l’Action SimpleText

Programme de l’Action RoCED

Liste des posters