Présentation Générale

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS  


Jan
17
Fri
2020
Kickoff meeting action PLATFORM @ Visio
Jan 17 all-day

AGENDA
10-10:30 – Tour de table et rappel de l’action
Notre action vise à examiner les impacts des algorithmes décisionnels sur les choix des consommateurs. Pour ce faire, nous organiserons des datathon et hackathon pour la conception et déploiement d’expériences contrôlées.
Datathon: effort de collecte de données, préférences, méta données via des mesures directes (questionnaires) ou indirectes (collecte de données à l’insu des sujets)
Hackathon: effort d’analyse de ces données principalement en utilisant des mesures statistiques et des algorithmes
Donc, pour organiser un datathon et un hackathon, il faut savoir quelle hypothèse nous recherchons.

Laurent/Béa. Note : Il serait souhaitable de consacrer un peu de temps lors de cette réunion pour avoir une vision globale sur les données qu’il est possible de récolter. Exemple : Position sur la page, liste des alternatives, prix, date, timing, trace individuelle… (tu nous as par exemple donner la liste des observables pour Total, est-il possible d’avoir la même chose pour booking, tripadvisor, facebook (par adAnalyst), etc.

10:30-11:30
Christophe: Sur le fond les questions qui m’intéressent sont a) quel est l’importance de l’effet des moteurs de recommandations ( qui peuvent différer par les données et les algo utilisés) sur les comportements effectifs (browsing, achats, partage etc). b) dans quelle mesure sont-ils acceptés et évalués par les consommateurs ?. A la première question il faudrait je pense une approche par expérimentation naturelle, la seconde se prête plus à une expérience en laboratoire (les réponses mesurées se faisant plutôt par des échelles de jugement subjectifs.
L/B : Nous sommes également intéressés par les questions soulevés par Christophe sur (1) impact et (2) acceptabilité. Voici d’autres pistes de réflexion sur ces sujets :
– Est-ce que la recommandation simplement réduit le coût de recherche en proposant la meilleure alternative au consommateur (selon l’offre proposée) ou alors modifie les préférences.
– Est-ce que l’impact de la recommandation est plus forte lorsque elle va dans le sens des croyances du consommateur. Et si c’est la cas, alors les recommandations vont restreindre le répertoire des choix. En d’autres termes, est-ce que les recommandations diminuent (augmentent) le champ des possibles.
– Est-ce que le degré d’ouverture (paramétrisation) de l’algorithme produisant la recommandation agit sur l’acceptabilité. Hypothèse : s’il l’on donne plus ou moins la main au consommateur, la recommandation sera plus acceptée (et donc efficace ?)
Boîte noire vs. algorithme basé sur l’historique vs. algorithme paramétré par l’utilisateur.
– Trouver le point de rupture de l’acceptabilité (par ex : « il est pour moi rédhibitoire que l’algorithme utilise x donnée ».) Arbitrage entre simplifier sa vie par les recommandations et la liberté
– Dynamique de la relation de confiance entre le consommateur et la recommandation
Autres questions (en vrac) :
– Hiérarchiser les déterminants des choix (prix, avis, notes, commentaires, place dans la page internet, etc.)… et la place de la recommandation parmi ces déterminants.
– Impact du format de la recommandation (produit), tri par pertinence, étoiles, avis.

Cas d’usage pour la révélation de préférences et de biais comportementaux
● Datathon 1.1 (co-leads : L. Muller et A. Tsoukias) : Formalisation de modèles de révélation de préférences et de biais
○ Collecter les préférences
○ Comparer les préférences : avec des données existantes pour lesquelles nous avons des choix enregistrés (e.g., choix d’un hôtel sur un site type tripadvisor.com ou booking.com) et également à travers des expériences dans le contexte contrôlé du laboratoire (on-line ou in-situ)
OBJECTIF: Design d’expériences pour la collecte de préférences
● Datathon 1.2 (co-leads : M. Öztürk et A. Fadhuile) : Définition de cas d’usage sous forme de couples (hypothèse/théorie, données). Plusieurs applications :
○ Biais social, c’est-à-dire sur l’influence de consommateurs tiers dans ses propres choix (exemple : notes attribuées en ligne, forum, etc.).
○ Biais d’ancrage, c’est-à-dire l’influence de l’amorçage sur la décision d’achat et sur le nombre de pages visitées ensuite (ex : affichage de prix et/ou produits en première page internet).
○ Biais statu quo: Occurrence dans les choix des options par défaut (ex : standard, options, etc.). = BIAIS STATU QUO… à rapporter avec la question de l’équité dans le classement algorithmique
OBJECTIF: Quelles hypothèses voulez vous vérifier ?

Hackathon pour le design et déploiement des expériences (co-leads : C. Benavent, O. Goga et B. Roussillon) :
● Hackathon pour étendre AdAnalyst pour cibler un ensemble précis d’internautes, de vérifier s’ils ont vu ou cliqué sur des publicités, et de leur demander de répondre à des questionnaires.
OBJECTIF: Quelles mesures directes/indirectes ? => les choix/achats, likes, questionnaire, choice experiment, beauty contest, enchères, etc.

Oana et Sihem: extension AdAnalyst avec le mouse tracking (indirectes) et les pop-ups (directes) – 2 stagiaires financés par l’ANR Jeune Chercheur d’Oana (Salim et Rosa jusqu’au 15/06)

● Hackathon pour la construction d’expériences contrôlées en laboratoire. L’enjeu est ici d’augmenter la validité externe des résultats issus d’expériences de laboratoire et la validité interne des résultats issus des méta-données.
Ceci est, il me semble, un enjeu transversal qui s’appliquera aux différentes questions.
OBJECTIF: Quelles hypothèses voulez vous vérifier ?
Oana et Sihem: Mesure de l’attitude des individus vis-à-vis de la pub en ligne (information ads sur les politiques publiques et product ads)
Oana et Sihem: Fouille de l’évolution des habitudes de consommation des clients TOTAL (stagiaire Abdou jusqu’au 30/06 financé par projet européen de Sihem)
Christophe: Travail sur l’influence des commentaires positifs/négatifs sur les réservations Airbnb

11:30-12
Prochaines étapes

URL :

Jul
6
Mon
2020
Second Symposium GDR CNRS MaDICS @ En distanciel avec BBB
Jul 6 – Jul 9 all-day

Présentation

La seconde édition du Symposium MaDICS aura lieu en distanciel du 6 au 9 juillet 2020. Chaque demi-journée propose un programme riche en exposés courts construit par nos responsables d’Actions et d’Atelier. Les sessions auront lieu sous BBB pour permettre à un plus grand nombre d’assister aux exposés. Les programmes seront disponibles d’ici au 18 juin : restez connectés !

Du : 2020-07-06
Au : 2020-07-09
Lieu : En distanciel avec BBB

Programme

Lundi 6 juillet
 9h00-12h30 Action Raisonner sur les donnéesSession 1
Intervenants : Joe Raad, Erman Acar, Stefan Schlobach, Manuel Atencia, Jérôme David, Jérôme Euzenat, Jérémy Lhez, Chan Le Duc, Thinh Dong, Myriam Lamolle, Arnaud Giacometti, Beatrice Markhoff, Arnaud Soulet, Thu Huong Nguyen et Andrea G.B. Tettamanzi
Programme détaillé
Lien vers la page de l’Action RoD
13h30-17h00 Atelier AGriculture, Environnent, Ecologie
Intervenants : Sylvain Galopin, Chuanming Dong, Clement Jonquet, Philippe Prévost et Michel Berducat
Programme détaillé
Lien vers la page de l’Atelier AGEE
13h15-17h00

Action Impact Sociétal des Algorithmes Décisionnels
Intervenants : Sihem Amer-Yahia, Juliette Sénéchal, Béatrice Roussillon, Oana Goga, Adélaïde Fadhuile, Laurent Muller, Rosa Khenniche, Salim Chouaki, Abdel Chibah, Nikita Gusarov, Soraya Koraytem et Alexis Tsoukias.
Programme détaillé (avec PDFs)
Lien vers la page de l’Action PLATFORM
Mardi 7 juillet
9h00-12h30 Atelier Outils Statistiques pour l’Imagerie hyperspectrale du milieu interstellaire
Intervenants : Jérôme Pety, Annie Zavagno, Rosine Lallement, Clément Hottier, Yannick Deville, Florent Chatelain et Antoine Roueff
Programme détaillé
Lien vers la page de l’Atelier OSIS
 9h00-12h30 Action RoDSession 2
Intervenants : Sébastien Ferré, Camille Bourgaux, Meghyn Bienvenu, Luis Palacios, Yue Ma, Chantal Reynaud, Gaëlle Lortal, Arnaud Grall, Thomas Minier, Hala Skaf-Molli, Pascal Molli, Julien Romero, Nicoleta Preda, Antoine Amarilli, Fabian M. Suchanek, Victor Charpenay et Sebastian Käbisch
Programme détaillé
Lien vers la page de l’Action RoD
14h00-16h00 Atelier MaDICS Humanités Numériques
Intervenants : Claudia MARINICA, Cécile CHANTRAINE, Ioana GALLERON, Max BELIGNE et Christophe TUFFERY
Programme détaillé
Lien vers la page de l’Atelier MaDICS-HN
14h00-17h00 Action MAChine LEarning for EArth observatioN
Intervenants : Germain Forestier, Romain Tavenard et Marc Rußwurm
Programme détaillé
Lien vers la page de l’Action MACLEAN
Mercredi 8 juillet
9h00-12h30 Atelier Big Data for Astronomy
Intervenants : Stéphane Plaszczynski, Marc Huertas-Company et Karine Zeitouni
Programme détaillé
Lien vers la page de l’Atelier BigData4Astro
9h00-12h30 Action anaLysE et dynaMique des messages et cONversations radicales sur Internet
Intervenants : Nawel Chaouni, Séraphin Alava, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel, Franck Biellmann, Raphaël Bavière, Océane Fourquet, Claire Laudy, Cyril Bruneau, Delphine Battistelli, Adrien Legros, Valentina Dragos
Programme détaillé
Lien vers la page de l’Action LEMON
14h00-17h00 Atelier Données Intelligentes: transformer l’information en connaissance
Intervenants : Andre Freitas et Laure Berti
Programme détaillé
Lien vers la page de l’Atelier DOING
Jeudi 9 juillet
 9h00-12h30 Restitution et synthèse
Programme détaillé

 
 
 

Programme de l’Action Rod – Session 1

Lundi 6 juillet 9h00-12h30  
9h00 Accueil
9h15 Atelier Approches récentes pour le raisonnement sur les données (1)

  • YAGO 4: A Reasonable Knowledge Base, Thomas Pellissier Tanon, Gerhard Weikum and Fabian M. Suchanek. (publié à ESWC 2020)
  • On the Impact of sameAs on Schema Matching, Joe Raad, Erman Acar and Stefan Schlobach. (publié à KCAP 2019)
  • Several link keys are better than one, or Extracting disjunctions of link key candidates, Manuel Atencia, Jérôme David and Jérôme Euzenat. (publié à Kcap 2019)
10h45 Pause
11h00 Atelier Approches récentes pour le raisonnement sur les données (2)

  • Decentralized Reasoning on a Network of Aligned Ontologies with Link Keys, Jérémy Lhez, Chan Le Duc, Thinh Dong and Myriam Lamolle. (publié à ISWC 2019)
  • Découverte de cardinalités maximales significatives dans des bases de connaissances, Arnaud Giacometti, Beatrice Markhoff and Arnaud Soulet. (publié à ISWC 2019)
  • Using Grammar-based Genetic Programming for Mining Disjointness Axioms Involving Complex Class Expressions, Thu Huong Nguyen and Andrea G.B. Tettamanzi. (publié à ICCS 2020)
12h30 Fin de l’atelier

Programme de l’Atelier AGEE

Lundi 6 juillet 13h30-17h00  
13h30 Introduction AGEE
13h40 AncGIS: SIG Web pour l’analyse des ressources mellifères, Sylvain Galopin, IGN
13h50 Fusion entre bases de données hétérogènes concernant la pollution des sols, Chuanming Dong, LASTIG, Univ Gustave Eiffel, ENSG, IGN, ADEME
14h10 Le projet D2KAB Data to Knowledge in Agronomy and Biodiversity, Clement Jonquet, LIRMM
14h30 TABLE RONDE 1 : Les défis scientifiques et technologiques pour l’intégration, la gestion et l’analyse de la donnée « Variée »
15h30 Pause
15h45 Enjeux, méthodes et pratiques pour la formation aux usages numériques dans les métiers du vivant, Philippe Prévost, Agreenium, Institut agronomique, vétérinaire et forestier de France
16h00 AgroTechnoPôle : La plateforme collaborative pour le développement des technologies au service de la transition agro écologique, Michel Berducat. TSCF, INRAE
16h15 TABLE RONDE 2 : Comment fédérer et animer la recherche en Big Data pour l’agro-env-eco ?
17h00 Fin de l’atelier

Programme de l’Action PLATFORM

Lundi 6 juillet 13h15-17h00  
13h15 Introduction PLATFORM et effet levier, Sihem Amer-Yahia
13h30 Aspects juridiques et économiques

  • CNIL/RGPD/code de la consommation, Juliette Sénéchal
  • DPO et autorisations, Béatrice Roussillon, Oana Goga, Adélaide Fadhuile, Aurélie Level et Laurent Muller
14h30 Pause et discussion libre
14h45 Aspects méthodologiques

  • Présentations de Rosa Khenniche et Salim Chouaki , Abdel Chibah , Nikita Gusarov et Soraya Koraytem , et discussion autour des méthodologies de déploiement de campagnes publicitaires, de développement d’algorithmes, de développement de critères de performance
  • Présentation et discussion sur les préférences, Alexis Tsoukias
15h45 Pause et discussion libre
16h00 Rédaction conjointe: Lexique + Leçons
17h00 Fin de l’atelier

Programme de l’Atelier Osis

Mardi 7 juillet 9h00-12h30  
9h00 Le projet Orion-B, Jérôme Pety (IRAM, Grenobble)
9h25 Big Data et apprentissage pour l’étude de la formation stellaire galactique, Annie Zavagno (LAM, Marseille)
9h50 Reconstruction 3D du milieu interstellaire local, Rosine Lallement et Clément Hottier (GEPI, Paris)
10h15 Pause
10h45 Méthodes de dé-mélange, Yannick Deville (IRAP, Toulouse)
11h10 Détection du gaz dans les données hyperspectrales MUSE, Florent Chatelain (GIPSA-lab, Grenoble)
11h35 Traitements statistiques des données Orion-B, Antoine Roueff (Institut Fresnel, Marseille)
12h00 Discussions et synthèse
12h30 Fin de l’Atelier

Programme de l’Action Rod – Session 2

Mardi 7 juillet 9h00-12h30  
9h00 Accueil
9h15 Atelier Approches récentes pour le raisonnement sur les données (3)

  • Link Prediction in Knowledge Graphs with Concepts of Nearest Neighbours, Sébastien Ferré. (publié à ESWC 2019)
  • Querying and Repairing Inconsistent Prioritized Knowledge Bases: Complexity Analysis and Links with Abstract Argumentation, Camille Bourgaux et Meghyn Bienvenu. (publié à KR2020)
  • Knowledge Based Situation Discovery for Avionics Maintenance, Luis Palacios, Yue Ma, Chantal Reynaud and Gaëlle Lortal. (publié à KCAP 2019)
10h45 Pause
11h00 Atelier Approches récentes pour le raisonnement sur les données (4)

  • Processing SPARQL Aggregate Queries with Web Preemption, Arnaud Grall, Thomas Minier, Hala Skaf-Molli and Pascal Molli. (publié à ESWC 2020)
  • Réécriture de requêtes atomiques par des vues chemins, Julien Romero, Nicoleta Preda, Antoine Amarilli and Fabian M. Suchanek. (publié à ESWC 2020)
  • L’annotation « sémantique » de documents – L’exemple du web des objets, Victor Charpenay and Sebastian Käbisch. (publié à ESWC 2020)
12h30 Fin de l’atelier

Programme de l’Atelier MaDICS-HN

Mardi 7 juillet 14h00-16h30  
14h00 Présentation de l’atelier et des participants
Introduction à la problématique : “Construire des données pour les machines Vs pour les humains”
14h15 Interventions

  • L’analyse de trajectoires au musée du Louvre: des problématiques liées aux données, Claudia MARINICA (MCF informatique)
  • Deux approches pour la préparation de données et des métadonnées destinées à analyser le théâtre, Cécile CHANTRAINE (PR Études théâtrales et Humanités Numériques) et Ioana GALLERON (PR Littérature française et Humanités Numériques)
  • La transformation de documents numérisés par la plateforme Persée dans un objectif d’analyses textuelles, Max BELIGNE (Doc Géographie)
  • La préparation de données et de métadonnées pour leur publication sur des plateformes cartographiques : l’expérience des PCR “Réseau de lithothèques” et du GDR SILEX, Christophe TUFFERY (IR)
15h30 Discussion libre, échanges autour de deux questions :
“Données et jeux de données: définitions, fins et moyens?”
“Manipulation des données en SHS : des verrous techniques ou humains?”
16h30 Fin de l’atelier

Programme de l’Action MACLEAN

Mardi 7 juillet 14h00-17h00  
14h00 Welcome
14h05 Deep learning for time series classification, Germain Forestier (Université Haute-Alsace)
15h00 Tslearn: A machine learning toolkit dedicated to time-series data, Romain Tavenard (Université Rennes 2)
15h20 BreizhCrops: A Time Series Dataset for Crop Type Mapping, Marc Rußwurm (TU Munich)
15h40 Hands-on training
16h20 Panel discussion: machine learning, time series, and Earth Observation: opportunities and challenges
17h00 Fin de l’atelier

Programme de l’Atelier BigData4Astro

Mercredi 8 juillet 9h00-12h30  
9h00 Introduction
9h15 Big Data astronomy with Spark, Stéphane Plaszczynski (IJCLab, Université Paris-Saclay)
9h50 Deep Learning for the next generation of big-data surveys, Marc Huertas-Company (Observatoire de Paris/LERMA, Université Paris-Diderot)
10h15 Big FAIR Data in Astronommy, Mark Allen, Observatoire astronomique de Strasbourg
10h50 Pause
11h00 Spatial Query Optimization for Big Astronomical Surveys – ASTROIDE project, Karine Zeitouni (Université de Versailles-Saint-Quentin/DAVID)
11h20 Table Ronde : Perspectives et verrous scientifiques, avec les invités et les animateurs de l’Atelier
12h15 Conclusion
12h30 Finde l’Atelier

Programme de l’Action LEMON

Mercredi 8 juillet 9h00-12h30  
9h00 Accueil et Introduction
9h15 Constitution de bases de données radicales afin de caractériser les discours extrémistes pour une méthode interdisciplinaire de prévention des déviances en ligne, Nawel Chaouni, Séraphin Alava
9h45 Détection des influenceurs dans les médias sociaux, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel
10h15 Méthodes et outils pour investigation sur les réseaux sociaux, Franck Biellmann, Raphaël Bavière
10h45 Pause et discussion libre
11h00 Extractions d’informations sémantiques à partir de données sociales, Océane Fourquet, Claire Laudy
11h20 Modélisation linguistique et formelle de la notion de discours haineux, Cyril Bruneau, Delphine Battistelli
11h40 Vers une ontologie pour la détection des opinions dans les corpus en français, Adrien Legros, Valentina Dragos
12h00 Discutions et conclusion du séminaire
12h30 Fin de l’atelier

Programme de l’Atelier DOING

Mercredi 8 juillet 14h00-17h00  
14h00 Introduction
14h10 Automatically understand and process the meaning of information at scale, Andre Freitas
15h00 Pause
15h20 Data Cleaning and Preparation for ML and Data Analytics: Toward a Principled Approach, Laure Berti
16h10 Discussions
17h00 Fin de l’atelier

Programme de la matinée Restitution et Synthèse

Salon 1

Jeudi 9 juillet 9h00-12h30  
9h00 Introduction à MaDICS, Sarah Cohen-Boulakia
9h15 Restitution des Actions et Ateliers
11h00 Pause
11h30 Discussions
Sep
25
Fri
2020
Action PLATFORM dans GdR Internet et Société
Sep 25 – Sep 26 all-day

Annonce en lien avec l’Action/le Réseau : PLATFORM

Thème :

Plateformes et risques algorithmiques

Présentation :

La manifestation vise à produire un document résumant notre retour d’expérience sur le travail de PLATFORM : autorisations légales, déploiement d’expériences, modélisation des préférences, fouille et requêtes de comportement, travail à venir.

Du : 2020-09-25

Au : 2020-09-25

Lieu : En ligne

Site Web : https://cis.cnrs.fr/gdr-members/