MaDICS

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…

Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.

Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus…
Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus…
Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus…
Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…

Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS

Jan

Fri

2020

Kickoff meeting action PLATFORM @ Visio

Tickets

Jan 17 all-day

AGENDA
10-10:30 – Tour de table et rappel de l’action
Notre action vise à examiner les impacts des algorithmes décisionnels sur les choix des consommateurs. Pour ce faire, nous organiserons des datathon et hackathon pour la conception et déploiement d’expériences contrôlées.
Datathon: effort de collecte de données, préférences, méta données via des mesures directes (questionnaires) ou indirectes (collecte de données à l’insu des sujets)
Hackathon: effort d’analyse de ces données principalement en utilisant des mesures statistiques et des algorithmes
Donc, pour organiser un datathon et un hackathon, il faut savoir quelle hypothèse nous recherchons.

Laurent/Béa. Note : Il serait souhaitable de consacrer un peu de temps lors de cette réunion pour avoir une vision globale sur les données qu’il est possible de récolter. Exemple : Position sur la page, liste des alternatives, prix, date, timing, trace individuelle… (tu nous as par exemple donner la liste des observables pour Total, est-il possible d’avoir la même chose pour booking, tripadvisor, facebook (par adAnalyst), etc.

10:30-11:30
Christophe: Sur le fond les questions qui m’intéressent sont a) quel est l’importance de l’effet des moteurs de recommandations ( qui peuvent différer par les données et les algo utilisés) sur les comportements effectifs (browsing, achats, partage etc). b) dans quelle mesure sont-ils acceptés et évalués par les consommateurs ?. A la première question il faudrait je pense une approche par expérimentation naturelle, la seconde se prête plus à une expérience en laboratoire (les réponses mesurées se faisant plutôt par des échelles de jugement subjectifs.
L/B : Nous sommes également intéressés par les questions soulevés par Christophe sur (1) impact et (2) acceptabilité. Voici d’autres pistes de réflexion sur ces sujets :
– Est-ce que la recommandation simplement réduit le coût de recherche en proposant la meilleure alternative au consommateur (selon l’offre proposée) ou alors modifie les préférences.
– Est-ce que l’impact de la recommandation est plus forte lorsque elle va dans le sens des croyances du consommateur. Et si c’est la cas, alors les recommandations vont restreindre le répertoire des choix. En d’autres termes, est-ce que les recommandations diminuent (augmentent) le champ des possibles.
– Est-ce que le degré d’ouverture (paramétrisation) de l’algorithme produisant la recommandation agit sur l’acceptabilité. Hypothèse : s’il l’on donne plus ou moins la main au consommateur, la recommandation sera plus acceptée (et donc efficace ?)
Boîte noire vs. algorithme basé sur l’historique vs. algorithme paramétré par l’utilisateur.
– Trouver le point de rupture de l’acceptabilité (par ex : « il est pour moi rédhibitoire que l’algorithme utilise x donnée ».) Arbitrage entre simplifier sa vie par les recommandations et la liberté
– Dynamique de la relation de confiance entre le consommateur et la recommandation
Autres questions (en vrac) :
– Hiérarchiser les déterminants des choix (prix, avis, notes, commentaires, place dans la page internet, etc.)… et la place de la recommandation parmi ces déterminants.
– Impact du format de la recommandation (produit), tri par pertinence, étoiles, avis.

Cas d’usage pour la révélation de préférences et de biais comportementaux
● Datathon 1.1 (co-leads : L. Muller et A. Tsoukias) : Formalisation de modèles de révélation de préférences et de biais
○ Collecter les préférences
○ Comparer les préférences : avec des données existantes pour lesquelles nous avons des choix enregistrés (e.g., choix d’un hôtel sur un site type tripadvisor.com ou booking.com) et également à travers des expériences dans le contexte contrôlé du laboratoire (on-line ou in-situ)
OBJECTIF: Design d’expériences pour la collecte de préférences
● Datathon 1.2 (co-leads : M. Öztürk et A. Fadhuile) : Définition de cas d’usage sous forme de couples (hypothèse/théorie, données). Plusieurs applications :
○ Biais social, c’est-à-dire sur l’influence de consommateurs tiers dans ses propres choix (exemple : notes attribuées en ligne, forum, etc.).
○ Biais d’ancrage, c’est-à-dire l’influence de l’amorçage sur la décision d’achat et sur le nombre de pages visitées ensuite (ex : affichage de prix et/ou produits en première page internet).
○ Biais statu quo: Occurrence dans les choix des options par défaut (ex : standard, options, etc.). = BIAIS STATU QUO… à rapporter avec la question de l’équité dans le classement algorithmique
OBJECTIF: Quelles hypothèses voulez vous vérifier ?

Hackathon pour le design et déploiement des expériences (co-leads : C. Benavent, O. Goga et B. Roussillon) :
● Hackathon pour étendre AdAnalyst pour cibler un ensemble précis d’internautes, de vérifier s’ils ont vu ou cliqué sur des publicités, et de leur demander de répondre à des questionnaires.
OBJECTIF: Quelles mesures directes/indirectes ? => les choix/achats, likes, questionnaire, choice experiment, beauty contest, enchères, etc.

Oana et Sihem: extension AdAnalyst avec le mouse tracking (indirectes) et les pop-ups (directes) – 2 stagiaires financés par l’ANR Jeune Chercheur d’Oana (Salim et Rosa jusqu’au 15/06)

● Hackathon pour la construction d’expériences contrôlées en laboratoire. L’enjeu est ici d’augmenter la validité externe des résultats issus d’expériences de laboratoire et la validité interne des résultats issus des méta-données.
Ceci est, il me semble, un enjeu transversal qui s’appliquera aux différentes questions.
OBJECTIF: Quelles hypothèses voulez vous vérifier ?
Oana et Sihem: Mesure de l’attitude des individus vis-à-vis de la pub en ligne (information ads sur les politiques publiques et product ads)
Oana et Sihem: Fouille de l’évolution des habitudes de consommation des clients TOTAL (stagiaire Abdou jusqu’au 30/06 financé par projet européen de Sihem)
Christophe: Travail sur l’influence des commentaires positifs/négatifs sur les réservations Airbnb

11:30-12
Prochaines étapes

URL :

Categories: PLATFORM

Jul

Mon

2020

Second Symposium GDR CNRS MaDICS @ En distanciel avec BBB

Tickets

Jul 6 – Jul 9 all-day

Présentation

La seconde édition du Symposium MaDICS aura lieu en distanciel du 6 au 9 juillet 2020. Chaque demi-journée propose un programme riche en exposés courts construit par nos responsables d’Actions et d’Atelier. Les sessions auront lieu sous BBB pour permettre à un plus grand nombre d’assister aux exposés. Les programmes seront disponibles d’ici au 18 juin : restez connectés !

Du : 2020-07-06
Au : 2020-07-09
Lieu : En distanciel avec BBB

Programme

Lundi 6 juillet
9h00-12h30	Action Raisonner sur les données – Session 1 Intervenants : Joe Raad, Erman Acar, Stefan Schlobach, Manuel Atencia, Jérôme David, Jérôme Euzenat, Jérémy Lhez, Chan Le Duc, Thinh Dong, Myriam Lamolle, Arnaud Giacometti, Beatrice Markhoff, Arnaud Soulet, Thu Huong Nguyen et Andrea G.B. Tettamanzi Programme détaillé Lien vers la page de l’Action RoD
13h30-17h00	Atelier AGriculture, Environnent, Ecologie Intervenants : Sylvain Galopin, Chuanming Dong, Clement Jonquet, Philippe Prévost et Michel Berducat Programme détaillé Lien vers la page de l’Atelier AGEE	13h15-17h00	Action Impact Sociétal des Algorithmes Décisionnels Intervenants : Sihem Amer-Yahia, Juliette Sénéchal, Béatrice Roussillon, Oana Goga, Adélaïde Fadhuile, Laurent Muller, Rosa Khenniche, Salim Chouaki, Abdel Chibah, Nikita Gusarov, Soraya Koraytem et Alexis Tsoukias. Programme détaillé (avec PDFs) Lien vers la page de l’Action PLATFORM
Mardi 7 juillet
9h00-12h30	Atelier Outils Statistiques pour l’Imagerie hyperspectrale du milieu interstellaire Intervenants : Jérôme Pety, Annie Zavagno, Rosine Lallement, Clément Hottier, Yannick Deville, Florent Chatelain et Antoine Roueff Programme détaillé Lien vers la page de l’Atelier OSIS	9h00-12h30	Action RoD – Session 2 Intervenants : Sébastien Ferré, Camille Bourgaux, Meghyn Bienvenu, Luis Palacios, Yue Ma, Chantal Reynaud, Gaëlle Lortal, Arnaud Grall, Thomas Minier, Hala Skaf-Molli, Pascal Molli, Julien Romero, Nicoleta Preda, Antoine Amarilli, Fabian M. Suchanek, Victor Charpenay et Sebastian Käbisch Programme détaillé Lien vers la page de l’Action RoD
14h00-16h00	Atelier MaDICS Humanités Numériques Intervenants : Claudia MARINICA, Cécile CHANTRAINE, Ioana GALLERON, Max BELIGNE et Christophe TUFFERY Programme détaillé Lien vers la page de l’Atelier MaDICS-HN	14h00-17h00	Action MAChine LEarning for EArth observatioN Intervenants : Germain Forestier, Romain Tavenard et Marc Rußwurm Programme détaillé Lien vers la page de l’Action MACLEAN
Mercredi 8 juillet
9h00-12h30	Atelier Big Data for Astronomy Intervenants : Stéphane Plaszczynski, Marc Huertas-Company et Karine Zeitouni Programme détaillé Lien vers la page de l’Atelier BigData4Astro	9h00-12h30	Action anaLysE et dynaMique des messages et cONversations radicales sur Internet Intervenants : Nawel Chaouni, Séraphin Alava, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel, Franck Biellmann, Raphaël Bavière, Océane Fourquet, Claire Laudy, Cyril Bruneau, Delphine Battistelli, Adrien Legros, Valentina Dragos Programme détaillé Lien vers la page de l’Action LEMON
14h00-17h00	Atelier Données Intelligentes: transformer l’information en connaissance Intervenants : Andre Freitas et Laure Berti Programme détaillé Lien vers la page de l’Atelier DOING
Jeudi 9 juillet
9h00-12h30	Restitution et synthèse Programme détaillé

Programme de l’Action Rod – Session 1

Lundi 6 juillet 9h00-12h30
9h00	Accueil
9h15	Atelier Approches récentes pour le raisonnement sur les données (1) YAGO 4: A Reasonable Knowledge Base, Thomas Pellissier Tanon, Gerhard Weikum and Fabian M. Suchanek. (publié à ESWC 2020) On the Impact of sameAs on Schema Matching, Joe Raad, Erman Acar and Stefan Schlobach. (publié à KCAP 2019) Several link keys are better than one, or Extracting disjunctions of link key candidates, Manuel Atencia, Jérôme David and Jérôme Euzenat. (publié à Kcap 2019)
10h45	Pause
11h00	Atelier Approches récentes pour le raisonnement sur les données (2) Decentralized Reasoning on a Network of Aligned Ontologies with Link Keys, Jérémy Lhez, Chan Le Duc, Thinh Dong and Myriam Lamolle. (publié à ISWC 2019) Découverte de cardinalités maximales significatives dans des bases de connaissances, Arnaud Giacometti, Beatrice Markhoff and Arnaud Soulet. (publié à ISWC 2019) Using Grammar-based Genetic Programming for Mining Disjointness Axioms Involving Complex Class Expressions, Thu Huong Nguyen and Andrea G.B. Tettamanzi. (publié à ICCS 2020)
12h30	Fin de l’atelier

Programme de l’Atelier AGEE

Lundi 6 juillet 13h30-17h00
13h30	Introduction AGEE
13h40	AncGIS: SIG Web pour l’analyse des ressources mellifères, Sylvain Galopin, IGN
13h50	Fusion entre bases de données hétérogènes concernant la pollution des sols, Chuanming Dong, LASTIG, Univ Gustave Eiffel, ENSG, IGN, ADEME
14h10	Le projet D2KAB Data to Knowledge in Agronomy and Biodiversity, Clement Jonquet, LIRMM
14h30	TABLE RONDE 1 : Les défis scientifiques et technologiques pour l’intégration, la gestion et l’analyse de la donnée « Variée »
15h30	Pause
15h45	Enjeux, méthodes et pratiques pour la formation aux usages numériques dans les métiers du vivant, Philippe Prévost, Agreenium, Institut agronomique, vétérinaire et forestier de France
16h00	AgroTechnoPôle : La plateforme collaborative pour le développement des technologies au service de la transition agro écologique, Michel Berducat. TSCF, INRAE
16h15	TABLE RONDE 2 : Comment fédérer et animer la recherche en Big Data pour l’agro-env-eco ?
17h00	Fin de l’atelier

Programme de l’Action PLATFORM

Lundi 6 juillet 13h15-17h00
13h15	Introduction PLATFORM et effet levier, Sihem Amer-Yahia
13h30	Aspects juridiques et économiques CNIL/RGPD/code de la consommation, Juliette Sénéchal DPO et autorisations, Béatrice Roussillon, Oana Goga, Adélaide Fadhuile, Aurélie Level et Laurent Muller
14h30	Pause et discussion libre
14h45	Aspects méthodologiques Présentations de Rosa Khenniche et Salim Chouaki , Abdel Chibah , Nikita Gusarov et Soraya Koraytem , et discussion autour des méthodologies de déploiement de campagnes publicitaires, de développement d’algorithmes, de développement de critères de performance Présentation et discussion sur les préférences, Alexis Tsoukias
15h45	Pause et discussion libre
16h00	Rédaction conjointe: Lexique + Leçons
17h00	Fin de l’atelier

Programme de l’Atelier Osis

Mardi 7 juillet 9h00-12h30
9h00	Le projet Orion-B, Jérôme Pety (IRAM, Grenobble)
9h25	Big Data et apprentissage pour l’étude de la formation stellaire galactique, Annie Zavagno (LAM, Marseille)
9h50	Reconstruction 3D du milieu interstellaire local, Rosine Lallement et Clément Hottier (GEPI, Paris)
10h15	Pause
10h45	Méthodes de dé-mélange, Yannick Deville (IRAP, Toulouse)
11h10	Détection du gaz dans les données hyperspectrales MUSE, Florent Chatelain (GIPSA-lab, Grenoble)
11h35	Traitements statistiques des données Orion-B, Antoine Roueff (Institut Fresnel, Marseille)
12h00	Discussions et synthèse
12h30	Fin de l’Atelier

Programme de l’Action Rod – Session 2

Mardi 7 juillet 9h00-12h30
9h00	Accueil
9h15	Atelier Approches récentes pour le raisonnement sur les données (3) Link Prediction in Knowledge Graphs with Concepts of Nearest Neighbours, Sébastien Ferré. (publié à ESWC 2019) Querying and Repairing Inconsistent Prioritized Knowledge Bases: Complexity Analysis and Links with Abstract Argumentation, Camille Bourgaux et Meghyn Bienvenu. (publié à KR2020) Knowledge Based Situation Discovery for Avionics Maintenance, Luis Palacios, Yue Ma, Chantal Reynaud and Gaëlle Lortal. (publié à KCAP 2019)
10h45	Pause
11h00	Atelier Approches récentes pour le raisonnement sur les données (4) Processing SPARQL Aggregate Queries with Web Preemption, Arnaud Grall, Thomas Minier, Hala Skaf-Molli and Pascal Molli. (publié à ESWC 2020) Réécriture de requêtes atomiques par des vues chemins, Julien Romero, Nicoleta Preda, Antoine Amarilli and Fabian M. Suchanek. (publié à ESWC 2020) L’annotation « sémantique » de documents – L’exemple du web des objets, Victor Charpenay and Sebastian Käbisch. (publié à ESWC 2020)
12h30	Fin de l’atelier

Programme de l’Atelier MaDICS-HN

Mardi 7 juillet 14h00-16h30
14h00	Présentation de l’atelier et des participants Introduction à la problématique : “Construire des données pour les machines Vs pour les humains”
14h15	Interventions L’analyse de trajectoires au musée du Louvre: des problématiques liées aux données, Claudia MARINICA (MCF informatique) Deux approches pour la préparation de données et des métadonnées destinées à analyser le théâtre, Cécile CHANTRAINE (PR Études théâtrales et Humanités Numériques) et Ioana GALLERON (PR Littérature française et Humanités Numériques) La transformation de documents numérisés par la plateforme Persée dans un objectif d’analyses textuelles, Max BELIGNE (Doc Géographie) La préparation de données et de métadonnées pour leur publication sur des plateformes cartographiques : l’expérience des PCR “Réseau de lithothèques” et du GDR SILEX, Christophe TUFFERY (IR)
15h30	Discussion libre, échanges autour de deux questions : “Données et jeux de données: définitions, fins et moyens?” “Manipulation des données en SHS : des verrous techniques ou humains?”
16h30	Fin de l’atelier

Programme de l’Action MACLEAN

Mardi 7 juillet 14h00-17h00
14h00	Welcome
14h05	Deep learning for time series classification, Germain Forestier (Université Haute-Alsace)
15h00	Tslearn: A machine learning toolkit dedicated to time-series data, Romain Tavenard (Université Rennes 2)
15h20	BreizhCrops: A Time Series Dataset for Crop Type Mapping, Marc Rußwurm (TU Munich)
15h40	Hands-on training
16h20	Panel discussion: machine learning, time series, and Earth Observation: opportunities and challenges
17h00	Fin de l’atelier

Programme de l’Atelier BigData4Astro

Mercredi 8 juillet 9h00-12h30
9h00	Introduction
9h15	Big Data astronomy with Spark, Stéphane Plaszczynski (IJCLab, Université Paris-Saclay)
9h50	Deep Learning for the next generation of big-data surveys, Marc Huertas-Company (Observatoire de Paris/LERMA, Université Paris-Diderot)
10h15	Big FAIR Data in Astronommy, Mark Allen, Observatoire astronomique de Strasbourg
10h50	Pause
11h00	Spatial Query Optimization for Big Astronomical Surveys – ASTROIDE project, Karine Zeitouni (Université de Versailles-Saint-Quentin/DAVID)
11h20	Table Ronde : Perspectives et verrous scientifiques, avec les invités et les animateurs de l’Atelier
12h15	Conclusion
12h30	Finde l’Atelier

Programme de l’Action LEMON

Mercredi 8 juillet 9h00-12h30
9h00	Accueil et Introduction
9h15	Constitution de bases de données radicales afin de caractériser les discours extrémistes pour une méthode interdisciplinaire de prévention des déviances en ligne, Nawel Chaouni, Séraphin Alava
9h45	Détection des influenceurs dans les médias sociaux, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel
10h15	Méthodes et outils pour investigation sur les réseaux sociaux, Franck Biellmann, Raphaël Bavière
10h45	Pause et discussion libre
11h00	Extractions d’informations sémantiques à partir de données sociales, Océane Fourquet, Claire Laudy
11h20	Modélisation linguistique et formelle de la notion de discours haineux, Cyril Bruneau, Delphine Battistelli
11h40	Vers une ontologie pour la détection des opinions dans les corpus en français, Adrien Legros, Valentina Dragos
12h00	Discutions et conclusion du séminaire
12h30	Fin de l’atelier

Programme de l’Atelier DOING

Mercredi 8 juillet 14h00-17h00
14h00	Introduction
14h10	Automatically understand and process the meaning of information at scale, Andre Freitas
15h00	Pause
15h20	Data Cleaning and Preparation for ML and Data Analytics: Toward a Principled Approach, Laure Berti
16h10	Discussions
17h00	Fin de l’atelier

Programme de la matinée Restitution et Synthèse

Salon 1

Jeudi 9 juillet 9h00-12h30
9h00	Introduction à MaDICS, Sarah Cohen-Boulakia
9h15	Restitution des Actions et Ateliers
11h00	Pause
11h30	Discussions

Categories: AGEE BigData4Astro DOING LEMON MACLEAN MaDICS MaDICS-HN OSIS PLATFORM RoD ·Journées

Sep

Fri

2020

Action PLATFORM dans GdR Internet et Société

Tickets

Sep 25 – Sep 26 all-day

Annonce en lien avec l’Action/le Réseau : PLATFORM

Thème :

Plateformes et risques algorithmiques

Présentation :

La manifestation vise à produire un document résumant notre retour d’expérience sur le travail de PLATFORM : autorisations légales, déploiement d’expériences, modélisation des préférences, fouille et requêtes de comportement, travail à venir.

Du : 2020-09-25

Au : 2020-09-25

Lieu : En ligne

Site Web : https://cis.cnrs.fr/gdr-members/

Categories: PLATFORM ·Journées

January – September 2020 Jan – Sep 2020

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Présentation Générale

Manifestations à venir

Actions, Ateliers et Groupes de Travail :

Présentation

Programme

Programme de l’Action Rod – Session 1

Programme de l’Atelier AGEE

Programme de l’Action PLATFORM

Programme de l’Atelier Osis

Programme de l’Action Rod – Session 2

Programme de l’Atelier MaDICS-HN

Programme de l’Action MACLEAN

Programme de l’Atelier BigData4Astro

Programme de l’Action LEMON

Programme de l’Atelier DOING

Programme de la matinée Restitution et Synthèse