
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS
AGENDA
10-10:30 – Tour de table et rappel de l’action
Notre action vise à examiner les impacts des algorithmes décisionnels sur les choix des consommateurs. Pour ce faire, nous organiserons des datathon et hackathon pour la conception et déploiement d’expériences contrôlées.
Datathon: effort de collecte de données, préférences, méta données via des mesures directes (questionnaires) ou indirectes (collecte de données à l’insu des sujets)
Hackathon: effort d’analyse de ces données principalement en utilisant des mesures statistiques et des algorithmes
Donc, pour organiser un datathon et un hackathon, il faut savoir quelle hypothèse nous recherchons.
Laurent/Béa. Note : Il serait souhaitable de consacrer un peu de temps lors de cette réunion pour avoir une vision globale sur les données qu’il est possible de récolter. Exemple : Position sur la page, liste des alternatives, prix, date, timing, trace individuelle… (tu nous as par exemple donner la liste des observables pour Total, est-il possible d’avoir la même chose pour booking, tripadvisor, facebook (par adAnalyst), etc.
10:30-11:30
Christophe: Sur le fond les questions qui m’intéressent sont a) quel est l’importance de l’effet des moteurs de recommandations ( qui peuvent différer par les données et les algo utilisés) sur les comportements effectifs (browsing, achats, partage etc). b) dans quelle mesure sont-ils acceptés et évalués par les consommateurs ?. A la première question il faudrait je pense une approche par expérimentation naturelle, la seconde se prête plus à une expérience en laboratoire (les réponses mesurées se faisant plutôt par des échelles de jugement subjectifs.
L/B : Nous sommes également intéressés par les questions soulevés par Christophe sur (1) impact et (2) acceptabilité. Voici d’autres pistes de réflexion sur ces sujets :
– Est-ce que la recommandation simplement réduit le coût de recherche en proposant la meilleure alternative au consommateur (selon l’offre proposée) ou alors modifie les préférences.
– Est-ce que l’impact de la recommandation est plus forte lorsque elle va dans le sens des croyances du consommateur. Et si c’est la cas, alors les recommandations vont restreindre le répertoire des choix. En d’autres termes, est-ce que les recommandations diminuent (augmentent) le champ des possibles.
– Est-ce que le degré d’ouverture (paramétrisation) de l’algorithme produisant la recommandation agit sur l’acceptabilité. Hypothèse : s’il l’on donne plus ou moins la main au consommateur, la recommandation sera plus acceptée (et donc efficace ?)
Boîte noire vs. algorithme basé sur l’historique vs. algorithme paramétré par l’utilisateur.
– Trouver le point de rupture de l’acceptabilité (par ex : « il est pour moi rédhibitoire que l’algorithme utilise x donnée ».) Arbitrage entre simplifier sa vie par les recommandations et la liberté
– Dynamique de la relation de confiance entre le consommateur et la recommandation
Autres questions (en vrac) :
– Hiérarchiser les déterminants des choix (prix, avis, notes, commentaires, place dans la page internet, etc.)… et la place de la recommandation parmi ces déterminants.
– Impact du format de la recommandation (produit), tri par pertinence, étoiles, avis.
Cas d’usage pour la révélation de préférences et de biais comportementaux
● Datathon 1.1 (co-leads : L. Muller et A. Tsoukias) : Formalisation de modèles de révélation de préférences et de biais
○ Collecter les préférences
○ Comparer les préférences : avec des données existantes pour lesquelles nous avons des choix enregistrés (e.g., choix d’un hôtel sur un site type tripadvisor.com ou booking.com) et également à travers des expériences dans le contexte contrôlé du laboratoire (on-line ou in-situ)
OBJECTIF: Design d’expériences pour la collecte de préférences
● Datathon 1.2 (co-leads : M. Öztürk et A. Fadhuile) : Définition de cas d’usage sous forme de couples (hypothèse/théorie, données). Plusieurs applications :
○ Biais social, c’est-à-dire sur l’influence de consommateurs tiers dans ses propres choix (exemple : notes attribuées en ligne, forum, etc.).
○ Biais d’ancrage, c’est-à-dire l’influence de l’amorçage sur la décision d’achat et sur le nombre de pages visitées ensuite (ex : affichage de prix et/ou produits en première page internet).
○ Biais statu quo: Occurrence dans les choix des options par défaut (ex : standard, options, etc.). = BIAIS STATU QUO… à rapporter avec la question de l’équité dans le classement algorithmique
OBJECTIF: Quelles hypothèses voulez vous vérifier ?
Hackathon pour le design et déploiement des expériences (co-leads : C. Benavent, O. Goga et B. Roussillon) :
● Hackathon pour étendre AdAnalyst pour cibler un ensemble précis d’internautes, de vérifier s’ils ont vu ou cliqué sur des publicités, et de leur demander de répondre à des questionnaires.
OBJECTIF: Quelles mesures directes/indirectes ? => les choix/achats, likes, questionnaire, choice experiment, beauty contest, enchères, etc.
Oana et Sihem: extension AdAnalyst avec le mouse tracking (indirectes) et les pop-ups (directes) – 2 stagiaires financés par l’ANR Jeune Chercheur d’Oana (Salim et Rosa jusqu’au 15/06)
● Hackathon pour la construction d’expériences contrôlées en laboratoire. L’enjeu est ici d’augmenter la validité externe des résultats issus d’expériences de laboratoire et la validité interne des résultats issus des méta-données.
Ceci est, il me semble, un enjeu transversal qui s’appliquera aux différentes questions.
OBJECTIF: Quelles hypothèses voulez vous vérifier ?
Oana et Sihem: Mesure de l’attitude des individus vis-à-vis de la pub en ligne (information ads sur les politiques publiques et product ads)
Oana et Sihem: Fouille de l’évolution des habitudes de consommation des clients TOTAL (stagiaire Abdou jusqu’au 30/06 financé par projet européen de Sihem)
Christophe: Travail sur l’influence des commentaires positifs/négatifs sur les réservations Airbnb
11:30-12
Prochaines étapes
Présentation
La seconde édition du Symposium MaDICS aura lieu en distanciel du 6 au 9 juillet 2020. Chaque demi-journée propose un programme riche en exposés courts construit par nos responsables d’Actions et d’Atelier. Les sessions auront lieu sous BBB pour permettre à un plus grand nombre d’assister aux exposés. Les programmes seront disponibles d’ici au 18 juin : restez connectés !
Du : 2020-07-06
Au : 2020-07-09
Lieu : En distanciel avec BBB
Programme
| Lundi 6 juillet | |||||
|---|---|---|---|---|---|
| 9h00-12h30 | Action Raisonner sur les données – Session 1 Intervenants : Joe Raad, Erman Acar, Stefan Schlobach, Manuel Atencia, Jérôme David, Jérôme Euzenat, Jérémy Lhez, Chan Le Duc, Thinh Dong, Myriam Lamolle, Arnaud Giacometti, Beatrice Markhoff, Arnaud Soulet, Thu Huong Nguyen et Andrea G.B. Tettamanzi Programme détaillé Lien vers la page de l’Action RoD | ||||
| 13h30-17h00 | Atelier AGriculture, Environnent, Ecologie Intervenants : Sylvain Galopin, Chuanming Dong, Clement Jonquet, Philippe Prévost et Michel Berducat Programme détaillé Lien vers la page de l’Atelier AGEE | 13h15-17h00 | Action Impact Sociétal des Algorithmes Décisionnels Intervenants : Sihem Amer-Yahia, Juliette Sénéchal, Béatrice Roussillon, Oana Goga, Adélaïde Fadhuile, Laurent Muller, Rosa Khenniche, Salim Chouaki, Abdel Chibah, Nikita Gusarov, Soraya Koraytem et Alexis Tsoukias. Programme détaillé (avec PDFs) Lien vers la page de l’Action PLATFORM | ||
| Mardi 7 juillet | |||||
| 9h00-12h30 | Atelier Outils Statistiques pour l’Imagerie hyperspectrale du milieu interstellaire Intervenants : Jérôme Pety, Annie Zavagno, Rosine Lallement, Clément Hottier, Yannick Deville, Florent Chatelain et Antoine Roueff Programme détaillé Lien vers la page de l’Atelier OSIS | 9h00-12h30 | Action RoD – Session 2 Intervenants : Sébastien Ferré, Camille Bourgaux, Meghyn Bienvenu, Luis Palacios, Yue Ma, Chantal Reynaud, Gaëlle Lortal, Arnaud Grall, Thomas Minier, Hala Skaf-Molli, Pascal Molli, Julien Romero, Nicoleta Preda, Antoine Amarilli, Fabian M. Suchanek, Victor Charpenay et Sebastian Käbisch Programme détaillé Lien vers la page de l’Action RoD | ||
| 14h00-16h00 | Atelier MaDICS Humanités Numériques Intervenants : Claudia MARINICA, Cécile CHANTRAINE, Ioana GALLERON, Max BELIGNE et Christophe TUFFERY Programme détaillé Lien vers la page de l’Atelier MaDICS-HN | 14h00-17h00 | Action MAChine LEarning for EArth observatioN Intervenants : Germain Forestier, Romain Tavenard et Marc Rußwurm Programme détaillé Lien vers la page de l’Action MACLEAN | ||
| Mercredi 8 juillet | |||||
| 9h00-12h30 | Atelier Big Data for Astronomy Intervenants : Stéphane Plaszczynski, Marc Huertas-Company et Karine Zeitouni Programme détaillé Lien vers la page de l’Atelier BigData4Astro | 9h00-12h30 | Action anaLysE et dynaMique des messages et cONversations radicales sur Internet Intervenants : Nawel Chaouni, Séraphin Alava, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel, Franck Biellmann, Raphaël Bavière, Océane Fourquet, Claire Laudy, Cyril Bruneau, Delphine Battistelli, Adrien Legros, Valentina Dragos Programme détaillé Lien vers la page de l’Action LEMON | ||
| 14h00-17h00 | Atelier Données Intelligentes: transformer l’information en connaissance Intervenants : Andre Freitas et Laure Berti Programme détaillé Lien vers la page de l’Atelier DOING | ||||
| Jeudi 9 juillet | |||||
| 9h00-12h30 | Restitution et synthèse Programme détaillé | ||||
Programme de l’Action Rod – Session 1
| Lundi 6 juillet 9h00-12h30 | |
|---|---|
| 9h00 | Accueil |
| 9h15 | Atelier Approches récentes pour le raisonnement sur les données (1)
|
| 10h45 | Pause |
| 11h00 | Atelier Approches récentes pour le raisonnement sur les données (2)
|
| 12h30 | Fin de l’atelier |
Programme de l’Atelier AGEE
| Lundi 6 juillet 13h30-17h00 | |
|---|---|
| 13h30 | Introduction AGEE |
| 13h40 | AncGIS: SIG Web pour l’analyse des ressources mellifères, Sylvain Galopin, IGN |
| 13h50 | Fusion entre bases de données hétérogènes concernant la pollution des sols, Chuanming Dong, LASTIG, Univ Gustave Eiffel, ENSG, IGN, ADEME |
| 14h10 | Le projet D2KAB Data to Knowledge in Agronomy and Biodiversity, Clement Jonquet, LIRMM |
| 14h30 | TABLE RONDE 1 : Les défis scientifiques et technologiques pour l’intégration, la gestion et l’analyse de la donnée « Variée » |
| 15h30 | Pause |
| 15h45 | Enjeux, méthodes et pratiques pour la formation aux usages numériques dans les métiers du vivant, Philippe Prévost, Agreenium, Institut agronomique, vétérinaire et forestier de France |
| 16h00 | AgroTechnoPôle : La plateforme collaborative pour le développement des technologies au service de la transition agro écologique, Michel Berducat. TSCF, INRAE |
| 16h15 | TABLE RONDE 2 : Comment fédérer et animer la recherche en Big Data pour l’agro-env-eco ? |
| 17h00 | Fin de l’atelier |
Programme de l’Action PLATFORM
Programme de l’Atelier Osis
| Mardi 7 juillet 9h00-12h30 | |
|---|---|
| 9h00 | Le projet Orion-B, Jérôme Pety (IRAM, Grenobble) |
| 9h25 | Big Data et apprentissage pour l’étude de la formation stellaire galactique, Annie Zavagno (LAM, Marseille) |
| 9h50 | Reconstruction 3D du milieu interstellaire local, Rosine Lallement et Clément Hottier (GEPI, Paris) |
| 10h15 | Pause |
| 10h45 | Méthodes de dé-mélange, Yannick Deville (IRAP, Toulouse) |
| 11h10 | Détection du gaz dans les données hyperspectrales MUSE, Florent Chatelain (GIPSA-lab, Grenoble) |
| 11h35 | Traitements statistiques des données Orion-B, Antoine Roueff (Institut Fresnel, Marseille) |
| 12h00 | Discussions et synthèse |
| 12h30 | Fin de l’Atelier |
Programme de l’Action Rod – Session 2
| Mardi 7 juillet 9h00-12h30 | |
|---|---|
| 9h00 | Accueil |
| 9h15 | Atelier Approches récentes pour le raisonnement sur les données (3)
|
| 10h45 | Pause |
| 11h00 | Atelier Approches récentes pour le raisonnement sur les données (4)
|
| 12h30 | Fin de l’atelier |
Programme de l’Atelier MaDICS-HN
| Mardi 7 juillet 14h00-16h30 | |
|---|---|
| 14h00 | Présentation de l’atelier et des participants Introduction à la problématique : “Construire des données pour les machines Vs pour les humains” |
| 14h15 | Interventions
|
| 15h30 | Discussion libre, échanges autour de deux questions : “Données et jeux de données: définitions, fins et moyens?” “Manipulation des données en SHS : des verrous techniques ou humains?” |
| 16h30 | Fin de l’atelier |
Programme de l’Action MACLEAN
| Mardi 7 juillet 14h00-17h00 | |
|---|---|
| 14h00 | Welcome |
| 14h05 | Deep learning for time series classification, Germain Forestier (Université Haute-Alsace) |
| 15h00 | Tslearn: A machine learning toolkit dedicated to time-series data, Romain Tavenard (Université Rennes 2) |
| 15h20 | BreizhCrops: A Time Series Dataset for Crop Type Mapping, Marc Rußwurm (TU Munich) |
| 15h40 | Hands-on training |
| 16h20 | Panel discussion: machine learning, time series, and Earth Observation: opportunities and challenges |
| 17h00 | Fin de l’atelier |
Programme de l’Atelier BigData4Astro
Programme de l’Action LEMON
| Mercredi 8 juillet 9h00-12h30 | |
|---|---|
| 9h00 | Accueil et Introduction |
| 9h15 | Constitution de bases de données radicales afin de caractériser les discours extrémistes pour une méthode interdisciplinaire de prévention des déviances en ligne, Nawel Chaouni, Séraphin Alava |
| 9h45 | Détection des influenceurs dans les médias sociaux, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel |
| 10h15 | Méthodes et outils pour investigation sur les réseaux sociaux, Franck Biellmann, Raphaël Bavière |
| 10h45 | Pause et discussion libre |
| 11h00 | Extractions d’informations sémantiques à partir de données sociales, Océane Fourquet, Claire Laudy |
| 11h20 | Modélisation linguistique et formelle de la notion de discours haineux, Cyril Bruneau, Delphine Battistelli |
| 11h40 | Vers une ontologie pour la détection des opinions dans les corpus en français, Adrien Legros, Valentina Dragos |
| 12h00 | Discutions et conclusion du séminaire |
| 12h30 | Fin de l’atelier |
Programme de l’Atelier DOING
| Mercredi 8 juillet 14h00-17h00 | |
|---|---|
| 14h00 | Introduction |
| 14h10 | Automatically understand and process the meaning of information at scale, Andre Freitas |
| 15h00 | Pause |
| 15h20 | Data Cleaning and Preparation for ML and Data Analytics: Toward a Principled Approach, Laure Berti |
| 16h10 | Discussions |
| 17h00 | Fin de l’atelier |
Programme de la matinée Restitution et Synthèse
| Jeudi 9 juillet 9h00-12h30 | |
|---|---|
| 9h00 | Introduction à MaDICS, Sarah Cohen-Boulakia |
| 9h15 | Restitution des Actions et Ateliers |
| 11h00 | Pause |
| 11h30 | Discussions |
Annonce en lien avec l’Action/le Réseau : PLATFORM
Thème :
Plateformes et risques algorithmiques
Présentation :
La manifestation vise à produire un document résumant notre retour d’expérience sur le travail de PLATFORM : autorisations légales, déploiement d’expériences, modélisation des préférences, fouille et requêtes de comportement, travail à venir.
Du : 2020-09-25
Au : 2020-09-25
Lieu : En ligne
Site Web : https://cis.cnrs.fr/gdr-members/
