Présentation Générale

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS  


Jan
17
Fri
2020
Kickoff meeting action PLATFORM @ Visio
Jan 17 all-day

AGENDA
10-10:30 – Tour de table et rappel de l’action
Notre action vise à examiner les impacts des algorithmes décisionnels sur les choix des consommateurs. Pour ce faire, nous organiserons des datathon et hackathon pour la conception et déploiement d’expériences contrôlées.
Datathon: effort de collecte de données, préférences, méta données via des mesures directes (questionnaires) ou indirectes (collecte de données à l’insu des sujets)
Hackathon: effort d’analyse de ces données principalement en utilisant des mesures statistiques et des algorithmes
Donc, pour organiser un datathon et un hackathon, il faut savoir quelle hypothèse nous recherchons.

Laurent/Béa. Note : Il serait souhaitable de consacrer un peu de temps lors de cette réunion pour avoir une vision globale sur les données qu’il est possible de récolter. Exemple : Position sur la page, liste des alternatives, prix, date, timing, trace individuelle… (tu nous as par exemple donner la liste des observables pour Total, est-il possible d’avoir la même chose pour booking, tripadvisor, facebook (par adAnalyst), etc.

10:30-11:30
Christophe: Sur le fond les questions qui m’intéressent sont a) quel est l’importance de l’effet des moteurs de recommandations ( qui peuvent différer par les données et les algo utilisés) sur les comportements effectifs (browsing, achats, partage etc). b) dans quelle mesure sont-ils acceptés et évalués par les consommateurs ?. A la première question il faudrait je pense une approche par expérimentation naturelle, la seconde se prête plus à une expérience en laboratoire (les réponses mesurées se faisant plutôt par des échelles de jugement subjectifs.
L/B : Nous sommes également intéressés par les questions soulevés par Christophe sur (1) impact et (2) acceptabilité. Voici d’autres pistes de réflexion sur ces sujets :
– Est-ce que la recommandation simplement réduit le coût de recherche en proposant la meilleure alternative au consommateur (selon l’offre proposée) ou alors modifie les préférences.
– Est-ce que l’impact de la recommandation est plus forte lorsque elle va dans le sens des croyances du consommateur. Et si c’est la cas, alors les recommandations vont restreindre le répertoire des choix. En d’autres termes, est-ce que les recommandations diminuent (augmentent) le champ des possibles.
– Est-ce que le degré d’ouverture (paramétrisation) de l’algorithme produisant la recommandation agit sur l’acceptabilité. Hypothèse : s’il l’on donne plus ou moins la main au consommateur, la recommandation sera plus acceptée (et donc efficace ?)
Boîte noire vs. algorithme basé sur l’historique vs. algorithme paramétré par l’utilisateur.
– Trouver le point de rupture de l’acceptabilité (par ex : « il est pour moi rédhibitoire que l’algorithme utilise x donnée ».) Arbitrage entre simplifier sa vie par les recommandations et la liberté
– Dynamique de la relation de confiance entre le consommateur et la recommandation
Autres questions (en vrac) :
– Hiérarchiser les déterminants des choix (prix, avis, notes, commentaires, place dans la page internet, etc.)… et la place de la recommandation parmi ces déterminants.
– Impact du format de la recommandation (produit), tri par pertinence, étoiles, avis.

Cas d’usage pour la révélation de préférences et de biais comportementaux
● Datathon 1.1 (co-leads : L. Muller et A. Tsoukias) : Formalisation de modèles de révélation de préférences et de biais
○ Collecter les préférences
○ Comparer les préférences : avec des données existantes pour lesquelles nous avons des choix enregistrés (e.g., choix d’un hôtel sur un site type tripadvisor.com ou booking.com) et également à travers des expériences dans le contexte contrôlé du laboratoire (on-line ou in-situ)
OBJECTIF: Design d’expériences pour la collecte de préférences
● Datathon 1.2 (co-leads : M. Öztürk et A. Fadhuile) : Définition de cas d’usage sous forme de couples (hypothèse/théorie, données). Plusieurs applications :
○ Biais social, c’est-à-dire sur l’influence de consommateurs tiers dans ses propres choix (exemple : notes attribuées en ligne, forum, etc.).
○ Biais d’ancrage, c’est-à-dire l’influence de l’amorçage sur la décision d’achat et sur le nombre de pages visitées ensuite (ex : affichage de prix et/ou produits en première page internet).
○ Biais statu quo: Occurrence dans les choix des options par défaut (ex : standard, options, etc.). = BIAIS STATU QUO… à rapporter avec la question de l’équité dans le classement algorithmique
OBJECTIF: Quelles hypothèses voulez vous vérifier ?

Hackathon pour le design et déploiement des expériences (co-leads : C. Benavent, O. Goga et B. Roussillon) :
● Hackathon pour étendre AdAnalyst pour cibler un ensemble précis d’internautes, de vérifier s’ils ont vu ou cliqué sur des publicités, et de leur demander de répondre à des questionnaires.
OBJECTIF: Quelles mesures directes/indirectes ? => les choix/achats, likes, questionnaire, choice experiment, beauty contest, enchères, etc.

Oana et Sihem: extension AdAnalyst avec le mouse tracking (indirectes) et les pop-ups (directes) – 2 stagiaires financés par l’ANR Jeune Chercheur d’Oana (Salim et Rosa jusqu’au 15/06)

● Hackathon pour la construction d’expériences contrôlées en laboratoire. L’enjeu est ici d’augmenter la validité externe des résultats issus d’expériences de laboratoire et la validité interne des résultats issus des méta-données.
Ceci est, il me semble, un enjeu transversal qui s’appliquera aux différentes questions.
OBJECTIF: Quelles hypothèses voulez vous vérifier ?
Oana et Sihem: Mesure de l’attitude des individus vis-à-vis de la pub en ligne (information ads sur les politiques publiques et product ads)
Oana et Sihem: Fouille de l’évolution des habitudes de consommation des clients TOTAL (stagiaire Abdou jusqu’au 30/06 financé par projet européen de Sihem)
Christophe: Travail sur l’influence des commentaires positifs/négatifs sur les réservations Airbnb

11:30-12
Prochaines étapes

URL :

Jul
6
Mon
2020
Second Symposium GDR CNRS MaDICS @ En distanciel avec BBB
Jul 6 – Jul 9 all-day

Présentation

La seconde édition du Symposium MaDICS aura lieu en distanciel du 6 au 9 juillet 2020. Chaque demi-journée propose un programme riche en exposés courts construit par nos responsables d’Actions et d’Atelier. Les sessions auront lieu sous BBB pour permettre à un plus grand nombre d’assister aux exposés. Les programmes seront disponibles d’ici au 18 juin : restez connectés !

Du : 2020-07-06
Au : 2020-07-09
Lieu : En distanciel avec BBB

Programme

Lundi 6 juillet
 9h00-12h30 Action Raisonner sur les donnéesSession 1
Intervenants : Joe Raad, Erman Acar, Stefan Schlobach, Manuel Atencia, Jérôme David, Jérôme Euzenat, Jérémy Lhez, Chan Le Duc, Thinh Dong, Myriam Lamolle, Arnaud Giacometti, Beatrice Markhoff, Arnaud Soulet, Thu Huong Nguyen et Andrea G.B. Tettamanzi
Programme détaillé
Lien vers la page de l’Action RoD
13h30-17h00 Atelier AGriculture, Environnent, Ecologie
Intervenants : Sylvain Galopin, Chuanming Dong, Clement Jonquet, Philippe Prévost et Michel Berducat
Programme détaillé
Lien vers la page de l’Atelier AGEE
13h15-17h00

Action Impact Sociétal des Algorithmes Décisionnels
Intervenants : Sihem Amer-Yahia, Juliette Sénéchal, Béatrice Roussillon, Oana Goga, Adélaïde Fadhuile, Laurent Muller, Rosa Khenniche, Salim Chouaki, Abdel Chibah, Nikita Gusarov, Soraya Koraytem et Alexis Tsoukias.
Programme détaillé (avec PDFs)
Lien vers la page de l’Action PLATFORM
Mardi 7 juillet
9h00-12h30 Atelier Outils Statistiques pour l’Imagerie hyperspectrale du milieu interstellaire
Intervenants : Jérôme Pety, Annie Zavagno, Rosine Lallement, Clément Hottier, Yannick Deville, Florent Chatelain et Antoine Roueff
Programme détaillé
Lien vers la page de l’Atelier OSIS
 9h00-12h30 Action RoDSession 2
Intervenants : Sébastien Ferré, Camille Bourgaux, Meghyn Bienvenu, Luis Palacios, Yue Ma, Chantal Reynaud, Gaëlle Lortal, Arnaud Grall, Thomas Minier, Hala Skaf-Molli, Pascal Molli, Julien Romero, Nicoleta Preda, Antoine Amarilli, Fabian M. Suchanek, Victor Charpenay et Sebastian Käbisch
Programme détaillé
Lien vers la page de l’Action RoD
14h00-16h00 Atelier MaDICS Humanités Numériques
Intervenants : Claudia MARINICA, Cécile CHANTRAINE, Ioana GALLERON, Max BELIGNE et Christophe TUFFERY
Programme détaillé
Lien vers la page de l’Atelier MaDICS-HN
14h00-17h00 Action MAChine LEarning for EArth observatioN
Intervenants : Germain Forestier, Romain Tavenard et Marc Rußwurm
Programme détaillé
Lien vers la page de l’Action MACLEAN
Mercredi 8 juillet
9h00-12h30 Atelier Big Data for Astronomy
Intervenants : Stéphane Plaszczynski, Marc Huertas-Company et Karine Zeitouni
Programme détaillé
Lien vers la page de l’Atelier BigData4Astro
9h00-12h30 Action anaLysE et dynaMique des messages et cONversations radicales sur Internet
Intervenants : Nawel Chaouni, Séraphin Alava, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel, Franck Biellmann, Raphaël Bavière, Océane Fourquet, Claire Laudy, Cyril Bruneau, Delphine Battistelli, Adrien Legros, Valentina Dragos
Programme détaillé
Lien vers la page de l’Action LEMON
14h00-17h00 Atelier Données Intelligentes: transformer l’information en connaissance
Intervenants : Andre Freitas et Laure Berti
Programme détaillé
Lien vers la page de l’Atelier DOING
Jeudi 9 juillet
 9h00-12h30 Restitution et synthèse
Programme détaillé

 
 
 

Programme de l’Action Rod – Session 1

Lundi 6 juillet 9h00-12h30  
9h00 Accueil
9h15 Atelier Approches récentes pour le raisonnement sur les données (1)

  • YAGO 4: A Reasonable Knowledge Base, Thomas Pellissier Tanon, Gerhard Weikum and Fabian M. Suchanek. (publié à ESWC 2020)
  • On the Impact of sameAs on Schema Matching, Joe Raad, Erman Acar and Stefan Schlobach. (publié à KCAP 2019)
  • Several link keys are better than one, or Extracting disjunctions of link key candidates, Manuel Atencia, Jérôme David and Jérôme Euzenat. (publié à Kcap 2019)
10h45 Pause
11h00 Atelier Approches récentes pour le raisonnement sur les données (2)

  • Decentralized Reasoning on a Network of Aligned Ontologies with Link Keys, Jérémy Lhez, Chan Le Duc, Thinh Dong and Myriam Lamolle. (publié à ISWC 2019)
  • Découverte de cardinalités maximales significatives dans des bases de connaissances, Arnaud Giacometti, Beatrice Markhoff and Arnaud Soulet. (publié à ISWC 2019)
  • Using Grammar-based Genetic Programming for Mining Disjointness Axioms Involving Complex Class Expressions, Thu Huong Nguyen and Andrea G.B. Tettamanzi. (publié à ICCS 2020)
12h30 Fin de l’atelier

Programme de l’Atelier AGEE

Lundi 6 juillet 13h30-17h00  
13h30 Introduction AGEE
13h40 AncGIS: SIG Web pour l’analyse des ressources mellifères, Sylvain Galopin, IGN
13h50 Fusion entre bases de données hétérogènes concernant la pollution des sols, Chuanming Dong, LASTIG, Univ Gustave Eiffel, ENSG, IGN, ADEME
14h10 Le projet D2KAB Data to Knowledge in Agronomy and Biodiversity, Clement Jonquet, LIRMM
14h30 TABLE RONDE 1 : Les défis scientifiques et technologiques pour l’intégration, la gestion et l’analyse de la donnée « Variée »
15h30 Pause
15h45 Enjeux, méthodes et pratiques pour la formation aux usages numériques dans les métiers du vivant, Philippe Prévost, Agreenium, Institut agronomique, vétérinaire et forestier de France
16h00 AgroTechnoPôle : La plateforme collaborative pour le développement des technologies au service de la transition agro écologique, Michel Berducat. TSCF, INRAE
16h15 TABLE RONDE 2 : Comment fédérer et animer la recherche en Big Data pour l’agro-env-eco ?
17h00 Fin de l’atelier

Programme de l’Action PLATFORM

Lundi 6 juillet 13h15-17h00  
13h15 Introduction PLATFORM et effet levier, Sihem Amer-Yahia
13h30 Aspects juridiques et économiques

  • CNIL/RGPD/code de la consommation, Juliette Sénéchal
  • DPO et autorisations, Béatrice Roussillon, Oana Goga, Adélaide Fadhuile, Aurélie Level et Laurent Muller
14h30 Pause et discussion libre
14h45 Aspects méthodologiques

  • Présentations de Rosa Khenniche et Salim Chouaki , Abdel Chibah , Nikita Gusarov et Soraya Koraytem , et discussion autour des méthodologies de déploiement de campagnes publicitaires, de développement d’algorithmes, de développement de critères de performance
  • Présentation et discussion sur les préférences, Alexis Tsoukias
15h45 Pause et discussion libre
16h00 Rédaction conjointe: Lexique + Leçons
17h00 Fin de l’atelier

Programme de l’Atelier Osis

Mardi 7 juillet 9h00-12h30  
9h00 Le projet Orion-B, Jérôme Pety (IRAM, Grenobble)
9h25 Big Data et apprentissage pour l’étude de la formation stellaire galactique, Annie Zavagno (LAM, Marseille)
9h50 Reconstruction 3D du milieu interstellaire local, Rosine Lallement et Clément Hottier (GEPI, Paris)
10h15 Pause
10h45 Méthodes de dé-mélange, Yannick Deville (IRAP, Toulouse)
11h10 Détection du gaz dans les données hyperspectrales MUSE, Florent Chatelain (GIPSA-lab, Grenoble)
11h35 Traitements statistiques des données Orion-B, Antoine Roueff (Institut Fresnel, Marseille)
12h00 Discussions et synthèse
12h30 Fin de l’Atelier

Programme de l’Action Rod – Session 2

Mardi 7 juillet 9h00-12h30  
9h00 Accueil
9h15 Atelier Approches récentes pour le raisonnement sur les données (3)

  • Link Prediction in Knowledge Graphs with Concepts of Nearest Neighbours, Sébastien Ferré. (publié à ESWC 2019)
  • Querying and Repairing Inconsistent Prioritized Knowledge Bases: Complexity Analysis and Links with Abstract Argumentation, Camille Bourgaux et Meghyn Bienvenu. (publié à KR2020)
  • Knowledge Based Situation Discovery for Avionics Maintenance, Luis Palacios, Yue Ma, Chantal Reynaud and Gaëlle Lortal. (publié à KCAP 2019)
10h45 Pause
11h00 Atelier Approches récentes pour le raisonnement sur les données (4)

  • Processing SPARQL Aggregate Queries with Web Preemption, Arnaud Grall, Thomas Minier, Hala Skaf-Molli and Pascal Molli. (publié à ESWC 2020)
  • Réécriture de requêtes atomiques par des vues chemins, Julien Romero, Nicoleta Preda, Antoine Amarilli and Fabian M. Suchanek. (publié à ESWC 2020)
  • L’annotation « sémantique » de documents – L’exemple du web des objets, Victor Charpenay and Sebastian Käbisch. (publié à ESWC 2020)
12h30 Fin de l’atelier

Programme de l’Atelier MaDICS-HN

Mardi 7 juillet 14h00-16h30  
14h00 Présentation de l’atelier et des participants
Introduction à la problématique : “Construire des données pour les machines Vs pour les humains”
14h15 Interventions

  • L’analyse de trajectoires au musée du Louvre: des problématiques liées aux données, Claudia MARINICA (MCF informatique)
  • Deux approches pour la préparation de données et des métadonnées destinées à analyser le théâtre, Cécile CHANTRAINE (PR Études théâtrales et Humanités Numériques) et Ioana GALLERON (PR Littérature française et Humanités Numériques)
  • La transformation de documents numérisés par la plateforme Persée dans un objectif d’analyses textuelles, Max BELIGNE (Doc Géographie)
  • La préparation de données et de métadonnées pour leur publication sur des plateformes cartographiques : l’expérience des PCR “Réseau de lithothèques” et du GDR SILEX, Christophe TUFFERY (IR)
15h30 Discussion libre, échanges autour de deux questions :
“Données et jeux de données: définitions, fins et moyens?”
“Manipulation des données en SHS : des verrous techniques ou humains?”
16h30 Fin de l’atelier

Programme de l’Action MACLEAN

Mardi 7 juillet 14h00-17h00  
14h00 Welcome
14h05 Deep learning for time series classification, Germain Forestier (Université Haute-Alsace)
15h00 Tslearn: A machine learning toolkit dedicated to time-series data, Romain Tavenard (Université Rennes 2)
15h20 BreizhCrops: A Time Series Dataset for Crop Type Mapping, Marc Rußwurm (TU Munich)
15h40 Hands-on training
16h20 Panel discussion: machine learning, time series, and Earth Observation: opportunities and challenges
17h00 Fin de l’atelier

Programme de l’Atelier BigData4Astro

Mercredi 8 juillet 9h00-12h30  
9h00 Introduction
9h15 Big Data astronomy with Spark, Stéphane Plaszczynski (IJCLab, Université Paris-Saclay)
9h50 Deep Learning for the next generation of big-data surveys, Marc Huertas-Company (Observatoire de Paris/LERMA, Université Paris-Diderot)
10h15 Big FAIR Data in Astronommy, Mark Allen, Observatoire astronomique de Strasbourg
10h50 Pause
11h00 Spatial Query Optimization for Big Astronomical Surveys – ASTROIDE project, Karine Zeitouni (Université de Versailles-Saint-Quentin/DAVID)
11h20 Table Ronde : Perspectives et verrous scientifiques, avec les invités et les animateurs de l’Atelier
12h15 Conclusion
12h30 Finde l’Atelier

Programme de l’Action LEMON

Mercredi 8 juillet 9h00-12h30  
9h00 Accueil et Introduction
9h15 Constitution de bases de données radicales afin de caractériser les discours extrémistes pour une méthode interdisciplinaire de prévention des déviances en ligne, Nawel Chaouni, Séraphin Alava
9h45 Détection des influenceurs dans les médias sociaux, Kevin Deturck, Frédérique Segond, Namrata Patel, Damien Nouvel
10h15 Méthodes et outils pour investigation sur les réseaux sociaux, Franck Biellmann, Raphaël Bavière
10h45 Pause et discussion libre
11h00 Extractions d’informations sémantiques à partir de données sociales, Océane Fourquet, Claire Laudy
11h20 Modélisation linguistique et formelle de la notion de discours haineux, Cyril Bruneau, Delphine Battistelli
11h40 Vers une ontologie pour la détection des opinions dans les corpus en français, Adrien Legros, Valentina Dragos
12h00 Discutions et conclusion du séminaire
12h30 Fin de l’atelier

Programme de l’Atelier DOING

Mercredi 8 juillet 14h00-17h00  
14h00 Introduction
14h10 Automatically understand and process the meaning of information at scale, Andre Freitas
15h00 Pause
15h20 Data Cleaning and Preparation for ML and Data Analytics: Toward a Principled Approach, Laure Berti
16h10 Discussions
17h00 Fin de l’atelier

Programme de la matinée Restitution et Synthèse

Salon 1

Jeudi 9 juillet 9h00-12h30  
9h00 Introduction à MaDICS, Sarah Cohen-Boulakia
9h15 Restitution des Actions et Ateliers
11h00 Pause
11h30 Discussions
Sep
25
Fri
2020
Action PLATFORM dans GdR Internet et Société
Sep 25 – Sep 26 all-day

Annonce en lien avec l’Action/le Réseau : PLATFORM

Thème :

Plateformes et risques algorithmiques

Présentation :

La manifestation vise à produire un document résumant notre retour d’expérience sur le travail de PLATFORM : autorisations légales, déploiement d’expériences, modélisation des préférences, fouille et requêtes de comportement, travail à venir.

Du : 2020-09-25

Au : 2020-09-25

Lieu : En ligne

Site Web : https://cis.cnrs.fr/gdr-members/

Nov
25
Wed
2020
Quels problèmes posent l’hétérogénéité des données en informatique et en Humanités numériques ? @ Visioconférene
Nov 25 @ 14:00 – 16:00

L’atelier Humanités numériques du GDR MaDICS (Masses de Données, Informations et Connaissances en Sciences) vise à contribuer au rapprochement des communautés de la science des données de celles des sciences humaines et sociales (SHS) impliquées dans les Humanités numériques. Il a pour objectif d’incorporer des éléments méthodologiques utilisés en SHS (par exemple, processus de constitution de corpus et de mise en relation de données, méthodologies d’analyse de corpus…) dans les processus informatiques (par exemple, intégration des données, navigation et visualisation des données…), et vice versa.
Après une première rencontre organisée le Mardi 7 juillet 2020 sur la notion de « données », l’atelier Humanités numériques du GDR MaDICS (Masses de Données, Informations et Connaissances en Sciences) organise un nouvel évènement le Mercredi 25 novembre 2020 associant les communautés de la science des données et des sciences des textes pour discuter la notion d'”hétérogénéité des données”.

Problématique

Alors que les projets de recherche en Humanités numériques menés depuis plusieurs années commencent à produire des données massives, au-delà de leur volume, leur stockage, leur archivage et leur accessibilité posent des problèmes techniques et épistémologiques en raison de leur hétérogénéité. Celle-ci reste un défi scientifique pour la science des données et pour la science des textes mais pour des raisons différentes qu’il conviendrait d’expliciter.
Le but de ce 2e évènement de l’atelier Humanités numériques est d’encourager chaque communauté scientifique à définir et à préciser ce qu’elle considère comme étant des “données hétérogènes”, à indiquer sur quoi porte cette hétérogénéité ainsi que les problèmes scientifiques que cette hétérogénéité pose et les solutions qui peuvent être apportées.
Organisée en ligne, la rencontre comprendra deux présentations et une table ronde qui visera l’échange entre les communautés scientifiques. Cette table ronde sera ouverte à tous et toutes ; les participants connectés seront invités à poser des questions ou à exposer leurs points de vue.

Programme
• 14:00. Introduction et présentation des participants.
• 14:00-14h45. Interventions et questions
• 14h45-16h. Table ronde

URL :

Jul
7
Wed
2021
Raconter Rennes par la donnée @ ISTIC
Jul 7 – Jul 8 all-day

Annonce en lien avec l’Action/le Réseau : MADONA

Programme

Mercredi 7 juillet 9h30-20h30  
9h00 Accueil des participants
9h30 “La poule, le couteau et l’open data: quand les non-experts découvrent la réalité des données ouvertes”, Simon Chignard (Etalab)
10h00 “Défis de la réutilisation des données ouvertes et stratégies alternatives”, Samuel Goëta
10h30 “Data-journalisme : raconter des histoires grâce aux données”, Alexandre Léchenet (Data journaliste)
11h00 Pause
11h15 “Open Data à Rennes et projet Rudi”, Ben Lister (Rennes Métropole)
11h45 Présentation de l’action Madona et premiers résultats, Patrick Marcel (Univ. Tours)
12h00 Présentation et lancement de l’atelier

  • Objectifs de l’atelier
  • Présentation des participants et du dispositif
  • Mise en place des groupes et des thématiques
12h30 Pause déjeuner
13h30 Challenge pour les participants
17h30 Point d’étape des participants et apéro studieux pour ceux qui veulent prolonger
19h30 Fin de l’atelier
Jeudi 8 juillet  
suite du challenge (optionnel : il est tout à fait possible de n’assister qu’à la première journée)

Le challenge

Présentation

En une ou deux journées, vous explorerez les données publiées sur le site de l’Open Data de Rennes Métropole en vue de mener une enquête qui sera par la suite publiée. Selon le type de production, vous pourrez la publier dans votre média si vous êtes professionnel, sur le site de Rennes Métropole ou tout autre lieu approprié. La publication pourra être proposée sous forme de data visualisation contextualisée, d’article écrit ou de format plus créatif, visuel ou sonore.

Règlement

Le règlement du Challenge est disponible ici.

Remise du prix

A l’issue des deux jours, les participants devront partager leur narration avant le 11 juillet. Un jury composé de membres de Rennes Métropole, de journalistes et de scientifiques décernera le prix de la meilleure narration.

Les trois meilleures narrations seront récompensées.

Pour qui?

Public:

Cet atelier s’adresse à tous, professionnels, étudiants ou amateurs, intéressés par le traitement de données. Il n’est pas nécessaire d’être spécialiste de l’Open Data ou de connaître Rennes. L’objectif pour l’équipe organisatrice est de voir comment vous construirez une enquête et une narration pour restituer les résultats de cette enquête. Il n’y a pas de thème imposé, vous pouvez travailler sur l’éducation, les transports, la santé, etc.

Tout au long de l’atelier un responsable de Rennes Métropole et une équipe de data scientistes seront à vos côtés pour vous accompagner et vous aider à réaliser la meilleure enquête possible.

Participation en ligne:

Il est possible de participer à distance, il faut en revanche le signaler lors de l’inscription.

Inscription

L’inscription est gratuite mais obligatoire, à faire avant le 25 juin 30 juin : https://framaforms.org/inscription-au-challenge-raconter-rennes-par-la-donnee-1622456641

Compte-tenu du contexte sanitaire, il ne sera pas possible de déjeuner sur place mais nous nous efforcerons de maintenir à disposition de tous une table de rafraichissements pendant toute la durée de l’atelier.

Site Web de l’Action MADONA: http://www.madics.fr/actions/actions-en-cours/madona/

Nov
29
Mon
2021
AstroInformatique 2021
Nov 29 – Dec 11 all-day

Annonce en lien avec l’Action/le Réseau : BigData4Astro

Thème :

Ecole Thematique AstroInformatique 2021 (ANF)

Présentation :

L’astronomie a toujours été précurseur dans les problématiques de traitement de données (grands projets EUCLID, GAIA) et de mises à disposition de données (Observatoire Virtuel) impliquant des communautés dispersées géographiquement. Les grands projets et instruments pour l’Astronomie actuels vont apporter à la communauté une quantité de données qui dépasse de plusieurs ordres de grandeur ce que les astronomes ont l’habitude de traiter. Les grands relevés et observatoires (SKA, EUCLID, GAIA …) imposent une manière différente de traiter les données à l’aide d’une chaîne automatisée cruciale pour les nouvelles découvertes. De nouvelles méthodes, de nouvelles utilisations et de nouveaux modes de traitement de données sont nécessaires et demandent une implication conjointe de personnel astrophysique et informatique.

Objectifs:
Sensibiliser les chercheurs et ingénieurs aux nouvelles technologies du traitement de données.
Former les scientifiques et ingénieurs aux méthodes informatiques de traitement de données massives en Astrophysique.
Renforcer cette action transverse de collaboration informatique et astrophysique.
Démontrer les possibilités d’utiliser ces nouvelles méthodes dans le cas de données astrophysiques à travers des cas pratiques et un hackathon.

Du : 2021-11-29

Au : 2021-12-10

Lieu : Pôle d’accueil universitaire de Séolane
Quartier du 11 eme BCA, 04400 Barcelonnette

Site Web : https://astroinfo2021.sciencesconf.org/

Dec
12
Mon
2022
ASNUM2022 : Conférence Action Spécifique Numérique Astrophysique
Dec 12 – Dec 16 all-day

Date : 2022-12-12 => 2022-12-16
Lieu : ENS Lyon

Rationale :
Numerical computation and data analysis are essential aspects of research in astrophysics and astronomy, a field which has historically always been a producer of big data. Thus, whether to analyze photometric or spectroscopic data from large observatories on the ground or in space, or to produce and analyze virtual data from numerical simulations, astrophysics tools require large computing resources and storage, as well as new numerical methods adapted to new or emerging architectures.

This conference at the initiative of the Numerical Specific Action responds to the desire of the community to exchange their thoughts on these different numerical aspects in astrophysics. We encourage everyone to come and share their numerical analysis and modeling work, with the desire that this week of exchange will make it possible to decompartmentalize the themes, and to identify the methodological points of convergence between observations and simulations.

Abstract and registration deadline : 17th October

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Dec
13
Tue
2022
PhD Defense: Explainable Classification of Uncertain Time Series
Dec 13 all-day

Date : 2022-12-13
Lieu : ISIMA, Salle du conseil (A102) and visio

Hello,

I hope you are doing well. 

I have the great pleasure to invite you to my PhD defense entitled Explainable Classification of Uncertain Time Series. The defense will take place on the 13th of December 2022 at 2 pm in room A102 (Salle du Conseil) at ISIMA.  You are also invited to share some drinks and candies after the defense in the room A104 right after the defense.

How to attend remotely?There will be two channels to attend the defense remotely:
– By Microsoft Teams using this link: https://teams.microsoft.com/l/meetup-join/19%3ameeting_YWNmMDQ1MDAtYWFlOC00MDNjLWE3NTMtNjY5ODkxOTVhMDFm%40thread.v2/0?context=%7b%22Tid%22%3a%225a16bd04-b475-49ff-b11a-c6c8359db1b1%22%2c%22Oid%22%3a%22949eb4b9-6120-456f-95a8-6ec37948db76%22%7d 
– By YouTube using this link: https://youtu.be/EW1Wp3Fg-1Q. Feel free to leave a thumb up if you like the presentation and a thumb down if you did not. I will also be happy to read any comment you may have about the presentation.

Here is the abstract of the presentation: Time series classification is one of the most studied theoretical and applied fields of time series analysis. Many classical machine learning as well as deep learning algorithms, have been developed during the last decade to accurately perform time series classification. However, the case where the time series are uncertain is still under-explored. In this work, we discuss the importance of uncertainty handling in machine learning in general and in time series classification in particular. We propose efficient, robust and explainable methods for the classification of uncertain time series. We assess our methods on simulated datasets, but also on a real scenario in the astrophysics in which uncertainty in preponderant. The results we obtained are understandable and trustable by astronomers. Our proposed methods are tools that will facilitate the understanding of the universe in which we life in particular, and the field of uncertain time classification in general.

Here is the composition of the Jury:
Anthony BAGNALL (R) – University of East AngliaSebastien DESTERCKE (R) –  Heudiasyc, University of Technology of Compiegne

Elisa FROMONT (E) – IRISA, University of Rennes 1Emmanuel GANGLER (E) – LPC, University Clermont AuvergneDavid HILL (E) – LIMOS, University Clermont Auvergne
Themis PALPANAS (E) – LIPADE, Universite Paris CiteEngelbert
MEPHU NGUIFO (A) – LIMOS, University Clermont Auvergne(R): Reviewer, (E): Examinator, (A): Advisor

I am looking forward to defending my work in front of you.

Best regards

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Jun
26
Mon
2023
École Thématique AstroInformatique 2023 et Hackathon AstroInfo AISSAI
Jun 26 – Jul 7 all-day

Date : 2023-06-26 => 2023-07-07
Lieu : L’école aura lieu dans le Sud-Est de la France, hébergée par le Village de Vacances Igesa « Destremau »

École Thematique AstroInformatique 2023 et Hackathon AstroInfo AISSAI
La troisième édition de l’école thématique AstroInformatique aura lieu du 26 au 30 juin et sera suivie du Hackathon AstroInfo AISSAI du 3 au 7 juillet.
L’inscription est ouverte!
L’école
Cette école a pour but de rassembler les chercheur·e·s, ingénieur·e·s et doctorant·e·s autour des nouvelles technologies du traitement de données massives en Astrophysique.
Les cours se concentreront sur des présentations et Travaux Pratiques en traitement des données, Machine learning et Deep Learning.
Le programme est disponible ici.
L’école aura lieu dans le sud-est de la France au Village Vacances Igesa « Destremau ».
Plus de détails sur la page web de l’école.
Ne tardez pas à vous inscrire, le nombre de places est limité !
Le hackathon
Dans la continuité de l’École nous organisons le Hackathon Astro AISSAI.
Le hackathon s’articule autour d’un projet scientifique et se déroulera tout au long de la semaine. Cette deuxième semaine s’adresse à des personnes ayant un peu d’expérience et le nombre de participants sera limité à 20.
Si vous êtes intéressé·e, merci de vous inscrire également sur le site du Hackathon.
Appel à propositions de projet
Nous invitons les participants “seniors” à soumettre des propositions de hack dans le domaine de l’astrophysique et de l’apprentissage automatique. Nous accueillons tous les types de projets, à condition qu’ils impliquent plusieurs participants pendant toute la semaine sur diverses tâches et conduisent à un résultat publiable.
Les candidats retenus travailleront à l’avance avec les organisateurs locaux pour préparer le matériel de hack (mise en page du projet, données ouvertes, code existant, notebook de départ, etc.).
Une connaissance préalable de l’apprentissage automatique est préférable mais non obligatoire, car une équipe locale sera disponible pour travailler avec les participants.
Veuillez soumettre vos propositions sur le formulaire d’inscription avant le 1er mai, 23h59 AOE (Anywhere on Earth).
Attention
L’inscription au hackathon et la soumission de sujet se font sur le site dédié au hackathon : https://aissai-hackathon.astroinfo.in2p3.fr/.
Thematic School AstroInformatics 2023
The third edition of the AstroInformatics thematic school will take place from June 26th to 30th, followed by the AstroInfo AISSAI Hackathon from July 3rd to 7th.
Registration is open!
The school
The goal of this school is to bring together researchers, engineers and students around new technologies for processing massive data in astrophysics.
The courses will focus on presentations and practical work in data processing, machine learning, and deep learning.
The program is available here.
The school will take place in the southeast of France at the Village Vacances Igesa “Destremau”.
More details on the school web site.
Don’t delay in registering, the number of spots is limited!
The hackathon
In the continuity of the school, we are organizing the Astro AISSAI Hackathon. The hackathon is based on a scientific project and will take place throughout the week. This second week is intended for people with some experience, and the number of participants will be limited to 20.
If you are interested in participating, please also register on the Hackathon web site.
Call for project proposals
We invite senior participants to submit hack proposals in the field of astrophysics and machine learning. We welcome all types of projects, as long as they involve and engage several participants for the entire week on various tasks and lead to a publishable result.
The successful candidates will work with local organizers in advance to prepare hack material (project layout, open data, existing code, starting notebook, etc.).
Prior knowledge of machine learning is preferable but not mandatory, as a local team will be available to work with the participants.
Please submit your proposals on the registration form before May 1st, 23:59 AOE (Anywhere on Earth).
Attention
Registration for the hackathon and submission of topics must be done on the dedicated hackathon website: https://aissai-hackathon.astroinfo.in2p3.fr/

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Nov
27
Mon
2023
11:47 Debating the potential of machine learning for astronomical surveys (#2)
Nov 27 – Dec 1 all-day

Date : 2023-11-27 => 2023-12-01
Lieu : Institut d’Astrophysique de Paris, Paris, France

Abstract deadline: August 31st 2023, Registration deadline please see note below

Machine learning techniques are developing rapidly. After our highly successful 2021 meeting, “Machine Learning for astronomical surveys”, an avalanche of new data and an ever-growing use of ML in astronomical surveys clearly mandated a follow-up.

This year’s meeting follows the same format as previously: a series of invited summary talks, short and very lively contributed talks, posters and debates. Our aim is the same as before: to cast a critical eye on the application of machine-learning techniques in astronomical surveys, including field-level inference, likelihood free approaches, generative models.

The need for new data-analysis techniques for next-generation surveys is no longer in doubt, but the applicability of these techniques (often developed outside of astronomy) needs to be questioned more than ever. We aim to make this conference a forum for discussions on problems
and solutions in data analysis of astronomical surveys. We are also interested in emerging class of problems in astronomy that mandate an evolution of our data analysis techniques.

This time, to bring together as many people as possible, while limiting our carbon impact, this conference will be organised in two locations simultaneously, at the IAP in Paris and the Flatiron Institute in New York, with speakers and audiences at both sites. A professional production company will provide high-resolution live streaming video.

While the main conference and debates will be held simultaneously (in the afternoon in Paris and in the morning in NY), the time-shifted period (morning in Paris and afternoon in NY) will be devoted to in depth review talks by leading experts in the field including:

  • Miles Cranmer (Cambridge University)
  • Marylou Gabrié (CMAP, Polytechnique)
  • Tomasz Kacprzak (ETH Zurich)
  • Jens Jasche (Stockholm University)
  • Soledad Villar (JHU)
  • Tiziana DiMatteo (CMU)

The conference will features three debates, organised jointly between Flatiron and IAP hosted simultaneously:

  • What can machine-learning do for the next generation surveys?
  • What is the impact of large language models in astronomy?
  • Is there truth in latent space?

These debates will be led by experts in machine-learning and/or surveys, with a wide range of views, which will certainly lead to lively discussions, including:

  • Nabila Aghanim (IAS, Orsay)
  • Pierre Casenove (CNES)
  • Aleksandra Ciprijanovic (Fermilab)
  • Helena Domínguez Sánchez (CEFCA)
  • David Hogg (NYU / Flatiron Institute)
  • Kyunghyun Cho (NYU)
  • François Lanusse (LCS, CEA)
  • Luisa Lucie-Smith (MPA)
  • Henry Joy McCracken (IAP, Sorbonne Université)
  • David Spergel (Simons Foundation)
  • Licia Verde (ICC-UB)
  • Lawrence Saul (Flatiron Institute)
  • Torsten Ensslin (MPA)

More information can be found at the conference website, please note the preliminary timetable.

Please register to the correct node that you want to attend to. Payment for the Paris node participation will only be called for by mid-September.

Registration closes for New York / Flatiron on September 30th, 2023. Abstract submission closes on August 31th 2023.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Dec
17
Tue
2024
International workshop on Scalable and Deep Graph Learning and Mining (SGLM)
Dec 17 all-day

Date : 2024-12-17

Call for Papers
Graphs serve as flexible and powerful models for representing diverse types of data encountered in modern research and industries. These include the WWW, social networks, biological networks, communication networks, transportation networks, energy grids, and many others. Unlike traditional tabular data formats, graphs enable the representation of entities along with their attributes or properties, as well as the relational structure between entities, making them invaluable for capturing complex data relationships and patterns. Additionally, graphs can accommodate unstructured and heterogeneous data, further enhancing their versatility in handling a wide range of data types and structures.
The significance of extracting knowledge and making predictions from graph data has grown rapidly in recent years. However, there remains a need for ongoing scientific exploration to formalize new problem types that align effectively with real-world applications. Additionally, investigating the algorithmic, statistical, and information-theoretic aspects of these problems is essential for advancing our understanding. Of particular interest to the workshop is the increasingly popular field of graph representation learning. These intermediate real-valued representations enable the application of learning and mining algorithms developed for non-relational data to graph structures. Given the rapid progress in this area, ensuring trustworthy AI on graphs requires focused attention.

The main aim of this workshop, scheduled to be held in conjunction with IEEE BigData, is to serve as a scientific forum for discussing the latest advancements in these areas. We welcome both theoretical and practical contributions, fostering interactions among participants. Additionally, we will schedule conferences or talks specifically focused on these topics to further enrich the discussions.

Topics
We cordially invite submissions covering theoretical aspects, algorithms, methods, and applications within the following (non-exhaustive) list of areas:

Computational or statistical learning theory related to graphs.
Theoretical analysis of graph algorithms or models.
Semi-supervised learning, online learning, active learning, transductive inference, and transfer learning in the context of graphs.
Graph and vertex embeddings and representation learning on graphs.
Explainable, fair, robust, and/or privacy preserving ML on graphs, and graph sampling.
Analysis of social media, chemical or biological networks, infrastructure networks, knowledge graphs.
Benchmarking aspects of graph based learning
Libraries and tools for all of the above areas.
Knowledge graph applications
Representation Learning over Knowledge Graphs
Dynamic knowledge graphs
Large Language Models for Knowledge Graphs
Knowledge Graphs for Large Language Models
Prompt engineering and knowledge graphs
Paper Submission
The desired workshop format is full day. The workshop accepts two types of submissions:

Long papers (full research papers / up to 10 pages (references included), in the IEEE 2-column format)
Short papers of 2-4 pages (for work in progress)
Papers should be formatted to IEEE Computer Society Proceedings Manuscript Formatting Guidelines (https://www.ieee.org/conferences/publishing/templates.html).
The submission deadline is October 01, 2024 for abstracts and for full papers.
Submissions should be made through cyberchair at:

Paper Submission Page

We also invite the submission of 2-4 pages extended abstracts as highlight papers or late breaking research papers. Highlight papers should summarize full papers that have been published, or accepted for publication.

Description of the submission review process, including key dates and coverage of how conflicts of interest are handled

Papers will be subject to three (3) blind peer reviews. Selection criteria include originality of ideas, correctness, clarity and significance of results and quality of presentation.

We are pleased to announce that authors of accepted papers from our Workshop are invited to submit an extended version of their work to our special issue in the Journal of Supercomputing.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.