Présentation Générale

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS  


Oct
13
Thu
2016
Innovatives Big Data
Oct 13 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Big Data

Présentation :

Le 13 octobre 2016, le CNRS organisera une journée dédiée au Big data afin de montrer les avancées de ses laboratoires dans un domaine qui va changer nos vies, nos pratiques, nos sociétés. L’appel à participation pour des posters, vidéos, prototypes et/ou démonstrateurs est ouvert à compter du 23 juin et jusqu’au 17 juillet.

Du : 2016-10-23

Au : 2016-10-23

Lieu : Paris, Campus Gérard-Mégie – Siège du CNRS, rue Michel Ange

Site Web : http://innovatives.cnrs.fr/big-data/innovatives-big-data/article/programme

Oct
14
Fri
2016
Rencontre Annuelle MaDICS 2016
Oct 14 all-day

Lieu : Auditorium, Paris, Campus Gérard-Mégie – Siège du CNRS, rue Michel Ange

Pour récupérer les diapositives, Merci de se connecter.

Programme

9h00  Accueil – Café    
9h30  Les news MaDICS, Christine Collet, direction MaDICS
10h00 
ATLAS : Apprentissage, opTimisation Large-échelle et cAlculs distribuéS
Marianne Clausel, LJK, INSMI, Massih Amini, LIG, INS2i
 
EADM : Environmental Acoustic Data mining
High velocity or long term recordings for species monitoring applied to marine mammals and birds, from Polar Oceans to Amazonian Forest
Hervé Glotin, LSIS, INS2i, Frédéric Precioso, I3S, INS2i
 
MAESTRO : MAsses de données En aSTROnomie et astrophysique
de l’Astrostatistique à l’Astroinformatique, deux mondes se rejoignent dans le domaine de l’analyse de masses de données en Astrophysique.
Sofian Maabout, laBRI, INS2i, Christian Surace, LAM, INSU
 
ImHyp : Imagerie Hyperspectrale
des aspects méthodologiques aux diverses applications dans des domaines extrêmement variés (biologie, chimie, géologie, télédétection, contrôle qualité, santé…)
Mauro Dalla Mura, GIPSA-Lab, INS2i, Marie-Françoise Devaux, INRA Nantes, Jocelyn Chanusot, GIPSA-Lab, INS2i
11h30  Traitement de données massives dans le contexte de la recherche spatiale
Les futures missions spatiales d’observation de la Terre et d’exploration de l’Univers nourriront la communauté scientifique avec des données dont la nature et la volumétrie vont considérablement évoluer par rapport à celles traitées aujourd’hui. Le Comité de Programme Scientifique (CPS) du CNES a identifié le besoin de mener une réflexion sur les verrous algorithmiques qui devront être adressés dans les 10-20 prochaines années afin de permettre une exploitation scientifique optimale de ces futures missions. Ces problèmes algorithmiques nécessitent des approches nouvelles qui devront faire appel à des connaissances issues de diverses disciplines (physiciens, informaticiens, ingénieurs, mathématiciens). La présentation permettra de présenter l’état d’avancement de la réflexion menée par le CPS et les opportunités futures dans le cadre de la recherche spatiale.
Pierre Brasseur, LGGE, INSU, INSIS, INEE
Jean-Loup Puget, Institut d’Astrophysique spatiale, Président du CPS CNES
12h30  Repas sous forme de buffet — Salle Frédéric Joliot
14h00  Echanges autour des posters et démonstrations
15h00 
ADOC : ENtrepôt et Analyse de DOCuments
Jérôme Darmont, ERIC, Olivier Teste, IRIT, INS2i, Natalia Grabar, STL, INSHS/ISCC
 
ReProVirtuFlow : Reproductibilité des expériences d’analyse de données scientifiques
Capacité et limites des systèmes Workflows scientifiques pour la reproductibilité en bioinformatique
Sarah Cohen-Boulakia, LRI, INS2i, Christophe Blanchet, IFB, INSB
 
PREDON : PREservation des DONnées scientifiques
Cristinel Diaconu, CPPM, IN2P3, Salima Benbernou, LIPADE Paris Descartes, INS2i
16h00  Pause café
16h30  Restitution et Perspectives
17h00  Fin de la rencontre
Nov
28
Mon
2016
Filtrage de contenus sensibles et sécurité des méthodes d’apprentissage
Nov 28 all-day

Annonce en lien avec l’Action/le Réseau : / Action du GdR ISIS “sécurisation des contenus multimedia”

Thème :

Apprentissage, contenus multimédias, Sécurité

Présentation :

Les méthodes d’apprentissages, lorsqu’elles sont utilisées pour filtrer ou détecter des informations sensibles (les messages cachés, modification d’un contenu, authentification d’une personne ou d’un objet, détection de SPAM, …), peuvent être mises à mal par un adversaire qui cherchera par exemple à détériorer leurs performances. La base de données d’apprentissage peut par exemple être corrompue afin de rendre l’étape d’apprentissage inefficace. La connaissance du classifieur peut permettre de générer facilement des faux-positifs de bonne qualité. Inversement il est également possible de prendre en compte ces attaques afin de sécuriser le système d’apprentissage.

L’objectif de cette journée sera dans un premier temps de dresser un panorama sur la problématique de l’apprentissage adversairiel puis de présenter des applications liées à ce contexte. La journée commencera par une présentation du Dr. Batista Biggio, chercheur à l’Université de Cagliari et expert dans le domaine.

Les membres de la communauté du GdR ISIS (ainsi que du GdR Madics et du pré-GdR Sécurité) seront ensuite invités à présenter leurs travaux implicitement ou explicitement liés aux attaques de systèmes d’apprentissage, de classification ou de recommandation, nous pouvons citer à titre d’exemple :

la génération et la détection de faux :
en biométrie et en authentification (spoofing),
en tatouage,
en stéganographie,
en extraction de preuves (forensics),
en filtrage de texte (SPAM),
en détection d’intrusions, …
les méthodes de pollution de bases d’images, de vidéos, ou de données plus généralement ;
le respect de la vie privée et les méthodes permettant d’inférer une base d’apprentissage ou une base de données ;
la mise à mal des systèmes de recommandations

Les personnes intéressées par présenter leurs travaux dans ce domaine doivent envoyer un résumé de leurs contribution d’ici le 3 novembre à Patrick Bas (Patrick.Bas@ec-lille.fr) et Marc Chaumont (Marc.Chaumont@lirmm.fr).

Du : 2016-11-28

Au : 2016-11-28

Lieu : Télécom ParisTech – Amphithéâtre Jade

Site Web : http://gdr-isis.fr/index.php?page=reunion&idreunion=325

Dec
2
Fri
2016
Journée ADOC
Dec 2 all-day

Annonce en lien avec l’Action/le Réseau : ADOC /

Thème :

Données environnementales

Présentation :

L’action ADOC du groupe de travail du CNRS MaDICS vise à faire se rencontrer les scientifiques de differentes disciplines, dont les SHS et l’informatique. Dans ce cadre, nous preparons une journée sur les données environnementales, prises dans un sens très large : écologie, urbanisme, aménagement, habitat, environnement industriel… La journée sera consacrée aux différents aspects liés aux données : leur collecte, stockage, traitement, obtention de résultats et leur présentation. De même, différents types de données seront au centre de l’interêt : données des SHS et donnees hétérogènes, données linguistiques et non linguistiques, donnees simples et objets complexes, etc.

Du : 2016-12-02

Au : 2016-12-02

Lieu : MESHS de Lille

Site Web : http://eric.univ-lyon2.fr/adoc/#actis

Inscrivez-vous maintenant !

journée AFIA-MaDICS : l’IA à l’heure du big data
Dec 2 all-day

Annonce en lien avec l’Action/le Réseau : / journée commune AFIA MaDICS

Thème :

Intelligence artificielle, sciences des données, Big Data

Présentation :

Cette journée scientifique à cheval entre l’association française d’intelligence artificielle (AFIA) et le GdR MaDICS à pour objectif d’examiner les liens entre IA et big data. Pour cette journée, nous souhaitons notamment mettre l’accent sur la place de l’humain dans la constitution et la manipulation des connaissances, thème cher à l’IA et qui se trouve au centre des conversations à l’heure du big data et du deep learning.

Du : 2016-12-02

Au : 2016-12-02

Lieu : amphithéatre de la MILC à Lyon

Site Web : http://bigia2016.irisa.fr

PREDONx 2016 : Atelier sur la Préservation des Données Scientifiques
Dec 2 – Dec 3 all-day

Annonce en lien avec l’Action/le Réseau : PREDON /

Thème :

Cycle des vie des données

Présentation :

Le programme de l’atelier este centré cette année sur le cycle de vie des données: modèles de durée de vie des données, distribution des données, popularité des données, modéles de sauvegarde à long terme, stockage pair-à-pair etc.. Les technologies associées avec la préservation des données digitales seront discutées également. Des modéles et exemples du management à long terme des données scientifique seront discuté aussi.

Du : 2016-12-02

Au : 2016-12-02

Lieu : LIPADE, Université Paris Déscartes

Site Web : https://indico.cern.ch/event/574405/

Inscrivez-vous maintenant !

Dec
12
Mon
2016
Journée Snakemake
Dec 12 – Dec 13 all-day

Annonce en lien avec l’Action/le Réseau : ReProVirtuFlow /

Thème :

Rassemblement des (futurs et actuels) utilisateurs du système Snakemake pour la gestion d’expériences scientifiques.

Présentation :

Snakemake est un nouveau système de workflows (utilisé pour définir et exécuter une analyse de données impliquant de nombreuses étapes de traitement de données) dont le nombre d’utilisateurs croît de facon forte en Europe et notamment en France.
L’objectif de cette journée de rencontre est de fédérer la communauté française utilisatrice du système Snakemake pour identifier une première série de cas d’utilisation et de bonnes pratiques notamment relatives à la reproductibilité des analyses.

Du : 2016-12-12

Au : 2016-12-12

Lieu : Institut Pasteur, Paris

Site Web : https://c3bi.pasteur.fr/news-journee-snakemake/

Inscrivez-vous maintenant !

Dec
13
Tue
2016
Journée Machine Learning Optimisation
Dec 13 – Dec 14 all-day

Annonce en lien avec l’Action/le Réseau : OUI : ATLAS /

Thème :

Machine Learning Optimisation

Présentation :

La journée s’adresse à tous les chercheurs intéressés par les thèmes du deep learning et de l’optimisation

Du : 2016-12-13

Au : 2016-12-13

Lieu : Lyon, Campus de la Doua

Site Web : http://ama.liglab.fr/ATLAS/index.php?title=Journ%C3%A9e_Machine_Learning_Optimisation

Inscrivez-vous maintenant !

Apr
6
Thu
2017
Workshop Statlearn 2017
Apr 6 – Apr 8 all-day

Annonce en lien avec l’Action/le Réseau : … / …

Thème :

Statistical Learning

Présentation :

The workshop Statlearn is a premier event held every year, which focuses on current and upcoming trends in Statistical Learning. Statlearn’17, the 8th edition of the workshop, will be held in Lyon on April, 6-7 2016. Statlearn’17 is a conference of the French Society of Statistics (SFdS). The workshop will be preceded by a 1-day spring school (tutorials).

Du : 2017-04-06

Au : 2017-04-07

Lieu : Université de Lyon 2

Site Web : http://statlearn.sfds.asso.fr

Apr
27
Thu
2017
Workshop on Environmental Acoustic Data Mining
Apr 27 – Apr 28 all-day

Annonce en lien avec l’Action/le Réseau : EADM /

Thème :

Environmental Acoustic Data Mining

Présentation :

Learning Dense Environmental Acoustic Representations
[LeDEAR], a workshop joint to ICLR, 27th April 2017 Toulon

Bioacoustic signaling is a primary mode of communication and exploration for most ot the animals. It enables quick load and hudge transfer of informations. This LeDEAR workshop aims to show the needs and to discuss the challenges to represent and extract this information from massive bioacoustic recordings. It is organized by the GDR CNRS EADM MADICS and is joint to the Int. Conference on Learning Representation. It will welcome attendees from Phd students to Ing., National Park managers or environmental data scientists.

TOPICS (NOT EXH.): LEARNING OPTIMAL BIOACOUSTIC REPRESENTATIONS, BIOSONAR, SCATTERING FOR BIOACOUSTICS, UNSUPERVISED BIOACOUSTICS, LARGE SCALE BIOACOUSTIC CLASSIFICATION, BIG BIOACOUSTIC DATA MINING, UNDERSEA BIOACOUSTICS, FOREST MONITORING, JOINT METADATA AND BIOACOUSTICS FOR BIODIVERSITY MANAGEMENT.

Org. Committee : Glotin, Precioso (pres), Roger, contact : frederic.precioso at unice.fr

Prog. Committee : Glotin (pres), Precioso, Joly, Paris, Giraudet, Gies, Arlotto, Roger, Balestriero.

Du : 2017-04-27

Au : 2017-04-27

Lieu : Université de Toulon
Campus Porte d’Italie
70 Avenue Roger Devoucoux
83000 TOULON

www.univ-tln.fr/

Site Web : http://sabiod.univ-tln.fr/EADM/

Inscrivez-vous maintenant !

May
3
Wed
2017
Journées MaDICS-ADOC
May 3 – May 5 all-day

Annonce en lien avec l’Action/le Réseau : ADOC /

Thème :

Analyse de données textuelles

Présentation :

L’action ADOC vise à mettre en relation des scientifiques en sciences humaines et sociales et en informatique, autour de la notion de gestion et d’analyse de documents. Dans ce cadre, nous organisons en conjonction avec la conférence EDA 2017 des journées consacrées à l’analyse de données textuelles.

Du : 2017-05-03

Au : 2017-05-05

Lieu : Lyon, Campus Porte des Alpes

Site Web : https://eric.univ-lyon2.fr/adoc/#texte@eda

Inscrivez-vous maintenant !

May
9
Tue
2017
SFPT‐GH 2017 — 5 ème Colloque du Groupe Hyperspectral de la Société Française de Photogrammétrie et de Télédétection
May 9 – May 12 all-day

Annonce en lien avec l’Action/le Réseau : ImHyp /

Thème :

Colloque du Groupe Hyperspectral de la Société Française de Photogrammétrie et de Télédétection

Présentation :

Le Groupe Hyperspectral de la Société Française de Photogrammétrie et de Télédétection (SFPT‐GH) a pour but de fédérer la communauté hyperspectrale française, d’assurer sa visibilité sur le plan international et de faciliter les échanges scientifiques. Les précédentes éditions organisées par le groupe ont réuni plus de 80 participants.

Du : 2017-05-09

Au : 2017-05-11

Lieu : Ifremer Centre de Brest

Site Web : http://www.sfpt.fr/hyperspectral/?page_id=1400

Jun
1
Thu
2017
Reprohackathon
Jun 1 – Jun 2 all-day

Annonce en lien avec l’Action/le Réseau : ReProVirtuFlow /

Thème :

Reproductibilité d’analyse de données

Présentation :

Dans le cadre de l’action Reprovirtuflow, nous lançons l’organisation d’une série de ReproHackathons visant à tester les capacités des systèmes de workflows disponibles à reproduire une expérience scientifique. Chaque ReproHackathon fournira aux participants :
(i) un accès au Cloud de l’Institut Francais de Bioinformatique, (ii) des cas d’utilisation fixés issus de publications scientifiques, (iii) pour chaque cas d’utilisation (un pipeline d’analyse et un jeu de données d’entrée), le défi sera de reproduire les résultats de la publication choisie.

Du : 2017-06-01

Au : 2017-06-02

Lieu : Gif-sur-yvette

Site Web : https://ifb-elixirfr.github.io/ReproHackathon/

Inscrivez-vous maintenant !

Jun
2
Fri
2017
Loyauté des traitements et décisions algorithmiques
Jun 2 – Jun 3 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

machine learning, éthique numérique

Présentation :

Datafication du quotidien, gouvernementalité algorithmique… autant de mots clefs qui suscitent enthousiasmes ou craintes quant aux conséquences économiques, politiques, sociales. En parallèle, le gouvernement à récemment promulgué la loi « République Numérique » tandis que l’Europe a publié en avril 2016 un nouveau règlement « relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données« ; règlement qui entrera en vigueur en mai 2018.
Dans ce cadre, la CNIL est chargée de conduire une réflexion sur les enjeux éthiques soulevés par l’évolution des technologies numériques et a ouvert un débat public sur Éthique et Numérique.

Pour répondre à cette demande, à la frontière des textes de loi et compte tenu de leurs difficultés de mise en application, nous (enseignants chercheurs) devons nous interroger sur les implications éthiques de l’utilisation des méthodes et algorithmes que nous contribuons à développer ou auxquels nous formons les étudiants. Comment s’assurer de la loyauté d’un algorithme vis à vis de citoyens ou consommateurs ? A priori par construction ou a postériori par contrôle? Sont des questions déjà abordés dans la littérature, notamment à propos des problèmes d’entrave à la concurrence (algorithme de pricing), de biais discriminatoire et compréhension des décisions algorithmiques lorsqu’une personne physique est impliquée. Ce sont aussi des problèmes de recherche ouverts et pour lesquels des réponses sont attendues au risque d’une rejet massif, par le public, de ces nouvelles technologies.

Du : 2017-06-02

Au : 2017-06-02

Lieu : INSA Toulouse

Site Web : https://perso.math.univ-toulouse.fr/aoc/workshop-fairness-in-algorithmic-decisions/

Jun
7
Wed
2017
SBDS 2017 : Research Summer School in Statistics & BigData Science
Jun 7 – Jun 10 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Apprentissage statistique

Présentation :

The Research Summer School in Statistics & BigData Science (SBDS) is at the interface of several disciplines: statistics, computer science (machine learning), signal processing, neurosciences. It will involve, during 3 days, for an audience of researchers, PhD students and engineers, a dozen of international scientists presenting their expertise and contributions in modern statistics and data science problems with a focus on large-scale/high-dimensional scenarios.

The objectives are to:

– analyze the latest theoretical advances in modeling and practical considerations regarding statistical learning, classification, representation, of large-scale raw data,

– highlight for students, scientists and practitioners the major scientific issues necessary for the development of such models and on the related practical and computational problems.

PhD Students’ contributions:

PhD students’ contributions are possible and we kindly invite interested people to submit their contributions. The accepted ones will be presented during the school according to the schedule of the school : http://math.unicaen.fr/~chamroukhi/SBDS2017/programme.html

Du : 2017-06-07

Au : 2017-06-09

Lieu : Université de Caen-Normandie, Caen.

Site Web : http://math.unicaen.fr/~chamroukhi/SBDS2017/

Jun
8
Thu
2017
Journées Visu 2017
Jun 8 – Jun 9 all-day

Annonce en lien avec l’Action/le Réseau : / Innovation

Thème :

Visualisation

Présentation :

Ces journées ont vocation à rassembler les acteurs, académiques et industriels, de la communauté française en visualisation, afin d’échanger sur les problématiques et les enjeux actuels et à venir de la visualisation en France. Ces journées couvrent en particulier les problématiques de la visualisation scientifique (SciVis) et de la visualisation d’informations (InfoVis).

Du : 2017-06-08

Au : 2017-06-08

Lieu : IFPEN Paris

Site Web : http://visu2017.liris.cnrs.fr/

Jun
19
Mon
2017
8e Atelier sur la Protection de la Vie Privée
Jun 19 – Jun 22 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Protection de la Vie Privée

Présentation :

Le but principal de l’atelier est de rassembler les chercheurs de la communauté francophone dont les travaux portent sur la protection de la vie privée et des données personnelles, et de leur offrir un forum privilégié pour pouvoir présenter et échanger leurs idées sur cette thématique. L’atelier est pluri-disciplinaire, et a vocation à rassembler notamment des chercheurs en informatique, droit, économie, sociologie et statistiques.
Nous envisageons de lancer après l’atelier une action MADICS plus spécifiquement focalisée sur les problématiques de vie privée dans les données massives. Les personnes intéressées par participer sont invitées à soumettre un court document pour présenter leur problématique.

Du : 2017-06-19

Au : 2017-06-21

Lieu : Autrans

Site Web : https://apvp2017.sciencesconf.org/

Summer school on
Jun 19 – Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : / Groupe Sigma de la SMAI

Thème :

High-Dimensional Data Analysis

Présentation :

The SMF (French Mathematical Society) and the Institut Henri Poincaré organize a mathematical summer school on “Structured Regularization for High-Dimensional Data Analysis”. This summer school will be the opportunity to bring together students, researchers and people working on High-Dimensional Data Analysis around three courses and four talks on new methods in structured regularization. The mathematical foundations of this event will lie between probability, statistics, optimization, image and signal processing.

Organizers:
* Yohann De Castro (Paris-Sud)
* Guillaume Lecué (CNRS and ENSAE)
* Gabriel Peyré (CNRS and ENS)

Du : 2017-06-19

Au : 2017-06-22

Lieu : Institut Henri Poincaré

Site Web : https://regularize-in-paris.github.io/

Jun
22
Thu
2017
Journées Science des Données MaDICS 2017 – 22 juin @ Ecole de Management, Marseille
Jun 22 all-day

Journées Science des Données MaDICS 2017

Data Science Innovatives Days, Jeudi 22 juin – Vendredi 23 juin


Programme du jeudi 22 juin 2017  – Auditorium EMD   

Liste des inscrits (Direction seulement)

9:15 Café – Accueil
9:45 Ouverture des journées
10:00 Data challenges with modularization and code submission – Lessons learned
Balazs Kegl, DR2 CNRS, University Paris Saclay

Motivated by the shortcomings of traditional data challenges, we have developed a unique concept and platform, called Rapid Analytics and Model Prototyping (RAMP) , based on modularization and code submission. Open code submission allows participants to build on each other’s ideas , provides the organizers with a fully functioning prototype , and makes it possible to build complex machine learning workflows while keeping the contributions simple. We will start this presentation by describing the context and motivation, the guiding design principles , and some of the technical details (front and backend) of the platform. We will then walk you through some of the most interesting workflows and applications (e.g., anomaly detection in particle physics detectors, classifying molecular spectra for safe drug administration, spatio-temporal time series prediction in climate science). In the last third of the talk we will present a preliminary analysis of the RAMPs that touches on both the technical (machine learning) aspects of the tool and on the sociology of crowdsourcing data analytics.

11:00 Les recherches en masses de Données Bioacoustiques sous l’impulsion de l’Action EADM
Hervé Glotin, Université de Toulon

Les masses de données bioacoustiques permettent d’investiguer de nouveaux champs de recherche sur de nombreux écosystèmes. Nous présentons deux exemples qui ont bénéficié de l’impulsion de MaDICS.
Le premier champ de recherche a consisté à optimiser des modèles de traitement de longues séries stéréophoniques pour améliorer les connaissances sur Physeter macrocephalus (cachalot) dont le comportement est très peu connu, et engendrant un risque de collision avec un trafic maritime de plus en plus intense. Le projet Bombyx ( http://glotin.univ-tln.fr/BOMBYX ) au large du Parc de Port-Cros a résulté sous l’impulsion de l’hackathon MaDICS EADM 2016 en des suivis 2D du cachalot sur des mois d’enregistrement (2 To de données stéréo). Les connaissances inédites extraites de cette masse de donnée portent sur le nombre, direction, et sens des passages, comportements sur des km3 de cette espèce méconnue.
Le second champ de recherche traite de la classification de 1500 espèces d’oiseaux dans le cadre du challenge LifeClef Bird 2017, INRIA Zenith et SABIOD, soutenu par MaDICS EADM. Nous présentons le modèle de classification état de l’art de cette tâche de classification de très grande diversité, conçu par le LSIS. Nous avons transposer le modèle de classification d’image large échelle de Google (Inception deep learning) dans le cadre de la classification d’images spectrales de vocalises d’oiseaux. Nous montrons comment nous avons rapidement adapté le modèle au domaine bioacoustique, et caractérisons les performances dépassant les autres propositions d’équipes internationales, dont certaines reposaient aussi sur une approche deep learning.

11:30 Machine Learning, Analyse statistique en partenariat industriel au sein de l’Action ATLAS
Charlotte Laclau, Laboratoire LIG Grenoble
Le but de l’exposé sera de présenter deux partenariats autour du machine learning et de l’analyse statistique, nés au sein de l’Action ATLAS et faisant à chaque fois intervenir des équipes académiques et des industriels. On expliquera à chaque fois le contexte, les outils mis et jeu et les différentes applications qui ont pu être développées ou en perspective.
12:00 La recherche partenariale et la valorisation
Mathilde Mougeot, Chargée de mission valorisation, INSMI
12:30 Déjeuner
14:00 News MaDICS
Christine Collet, Gernoble INP, Direction MaDICS, INS2i
Echanges avec le CNRS
Adeline Nazarenko, Directrice Adjointe Scientifique INS2i
14:30 Scientific workflows and companion tools for reproducibility in bioinformatics: status, opportunities and first lessons learnt
Sarah Cohen Boulakia, Université Paris-Saclay

With the development of new experimental technologies, an avalanche of data has to be computationally analyzed for scientific advancements and discoveries to emerge. Faced with the complexity of analysis pipelines, the large number of computational tools, and the enormous amount of data to manage, there is compelling evidence that many (if not most) scientific discoveries will not stand the test of time: increasing the reproducibility of computed results is of paramount importance.
The objective we set out in this work is to place scientific workflows in the context of reproducibility: We define several levels of reproducibility; we characterize and define the criteria that need to be catered for by reproducibility-friendly scientific workflow systems; we use such criteria to place several representative and widely used workflow systems and companion tools within such a framework; we discuss the remaining challenges posed by reproducible scientific workflows in the life sciences.
Our study was guided by three use cases from the French community, involving in silico experiments. ReproHackathons have followed, providing even more concrete feedback in the ability of the current systems to run reproducible experiments.

15:00 Pitch des posters et démonstrations
Vincent Claveau, Appel à Posters et démonstrations
16:00 Pause
16:30 Gouvernance des masses de données, Questions éthiques et juridiques
Danièle Bourcier, DR CNRS, Commission d’éthique du numérique (Alliance ALLISTENe)

Les problématiques juridiques soulevées par les Big data apportent de nouveaux enjeux pour ce qui en est du respect de la vie privée et de la protection des données personnelles. En effet, les Big data ne se réfèrent pas uniquement aux données (implicitement ou explicitement) communiquées par les individus en question, mais aussi aux données produites ou inférées par les opérateurs en ligne, grâce à des algorithmes de plus en plus sophistiqués.
Mais les enjeux du Big data s’étendent bien au-delà des problématiques liées à la vie privée. En vue des nouvelles techniques de profilage sur Internet, les Big data entrainent aussi une perte potentielle d’autonomie de la part des internautes qui se voient de plus en plus assujettis aux décisions prises par des algorithmes, qui vont déterminer la façon dont ils peuvent effectivement interagir avec une plateforme donnée, d’après la catégorie dans laquelle ils ont été classés. Une réflexiion éthique s’impose.
Nous verrons les questions de vie privée posées par les big data notamment dans le domaine de la santé et examinerons la dernière charte éthique élaborée sur l’Apprentissage machine élaboré par la CERNA.

17:30 Posters et Démonstrations
Daniel Aguiar da Silva Carvalho
Maxence Ahlouche
E. Claeys
Ugo Comignani
Clément Dalloux
Youssef Hmamouche
Lynda Khiali
Abdoul Macina
François Meunier
Rim Shayakhmetov
18:30 Apéritif dinatoire et Networking
Jun
23
Fri
2017
1ère journée RoD
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : RoD / Action MaDICS

Thème :

Raisonner sur les données

Présentation :

Cette première journée RoD a pour objectif d’identifier les équipes intéressées, de faire interagir les équipes et de faire émerger des problématiques d’intérêt commun au travers de différentes présentations.

Du : 2017-06-23

Au : 2017-06-23

Lieu : Ecole de Management de Marseille

Site Web : http://www.lirmm.fr/rod

Programme préliminaire (10h-16h)

Matinée

  • présentation de Rod (Marie-Laure Mugnier, Marie-Christine Rousset)
  • Ontology-Mediated Query Answering and Heterogeneous Data (Federico Ulliana, LIRMM / Inria, Université de Montpellier)
  • SIDES 3.0, une plate-forme sémantique centrée utilisateurs pour la formation en Santé (Fabrice Jouanot, LIG, Université Grenoble Alpes)
  • YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames (Thomas Rebele, LTCI, Telecom ParisTech)

Après-midi

Présentation des équipes