Présentation Générale

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS  


Jun
19
Mon
2017
8e Atelier sur la Protection de la Vie Privée
Jun 19 – Jun 22 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Protection de la Vie Privée

Présentation :

Le but principal de l’atelier est de rassembler les chercheurs de la communauté francophone dont les travaux portent sur la protection de la vie privée et des données personnelles, et de leur offrir un forum privilégié pour pouvoir présenter et échanger leurs idées sur cette thématique. L’atelier est pluri-disciplinaire, et a vocation à rassembler notamment des chercheurs en informatique, droit, économie, sociologie et statistiques.
Nous envisageons de lancer après l’atelier une action MADICS plus spécifiquement focalisée sur les problématiques de vie privée dans les données massives. Les personnes intéressées par participer sont invitées à soumettre un court document pour présenter leur problématique.

Du : 2017-06-19

Au : 2017-06-21

Lieu : Autrans

Site Web : https://apvp2017.sciencesconf.org/

Summer school on
Jun 19 – Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : / Groupe Sigma de la SMAI

Thème :

High-Dimensional Data Analysis

Présentation :

The SMF (French Mathematical Society) and the Institut Henri Poincaré organize a mathematical summer school on “Structured Regularization for High-Dimensional Data Analysis”. This summer school will be the opportunity to bring together students, researchers and people working on High-Dimensional Data Analysis around three courses and four talks on new methods in structured regularization. The mathematical foundations of this event will lie between probability, statistics, optimization, image and signal processing.

Organizers:
* Yohann De Castro (Paris-Sud)
* Guillaume Lecué (CNRS and ENSAE)
* Gabriel Peyré (CNRS and ENS)

Du : 2017-06-19

Au : 2017-06-22

Lieu : Institut Henri Poincaré

Site Web : https://regularize-in-paris.github.io/

Jun
22
Thu
2017
Journées Science des Données MaDICS 2017 – 22 juin @ Ecole de Management, Marseille
Jun 22 all-day

Journées Science des Données MaDICS 2017

Data Science Innovatives Days, Jeudi 22 juin – Vendredi 23 juin


Programme du jeudi 22 juin 2017  – Auditorium EMD   

Liste des inscrits (Direction seulement)

9:15 Café – Accueil
9:45 Ouverture des journées
10:00 Data challenges with modularization and code submission – Lessons learned
Balazs Kegl, DR2 CNRS, University Paris Saclay

Motivated by the shortcomings of traditional data challenges, we have developed a unique concept and platform, called Rapid Analytics and Model Prototyping (RAMP) , based on modularization and code submission. Open code submission allows participants to build on each other’s ideas , provides the organizers with a fully functioning prototype , and makes it possible to build complex machine learning workflows while keeping the contributions simple. We will start this presentation by describing the context and motivation, the guiding design principles , and some of the technical details (front and backend) of the platform. We will then walk you through some of the most interesting workflows and applications (e.g., anomaly detection in particle physics detectors, classifying molecular spectra for safe drug administration, spatio-temporal time series prediction in climate science). In the last third of the talk we will present a preliminary analysis of the RAMPs that touches on both the technical (machine learning) aspects of the tool and on the sociology of crowdsourcing data analytics.

11:00 Les recherches en masses de Données Bioacoustiques sous l’impulsion de l’Action EADM
Hervé Glotin, Université de Toulon

Les masses de données bioacoustiques permettent d’investiguer de nouveaux champs de recherche sur de nombreux écosystèmes. Nous présentons deux exemples qui ont bénéficié de l’impulsion de MaDICS.
Le premier champ de recherche a consisté à optimiser des modèles de traitement de longues séries stéréophoniques pour améliorer les connaissances sur Physeter macrocephalus (cachalot) dont le comportement est très peu connu, et engendrant un risque de collision avec un trafic maritime de plus en plus intense. Le projet Bombyx ( http://glotin.univ-tln.fr/BOMBYX ) au large du Parc de Port-Cros a résulté sous l’impulsion de l’hackathon MaDICS EADM 2016 en des suivis 2D du cachalot sur des mois d’enregistrement (2 To de données stéréo). Les connaissances inédites extraites de cette masse de donnée portent sur le nombre, direction, et sens des passages, comportements sur des km3 de cette espèce méconnue.
Le second champ de recherche traite de la classification de 1500 espèces d’oiseaux dans le cadre du challenge LifeClef Bird 2017, INRIA Zenith et SABIOD, soutenu par MaDICS EADM. Nous présentons le modèle de classification état de l’art de cette tâche de classification de très grande diversité, conçu par le LSIS. Nous avons transposer le modèle de classification d’image large échelle de Google (Inception deep learning) dans le cadre de la classification d’images spectrales de vocalises d’oiseaux. Nous montrons comment nous avons rapidement adapté le modèle au domaine bioacoustique, et caractérisons les performances dépassant les autres propositions d’équipes internationales, dont certaines reposaient aussi sur une approche deep learning.

11:30 Machine Learning, Analyse statistique en partenariat industriel au sein de l’Action ATLAS
Charlotte Laclau, Laboratoire LIG Grenoble
Le but de l’exposé sera de présenter deux partenariats autour du machine learning et de l’analyse statistique, nés au sein de l’Action ATLAS et faisant à chaque fois intervenir des équipes académiques et des industriels. On expliquera à chaque fois le contexte, les outils mis et jeu et les différentes applications qui ont pu être développées ou en perspective.
12:00 La recherche partenariale et la valorisation
Mathilde Mougeot, Chargée de mission valorisation, INSMI
12:30 Déjeuner
14:00 News MaDICS
Christine Collet, Gernoble INP, Direction MaDICS, INS2i
Echanges avec le CNRS
Adeline Nazarenko, Directrice Adjointe Scientifique INS2i
14:30 Scientific workflows and companion tools for reproducibility in bioinformatics: status, opportunities and first lessons learnt
Sarah Cohen Boulakia, Université Paris-Saclay

With the development of new experimental technologies, an avalanche of data has to be computationally analyzed for scientific advancements and discoveries to emerge. Faced with the complexity of analysis pipelines, the large number of computational tools, and the enormous amount of data to manage, there is compelling evidence that many (if not most) scientific discoveries will not stand the test of time: increasing the reproducibility of computed results is of paramount importance.
The objective we set out in this work is to place scientific workflows in the context of reproducibility: We define several levels of reproducibility; we characterize and define the criteria that need to be catered for by reproducibility-friendly scientific workflow systems; we use such criteria to place several representative and widely used workflow systems and companion tools within such a framework; we discuss the remaining challenges posed by reproducible scientific workflows in the life sciences.
Our study was guided by three use cases from the French community, involving in silico experiments. ReproHackathons have followed, providing even more concrete feedback in the ability of the current systems to run reproducible experiments.

15:00 Pitch des posters et démonstrations
Vincent Claveau, Appel à Posters et démonstrations
16:00 Pause
16:30 Gouvernance des masses de données, Questions éthiques et juridiques
Danièle Bourcier, DR CNRS, Commission d’éthique du numérique (Alliance ALLISTENe)

Les problématiques juridiques soulevées par les Big data apportent de nouveaux enjeux pour ce qui en est du respect de la vie privée et de la protection des données personnelles. En effet, les Big data ne se réfèrent pas uniquement aux données (implicitement ou explicitement) communiquées par les individus en question, mais aussi aux données produites ou inférées par les opérateurs en ligne, grâce à des algorithmes de plus en plus sophistiqués.
Mais les enjeux du Big data s’étendent bien au-delà des problématiques liées à la vie privée. En vue des nouvelles techniques de profilage sur Internet, les Big data entrainent aussi une perte potentielle d’autonomie de la part des internautes qui se voient de plus en plus assujettis aux décisions prises par des algorithmes, qui vont déterminer la façon dont ils peuvent effectivement interagir avec une plateforme donnée, d’après la catégorie dans laquelle ils ont été classés. Une réflexiion éthique s’impose.
Nous verrons les questions de vie privée posées par les big data notamment dans le domaine de la santé et examinerons la dernière charte éthique élaborée sur l’Apprentissage machine élaboré par la CERNA.

17:30 Posters et Démonstrations
Daniel Aguiar da Silva Carvalho
Maxence Ahlouche
E. Claeys
Ugo Comignani
Clément Dalloux
Youssef Hmamouche
Lynda Khiali
Abdoul Macina
François Meunier
Rim Shayakhmetov
18:30 Apéritif dinatoire et Networking
Jun
23
Fri
2017
1ère journée RoD
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : RoD / Action MaDICS

Thème :

Raisonner sur les données

Présentation :

Cette première journée RoD a pour objectif d’identifier les équipes intéressées, de faire interagir les équipes et de faire émerger des problématiques d’intérêt commun au travers de différentes présentations.

Du : 2017-06-23

Au : 2017-06-23

Lieu : Ecole de Management de Marseille

Site Web : http://www.lirmm.fr/rod

Programme préliminaire (10h-16h)

Matinée

  • présentation de Rod (Marie-Laure Mugnier, Marie-Christine Rousset)
  • Ontology-Mediated Query Answering and Heterogeneous Data (Federico Ulliana, LIRMM / Inria, Université de Montpellier)
  • SIDES 3.0, une plate-forme sémantique centrée utilisateurs pour la formation en Santé (Fabrice Jouanot, LIG, Université Grenoble Alpes)
  • YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames (Thomas Rebele, LTCI, Telecom ParisTech)

Après-midi

Présentation des équipes

Activité GRAMINEES/PREDON
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : GRAMINEES/PREDON

Thème :

Réutilisation de données Hétérogènes pour la Fouille de Graphes

Présentation :
Dans le domaine de l’écologie et de la biodiversité, l’augmentation des fréquences d’acquisition de données a abouti à une accumulation considérable de données hétérogènes et dispersées qu’il est nécessaire d’organiser, documenter et trier pour les exploiter à des fins de recherche et d’appui opérationnel à l’expertise. Les graphes sont un des axes phares de développement de nouvelles approches, d’analyses intégratives et de la représentation des données complexes pour la recherche en écologie et environnement. La démarche initiée par le consortium IndexMEED consiste à créer un cercle vertueux sur tout le cycle de vie des données pour obtenir des résultats visuels et des scénarios analysables sous forme de graphes, et permettre à différentes communautés de parcourir les liens entre les données et de formuler de nouvelles hypothèses, de combiner des objets et d’explorer leurs relations statistiques.

Objectifs :
Dans le cadre des animations soutenues par le GdR MADICS, l’Action GRAMINEES, assisté de membres de PREDON organise un atelier qui vise à :
1/ Développer la dynamique d’échange entre des experts en écologie/biodiversité et des experts du domaine des STIC concernant la fouille de graphes ; (GRAMINEES)
2/ Réaliser une première version de carte des compétences de laboratoires qui pourront apporter des outils méthodologiques ou des techniques algorithmiques adéquates pour l’analyse des données sur la biodiversité et l’environnement. (GRAMINEES)
3/ Identifier les verrous concernant la préservation et la ré-utilisabilité des données multisources en environnement et définir les compétences permettant de lever ces verrous (PREDON)

Du : 2017-06-23
Au : 2017-05-23

Lieu : Marseille

Site Web : https://indexmeed2017.sciencesconf.org/resource/page/id/14

Programme

Matinée
Présentations de 10h à 12h30 (30 minutes de présentation et 20 minutes d’échanges).

  • 10h15-10h50 : Bibliothèque de fouille de graphe (Luc HOGIE, I3S(CNRS-UNS) Inria)
  • 10h50-11h10 : GDR Ecostat (Romain DAVID, IMBE, INEE)
  • 11h10-11h35 : Preservation des données scientifiques (Cristinel Diaconu, CPPM Marseille)
  • 11h35-12h00 : Cloud collaboratif pour l’imagerie medicale, semantique et protection des donnees (Mehdi BENTOUNSI, Lipade, Paris Descartes)
  • 12h00-12h30 : Sémantique et thésaurus (Dominique VACHEZ et/ou Romain DAVID)

Après-midi

  • 14h00-16h00 Animation sur les réseaux de compétences nécessaires à la réutilisation de données Hétérogènes pour la Fouille de Graphes
    • 14h00-15h00 : Présentation d’un projet d’organigramme et schémas fonctionnel autour des compétences, dans le cadre des différents instituts (outils : Google Doc et un outil de mind-mapping)
      Introduction avec Panorama et liens de GRAMINEES avec les autres actions de IndexMeed
      Elaboration d’une fresque compétences et noms de personnes en France et partenaires étrangers possibles
    • 15h00-15h30 : Graphe des compétences et acteurs dans le cadre de GRAMINEES basé sur des mots clefs
      Méthodologie des choix de mots clefs
      Propositions de fiches action
      Rendu sous forme de graphe
  • 15h30-16h00 : Discussions et clôture de l’atelier (PREDON + GRAMINEES)
Atelier Données Massives et Santé Numérique
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : Atelier MaDICS

Thème :

Données massives et santé numérique

Présentation :

L’atelier “Données massives et santé numérique” a pour objectif de présenter des travaux de recherche faisant intervenir des données massives dans le domaine de la santé numérique. Les exposés s’adresseront à la fois à un public d’informaticiens et de mathématiciens.

Du : 2017-06-23

Au : 2017-06-23

Lieu : Marseille

Site Web : http://www.madics.fr/

Programme:

  • 10:00-10:10 : Données massives et Santé Numérique, introduction, Mathilde Mougeot, Université Paris-Diderot.
  • 10:10-10:45 : Arbres de décisions binaires non supervisés: applications en santé publique, Pierre MICHEL, CNRS/ Université Aix-Marseille.
  • 10:45-11:20 : Towards neuroimaging big data: understanding inter-individual variability, Sylvain TAKERKART, NRS/ Université Aix-Marseille.
  • 11:20-11:55 : Apprentissage de l’échelle optimale d’analyse dans les études d’association pangénomique, Christophe AMBROISE, Université D’Evry & Agro Paris Tech.
  • 11:55-12:30 : Medical data: from big to meaningful, Stéphanie ALLASSONIERE, Université Paris Descartes & Ecole Polytechnique.
  • 14:00-14:35 : Étude de l’équilibre statique et la qualité de marche : avances sur le programme 5p, Juan MANTILLA, Centre de Mathématiques et de Leurs Applications.
  • 14:30-15:10 : Big Data en santé avec le Caisse Nationale d’Assurance Maladie, Stéphane GAIFFAS, Agathe GUILLOUX, Ecole Polytechnique, Université d’Evry.
  • 15:10-15:45 : Big data et apprentissage profond en santé publique, Badih GHATTAS, Université Aix-Marseille.
  • 15:45-16:00 : Données massives et Santé Numérique. Conclusion de la journée, les axes de recherche, M. Mougeot
Blockfest 1.3
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : Atelier MaDICS

Thème : Technologie de stockage et de transmission d’informations Blockchain

Technologie de stockage et de transmission d’informations Blockchain

Présentation :

Cet Atelier a pour objectif de connecter l’écosystème de la recherche avec les réflexions actuelles de l’industrie sur la Blockchain. Il s’agit d’un événement biface qui s’adressera aux explorateurs débutants et aux personnes ayant déjà un projet grâce à un programme pensé par des experts en facilitation et en blockchain.
Il est la troisième édition de la série des blockfests …

Du : 2017-06-23

Au : 2017-06-23

Lieu : Ecole de Management de Marseille

Site Web :

Programme préliminaire (9h-16h30)

  • 9h – 10h Introduction à la Blockchain – conférence plénière (Jean-Luc Parouty, IR CNRS, Institut de Biologie Structurale)
  • 10h – 10h30 Présentation des cas d’usages soumis ou pas par les industriels
  • 11h – 12h00 Workshop technique d’introduction au développement de Smart Contract
    Répartition des équipes sur chacune des thématiques
  • 13h30 – 15h30 Les équipes travaillent sur leur cas d’usage et leur smart contract facilitation par les mentors Blockfest
  • 16h00 – 16h30 Court Pitch des équipes
  • 16h30 Conclusion et remerciements
Journée Indexation en lien avc ISIS Indexation et Recherche Image-Multimédia (IRIM)
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : Le GdR ISIS

Thème :

Indexation de grandes masses de données

Présentation :

La journée se déroulera en deux parties. Une première partie sera consacrée à une présentation de la campagne TRECVid (indexation et recherche dans les documents multimédia) et à un bilan sur la participation d’IRIM à celle-ci. Ceci inclura des présentations spécifiques associées aux travaux menés en commun dans le cadre de l’action IRIM. Une deuxième partie sera consacrée à des présentations faites par les membres des deux GDR ISIS et MaDICS, et peut-être par un ou deux orateurs invités, sur leurs travaux en indexation de grandes masses de données, y compris au-delà du multimédia. La journée se conclura par une discussion sur les possibilités de coopération entre les membres des deux communautés.

Du : 2017-06-23

Au : 2017-06-23

Lieu : Marseille

Site Web : http://www.madics.fr/event/journees-madics-2017-23-juin/

Journées Science des Données MaDICS 2017 – 23 juin @ Ecole de Management, Marseille
Jun 23 all-day

Journées Science des Données MaDICS 2017

Data Science Innovatives Days, Jeudi 22 juin – Vendredi 23 juin


Programme du vendredi 23 juin 2017

9h-10h Introduction à la Blockchain
Jean-Luc Parouty, IR CNRS, Institut de Biologie Structurale
Auditorium
9:45 Pause Café
10h-16h Actions MaDICS et Ateliers ; Déjeuner (12h30) ; Pause (16h)
Actions MaDICS

GRAMINEES : GRaph data Mining in Natural, Ecological and Environnemental Sciences
David Romain (IMBE,INEE), Dino Ienco (TETIS, IRSTEA)
Détails du programme
Vietnam
PREDON : Préservation des données scientifiques
Cristinel Diaconu (CPPM, IN2P3), Salima Benbernou (LIPADE Paris Descartes, INS2i)
Détails du programme
Vietnam
 MAESTRO : MAsses de données En aSTROnomie et astrophysique
Sofian Maabout (laBRI, INS2i), Christian Surace (LAM, INSU)
Détails du programme
Narbada
RoD : Raisonner sur les données (Reasoning on Data)
Marie-Laure Mugnier (LIRMM, INS2i), Marie-Christine Rousset (LIG, INS2i), Véronique Bellon (ITAP-UMR IRSTEA / SupAgro), Olivier Palombi (LADAF-CHU Grenoble-Alpes)
Détails du programme
Nepal
Ateliers

Masses de Données et santé
Mougeot Mathilde, Université Paris Diderot, INS2i
Détails du programme
Inde
QUALIMADOS: Qualité des masses de données scientifiques
Allel Hadjali (LIAS – ENSMA, Poitiers), Laure Berti-Equille (IRD, Montpellier), Angela Bonifati (LIRIS, INS2i)
Détails du programme (avec les présentations)
Gange
Indexation de grandes masses de données (en lien avec le GdR ISIS)
Georges Quénot (LIG, INS2i), Matthieu Cord (LIP6, INS2i), Jenny Benois-Pineau, Vincent Claveau (Irisa, INS2i)
Détails du programme
Japon
Blockfest 1.3
Sajida Zouarhi (Université Grenoble Alpes & Orange labs)
Nicolas Wagner, Mehdi Amari, Jérôme Gonzales

Détails du programme
Mékong

 

MADICS/PREDON Atelier sur la préservation des données
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : PREDON

Thème :

La préservation des données et l’intelligence artificielle

Présentation :

Il faut sauver les données scientifique, d’accord. Mais lequelles? Dans un contexte de “big data”, sauver veut nécéssairement dire “effacer, trier, néttoyer…” comment être sûr que l’on n’oublie pas…. euh…l’essentiel? Des exemples de données réduites en champs de ruines par l’inaccessibilité du code pullulent….Quels sont les paramètres des données qui doivent être poursuivis (fréquence d’accès, criticité dans les algorithmes, reliabilité, redondance, niveau d’absraction…) et comment faire pour éviter l’effet “si je le savais…”. Est-ce qu’on peut s’appuyer sur les algorithmes ou workflows issus de l’intelligence artificielle pour guider la préservation des données et des connaissances dans la recherche scientifique? Nous proposons un “brainstorming” autour de ce sujet. N’hésitez pas à proposer des interventions ou des thématiques adjacentes.

Du : 2017-06-23

Au : 2017-06-23

Lieu : Ecole de Management de Marseille, Rue Joseph Biaggi, Marseille

Site Web : https://indico.cern.ch/event/641755/

Programme

Voir sur cette page.

Maestro – 2017
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : MAESTRO

Thème :

Masse de données en Astrophysique

Présentation :

Dans le domaine de l’astronomie, l’évolution rapide des télescopes et autres instruments scientifiques ainsi que le recours intensif à la simulation informatique ont conduit, ces dernières années, à une production massive de données.

Dans le cadre des animations soutenues par le GdR MADICS, l’Action MAESTRO organise un atelier rassemblant des chercheurs, praticiens s’intéressant à la gestion des grandes masses de données en astrophysique. L’objectif de l’atelier est de faire échanger les différents participants sur les problématiques et/ou solutions envisagées afin de traiter efficacement les masses de données en jeu.

Nous sollicitons à cet effet des contributions pour des présentations sur les sujets suivants (liste non exhaustive).
* Retour d’expérience sur traitement de données en astrophysique
* Fouille interactive de grandes masses de données
* Optimisation de requêtes
* Parallélisme et données distribuées
* Analyse statistique et problèmes algorithmiques sous-jacents.
* Ontologies et données en astrophysique
* Intégration de données massives

Du : 2017-06-23

Au : 2017-06-23

Lieu : Ecole de Management Marseille

Montée de l’Université
Rue Joseph Biaggi – CS 70329
13331 Marseille Cedex 3

Site Web : https://maestro-2017.sciencesconf.org/

Programme :

  • Introduction :
    • 10:00 MAESTRO (présentation), C. Surace/S. Maabout
    • 10:10 Plateforme Galactica, F. Gaudet
    • 10:30 Evolution of Data Management Systems for Big Data Applications, A. Hameurlain
  • Données Astrophysiques :
    • 11:00 SKA, C. Ferrari
    • 11:30 LSST, E. Gangler
  • 12:00 Déjeuner
  • Machine Learning et Deep Learning
    • 13:30 Exploring the spectroscopic diversity of type Ia supernovae with DRACULA: a machine learning approach, E. Ishida
    • 13:45 Classification of reliability for redshift measurements, S. Jamal
    • 14:00 Clustering pour détection d’amas ouverts avec Gaia, M. Morvan
    • 14:15 Galaxy morphology with CNNs using transfer learning, A. Boucaud
  • Organisations :
    • 14:30 BIGSKYEARTH (présentation), E. Gangler/K. Zeitouni
    • 14:50 Cosmostatistics initiative : (https://asaip.psu.edu/organizations/iaa/iaa-working-group-of-cosmostatistics), E. Ishida
  • 15:10 Wrap up, sondage, conclusions

QUALIMADOS : Atelier Qualité des masses de données scientifiques
Jun 23 all-day

Annonce en lien avec l’Action/le Réseau : Atelier MaDICS

Thème : Qualité des masses de données scientifiques

Organisateurs :

  • Allel Hadjali (LIAS/ENSMA, Poitiers)
  • Laure Berti-Equille (IRD, Montpellier)
  • Angela Bonifati (LIRIS/CNRS, Lyon)

Présentation :
L’existence d’anomalies et d’impuretés dans les données, issues d’applications modernes du monde réel, est bien connue de nos jours. L’étude de la qualité des données reste donc un problème majeur car les données “impures ou impropres” peuvent conduire à des décisions incorrectes et à des analyses non fiables. Ce constat est particulièrement vrai dans le contexte des données scientifiques (issues de simulation en physique et en énergie, d’observations par satellites en astronomie et en astrophysique, de cartographie du génome, etc.). L’objectif de l’atelier “Qualité des masses de données scientifiques” est d’être un espace d’échanges entre chercheurs, experts et professionnels autour des nouveaux enjeux et défis liés à la qualité des données scientifiques dans l’ère du Big data.

L’Atelier sera également l’occasion de discuter et de réfléchir à la création d’une Action liée à la “qualité des masses de données” dans le GdR MaDICS.

Du : 2017-06-23

Au : 2017-06-23

Lieu : École de Management de Marseille, Marseille

Site Web : http://www.madics.fr/event/journees-madics-2017-23-juin/

Programme (10h15 – 16H)

  • 10h15 – 10h30 : Présentation de l’atelier et de ses objectifs (Allel Hadjali, LIAS/ENSMA, Poitiers)
  • 10h30 – 11h00 : Data Quality: where are we on the journey from theory to practice? (Angela Bonifati, LIRIS, Lyon)
  • 11h – 11h30 : Tour d’horizon des données scientifiques et des problématiques particulières liées à leur qualité (Laure Berti-Equille, IRD, Montpellier)
  • 11h30 – 12h15 : Gestion des annotations sémantiques en santé – Le projet ELISA (Cédric Pruski, ITIS, Luxembourg)
  • 14h – 14h45 : Prise en compte des données manquantes dans les modèles de mélanges :
    application aux séries temporelles d’images multispectrales (Serge Iovleff,Université de Lille)
  • 14h45 – 15h30 : Qualité dans l’entrepôt de données cliniques de l’HEGP (Bastien Rance, HEGP, Paris)
  • 15h30 – 16h : Discussions et clôture de l’atelier
Jun
26
Mon
2017
Big Data Mining and Visualization
Jun 26 – Jun 28 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Regards croisés sur les data

Présentation :

Les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est, d’une part, de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de gestion de données massives ainsi que par les concepts manipulés autour de ces données. D’autre part, l’objectif est d’animer et de dynamiser une communauté scientifique pluridisciplinaire. Pour ce faire, un appel à communications est donc lancé, et des personnes spécialistes de ces questions seront également invitées à présenter leurs travaux.
Pour cette nouvelle édition, un focus est fait sur des approches pluridisciplinaires (Informatique, Sciences de l’Information, Mathématiques, Sciences du langage, Géographie, Biologie, Droit, éthique, Histoire…) du phénomène des data dans leurs différentes acceptions (open data, big data, smart data…) et sur différents terrains (analyse prédictive, veille, politiques publiques, humanités numériques, e-science…).

Du : 2017-06-26

Au : 2017-06-27

Lieu : Université de Lille

Site Web : https://eric.univ-lyon2.fr/~gt-fdc/journees/objectifs/

Jul
1
Sat
2017
#DigitAg Challenge 2017
Jul 1 – Jul 3 all-day

Annonce en lien avec l’Action/le Réseau : / Innovation

Thème :

Hackathon : Imaginons des services numériques pour l’Agriculture de demain !

Présentation :

Les 1er et 2 Juillet, entreprises, start-ups, chercheurs, professionnels de l’agriculture, développeurs présélectionnés par six pôles de compétitivité agricoles du Club Sully se réuniront avec un objectif : inventer les services numériques de demain. Les enjeux : montrer l’impact positif de données ouvertes pour dynamiser l’innovation et préparer quelques applications qu’un futur portail de données à vocation agricole pourrait héberger.

Nous souhaitons valoriser les compétences techniques sur la gestion des données : mise à disposition d’outils issus de la recherche, coaching des équipes par des chercheurs et coéquipiers chercheurs. Si vous êtes intéressez, n’hésitez pas à nous contacter.

Du : 2017-07-01

Au : 2017-07-02

Lieu : Montpellier

Site Web : http://www.digitag-challenge.fr

Jul
2
Sun
2017
2017 EFITA CONGRESS
Jul 2 – Jul 7 all-day

Annonce en lien avec l’Action/le Réseau : / Innovation

Thème :

European conference dedicated to the future use of ICT in the agriculture and agri-food sector, bioresource and biomass sector

Présentation :

Montpellier, France, organizes this year the EFITA Congress. EFITA is the European conference dedicated to the future use of ICT in the agri-food sector, bioresource and biomass sector. It was launched and is supported by the European Federation for Information Technology in Agriculture, Food and the Environment (EFITA). EFITA happens every two year, and EFITA 2017 is the 11th edition. 150 participants are expected from around 30 countries.

Many initiatives such as invited workshops and sessions and internal meetings come together within EFITA conference to make Montpellier the place to go in July when it comes to ICT for agri-food, bioresource and biomass sectors. A Hackathon will happen the week-end before and a technical tour will conclude the conference. The schedule is organised to make the conference attractive to research teams and to companies.

Du : 2017-07-02

Au : 2017-07-06

Lieu : Montpellier, France.

Site Web : http://www.efita2017.org

Aug
28
Mon
2017
ECOLE THEMATIQUE Imagerie hyperspectrale:
Aug 28 – Sep 2 all-day

Annonce en lien avec l’Action/le Réseau : ImHyp / Formation

Thème :

Imagerie hyperspectrale

Présentation :

Les axes du programme se définissent donc autour de l’architecture présentée ci-dessus en proposant (1) des approfondissements sur certaines étapes comme les corrections radiométriques, les traitements de démélange et de classification.
(2) Les méthodes de fusion avec les données panchromatiques ou des données d’autres sources comme le LIDAR seront aussi présentées.
(3) des questionnements sur les applications et les produits utilisables par les acteurs de terrain. Une étude de cas sera proposée avec la préparation d’un survol et sa réalisation avec un drone, complétées par des relevés terrain (description et signatures spectrales) et la mise en forme de méta-données, puis des traitements et des discussions sur les résultats obtenus. Ceci permettra aux participants et notamment aux jeunes collègues d’envisager le déroulement complet d’une mission.

Du : 2017-08-28

Au : 2017-09-01

Lieu : Lieu: Aspet Le Village-Club “Le Bois Perché” http://www.vpt31.net/nos-etablissements/aspet-le-piemont-pyreneen/
Localisation : proximité de Toulouse
A 500 m d’altitude dans le piémont pyrénéen, au pied du massif du Cagire (2000 m) et à 35 km à peine de l’Espagne, le village-club du Bois Perché offre une vue panoramique sur le charmant village d’Aspet.

Site Web : https://hyep2017.sciencesconf.org/

Aug
29
Tue
2017
Séminaire de Lori Mann Bruce “Hyperspectral Image Analysis with Applications of UAVs for Precision Agriculture”
Aug 29 – Aug 30 all-day

Annonce en lien avec l’Action/le Réseau : ImHyp / Formation

Thème :

Hyperspectral Image Analysis with Applications of UAVs for Precision Agriculture

Présentation :

Lori Mann Bruce, Professeur à la Mississippi State University, Distinguished Lecturer de IEEE GRSS donnera une séminaire le Mardi 29 Aout 2017 à 14h30 à l’Amphi Prunet de l’ENSAT, Toulouse (pour s’y rendre: http://www.ensat.fr/fr/contacts.html).

Elle parlera de “Hyperspectral Image Analysis with Applications of UAVs for Precision Agriculture”. Le résumé de sa présentation est le suivant.

Hyperspectral sensors inherently acquire high dimensional optical data resulting from fine spectral sampling. In recent years, smaller, lighter, and more affordable hyperspectral sensors have been developed, allowing them to be utilized on a variety of platforms, including unmanned aerial vehicles (UAVs or drones). As a result, hyperspectral data are now more often high dimensional not only spectrally, but also spatially and temporally. This seminar will provide a broad overview of techniques commonly employed for analysis of high dimensional data (such as linear transform-based approaches and data partitioning methods) as well as more specialized techniques designed for hyperspectral imagery (spectral band grouping, multi-classifier and decision fusion, and game theory approaches). The seminar will also include examples of applying such methods to hyperspectral imagery for precision agriculture applications, including vegetative species mapping and vegetative stress characterization. Practical details will also be provided regarding the field campaigns and UAV image collection for these studies.

Du : 2017-08-29

Au : 2017-08-29

Lieu : Amphi Prunet de l’ENSAT, Toulouse

Site Web : http://www.grss-ieee.org/wp-content/uploads/2016/10/Lori_Mann_Bruce_5oct16.pdf

Sep
11
Mon
2017
Workshop on Decentralized Machine Learning, Optimization and Privacy
Sep 11 – Sep 13 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

science des données, apprentissage statistique, optimisation, systèmes et algorithmes distribués, préservation de la vie privée, données massivement distribuées

Présentation :

The workshop will focus on decentralized machine learning and related challenges regarding distributed systems, optimization and privacy. With the advent of personal devices with computation and storage capabilities, it becomes possible to run machine learning on-device to provide personalized services to users without exposing their sensitive data to large data centers. Such decentralized architectures allow individuals to better control their data and to reduce the infrastructure costs and risks for the service provider, which motivates the design of machine learning and optimization algorithms adapted to constraints arising from this new paradigm. Beyond standard parallel computing techniques, it requires efficient solutions to deal with settings involving a very large number of parties, limited control over the network dynamics, heterogeneous local data distributions and/or the absence of a central coordinating entity. Another challenge is to develop decentralized learning protocols which provably preserve privacy for each user and show some robustness against malicious parties.

The workshop will be devoted to the new challenges raised by decentralized machine learning, including:
– How to design efficient optimization algorithms (in terms of convergence rate, number of rounds, bandwidth, energy…) for the decentralized setting?
– How can users collaborate to learn useful models in a fully decentralized network where communication is peer-to-peer only?
– How to address privacy and security issues under various adversary models?

A major objective of the workshop is to initiate new fruitful collaborations between researchers in optimization, machine learning, privacy and distributed systems. Attendees are welcome to bring a poster to present their recent work at the poster session.

Du : 2017-09-11

Au : 2017-09-12

Lieu : INRIA Lille

Site Web : https://team.inria.fr/magnet/workshop-on-decentralized-machine-learning-optimization-and-privacy/

Oct
9
Mon
2017
School of Statistics for Astrophysics 2017: Bayesian Methodology
Oct 9 – Oct 14 all-day

Annonce en lien avec l’Action/le Réseau : MAESTRO /

Thème :

Astrostatistique

Présentation :

L’objectif de l’école est de donner les compétences nécessaires aux participants pour entreprendre par eux-mêmes des analyses de type bayésien qui deviennent de plus en plus répandues en astrophysique (cosmologie, exoplanètes…). Nous insistons également beaucoup sur l’importance d’établir des collaborations entre astrophysiciens et statisticiens pour des développements algorithmiques et méthodologiques souvent requis par la spécificité des données astrophysiques.

Du : 2017-10-09

Au : 2017-10-13

Lieu : L’ESCANDILLE VILLAGE VACANCES – Autrans (Vercors)

Site Web : https://stat4astro2017.sciencesconf.org/

Oct
10
Tue
2017
XLDB 2017
Oct 10 – Oct 13 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Extra Large Databases

Présentation :

XLDB (eXtremely Large DataBases, http://www.xldb.org) s’est affirmée au fil des années comme une conférence mondiale majeure autour des questions liées à la gestion et à l’analyse des très grandes masses de données. Depuis le premier atelier XLDB qui s’est tenu à SLAC en octobre 2007, cet évenement a pris une grande envergure en se transformant en une conférence internationale ouverte. Elle a lieu depuis ses débuts en Californie, soit à SLAC (National Accelerator Laboratory, Stanford), soit à l’Université de Stanford. Elle est complétée par des conférences satellites hors Etats-Unis.

La communauté XLDB, qui comprend aujourd’hui un millier d’universitaires et d’académiques, s’est fixée comme objectifs principaux de :

• Identifier les principaux verrous scientifiques liés à la thématique des très grandes bases de données,
• Identifier les tendances actuelles dans ce domaine,
• Combler le fossé qui sépare les utilisateurs qui tentent de créer et d’utiliser des bases de données et les fournissuers de technlogies permettant la gestion et l’analyse des données à très grande échelle
• Faciliter le développement de technologies pour la gestion des grandes masses de données.

L’originalité de la communauté XLDB est de regrouper à la fois des chercheurs qui s’intéressent à des questions ouvertes dans le domaine des très grandes bases de données et des industriels fournisseurs de technologies dans ce domaine mais également des scientifiques utilisateurs de telles bases de données.

Du : 2017-10-10

Au : 2017-10-12

Lieu : Clermont-Ferrand

Site Web : https://xldb2017.uca.fr