
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS
Annonce en lien avec l’Action/le Réseau : … / …
Thème :
Statistical Learning
Présentation :
The workshop Statlearn is a premier event held every year, which focuses on current and upcoming trends in Statistical Learning. Statlearn’17, the 8th edition of the workshop, will be held in Lyon on April, 6-7 2016. Statlearn’17 is a conference of the French Society of Statistics (SFdS). The workshop will be preceded by a 1-day spring school (tutorials).
Du : 2017-04-06
Au : 2017-04-07
Lieu : Université de Lyon 2
Site Web : http://statlearn.sfds.asso.fr
Annonce en lien avec l’Action/le Réseau : EADM /
Thème :
Environmental Acoustic Data Mining
Présentation :
Learning Dense Environmental Acoustic Representations
[LeDEAR], a workshop joint to ICLR, 27th April 2017 Toulon
Bioacoustic signaling is a primary mode of communication and exploration for most ot the animals. It enables quick load and hudge transfer of informations. This LeDEAR workshop aims to show the needs and to discuss the challenges to represent and extract this information from massive bioacoustic recordings. It is organized by the GDR CNRS EADM MADICS and is joint to the Int. Conference on Learning Representation. It will welcome attendees from Phd students to Ing., National Park managers or environmental data scientists.
TOPICS (NOT EXH.): LEARNING OPTIMAL BIOACOUSTIC REPRESENTATIONS, BIOSONAR, SCATTERING FOR BIOACOUSTICS, UNSUPERVISED BIOACOUSTICS, LARGE SCALE BIOACOUSTIC CLASSIFICATION, BIG BIOACOUSTIC DATA MINING, UNDERSEA BIOACOUSTICS, FOREST MONITORING, JOINT METADATA AND BIOACOUSTICS FOR BIODIVERSITY MANAGEMENT.
Org. Committee : Glotin, Precioso (pres), Roger, contact : frederic.precioso at unice.fr
Prog. Committee : Glotin (pres), Precioso, Joly, Paris, Giraudet, Gies, Arlotto, Roger, Balestriero.
Du : 2017-04-27
Au : 2017-04-27
Lieu : Université de Toulon
Campus Porte d’Italie
70 Avenue Roger Devoucoux
83000 TOULON
www.univ-tln.fr/
Site Web : http://sabiod.univ-tln.fr/EADM/
Annonce en lien avec l’Action/le Réseau : ADOC /
Thème :
Analyse de données textuelles
Présentation :
L’action ADOC vise à mettre en relation des scientifiques en sciences humaines et sociales et en informatique, autour de la notion de gestion et d’analyse de documents. Dans ce cadre, nous organisons en conjonction avec la conférence EDA 2017 des journées consacrées à l’analyse de données textuelles.
Du : 2017-05-03
Au : 2017-05-05
Lieu : Lyon, Campus Porte des Alpes
Site Web : https://eric.univ-lyon2.fr/adoc/#texte@eda
Annonce en lien avec l’Action/le Réseau : ImHyp /
Thème :
Colloque du Groupe Hyperspectral de la Société Française de Photogrammétrie et de Télédétection
Présentation :
Le Groupe Hyperspectral de la Société Française de Photogrammétrie et de Télédétection (SFPT‐GH) a pour but de fédérer la communauté hyperspectrale française, d’assurer sa visibilité sur le plan international et de faciliter les échanges scientifiques. Les précédentes éditions organisées par le groupe ont réuni plus de 80 participants.
Du : 2017-05-09
Au : 2017-05-11
Lieu : Ifremer Centre de Brest
Site Web : http://www.sfpt.fr/hyperspectral/?page_id=1400
Annonce en lien avec l’Action/le Réseau : ReProVirtuFlow /
Thème :
Reproductibilité d’analyse de données
Présentation :
Dans le cadre de l’action Reprovirtuflow, nous lançons l’organisation d’une série de ReproHackathons visant à tester les capacités des systèmes de workflows disponibles à reproduire une expérience scientifique. Chaque ReproHackathon fournira aux participants :
(i) un accès au Cloud de l’Institut Francais de Bioinformatique, (ii) des cas d’utilisation fixés issus de publications scientifiques, (iii) pour chaque cas d’utilisation (un pipeline d’analyse et un jeu de données d’entrée), le défi sera de reproduire les résultats de la publication choisie.
Du : 2017-06-01
Au : 2017-06-02
Lieu : Gif-sur-yvette
Site Web : https://ifb-elixirfr.github.io/ReproHackathon/
Annonce en lien avec l’Action/le Réseau : aucun
Thème :
machine learning, éthique numérique
Présentation :
Datafication du quotidien, gouvernementalité algorithmique… autant de mots clefs qui suscitent enthousiasmes ou craintes quant aux conséquences économiques, politiques, sociales. En parallèle, le gouvernement à récemment promulgué la loi « République Numérique » tandis que l’Europe a publié en avril 2016 un nouveau règlement « relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données« ; règlement qui entrera en vigueur en mai 2018.
Dans ce cadre, la CNIL est chargée de conduire une réflexion sur les enjeux éthiques soulevés par l’évolution des technologies numériques et a ouvert un débat public sur Éthique et Numérique.
Pour répondre à cette demande, à la frontière des textes de loi et compte tenu de leurs difficultés de mise en application, nous (enseignants chercheurs) devons nous interroger sur les implications éthiques de l’utilisation des méthodes et algorithmes que nous contribuons à développer ou auxquels nous formons les étudiants. Comment s’assurer de la loyauté d’un algorithme vis à vis de citoyens ou consommateurs ? A priori par construction ou a postériori par contrôle? Sont des questions déjà abordés dans la littérature, notamment à propos des problèmes d’entrave à la concurrence (algorithme de pricing), de biais discriminatoire et compréhension des décisions algorithmiques lorsqu’une personne physique est impliquée. Ce sont aussi des problèmes de recherche ouverts et pour lesquels des réponses sont attendues au risque d’une rejet massif, par le public, de ces nouvelles technologies.
Du : 2017-06-02
Au : 2017-06-02
Lieu : INSA Toulouse
Site Web : https://perso.math.univ-toulouse.fr/aoc/workshop-fairness-in-algorithmic-decisions/
Annonce en lien avec l’Action/le Réseau : aucun
Thème :
Apprentissage statistique
Présentation :
The Research Summer School in Statistics & BigData Science (SBDS) is at the interface of several disciplines: statistics, computer science (machine learning), signal processing, neurosciences. It will involve, during 3 days, for an audience of researchers, PhD students and engineers, a dozen of international scientists presenting their expertise and contributions in modern statistics and data science problems with a focus on large-scale/high-dimensional scenarios.
The objectives are to:
– analyze the latest theoretical advances in modeling and practical considerations regarding statistical learning, classification, representation, of large-scale raw data,
– highlight for students, scientists and practitioners the major scientific issues necessary for the development of such models and on the related practical and computational problems.
PhD Students’ contributions:
PhD students’ contributions are possible and we kindly invite interested people to submit their contributions. The accepted ones will be presented during the school according to the schedule of the school : http://math.unicaen.fr/~chamroukhi/SBDS2017/programme.html
Du : 2017-06-07
Au : 2017-06-09
Lieu : Université de Caen-Normandie, Caen.
Site Web : http://math.unicaen.fr/~chamroukhi/SBDS2017/
Annonce en lien avec l’Action/le Réseau : / Innovation
Thème :
Visualisation
Présentation :
Ces journées ont vocation à rassembler les acteurs, académiques et industriels, de la communauté française en visualisation, afin d’échanger sur les problématiques et les enjeux actuels et à venir de la visualisation en France. Ces journées couvrent en particulier les problématiques de la visualisation scientifique (SciVis) et de la visualisation d’informations (InfoVis).
Du : 2017-06-08
Au : 2017-06-08
Lieu : IFPEN Paris
Site Web : http://visu2017.liris.cnrs.fr/
Annonce en lien avec l’Action/le Réseau : aucun
Thème :
Protection de la Vie Privée
Présentation :
Le but principal de l’atelier est de rassembler les chercheurs de la communauté francophone dont les travaux portent sur la protection de la vie privée et des données personnelles, et de leur offrir un forum privilégié pour pouvoir présenter et échanger leurs idées sur cette thématique. L’atelier est pluri-disciplinaire, et a vocation à rassembler notamment des chercheurs en informatique, droit, économie, sociologie et statistiques.
Nous envisageons de lancer après l’atelier une action MADICS plus spécifiquement focalisée sur les problématiques de vie privée dans les données massives. Les personnes intéressées par participer sont invitées à soumettre un court document pour présenter leur problématique.
Du : 2017-06-19
Au : 2017-06-21
Lieu : Autrans
Site Web : https://apvp2017.sciencesconf.org/
Annonce en lien avec l’Action/le Réseau : / Groupe Sigma de la SMAI
Thème :
High-Dimensional Data Analysis
Présentation :
The SMF (French Mathematical Society) and the Institut Henri Poincaré organize a mathematical summer school on “Structured Regularization for High-Dimensional Data Analysis”. This summer school will be the opportunity to bring together students, researchers and people working on High-Dimensional Data Analysis around three courses and four talks on new methods in structured regularization. The mathematical foundations of this event will lie between probability, statistics, optimization, image and signal processing.
Organizers:
* Yohann De Castro (Paris-Sud)
* Guillaume Lecué (CNRS and ENSAE)
* Gabriel Peyré (CNRS and ENS)
Du : 2017-06-19
Au : 2017-06-22
Lieu : Institut Henri Poincaré
Site Web : https://regularize-in-paris.github.io/
Journées Science des Données MaDICS 2017
Data Science Innovatives Days, Jeudi 22 juin – Vendredi 23 juin
Programme du jeudi 22 juin 2017 – Auditorium EMD 
Liste des inscrits (Direction seulement)
| 9:15 | Café – Accueil | ||
| 9:45 | Ouverture des journées | ||
| 10:00 | Data challenges with modularization and code submission – Lessons learned Balazs Kegl, DR2 CNRS, University Paris Saclay Motivated by the shortcomings of traditional data challenges, we have developed a unique concept and platform, called Rapid Analytics and Model Prototyping (RAMP) , based on modularization and code submission. Open code submission allows participants to build on each other’s ideas , provides the organizers with a fully functioning prototype , and makes it possible to build complex machine learning workflows while keeping the contributions simple. We will start this presentation by describing the context and motivation, the guiding design principles , and some of the technical details (front and backend) of the platform. We will then walk you through some of the most interesting workflows and applications (e.g., anomaly detection in particle physics detectors, classifying molecular spectra for safe drug administration, spatio-temporal time series prediction in climate science). In the last third of the talk we will present a preliminary analysis of the RAMPs that touches on both the technical (machine learning) aspects of the tool and on the sociology of crowdsourcing data analytics. | ||
| 11:00 | Les recherches en masses de Données Bioacoustiques sous l’impulsion de l’Action EADM Hervé Glotin, Université de Toulon Les masses de données bioacoustiques permettent d’investiguer de nouveaux champs de recherche sur de nombreux écosystèmes. Nous présentons deux exemples qui ont bénéficié de l’impulsion de MaDICS. | ||
| 11:30 | Machine Learning, Analyse statistique en partenariat industriel au sein de l’Action ATLAS Charlotte Laclau, Laboratoire LIG Grenoble Le but de l’exposé sera de présenter deux partenariats autour du machine learning et de l’analyse statistique, nés au sein de l’Action ATLAS et faisant à chaque fois intervenir des équipes académiques et des industriels. On expliquera à chaque fois le contexte, les outils mis et jeu et les différentes applications qui ont pu être développées ou en perspective. | ||
| 12:00 | La recherche partenariale et la valorisation Mathilde Mougeot, Chargée de mission valorisation, INSMI | ||
| 12:30 | Déjeuner | ||
| 14:00 | News MaDICS Christine Collet, Gernoble INP, Direction MaDICS, INS2i Echanges avec le CNRS Adeline Nazarenko, Directrice Adjointe Scientifique INS2i | ||
| 14:30 | Scientific workflows and companion tools for reproducibility in bioinformatics: status, opportunities and first lessons learnt Sarah Cohen Boulakia, Université Paris-Saclay With the development of new experimental technologies, an avalanche of data has to be computationally analyzed for scientific advancements and discoveries to emerge. Faced with the complexity of analysis pipelines, the large number of computational tools, and the enormous amount of data to manage, there is compelling evidence that many (if not most) scientific discoveries will not stand the test of time: increasing the reproducibility of computed results is of paramount importance. | ||
| 15:00 | Pitch des posters et démonstrations Vincent Claveau, Appel à Posters et démonstrations | ||
| 16:00 | Pause | ||
| 16:30 | Gouvernance des masses de données, Questions éthiques et juridiques Danièle Bourcier, DR CNRS, Commission d’éthique du numérique (Alliance ALLISTENe) Les problématiques juridiques soulevées par les Big data apportent de nouveaux enjeux pour ce qui en est du respect de la vie privée et de la protection des données personnelles. En effet, les Big data ne se réfèrent pas uniquement aux données (implicitement ou explicitement) communiquées par les individus en question, mais aussi aux données produites ou inférées par les opérateurs en ligne, grâce à des algorithmes de plus en plus sophistiqués. | ||
| 17:30 | Posters et Démonstrations Daniel Aguiar da Silva Carvalho Maxence Ahlouche E. Claeys Ugo Comignani Clément Dalloux Youssef Hmamouche Lynda Khiali Abdoul Macina François Meunier Rim Shayakhmetov | ||
| 18:30 | Apéritif dinatoire et Networking |
Annonce en lien avec l’Action/le Réseau : RoD / Action MaDICS
Thème :
Raisonner sur les données
Présentation :
Cette première journée RoD a pour objectif d’identifier les équipes intéressées, de faire interagir les équipes et de faire émerger des problématiques d’intérêt commun au travers de différentes présentations.
Du : 2017-06-23
Au : 2017-06-23
Lieu : Ecole de Management de Marseille
Site Web : http://www.lirmm.fr/rod
Programme préliminaire (10h-16h)
Matinée
- présentation de Rod (Marie-Laure Mugnier, Marie-Christine Rousset)
- Ontology-Mediated Query Answering and Heterogeneous Data (Federico Ulliana, LIRMM / Inria, Université de Montpellier)
- SIDES 3.0, une plate-forme sémantique centrée utilisateurs pour la formation en Santé (Fabrice Jouanot, LIG, Université Grenoble Alpes)
- YAGO: a multilingual knowledge base from Wikipedia, Wordnet, and Geonames (Thomas Rebele, LTCI, Telecom ParisTech)
Après-midi
Présentation des équipes
Annonce en lien avec l’Action/le Réseau : GRAMINEES/PREDON
Thème :
Réutilisation de données Hétérogènes pour la Fouille de Graphes
Présentation :
Dans le domaine de l’écologie et de la biodiversité, l’augmentation des fréquences d’acquisition de données a abouti à une accumulation considérable de données hétérogènes et dispersées qu’il est nécessaire d’organiser, documenter et trier pour les exploiter à des fins de recherche et d’appui opérationnel à l’expertise. Les graphes sont un des axes phares de développement de nouvelles approches, d’analyses intégratives et de la représentation des données complexes pour la recherche en écologie et environnement. La démarche initiée par le consortium IndexMEED consiste à créer un cercle vertueux sur tout le cycle de vie des données pour obtenir des résultats visuels et des scénarios analysables sous forme de graphes, et permettre à différentes communautés de parcourir les liens entre les données et de formuler de nouvelles hypothèses, de combiner des objets et d’explorer leurs relations statistiques.
Objectifs :
Dans le cadre des animations soutenues par le GdR MADICS, l’Action GRAMINEES, assisté de membres de PREDON organise un atelier qui vise à :
1/ Développer la dynamique d’échange entre des experts en écologie/biodiversité et des experts du domaine des STIC concernant la fouille de graphes ; (GRAMINEES)
2/ Réaliser une première version de carte des compétences de laboratoires qui pourront apporter des outils méthodologiques ou des techniques algorithmiques adéquates pour l’analyse des données sur la biodiversité et l’environnement. (GRAMINEES)
3/ Identifier les verrous concernant la préservation et la ré-utilisabilité des données multisources en environnement et définir les compétences permettant de lever ces verrous (PREDON)
Du : 2017-06-23
Au : 2017-05-23
Lieu : Marseille
Site Web : https://indexmeed2017.sciencesconf.org/resource/page/id/14
Programme
Matinée
Présentations de 10h à 12h30 (30 minutes de présentation et 20 minutes d’échanges).
- 10h15-10h50 : Bibliothèque de fouille de graphe (Luc HOGIE, I3S(CNRS-UNS) Inria)
- 10h50-11h10 : GDR Ecostat (Romain DAVID, IMBE, INEE)
- 11h10-11h35 : Preservation des données scientifiques (Cristinel Diaconu, CPPM Marseille)
- 11h35-12h00 : Cloud collaboratif pour l’imagerie medicale, semantique et protection des donnees (Mehdi BENTOUNSI, Lipade, Paris Descartes)
- 12h00-12h30 : Sémantique et thésaurus (Dominique VACHEZ et/ou Romain DAVID)
Après-midi
- 14h00-16h00 Animation sur les réseaux de compétences nécessaires à la réutilisation de données Hétérogènes pour la Fouille de Graphes
- 14h00-15h00 : Présentation d’un projet d’organigramme et schémas fonctionnel autour des compétences, dans le cadre des différents instituts (outils : Google Doc et un outil de mind-mapping)
Introduction avec Panorama et liens de GRAMINEES avec les autres actions de IndexMeed
Elaboration d’une fresque compétences et noms de personnes en France et partenaires étrangers possibles - 15h00-15h30 : Graphe des compétences et acteurs dans le cadre de GRAMINEES basé sur des mots clefs
Méthodologie des choix de mots clefs
Propositions de fiches action
Rendu sous forme de graphe
- 14h00-15h00 : Présentation d’un projet d’organigramme et schémas fonctionnel autour des compétences, dans le cadre des différents instituts (outils : Google Doc et un outil de mind-mapping)
- 15h30-16h00 : Discussions et clôture de l’atelier (PREDON + GRAMINEES)
Annonce en lien avec l’Action/le Réseau : Atelier MaDICS
Thème :
Données massives et santé numérique
Présentation :
L’atelier “Données massives et santé numérique” a pour objectif de présenter des travaux de recherche faisant intervenir des données massives dans le domaine de la santé numérique. Les exposés s’adresseront à la fois à un public d’informaticiens et de mathématiciens.
Du : 2017-06-23
Au : 2017-06-23
Lieu : Marseille
Site Web : http://www.madics.fr/
Programme:
- 10:00-10:10 : Données massives et Santé Numérique, introduction, Mathilde Mougeot, Université Paris-Diderot.
- 10:10-10:45 : Arbres de décisions binaires non supervisés: applications en santé publique, Pierre MICHEL, CNRS/ Université Aix-Marseille.
- 10:45-11:20 : Towards neuroimaging big data: understanding inter-individual variability, Sylvain TAKERKART, NRS/ Université Aix-Marseille.
- 11:20-11:55 : Apprentissage de l’échelle optimale d’analyse dans les études d’association pangénomique, Christophe AMBROISE, Université D’Evry & Agro Paris Tech.
- 11:55-12:30 : Medical data: from big to meaningful, Stéphanie ALLASSONIERE, Université Paris Descartes & Ecole Polytechnique.
- 14:00-14:35 : Étude de l’équilibre statique et la qualité de marche : avances sur le programme 5p, Juan MANTILLA, Centre de Mathématiques et de Leurs Applications.
- 14:30-15:10 : Big Data en santé avec le Caisse Nationale d’Assurance Maladie, Stéphane GAIFFAS, Agathe GUILLOUX, Ecole Polytechnique, Université d’Evry.
- 15:10-15:45 : Big data et apprentissage profond en santé publique, Badih GHATTAS, Université Aix-Marseille.
- 15:45-16:00 : Données massives et Santé Numérique. Conclusion de la journée, les axes de recherche, M. Mougeot
Annonce en lien avec l’Action/le Réseau : Atelier MaDICS
Thème : Technologie de stockage et de transmission d’informations Blockchain
Technologie de stockage et de transmission d’informations Blockchain
Présentation :
Cet Atelier a pour objectif de connecter l’écosystème de la recherche avec les réflexions actuelles de l’industrie sur la Blockchain. Il s’agit d’un événement biface qui s’adressera aux explorateurs débutants et aux personnes ayant déjà un projet grâce à un programme pensé par des experts en facilitation et en blockchain.
Il est la troisième édition de la série des blockfests …
Du : 2017-06-23
Au : 2017-06-23
Lieu : Ecole de Management de Marseille
Site Web :
Programme préliminaire (9h-16h30)
- 9h – 10h Introduction à la Blockchain – conférence plénière (Jean-Luc Parouty, IR CNRS, Institut de Biologie Structurale)
- 10h – 10h30 Présentation des cas d’usages soumis ou pas par les industriels
- 11h – 12h00 Workshop technique d’introduction au développement de Smart Contract
Répartition des équipes sur chacune des thématiques - 13h30 – 15h30 Les équipes travaillent sur leur cas d’usage et leur smart contract facilitation par les mentors Blockfest
- 16h00 – 16h30 Court Pitch des équipes
- 16h30 Conclusion et remerciements
Annonce en lien avec l’Action/le Réseau : Le GdR ISIS
Thème :
Indexation de grandes masses de données
Présentation :
La journée se déroulera en deux parties. Une première partie sera consacrée à une présentation de la campagne TRECVid (indexation et recherche dans les documents multimédia) et à un bilan sur la participation d’IRIM à celle-ci. Ceci inclura des présentations spécifiques associées aux travaux menés en commun dans le cadre de l’action IRIM. Une deuxième partie sera consacrée à des présentations faites par les membres des deux GDR ISIS et MaDICS, et peut-être par un ou deux orateurs invités, sur leurs travaux en indexation de grandes masses de données, y compris au-delà du multimédia. La journée se conclura par une discussion sur les possibilités de coopération entre les membres des deux communautés.
Du : 2017-06-23
Au : 2017-06-23
Lieu : Marseille
Site Web : http://www.madics.fr/event/journees-madics-2017-23-juin/
Journées Science des Données MaDICS 2017
Data Science Innovatives Days, Jeudi 22 juin – Vendredi 23 juin
Programme du vendredi 23 juin 2017 
| 9h-10h | Introduction à la Blockchain Jean-Luc Parouty, IR CNRS, Institut de Biologie Structurale | Auditorium | ||||||||
| 9:45 | Pause Café | |||||||||
| 10h-16h | Actions MaDICS et Ateliers ; Déjeuner (12h30) ; Pause (16h) | |||||||||
Actions MaDICS
| ||||||||||
Ateliers
| ||||||||||
Annonce en lien avec l’Action/le Réseau : PREDON
Thème :
La préservation des données et l’intelligence artificielle
Présentation :
Il faut sauver les données scientifique, d’accord. Mais lequelles? Dans un contexte de “big data”, sauver veut nécéssairement dire “effacer, trier, néttoyer…” comment être sûr que l’on n’oublie pas…. euh…l’essentiel? Des exemples de données réduites en champs de ruines par l’inaccessibilité du code pullulent….Quels sont les paramètres des données qui doivent être poursuivis (fréquence d’accès, criticité dans les algorithmes, reliabilité, redondance, niveau d’absraction…) et comment faire pour éviter l’effet “si je le savais…”. Est-ce qu’on peut s’appuyer sur les algorithmes ou workflows issus de l’intelligence artificielle pour guider la préservation des données et des connaissances dans la recherche scientifique? Nous proposons un “brainstorming” autour de ce sujet. N’hésitez pas à proposer des interventions ou des thématiques adjacentes.
Du : 2017-06-23
Au : 2017-06-23
Lieu : Ecole de Management de Marseille, Rue Joseph Biaggi, Marseille
Site Web : https://indico.cern.ch/event/641755/
Programme
Voir sur cette page.
Annonce en lien avec l’Action/le Réseau : MAESTRO
Thème :
Masse de données en Astrophysique
Présentation :
Dans le domaine de l’astronomie, l’évolution rapide des télescopes et autres instruments scientifiques ainsi que le recours intensif à la simulation informatique ont conduit, ces dernières années, à une production massive de données.
Dans le cadre des animations soutenues par le GdR MADICS, l’Action MAESTRO organise un atelier rassemblant des chercheurs, praticiens s’intéressant à la gestion des grandes masses de données en astrophysique. L’objectif de l’atelier est de faire échanger les différents participants sur les problématiques et/ou solutions envisagées afin de traiter efficacement les masses de données en jeu.
Nous sollicitons à cet effet des contributions pour des présentations sur les sujets suivants (liste non exhaustive).
* Retour d’expérience sur traitement de données en astrophysique
* Fouille interactive de grandes masses de données
* Optimisation de requêtes
* Parallélisme et données distribuées
* Analyse statistique et problèmes algorithmiques sous-jacents.
* Ontologies et données en astrophysique
* Intégration de données massives
Du : 2017-06-23
Au : 2017-06-23
Lieu : Ecole de Management Marseille
Montée de l’Université
Rue Joseph Biaggi – CS 70329
13331 Marseille Cedex 3
Site Web : https://maestro-2017.sciencesconf.org/
Programme :
- Introduction :
- 10:00 MAESTRO (présentation), C. Surace/S. Maabout
- 10:10 Plateforme Galactica, F. Gaudet
- 10:30 Evolution of Data Management Systems for Big Data Applications, A. Hameurlain
- Données Astrophysiques :
- 11:00 SKA, C. Ferrari
- 11:30 LSST, E. Gangler
- 12:00 Déjeuner
- Machine Learning et Deep Learning
- 13:30 Exploring the spectroscopic diversity of type Ia supernovae with DRACULA: a machine learning approach, E. Ishida
- 13:45 Classification of reliability for redshift measurements, S. Jamal
- 14:00 Clustering pour détection d’amas ouverts avec Gaia, M. Morvan
- 14:15 Galaxy morphology with CNNs using transfer learning, A. Boucaud
- Organisations :
- 14:30 BIGSKYEARTH (présentation), E. Gangler/K. Zeitouni
- 14:50 Cosmostatistics initiative : (https://asaip.psu.edu/organizations/iaa/iaa-working-group-of-cosmostatistics), E. Ishida
- 15:10 Wrap up, sondage, conclusions
Annonce en lien avec l’Action/le Réseau : Atelier MaDICS
Thème : Qualité des masses de données scientifiques
Organisateurs :
- Allel Hadjali (LIAS/ENSMA, Poitiers)
- Laure Berti-Equille (IRD, Montpellier)
- Angela Bonifati (LIRIS/CNRS, Lyon)
Présentation :
L’existence d’anomalies et d’impuretés dans les données, issues d’applications modernes du monde réel, est bien connue de nos jours. L’étude de la qualité des données reste donc un problème majeur car les données “impures ou impropres” peuvent conduire à des décisions incorrectes et à des analyses non fiables. Ce constat est particulièrement vrai dans le contexte des données scientifiques (issues de simulation en physique et en énergie, d’observations par satellites en astronomie et en astrophysique, de cartographie du génome, etc.). L’objectif de l’atelier “Qualité des masses de données scientifiques” est d’être un espace d’échanges entre chercheurs, experts et professionnels autour des nouveaux enjeux et défis liés à la qualité des données scientifiques dans l’ère du Big data.
L’Atelier sera également l’occasion de discuter et de réfléchir à la création d’une Action liée à la “qualité des masses de données” dans le GdR MaDICS.
Du : 2017-06-23
Au : 2017-06-23
Lieu : École de Management de Marseille, Marseille
Site Web : http://www.madics.fr/event/journees-madics-2017-23-juin/
Programme (10h15 – 16H)
- 10h15 – 10h30 : Présentation de l’atelier et de ses objectifs (Allel Hadjali, LIAS/ENSMA, Poitiers)

- 10h30 – 11h00 : Data Quality: where are we on the journey from theory to practice? (Angela Bonifati, LIRIS, Lyon)

- 11h – 11h30 : Tour d’horizon des données scientifiques et des problématiques particulières liées à leur qualité (Laure Berti-Equille, IRD, Montpellier)

- 11h30 – 12h15 : Gestion des annotations sémantiques en santé – Le projet ELISA (Cédric Pruski, ITIS, Luxembourg)

- 14h – 14h45 : Prise en compte des données manquantes dans les modèles de mélanges :
application aux séries temporelles d’images multispectrales (Serge Iovleff,Université de Lille)
- 14h45 – 15h30 : Qualité dans l’entrepôt de données cliniques de l’HEGP (Bastien Rance, HEGP, Paris)

- 15h30 – 16h : Discussions et clôture de l’atelier

