Présentation Générale

MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…


Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.


Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:

  • Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
    Pour en savoir plus…
  • Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
    Pour en savoir plus…
  • Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
    Pour en savoir plus…
  • Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.

Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…


Manifestations à venir

Journées Ecoles Conférences et Séminaires

Actions, Ateliers et Groupes de Travail :

DAE DatAstro DSChem EXMIA GeoKIF HELP Musiscale RECAST SaD-2HN SIMDAC SimpleText TIDS  


Dec
9
Thu
2021
Journée commune AFIA-THL / ARIA / GDR TAL “Accès interactif à l’information”
Dec 9 all-day

Date : 2021-12-09
Lieu : Paris (Jussieu)

Le GDR-TAL (Groupement de recherche en Traitement Automatique de la Langue) et deux associations : l’AFIA (Association française pour l’intelligence artificielle), au travers de son collège Technologies du Langage Humain (TLH) et l’ARIA (Association de Recherche d’Information et Applications) organisent une journée commune sur le thème de l’”Accès interactif à l’information” le 09 décembre 2021 à Paris (Jussieu).

L’objectif de cette journée est de réunir chercheurs-euses en Intelligence Artificielle, en Traitement Automatique des Langues et en Recherche d’Information travaillant sur les aspects interactifs de l’accès à l’information. Cette journée sera alors l’occasion de confronter les expériences de la recherche interactive dans différents domaines d’applications, tant du côté avancé de la recherche que du côté des applications industrielles.

La journée sera composée de deux présentations invitées, de sessions avec présentations courtes suivie de posters et démonstrations pour susciter les discussions, et se terminera par une table ronde.

Nous sollicitons des communications pouvant porter sur tous les thèmes de l’accès interactif à l’information, incluant, de façon non limitative :
– Agents conversationnels (ex : chatbots, incarnation/avatars, génération de dialogues) ;
– Annotation et construction de corpus ;
– Apprentissage actif ;
– Apprentissage par renforcement ;
– Construction de ressources (en particulier Francophones ou multilingues) ;
– Evaluation de systèmes interactifs ;
– Explicabilité (ex: du choix des informations proposées par un chatbot, transparence des systèmes) ;
– Influence de la qualité des ressources, biais, équité/impartialité ;
– Interaction multimodale ;
– Interface homme-machine-robot ;
– Modélisation de l’utilisateur ;
– Personnalisation (persona et côté utilisateurs) ;
– Recherche d’information immersive ;
– Résumé automatique interactif ;
– Retour de pertinence (relevance feedback) ;
– Système questions / réponses.

Les propositions de communications orales sont attendues avant le *** 8 novembre 2021 *** sous la forme d’un résumé d’une à deux pages comprenant un titre, une liste d’auteur.e.s, une liste de mots-clés et un résumé du contenu de la présentation proposée en respectant la feuille de style (latex) ci-dessous :
https://jaii2021.sciencesconf.org/data/pages/Modele_de_document_pour_JAII2021.zip

Les soumissions seront effectuées via easychair : https://easychair.org/my/conference?conf=jaii2021

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Dec
10
Fri
2021
Workshop TOTh 2021: Terminology, interoperability and Data integration: Issues and Challenges
Dec 10 all-day

Date : 2021-12-10
Lieu : LIMICS, campus des cordeliers – 15 rue de l’école de médecine
Paris, France

The relation between terminological and ontological dimensions in knowledge organisation systems (KOSs) is a major problem when working on interoperability and on data and knowledge integration. The growing number of multilingual resources available on the web (classifications, glossaries, thesaurus, terminologies, and ontologies) increases this problem. One of the solutions for achieving interoperability between these resources is the use of a computational resource for the conceptual system of terminologies.

This raises some issues such as the impact of Linked Open Data, Linguistic Linked Open Data and Linked Open Vocabulary on the construction of these resources. This approach can become operational by using tools to separate terminological and ontological layers. The choice of these tools is determined by the primitives they suggest to build the conceptual and linguistic models of the entities to be represented.

The following issues may be raised throughout the workshop:
– in the above context, how can we take into account both the linguistic dimension and its relationship to the conceptual dimension?
– how do standards such as W3C, ISO, etc. influence the construction of ontologies?
– what are the current relative methods, standards and tools (environments)?
– how can we ensure that the primitives included in these tools fulfil the needs of terminologists?

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Dec
16
Thu
2021
Séminaire de clôture du projet ANR ALEGORIA, sur la structuration et valorisation du patrimoine géographique iconographique dématérialisé
Dec 16 all-day

Date : 2021-12-16
Lieu : Distanciel

Nous avons le plaisir de vous convier au séminaire de clôture du projet ANR ALEGORIA sur la structurAtion et vaLorisation du patrimoinE géoGraphique icOnogRaphIque démAtérialisé, qui se déroulera le 16 décembre 2021, de 9h30 à 17h.

Ce séminaire aura lieu en distanciel, et le programme de la journée et les modalités de participation sont présentés sur le site web du séminaire :

https://www.alegoria-project.fr/seminaire_cloture/

Veuillez noter que l’inscription est gratuite mais obligatoire : https://forms.gle/6EAw4yV8p3AbpBwr9
Le lien Zoom de visio-conférence vous sera envoyé dans un second temps.

Résumé : le projet ALEGORIA vise à faciliter la valorisation de fonds institutionnels iconographiques décrivant le territoire français à différentes époques allant de l’entre-deux-guerres à nos jours. Ces fonds, de tailles variables entre milliers et centaines de milliers d’éléments, sont constitués de photographies aériennes obliques ou verticales, ou encore terrestres. Contrairement à l’exploitation bien ancrée qui est faite de l’imagerie satellitaire où les usages professionnels sont nombreux (scientifiques, civils et militaires), la valorisation de ces fonds reste confidentielle. Ils sont disséminés au sein de différentes institutions, numérisés partiellement, en général pas ou peu documentés et faiblement géoréférencés. Ils représentent pourtant un patrimoine riche, peu connu du grand public et exploité de manière contrainte par ses principaux utilisateurs (chercheurs, institutions et collectivités locales), en consultation directe à la photothèque ou par le biais de photothèques classiques en ligne. La mise en valeur d’un tel patrimoine bénéficierait d’outils permettant d’automatiser leur traitement, leur indexation et interconnexion, à l’intérieur d’un fonds mais aussi entre fonds. Leur mise en oeuvre au sein d’applications implique en outre de faciliter leur appréhension par des utilisateurs non spécialistes, ce qui suppose de fournir des outils conviviaux pour l’exploration visuelle de ces fonds. Pour plusieurs cas d’usage en SHS (sociologie visuelle urbaine et tourisme), ALEGORIA propose de répondre à ces deux constats en établissant d’une part une preuve de concept de la faisabilité et de la plus-value de décrire, structurer, indexer, et localiser ces collections intra et inter-fonds selon différentes modalités, et d’autre part un prototype innovant de restitution immersive et interactive 3D de ces fonds (reposant sur itowns, le géoportail 3D de l’IGN) en termes de contenus, métadonnées et interconnexions établies. Le consortium est composé de plusieurs partenaires académiques en STIC et en SHS, ainsi que des fournisseurs de contenus : IGN-UGE/LaSTIG (coordinateur), LIRIS (Ecole Centrale Lyon), Archives nationales, LAVUE (Univ. Paris-Nanterre), Musée Nicéphore Niépce.

https://www.alegoria-project.fr/

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Jan
24
Mon
2022
8ème École d’Hiver é-EGC “L’humain dans la boucle de l’exploration des données et de l’apprentissage”, Blois, France
Jan 24 – Jan 28 all-day

Date : 2022-01-24 => 2022-01-28
Lieu : Blois, France

ECOLE D’HIVER – APPEL A PARTICIPATION

8ème Ecole d’Hiver é-EGC sur le thème « L’humain dans la boucle de l’exploration des données et de l’apprentissage »
24 – 28 Janvier 2022, Blois – France

Accueil


==============================================

La huitième École d’Hiver é-EGC, sur le thème « L’humain dans la boucle de l’exploration des données et de l’apprentissage », est un événement organisé par l’Association Extraction et Gestion de Connaissances (EGC, http://www.egc.asso.fr/).
Cet événement s’organise autour de deux activités principales :
• deux jours de formation : les 24 et 25 Janvier 2022
• participation à la conférence EGC2022 : du 24 au 28 janvier 2022

Cet appel est également disponible à l’adresse :

Ecole

THEMES DE L’ECOLE : L’humain dans la boucle de l’exploration des données et de l’apprentissage
L’exploration de données est une tâche qui nécessite intrinsèquement une forte interaction humaine. L’expert en la matière examine les données pour identifier une hypothèse, des questions potentielles et où chercher des réponses dans les données. De même, en apprentissage automatique ou en fouille de données, l’expert peut jouer un rôle fondamental dans le processus d’élicitation d’un modèle ou de découvertes de connaissances en spécifiant des propriétés que doit satisfaire le modèle recherché. Cette école s’intéresse aux différentes méthodes d’intégration de l’humain au processus d’exploration de données et de découverte de connaissances.

OBJECTIFS DE L’ECOLE
Les deux jours de formation ont pour but principal d’offrir aux participants des tutoriaux d’initiation dans le domaine de recherche couvrant les thèmes de l’école mais également des tutoriaux plus spécifiques présentant les récentes avancées proposant des solutions et des techniques nouvelles pour les différentes problématiques ayant émergées dans ce domaine. Les exposés de 1h30 couvriront une large gamme des problématiques et des solutions existantes. Certains exposés seront associés à des séances plus pratiques afin de permettre aux participants de manipuler quelques outils.
La participation à la conférence permettra aux participants de prendre part à un des événements majeurs de la communauté francophone de l’extraction et la gestion de connaissances. Elle leur permettra d’assister à des présentations de nouvelles avancées et approches développées dans la communauté, ceci pouvant ainsi inspirer leur parcours scientifique futur.
Enfin, cette école souhaite offrir aux jeunes chercheurs (doctorants, post-doctorants et ingénieurs) et aux chercheurs confirmés du domaine la possibilité de se rencontrer et d’échanger des idées, ce qui devrait également permettre aux jeunes chercheurs d’enrichir leur réseau.

PROGRAMME DE L’ECOLE
Le programme sera finalisé et disponible sur le site de l’école dans les plus brefs délais ; les intervenants :
Sihem Amer-Yahia (LIG, Université de Grenoble Alpes)
Sarah Cohen-Boulakia (LRI, Université Paris-Saclay)
Bruno Crémilleux (GREYC, Université de Caen)
Nicolas Labroche, Patrick Marcel et Veronika Peralta (LIFAT, Université de Tours)
Vincent Lemaire (Orange R&D)
Vanessa Murdock (Amazon)
Christel Vrain (LIFO, Université d’Orléans)

PUBLIC CONCERNE
L’École d’Hiver é-EGC 2022 s’adresse particulièrement aux doctorants et étudiants, de manière générale, désirant approfondir leurs connaissances dans le domaine de l’exploration de données et de l’apprentissage.

COMITÉ SCIENTIFIQUE ET ORGANISATION
• Sihem Amer-Yahia (LIG, Université Grenoble Alpes)
• Arnaud Martin (IRISA, Université de Rennes 1)
• Claudia Marinica (LS2N, Université de Nantes)
• Arnaud Soulet (LIFAT, Université de Tours)

DATES IMPORTANTES
• Date limite pré-inscriptions (CV à fournir) : 14/11/2021
• Inscription effective (École (formation + conférence EGC), sur le site de la conférence) : 15/12/2021

L’INSCRIPTION SE RÉALISE EN DEUX ÉTAPES
1/ Les participants doivent manifester leur intérêt, avant le 14/11/2021, pour participer à l’École en s’inscrivant avec ce formulaire :
https://docs.google.com/forms/d/1iLqbYfYO4bO1CGZyhfGBpfq144Nr89ox41WoDA4flMA/prefill
Pour que la pré-inscription soit prise en compte, elle doit être accompagnée d’un CV récent du participant.
2/ Après la confirmation de la pré-inscription par le comité d’organisation, et avant le 15/12/2021, les participants doivent s’inscrire via la page d’inscription de la conférence EGC2022 (attention de bien choisir le tarif comprenant l’École).

Le nombre total de participants est limité à 30 personnes. Le tarif de l’inscription sera affiché sur le site de la conférence EGC (https://egc2022.univ-tours.fr/) et il comprend :
– la participation à l’École d’Hiver (24 et 25 janvier) ;
– la participation à la conférence (26 au 28 janvier) ;
– les déjeuners et le repas de gala.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

SIFED: Symposium International Francophone sur l’Ecrit et le Document
Jan 24 – Jan 28 all-day

Date : 2022-01-24 => 2021-12-10
Lieu : Rotonde, INSA Lyon
Campus de la Doua
20 avenue Albert Einstein
69621 Villeurbanne Cedex

SIFED (Symposium International Francophone sur l’Ecrit et le Document) , anciennement CIFED, est organisé par le GRCE (Groupe de Recherche en Communication Ecrite : http://grce.labri.fr) depuis 1990. Cet événement a toujours eu pour ambition de fédérer les chercheurs (jeunes chercheurs, chercheurs séniors, académiques et industriels) intéressés par les travaux autour de l’analyse de documents et de l’écriture, en particulier sur les problématiques d’analyse et de traitement d’images et du signal, de la reconnaissance des formes, de l’intelligence artificielle, de la recherche d’information, etc. Aussi ce symposium est-il un lieu privilégié de rencontres et d’échanges, permettant de faire un état des lieux des recherches et développements dans ce domaine, d’informer sur les travaux à venir, de contribuer à la cohérence de la communauté mais aussi de l’ouvrir et de lui donner une visibilité nationale et internationale.

Pour cette journée du 10 décembre 2021, nous sollicitons des communications (orales, démos) qui peuvent correspondre à des présentations de projets académiques ou industriels existants, des retours d’expériences ou bien des travaux préliminaires portant sur les problématiques de l’analyse et la reconnaissance du document (ARD).

Cette édition permettra notamment aux doctorants et aux post-doctorants de présenter leurs travaux de recherche sur l’ensemble des thématiques et problématiques de l’ARD. Cette journée se veut également être un moment de convivialité et de rassemblement dont nous avons été trop largement privé ces deux dernières années.

SIFED’2021 aura lieu à l’INSA Lyon (dans l’amphithéâtre de la Rotonde) le vendredi 10 décembre 2021 de 9h à 18h (la fin de l’après-midi se terminera par l’AG du GRCE pour finir au plus tard à 18h).

La journée se tiendra précisément le lendemain de la manifestation INNOV’2021 qui concerne les “Innovations pour les Banques&Assurances” (laboratoires de notre communauté, industriels éditeurs logiciels, start’ups et secteurs Banques/Assurances seront représentés) et qui se tiendra aux Terrasses du Parc à 500 mètres de la Rotonde.

A l’occasion de l’édition 2021 de SIFED, un hommage sera rendu à notre collègue Guy Lorette.

Qui peut participer à SIFED ?

Vous êtes doctorants ou postdoctorants et travaillez sur un sujet en lien avec la thématique de l’analyse et la reconnaissance de document.
Tous les autres membres seniors ou jeunes chercheurs, même s’ils ne présentent pas, sont naturellement invités à nous rejoindre à SIFED le 10 décembre à l’INSA Lyon.

Comment?

Il suffit de retourner une déclaration d’intention à veronique.eglin@insa-lyon.fr avec votre nom, les personnes associées au projet (encadrement/direction du travail), un titre (anglais/français) puis vous nous confirmerez plus tard votre présence effective le 10 décembre : sera physiquement présent.e / sera virtuellement présent.e / se fera représenter

Selon quel timing ?

Nous n’envisageons pas de processus de reviewing des présentations, car cela n’est pas l’objectif de la journée : nous demandons simplement aux jeunes chercheurs de nous renvoyer un titre de leur travail, à partir d’aujourd’hui et jusqu’au 10 novembre 2021.

Comment cela se passera-t-il le 10 décembre ?

  • Les présentations se feront sur place (idéalement) ou à distance (pour ceux/celles qui ne pourront être physiquement présents)
  • La durée des présentations sera d’une vingtaine de minutes
  • Les pauses (accueil – matin et après midi) ainsi que le buffet du midi vous seront offerts


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Jan
25
Tue
2022
Atelier Apprentissage Profond: Théorie et Applications (APTA)
Jan 25 all-day

Date : 2022-01-25
Lieu : Blois, France

DESCRIPTIF

L’apprentissage profond (deep learning) révolutionne depuis plusieurs années l’apprentissage automatique. Alors que les premiers résultats marquants ont été obtenus principalement en analyse d’images, les travaux actuels en apprentissage profond s’intéressent à présent à tous les types de données (images, vidéos, son, séries temporelles, textes, etc.). De plus, l’utilisation des réseaux profonds s’est également étendue à presque tous les types de traitements (classification, clustering, génération, augmentation de données, détection d’anomalies, prédiction, segmentation, etc.). Ainsi, l’impact de l’apprentissage profond dans le domaine de la science des données et l’extraction de connaissances est considérable.

Suite au succès des éditions précédentes de l’atelier APTA, nous souhaitons à nouveau proposer, dans le cadre de la conférence EGC, un espace d’échanges autour de ce domaine. Celui-ci permettra d’aborder les défis théoriques et les possibilités applicatives qu’il offre à notre discipline de l’extraction et de la gestion des connaissances. Dans le cadre de cet atelier, nous souhaitons nous focaliser sur les applications de l’apprentissage profond dans différents domaines (analyse ou génération d’images, classification de données temporelles, extraction d’informations à partir de données hétérogènes, etc.) mais également permettre la présentation de travaux plus théoriques (nouvelles architectures, nouvelles fonctions de coût, interprétabilité des modèles, etc).

THÈMES DE L’ATELIER (LISTE NON EXHAUSTIVE)

  • Applications de l’apprentissage profond
    • Extraction d’informations à partir d’images, de vidéos, de sons
    • Analyse de séquences temporelles
    • Text-mining
    • Analyse du langage naturel, de la parole
    • Données géographiques
    • Données financières
    • Données de mouvements humains
    • Données médicales, biologiques, bio-informatiques
    • Recommandation et publicité ciblée
    • Jeu et résolution de problèmes
  • Nouvelles approches pour l’apprentissage profond
    • Réseaux récurrents
    • Réseaux siamois
    • Apprentissage par renforcement
    • Réseaux antagonistes génératifs (GAN)
    • Convolutions et graphes
    • Apprentissage auto-supervisé (self-supervised learning)
    • Apprentissage profond collaboratif
    • Modèles prédictifs

DATES IMPORTANTES

  • Soumission des papiers : 23/11/2021
  • Notification aux auteurs : 13/12/2021
  • Réception des versions finales : 17/12/2021
  • Mise en ligne du programme : 03/01/2022
  • Date de l’atelier : 25/01/2022
  • INSTRUCTIONS AUX AUTEURS

    Les auteurs sont invités à soumettre électroniquement leur proposition en utilisant la plateforme de l’atelier :
    https://apta2022.sciencesconf.org/submission/submit

    La taille des soumissions sera de 10 pages au maximum. Elle pourra être beaucoup plus courte, en particulier pour les articles présentant un travail qui débute ou la présentation de projet de recherche. Le format LaTex à utiliser est celui de la revue « Revue des Nouvelles Technologie de l’Information » (RNTI) disponible à l’adresse suivante : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

    ORGANISATEURS

    • Maxime Devanne, MCF, Université de Haute-Alsace, IRIMAS
    • Camille Kurtz, MCF, Université de Paris, LIPADE

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Mar
    1
    Tue
    2022
    première demi-journée de deux séminaires sur les techniques d’anonymisation de données
    Mar 1 all-day

    Date : 2022-03-01
    Lieu : virtuel,
    organisé par le LS2N (Laboratoire des Sciences du Numérique de Nantes)

    Le Thème transverse Sciences du Vivant du LS2N organise une mini-série de deux demi-journées de séminaires sur “l’anonymisation de données”.

    Les inscriptions aux deux demi-journées sont indépendantes.

    La première demi-journée de séminaires se déroulera le mardi 1er mars 2022, de 14H00 à 18H15, en mode distanciel. Le programme comporte 4 présentations :

    Générer des données synthétiques centrées sur le patient : plus de raison de faire courir un risque de réidentification dans l’analyse des données biomédicales
    Pierre-Antoine GOURRAUD, PU-PH, CHU de Nantes, Université de Nantes

    Désidentification de textes : une tâche de détection d’entités ; désidentification de textes médicaux : état de l’art
    Évaluation du risque de réidentification de textes
    Une autre voie : la création de données artificielles
    Pierre ZWEIGENBAULM (*), DR CNRS, responsable du groupe ILES (Langue Ecrite et Signée)
    Aurélie Névéol(*), CR CNRS
    Cyril GROUIN(*) IR CNRS.
    (*) Laboratoire Interdisciplinaire des Sciences du Numérique), Université Paris-Saclay, Orsay

    inscription gratuite mais obligatoire, lien pour l’inscription :
    https://docs.google.com/forms/d/e/1FAIpQLSeeMkarTuw5seNnxd04xauILglY6pgIg1Soqfe-twXPPXEdTw/viewform?usp=pp_url
    programme détaillé ci-dessous

    PROGRAMME :
    14H00-15H15
    Générer des données synthétiques centrées sur le patient : plus de raison de faire courir un risque de réidentification dans l’analyse des données biomédicales
    par le Pr Pierre-Antoine GOURRAUD, PU-PH, CHU de Nantes, Université de Nantes

    Résumé : Les analyses de données massives s’alimentent presque toujours de données personnelles pseudonymisées. Les interprétations et prédictions auxquelles elles aboutissent sont utiles à la société, mais un risque de réidentification individuelle demeure. Nous présentons une nouvelle méthode permettant de générer des données synthétiques, des avatars, de granularité individuelle, tout en préservant la vie privée des patients, à l’exemple d’un essai clinique et d’un jeu de données en cancérologie utilisé en prédiction avec un algorithme apprenant.

    15H15-16H15 ; 16H45-17H30 ; 17H30-18H15
    Intervenants du LISN (Laboratoire Interdisciplinaire des Sciences du Numérique), Université Paris-Saclay, Orsay

    Pierre ZWEIGENBAULM, DR CNRS, responsable du groupe ILES (Langue Ecrite et Signée)
    Aurélie Névéol, CR CNRS
    Cyril GROUIN IR CNRS

    15H15-16H15
    Désidentification de textes : une tâche de détection d’entités ; désidentification de textes médicaux : état de l’art.

    Résumé : La désidentification de textes est habituellement modélisée en traitement automatique des langues comme une tâche de détection d’« entités nommées ». Nous donnerons ici une brève introduction à cette tâche : notion d’entité, mesures d’évaluation, les indices qui permettent de détecter des entités dans les textes. Nous résumerons les méthodes employées au fil du temps pour aborder cette tâche, des patrons à la classification supervisée, statistique puis neuronale. Nous poursuivrons avec la désidentification de textes médicaux. Nous présenterons d’abord la question du choix de l’ensemble des types d’entités à repérer lorsque l’on instancie la tâche de détection d’entités sur des textes médicaux : noms de personnes, dates, etc. Nous présenterons ensuite les méthodes qui ont été proposées pour réaliser cette tâche, avec des exemples concernant le traitement de l’anglais et du français : méthodes à base de patrons (de-id, MEDINA v1), à base d’apprentissage supervisé statistique (MEDINA v2, divers outils aux États-Unis) puis neuronal (NeuroNER, MAPA…) et les performances associées.

    16H15-16H45 PAUSE

    16H45-17H30
    Évaluation du risque de réidentification de textes.

    Résumé : La question du risque de réidentification est difficile à évaluer sur des textes en langue naturelle. Nous rappellerons le mode d’évaluation traditionnel de la détection d’entités en TAL, qui opère au niveau des entités individuelles. Nous examinerons également des manières simples de l’étendre à des unités textuelles plus pertinentes comme le document ou le dossier. Nous présenterons enfin une expérience d’évaluation du risque de réidentification sur des données réelles.

    17H30-18H15
    Une autre voie : la création de données artificielles.

    Résumé : La désidentification de textes vise à réduire le risque de réidentification de documents textuels, notamment pour rendre acceptable le travail des chercheurs ou des ingénieurs lors de la mise au point d’algorithmes s’appliquant à ces données. Une autre façon de contourner les difficultés d’accès à des textes confidentiels pour le traitement automatique des langues consiste à créer des textes artificiels ayant des propriétés suffisamment similaires aux textes réels, mais ne concernant pas de patients réels. Nous présenterons des directions de travail en ce sens, fondés notamment sur la traduction automatique et sur la génération de textes.

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Mar
    8
    Tue
    2022
    deuxième demi-journée de deux séminaires dédiés aux techniques de l’anonymisation de données – 8 mars 2022
    Mar 8 all-day

    Date : 2022-03-08
    Lieu : virtuel,
    organisé par le LS2N (Laboratoire des Sciences du Numérique de Nantes)

    Le Thème transverse Sciences du Vivant du LS2N organise une mini-série de deux demi-journées de séminaires sur “l’anonymisation de données”.

    Les inscriptions aux deux demi-journées sont indépendantes.

    La deuxième demi-journée de séminaire / tutoriel se déroulera le mardi 8 mars 2022, de 9H30 à 12H30, en mode distanciel. Elle sera consacrée aux techniques d’anonymisation de données, avec le conférencier et le programme suivants :

    Pr Benjamin NGUYEN,
    Laboratoire d’Informatique Fondamentale d’Orléans, Equipe Sécurité des Données et des Systèmes
    INSA Centre Val de Loire & Université d’Orléans
    GdR Sécurité Informatique / GT Protection de la Vie Privée

    Programme :
    – Qu’est-ce que l’anonymat ?
    – La pseudonymisation
    – Architecture d’anonymisation
    – Technique historique d’anonymisation
    – Evaluation du risque de réidentification
    – Techniques classiques d’anonymisation
    – Méthodes statistiques classiques
    – Confidentialité différentielle (Differential Privacy)

    Le séminaire intègrera plusieurs parties démonstration en mode “tutoriel”. A cette occasion, les participants seront invités à réaliser eux-mêmes les opérations, en utilisant les logiciels ARX (pour l’anonymisation) et WEKA (pour l’analyse de données).

    Le principe sera de fournir aux participants tous les fichiers dont ils ont besoin pour suivre, afin qu’ils réalisent les opérations en parallèle avec le conférencier.
    L’objectif est de permettre une première prise en main de l’outil ARX, pour des utilisations futures dans d’autres contextes.

    Pour un déroulement efficace, le nombre d’inscrits est limité à 30.

    La participation à la première demi-journée (1 mars 2022) NE constitue PAS un prérequis pour participer à la deuxième demi-journée.
    inscription gratuite mais obligatoire, nombre de places limité à 30,
    lien pour l’inscription :
    https://docs.google.com/forms/d/e/1FAIpQLScPEBXOSZQDepMDqGaFzNt6e4FmbDP7VzMRBU0H9kCbEyn9lA/viewform?usp=pp_url

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Mar
    15
    Tue
    2022
    Workshop on Security Monitoring
    Mar 15 – Mar 16 all-day

    Date : 2022-03-15 => 2022-03-16
    Lieu : Rennes

    =========================================
    March 15-16, 2022, Rennes, France

    SUPSEC


    =========================================

    We are pleased to announce the first Workshop on Security Monitoring which will take place in Rennes (France), March 15-16, 2022.

    This Workshop is organized as part of the SUPSEC thematic semester funded by the French DGA and managed by Inria for the different partners.

    **************************************************************
    Preliminary program
    **************************************************************

    March 15
    10:00 Welcome session
    10:30 Presentation of the semester, Ludovic Mé (Inria) and David Lubicz (DGA)
    11:15 A primer on the topic, Hervé Debar (Télécom SudParis)

    12:15 Lunch/Demos

    13:30 Security monitoring session (1)
    13:30 Thomas Burnouf (EDF)
    14:15 Baptiste Chevreau (Orange)
    15:00 Fabien Pouget (Thales)
    15:45 Nicolas Prigent (CALID)
    16:30 – 17:00 Coffee break & demos

    March 16
    09:00 Welcome/Coffee
    09:30 – Security monitoring session (2)
    09:30 Benjamin Morin (ANSSI)
    10:15 Charles Sala (CHU de Lyon)
    11:00 TBA (Airbus)

    11:45 Lunch/Demos

    14:00 Solutions Session
    13:00 Georges Bossert (Sekoia)
    13:45 Dimitri Tromboff (Thales Punch Plateform)
    14:30 Alexandre Nilovic (ElasticSearch)
    15:15 – 16:00 TBA (Splunk)

    **************************************************************
    Registration (free but mandatory)
    **************************************************************

    By email to lydie.mabil@inria.fr before March the 1rst

    Last/Family NAME:

    First name:

    Affiliation/Institution:

    Email:

    Phone:

    Arrival date:

    Departure date:

    Dietary restrictions:

    Free comments:

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Mar
    18
    Fri
    2022
    Journée thématique : Le temps dans tous ses états
    Mar 18 all-day

    Date : 2022-03-18
    Lieu : Campus des Cordeliers, Paris (LIMICS)

    Détection, représentation, et exploitation des aspects temporels dans les données

    Les données temporelles sont présentes dans un large éventail de domaines tels que la médecine, la bio-informatique, l’environnement, l’économie, la finance, la culture, l’ingénierie, les médias sociaux. Qu’il s’agisse de surveiller l’évolution d’une épidémie au fil du temps, de détecter des changements environnementaux ou des changements d’opinions, d’analyser des parcours de patients, ou encore de détecter des évolutions dans l’utilisation de la langue, il existe un réel besoin d’approches capables de détecter, de représenter, de raisonner, ou d’analyser des jeux de données structurés ou des corpus de textes comportant des données évolutives ou temporelles. Les données temporelles peuvent être de nature complexe, et sont souvent incomplètes, incertaines, bruitées, et volumineuses et leur traitement fait l’objet de recherches particulièrement actives ces dernières années.

    La journée thématique « Le temps dans tous ses états » organisée par l’AFIA a pour objectif de réunir des chercheurs et des industriels qui travaillent sur des sujets liés aux traitements des données temporelles en intelligence artificielle. Elle accueillera les communications qui couvrent, sans s’y limiter, un ou plusieurs des thèmes suivants :

    • Modèles de données temporels, Ontologies, contraintes temporelles
    • Temps et Traitement automatique du langage naturel
    • Indexation, langages de requêtes
    • Raisonnement temporel
    • Gestion de l’imprécision, de l’incomplétude et de l’incertitude dans les données temporelles
    • Fouille de données temporelles, Classification, Prédiction
    • Analyse temporelle de sentiments
    • Détection et représentation des changements dans les données évolutives
    • Visualisation de données temporelles
    • Applications impliquant des données temporelles

    Les articles soumis peuvent être des papiers courts (2 pages) ou longs (jusque 12 pages) qui peuvent avoir été déjà présentés dans une conférence nationale ou internationale. Les articles courts peuvent proposer de nouvelles idées qui n’ont pas encore été évaluées.

    Les soumissions, en français ou en anglais, sont acceptées dans l’espace Nouveau Dépôt du site jusqu’au 27 février (réponse le 4 mars).

    L’inscription est gratuite mais impérative, avant le vendredi 11 mars, ceci afin de faciliter l’organisation de la journée. Elle se déroulera au campus des Cordeliers (Paris), site du Laboratoire d’informatique médicale et d’ingénierie des connaissances en e-santé (LIMICS).

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Assemblée des Responsables d’Acttions et Ateliers @ visio
    Mar 18 @ 09:00 – 17:00
    Mar
    21
    Mon
    2022
    Journées du GdR MAGIS
    Mar 21 – Mar 23 all-day

    Date : 2022-03-21 => 2022-03-23
    Lieu : Grenoble, Campus de Saint-Martin-d’Hères
    Bâtiment IMAG

    Renouvelé en 2022 pour 5 ans par ses deux instituts de rattachement INS2I et INSHS, et avec le soutien de l’INEE, le GdR CNRS MAGIS réunit 350 chercheurs et ingénieurs de 55 unités de recherche qui travaillent au carrefour de l’informatique, de la géographie, des sciences environnementales.

    Ces journées sont un moment privilégié pour prendre connaissance des feuilles de routes des 5 chantiers transversaux et des 14 groupes de travail (appelés Actions de Recherche) qui rythmeront l’activité du GdR pendant les 5 prochaines années.

    Cette manifestation est organisée autour d’une session plénière qui se déroulera en présentiel (lundi 21 mars après-midi et mardi 22 mars toute la journée) et d’ateliers – organisés en présentiel et en mode hybride pour certains – qui se tiendront en amont ou en aval de la plénière.

    Le programme est accessible ici

    Les inscriptions pour la plénière et les ateliers se font sur ce site également. Notez que l’inscription est gratuite mais obligatoire pour des raisons logistiques.

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Mar
    28
    Mon
    2022
    JFMS2022: Journées francophones de la modélisation et de la simulation
    Mar 28 – Apr 3 all-day

    Annonce en lien avec l’Action/le Réseau : DOING

    Thème :

    Modélisation et Simulation, Systèmes Multi-Agents, Optimisation

    Présentation :

    Les JFMS sont un rendez-vous biennal de la communauté des chercheurs francophones travaillant sur le formalisme DEVS et plus largement sur la théorie de la Modélisation et de la Simulation initié par B.P. Zeigler. Placées sous le signe de l’échange et de l’interdisciplinarité, ces journées sont ouvertes vers d’autres disciplines et vers l’ensemble des domaines d’applications de la modélisation et de la simulation. L’ouverture vers les entreprises et les organismes de recherche privés est un aspect important de cet atelier pour que les défis liés à l’ingénierie de la modélisation et de la simulation soient pleinement considérés. Cet atelier est un lieu privilégié d’échanges scientifiques et technologiques et permet aux jeunes chercheurs et aux doctorants de faire connaître leurs travaux, ainsi que faire émerger des collaborations ou encore répondre de manière collégiale à des appels à projet.
    https://devs-network.org/jfms-2022/

    Du : 2022-03-28

    Au : 2022-04-02

    Lieu : IES de Cargèse (Corse du Sud)

    Site Web : https://easychair.org/cfp/jfms-2022

    Les journées Francophones de la modélisation et de la simulation 2022
    Mar 28 – Apr 1 all-day

    Date : 2022-03-28 => 2022-04-01
    Lieu : IES de Cargèse (Corse)

    Les journées Francophones de la modélisation et de la simulation 2022 seront organisées par le réseau RED du 28 mars au 2 Avril 2022 à l’Institut des Études Scientifiques de Cargèse (UMS CNRS).

    Les JFMS sont un moment et un lieu privilégiés d’échanges scientifiques autour des questions de la modélisation et de la simulation des systèmes complexes. Ces journées alternent présentations scientifiques, tables rondes et ateliers de travail et de réflexion en groupe.

    Pour cette édition, les JFMS co-organisent avec l’AFIA une journée IA et Simulation le lundi 28 Mars.

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Mar
    29
    Tue
    2022
    DataPlat 2022, the 1st International Workshop on Data Platform Design, Management, and Optimization
    Mar 29 all-day

    Date : 2022-03-29
    Lieu : Edinburgh

    Call For Papers for DataPlat 2022, the 1st International Workshop on Data Platform Design, Management, and Optimization, which will be held on March 29, 2022 at Edinburgh, co-located with EDBT/ICDT.

    DataPlat focuses on the challenges originating from the paradigm change imposed by big data, which has triggered the evolution of information systems into complex data platforms or data ecosystems supporting data-intensive storage, computation, and analysis of data with heterogeneous structures. Over the last years, several research proposals have been made concerning vertical solutions that address different parts of the data management lifecycle within complex data-intensive ecosystems. DataPlat is aimed at funneling these efforts towards the development of data platforms as data-intensive ecosystems supporting data scientists and architects at a high level, and fosters innovative research solutions that contribute to further advancements in this field. DataPlat covers the topics of metadata modeling, collection, and storage to capture the distinguishing features of the data; the enabling of advanced functionalities spanning from research and data profiling to provenance control, orchestration of data transformation pipelines, incremental data integration, and efficient querying; data integration and querying within heterogeneous storage and computation engines, including multi-model DBMSs, polystores and cloud storage systems; the simplification of data management and fruition by data scientists, including artificial intelligence solutions and AutoML techniques.

    The deadline for paper submission is December 12, 2021.

    Authors of the best papers will be invited to submit an extended version to a Special Issue with Elsevier’s Future Generation Computer Systems (FGCS) journal (IF: 7.187).

    For further information on the workshop, please head to https://big.csr.unibo.it/dataplat2022/


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Apr
    7
    Thu
    2022
    Appel à participation à la 8ème journée de l’AFIA : PDIA 2022 – IA et Créativité, 07 avril 2022, Paris
    Apr 7 all-day

    Date : 2022-04-07
    Lieu : CNAM, Paris 75003

    L’Association Française pour l’Intelligence Artificielle (AFIA) organise sa huitième journée PERSPECTIVES ET DEFIS DE l’IA sur le thème de « IA et créativité » le 07 avril 2022, au CNAM, Amphi Georges Friedmann, 2 rue Conté – Paris 75003.

    Le programme détaillé de la journée est accessible via le lien : https://afia.asso.fr/pdia-2022/

    Pour des raisons logistiques, il est fortement conseillé de s’inscrire avant le 01 avril 2022 via le lien : https://www.linscription.com/pro/activite.php?P1=91152

    Cet événement est organisé par : Fayçal HAMDI (CEDRIC, CNAM Paris), Engelbert MEPHU NGUIFO (LIMOS, Université Clermont Auvergne), Davy MONTICOLO (ERPI, Université de Lorraine), Fatiha SAIS (LISN, Université Paris Saclay)

    —— —— — ——
    Programme

    9h-9h15 – Accueil
    9h15 – 9h30 : Présentation de l’AFIA et introduction de la journée

    Session 1 : Texte, IHM et IA

    9h30 – 10h30 : Baptiste Caramiaux, Chercheur CNRS au laboratoire ISIR, Sorbonne Paris Université, membre du HCI Sorbonne group [page-web].
    Titre: Repenser l’Interaction avec les Technologies d’Apprentissage

    10h30 – 11h30 : Alex Gabriel, Chercheur post-doctoral au laboratoire ERPI, Université de Lorraine [page-web]
    Titre : Intelligence artificielle pour assister l’idéation et la conception amont

    11h30 – 11h45 : Pause café

    11h45 – 12h45 : Anne-Gwenn BOSSER, Maîtresse de Conférences au laboratoire STICC, ENIB, Université de Brest Bretagne Loire, [page-web]
    Titre : Machines à écrire: créer des programmes qui créent pour apprendre à se servir de l’IA

    12h45 – 14h : Pause déjeuner

    Session 2 – Arts et IA

    14h – 15h : Jean-Claude Heudin, Chercheur en IA, écrivain et compositeur [page-web].
    Titre : Angelia – une Intelligence Artificielle pour la musique électronique.

    15h -16h : Jérôme Nika, Chercheur à l’IRCAM, [page-web].
    Titre : Musique et “IA” pour “Instruments Artificiels”

    16h-16h15 – pause café

    16h15 – 17h15 : François Pachet, directeur du Spotify Creator Technology Research Lab, [page-web].
    Exposé autour de « La créativité computationnelle lié à la musique »

    17h15 – Clôture de la journée – discussion

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Apr
    22
    Fri
    2022
    1-st Call for Participation – SimpleText Track @ CLEF-2022
    Apr 22 all-day

    Date : 2022-04-22

    Context
    The web and social media have democratized information sharing and have become the main source of information for citizens, risking users to rely on shallow information in sources prioritizing commercial or political incentives rather than the correctness and informational value. Non-experts tend to avoid scientific literature due to its complex language, internal vernacular, or their lack of prior background knowledge. Text simplification approaches hold the promise to remove some of these barriers. The SimpleText track is a part of the CLEF initiative which promotes the systematic evaluation of information access systems, primarily through experimentation on shared tasks. SimpleText addresses the challenges of text simplification approaches in the context of promoting scientific information access, by providing appropriate data and benchmarks. The track uses a corpus of scientific literature abstracts and popular science requests. It features three tasks.

    Tasks
    We invite you to submit both automatic and manual runs! Manual intervention should be reported.

    * Task 1: What is in (or out)? Select passages to include in a simplified summary, given a query.

    * Task 2: What is unclear? Given a passage and a query, rank terms/concepts that are required to be explained for understanding this passage (definitions, context, applications,..).

    * Task 3: Rewrite this! Given a query, simplify passages from scientific abstracts.

    * In addition, we welcome any other type of submission that uses our data as an open task.

    How to participate
    In order to participate, you should sign up at the CLEF website (https://clef2022-labs-registration.dei.unipd.it/). All team members should join the SimpleText mailing list (https://groups.google.com/g/simpletext). The data will be made available to all registered participants.

    Deadlines

    *Data release: February 2022

    *Final guidelines: March 2022

    *Run submission: 22 April 2022

    *Results available: 6 May 2022

    *Draft paper submission: 27 May 2022

    *Camera-ready: 1 July 2022

    *CLEF conference: 5-8 September 2022

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    1st call-for-participation JOKER@CLEF: Automatic Wordplay and Humour Translation Task
    Apr 22 all-day

    Date : 2022-04-22

    Deadlines

    Data & guidelines release: February – March 2022

    Run submission: 22 April 2022

    Draft paper submission: 27 May 2022

    CLEF conference: 5–8 September 2022

    Context

    Humour remains one of the most difficult aspects of intercultural communication: understanding humour often requires understanding implicit cultural references and/or double meanings, and this raises the question of its (un)translatability. Wordplay is a common source of humour due to its attention-getting and subversive character. The translation of humour and wordplay is therefore in high demand. Modern translation depends heavily on technological aids, yet few works have treated the automation of humour and wordplay translation, or the creation of humour corpora. The goal of the JOKER workshop is to bring together translators and computer scientists to work on an evaluation framework for wordplay, including data and metric development, and to foster work on automatic methods for wordplay translation.

    Tasks

    We invite you to submit both automatic and manual runs! Manual intervention should be reported.

    Task 1: Сlassify and explain instances of wordplay.

    Task 2: Translate single words containing wordplay.

    Task 3: Translate entire phrases containing wordplay.

    Unshared task: We welcome any other type of submission that uses our data as an open task.

    How to participate
    Sign up at the CLEF website (https://clef2022-labs-registration.dei.unipd.it/). All team members should join the JOKER mailing list (https://groups.google.com/u/4/g/joker-project). The data will be made available to all registered participants.

    Contacts

    JOKER website: http://joker-project.com/

    CLEF website:
    https://clef2022.clef-initiative.eu/index.php

    Registration: https://clef2022-labs-registration.dei.unipd.it/

    Email: contact@joker-project.com

    Twitter: https://twitter.com/joker_research

    Google Group: https://groups.google.com/u/4/g/joker-project


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Discovery Science 2022
    Apr 22 all-day

    Date : 2022-04-22
    Lieu : Montpellier, France

    The 25th International Conference on Discovery Science (DS 2022)

    https://ds2022.sciencesconf.org/

    Montpellier, France, October, 10-12, 2022

    ***********************************
    COVID-19
    ***********************************
    We hope that by October the world will have returned to normality and we can welcome you in Montpellier. However, in case the COVID-19 risk persists and traveling is difficult, DS 2022 will take place either as a mixed event by offering both remote and on site presentation options or as a fully online event in the worst case. The accepted papers will still be published by Springer and the special issue will proceed as announced. In these challenging times that the whole of humanity is going through, we hope that all of you are safe and remain healthy.

    ***********************************
    ::: Scope :::
    ***********************************
    The 25th International Conference on Discovery Science (DS 2022) provides an open forum for
    intensive discussions and exchange of new ideas among researchers working in the area of Discovery Science. The scope of the conference includes the development and analysis of methods for discovering scientific knowledge, coming from machine learning, data mining, intelligent data analysis, big data analysis as well as their application in various scientific domains.

    ***********************************
    ::: Submission Topics :::
    ***********************************
    We invite submissions of research papers addressing all aspects of discovery science: papers that focus on the analysis of different types of massive and complex data, including structured, spatio-temporal and network data. We would also like to encourage contributions from the areas of computational scientific discovery, mining scientific data, computational creativity and discovery informatics.
    We particularly welcome papers addressing applications from different domains of science including biomedicine and life sciences, astronomy, physics, chemistry, as well as social sciences. Applications to massive, heterogeneous, continuous or imprecise data sets are of particular interests. Possible topics include, but are not limited to:

    Knowledge discovery, machine learning and statistical methods
    Ubiquitous Knowledge Discovery
    Data Streams, Evolving Data and Models
    Change Detection and Model Maintenance
    Active Knowledge Discovery
    Information extraction from scientific literature
    Knowledge discovery from heterogeneous, unstructured and multimedia data
    Data and knowledge visualization
    Planning to Learn
    Knowledge Transfer
    Computational Creativity
    Human-machine interaction for knowledge discovery and management
    Evaluation of models and predictions in discovery setting
    Causality modelling
    AutoML, meta-learning, planning to learn
    Explainable AI, interpretability of machine learning and deep learning models
    Learning from complex data
    Graphs, networks, linked and relational data
    Spatial, temporal and spatiotemporal data
    Unstructured data, including textual and web data
    Multimedia data
    AI frameworks for discovery in scientific domains
    Biomedical knowledge discovery, analysis of (multi)omics, micro-array, gene deletion, gene set enrichment data
    Machine Learning for High-Performance Computing, Grid and Cloud Computing
    Applications of the above techniques in scientific domains, such as
    Physical sciences (e.g., materials sciences, particle physics)
    Life sciences (e.g., systems biology/systems medicine)
    Environmental sciences
    Life Sciences
    Natural and social sciences

    ***********************************
    ::: Publishing :::
    ***********************************
    Traditionally the proceedings of DS series appear in the Lecture Notes in Artificial Intelligence Series by Springer-Verlag. In addition, authors of best papers will be invited to submit their extended versions to a special issue on Discovery Science of the Machine Learning journal published by Springer. Fast Track Processing will be used to have them reviewed and published.

    ***********************************
    ::: IMPORTANT DATES :::
    ***********************************
    Abstract submission: May 23, 2022
    Full paper submission: May 30, 2022
    Notification: July 20, 2022
    Camera ready version, author registration: August 8, 2022
    Conference: October 10-12, 2022

    ***********************************
    ::: Submission guidelines :::
    ***********************************
    Regular research papers may contain up to fifteen (15) pages and must be formatted according to the layout supplied by Springer-Verlag for the Lecture Notes in Computer Science series. The Program Committee reserves the right to offer acceptance as Short Papers (10 pages in the Proceedings) to some submissions. The reviews are single-blind. You do not need to anonymize your submission.
    Submitted papers may not have appeared in or be under consideration for another workshop, conference or a journal, nor may they be under review or submitted to another forum during the DS 2022 review process.
    We encourage all authors to include their individual ORCID in their address information.
    Authors can submit their regular papers via our submission page through Easychair:

    https://easychair.org/my/login_author?sum=073323801fd3b7125c2b6cc57ecf0a6f;conference=267691

    Authors of accepted papers must submit along with the final version of their paper a consent to publish, filled and signed. Authors of accepted papers are expected to register to the conference and present their work (see author registration date).

    ***********************************
    Special issue and Best Student Paper Award
    ***********************************
    The authors of a number of selected papers presented at DS 2022 will be invited to submit extended versions of their papers for possible inclusion in a special issue of Machine Learning journal (published by Springer) on Discovery Science. Fast-track processing will be used to have them reviewed and published.
    There will be an award for the Best Student Paper in the value of 555 Euro sponsored by Springer.

    Dino Ienco (PC Co-Chairs DS)
    Pascal Poncelet (PC Co-Chairs DS)
    Sašo Džeroski (General Chair DS)

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    Journée d’étude Mots/Machines #4: Simplification et adaptation du texte
    Apr 22 all-day

    Date : 2022-04-22
    Lieu : Université de Bretagne Occidentale

    20, rue Duquesne – CS9383729238

    Brest Cedex 3, France

    La simplification de textes est utilisée dans les domaines de la traduction,la localisation et la rédaction technique. La pré-édition consiste à préparer un document avant d’appliquer la traduction automatique afin d’obtenir de meilleurs résultats et de réduire la charge de travail de post-édition. C’est devenu un choix courant pour les entreprises publiant leur contenu dans différentes langues.

    En outre, la simplification du texte améliore les applications de traitement automatique de la langue naturelle, notamment les résultats de la traduction automatique. Ainsi, la simplification automatique de textes pourrait s’avérer utile dans divers domaines tels que la communication scientifique, le journalisme scientifique, la politique et l’éducation, tant pour les cours de sciences que pour la didactique. La vulgarisation scientifique et le journalisme scientifique sont d’ailleurs l’un des plus anciens programmes de l’UNESCO.

    Les textes simplifiés sont également plus accessibles aux locuteurs non natifs, aux jeunes lecteurs, aux personnes souffrant d’un handicap de lecture ou ayant un niveau d’éducation inférieur (objectif de développement durable INÉGALITÉ RÉDUITE).

    Les textes scientifiques, tels que les publications de recherche, peuvent être difficiles à comprendre pour les non-experts du domaine ou les scientifiques qui ne sont pas concernés par la publication. L’amélioration de la compréhensibilité des textes et leur adaptation à différents publics restent un problème non résolu. La simplification de textes est un pas en avant vers la recherche réellement ouverte, accessible et compréhensible par tous, le développement d’un contre-discours aux fake news basées sur des résultats scientifiques, la possibilité s de lire plus rapidement et par conséquent, de devenir mieux informé.e sur les résultats scientifiques, notamment avec l’explosion de la science ouverte depuis le début de la pandémie actuelle de COVID-19 (objectif de développement durable ÉDUCATION DE QUALITÉ).

    L’objectif de cette journée d’étude est de fournir une plateforme de communication à une communauté interdisciplinaire de chercheurs en traduction, rédaction technique, traitement du langage naturel, recherche d’information, linguistique, didactique, journalisme scientifique et vulgarisation scientifique.

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.