RoD (2017-2020)

Action RoD – GdR IA (2017-2020)

Raisonner sur les données (Reasoning on Data)

Responsables

Correspondant ComDIR :

Thématiques

Cette action sest inter-GDR (MaDICS et IA), avec deux thématiques centrales :

  • la gestion de données hétérogènes (sciences des données)
  • la représentation de connaissances et les raisonnements (intelligence artificielle)

Données concernées

Nous considérons des données pour lesquelles l’ajout d’une couche « sémantique » a potentiellement une forte valeur ajoutée : Données hétérogènes (hétérogénéité des modèles de données et hétérogénéité sémantique) , Données du Web (Linked Open Data) , Données imparfaites (contradictoires, incomplètes, de fiabilité variable, …)

Mots clés

Algorithmes, Ontology-Based Data Access, Intégration de données hétérogènes, Liage de données et traitement de données liées, Raisonnements sur des données imparfaites

Contexte scientifique

Au niveau international, la question de l’exploitation de connaissances pour accéder à des données volumineuses et hétérogènes est très étudiée depuis quelques années. De nombreux travaux visent à prendre en compte des connaissances de nature ontologique (qui peuvent aller de la simple taxomomie à des connaissances décrites dans des langages logiques, comme les logiques de description, ou des langages à base de règles, organisés et étudiés en fragments d’expressivité variable) et à exploiter les inférences associées à ces connaissances dans tout le cycle de vie des données (accès, validation, enrichissement, etc.), le problème emblématique étant celui de l’interrogation (ou requêtage) des données (de nombreuses tâches complexes sur les données pouvant se reformuler en termes d’interrogation). On peut citer notamment la problématique d’Ontology-Based Data Access, très présente au niveau international dans les communautés Knowledge Representation and Reasoning, Data Management, et Semantic Web, mais dans une moindre mesure en France.

Cette action s’intéresse de façon générale au développement de techniques de représentation de connaissances et de raisonnements permettant de mieux tirer parti des données disponibles en masse dans différents formats, modèles et systèmes.

L’accent est particulièrement mis sur le développement d’algorithmes efficaces :

  • pour l’interrogation de données prenant en compte des connaissances ontologiques
  • pour l’intégration et l’analyse de données hétérogènes
  • pour le traitement de données liées, et le liage de données issues de différentes bases
  • pour raisonner sur des données incomplètes, pouvant être incertaines et de qualité variable (possiblement inconsistantes avec les connaissances ontologiques, issues de bases de diverse fiabilité, …).

L’objectif est de fédérer une communauté française sur le sujet.

Trois domaines d’application sont mis en avant, avec des fournisseurs de données prêts à mettre leurs données à disposition de la communauté de recherche : 


  • Agriculture numérique. L’institut de convergence #DigitAd (Human-Centred Digital Agriculture Convergence Lab) basé à Montpellier sera initié en janvier 2017. Son objectif général est de construire les briques scientifiques permettant le déploiement de l’agriculture numérique, en se basant sur une approche pluri-disciplinaire. En association avec #DigitAd, l’Irstea a été mandaté par les ministres de l’agriculture, de la recherche et de l’économie pour proposer un portail de données agricoles ouvertes. Dans ce domaine, de nombreuses bases de données relationnelles existent et stockent des données hétérogènes massives qu’il s’agit d’intégrer pour en faciliter l’accès à des usagers (décideurs, scientifiques, agriculteurs) ayant des besoins d’analyse très variés. Des ontologies, développées avec l’aide des experts du domaine, offrent un vocabulaire métier pour servir d’interfaces de requêtes adaptées au différents utilisateurs impliqués. Ce domaine est particulièrement adapté au développement d’approches de type Ontology-Based Data Access, et de méthodes de gestion d’inconsistances.
  • Contenus pédagogiques en santé. La totalité des examens facultaires des facultés de médecine en France sont réalisés depuis plus de 3 ans sur une plate-forme numérique nationale dédiée intitulée SIDES. Il est offert aussi à tous les étudiants (60 000 actuellement) la possibilité de réaliser des entrainements avec correction automatique. Toutes ces activités sont tracées. L’unité élémentaire est un cas clinique, intitulé “dossier progressif”, constitué de 15 questions et devant être réalisé en 30 minutes par l’étudiant. Il existe aujourd’hui plus de 2000 dossiers de ce type dans une banque nationale dite d’entrainement alimentée par toutes les facultés de médecine de France. A titre indicatif et seulement sur la partie entrainement, plus de 4 millions de dossiers réalisés ont été enregistrés dans une base de données relationnelle de logs d’activités. Ce jeu de données sera anonymisé et permettra de tester la valeur ajoutée de l’enrichissement de ces données par des méta-données RDF et des connaissances ontologiques pour l’analyse personnalisée, et à la demande, des résultats, des lacunes et de la progression d’un étudiant ou d’un groupe d’étudiants. Les enjeux dépassent la formation initiale en Médecine car SIDES a pour vocation de s’élargir à toutes les formations en santé, y compris la formation continue.
  • Données ouvertes du Web. DBpedia.fr regroupe 200 millions de triplets RDF extraits de Wikipedia francophone et le récent DBpedia historic représente toutes les révisions de pages depuis la création de Wikipedia Fr soit 1,9 milliard de triplets. Yago contient 120 millions de triplets RDF extraits également de Wikipedia. Web Data Commons met à disposition plusieurs gros jeux de données structurées extraites du Web sur des domaines variés. Ces jeux de données permettront de tester la faisabilité et l’apport d’algorithmes d’inférence pour améliorer la qualité et la complétude des données et des réponses aux requêtes, ainsi que pour le liage et la fusion de données. De plus, avec une moyenne de 70 000 requêtes par jour et des pics à 2,5 million de requêtes, le service DBpedia.fr publie des données sur le LOD depuis 2012 et place le chapitre francophone de DBpedia en deuxième position derrière l’Anglais. Dès lors il représente aussi un domaine d’application directe des recherches proposées ici.

Visitez le site web de l’Action RoD


Évènements à venir

Dec 31 2017 – Jan 1 2018 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : INRIA Grenoble, equipe Mistis Durée : 24 a 30 mois Contact : florence.forbes@inria.fr Date limite de publication : 2017-12-31 Contexte : Le projet, collaboration entre[...]
Dec 20 – Dec 21 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : LPTM/ETIS Durée : 12 months Contact : Dimitrios.Kotzinos@u-cergy.fr Date limite de publication : 2017-12-20 Contexte : A one-year post-doctoral position is open in the framework[...]
Dec 18 – Dec 19 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : LabEx Intelligence des Mondes Urbains Durée : 1 an Contact : isabelle.diraimondo@insa – lyon.fr et isabelle.lefort@univ – lyon2.fr Date limite de publication : 2017-12-18 Contexte[...]
Dec 15 – Dec 16 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : CEA LIST Durée : 12 mois Contact : herve.le-borgne@cea.fr Date limite de publication : 2017-12-15 Contexte : Le CEA LIST propose un post-doc sur la[...]
Dec 4 – Dec 5 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Ensai Durée : 2 ans et 8 mois Contact : romaric.gaudel@ensai.fr Date limite de publication : 2017-12-04 Contexte : L’Ensai est une école d’ingénieurs qui[...]
Dec 1 – Dec 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Succeed Together Durée : CDI Contact : mcdfconseil@live.fr Date limite de publication : 2017-12-01 Contexte : L’entreprise Succeed Together propose des solutions digitales – SucceedMeeting,[...]
Dec 1 – Dec 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Laboratoire Hubert Curien – UMR CNRS 5516 – Saint-Etienne (France) Durée : 12 mois (extensible) Contact : Francois.Jacquenet@univ-st-etienne.fr Date limite de publication : 2017-12-01 Contexte[...]
Nov 20 – Nov 21 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : LRI, Université Paris-Sud Durée : 1 year Contact : silviu.maniu@lri.fr Date limite de publication : 2017-11-20 Contexte : The Internet of Things (IoT), the large[...]
Nov 1 – Nov 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : LS2N – Laboratoire des Sciences Numériques de Nantes Durée : 1 an Contact : pascal.molli@univ-nantes.fr Date limite de publication : 2017-11-01 Contexte : Dans la[...]
Nov 1 – Nov 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : GREYC CNRS UMR 6072 (Université de Caen Normandie) en collaboration avec l’IRISA CNRS UMR 6074 et le LIPN CNRS UMR 7030 Durée : 1 an[...]
Oct 31 – Nov 1 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Télécom ParisTech Durée : CDI Contact : recrutement@telecom-paristech.fr Date limite de publication : 2017-10-31 Contexte : Télécom ParisTech, grande école d’ingénieurs en Technologies de l’Information[...]
Oct 20 – Oct 21 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : LIRIS – INSA Lyon Durée : 12 mois Contact : Véronique Eglin Date limite de publication : 2017-10-20 Contexte : Extraction d’indices sonores par «[...]
Oct 15 – Oct 16 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : LAMIH UMR CNRS 8201, UVHC Durée : 12 mois Contact : veronique.delcroix@univ-valenciennes.fr Date limite de publication : 2017-10-15 Contexte : projet ELSAT 2020 (Ecomobilité Logistique[...]
Oct 10 – Oct 11 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Laboratoire Hubert Curien, Université de Saint-Etienne Durée : 1 or 2 years Contact : emilie.morvant@univ-st-etienne.fr Date limite de publication : 2017-10-10 Contexte : Expected Starting[...]
Oct 1 – Oct 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : De Vinci Research Center – ESILV Durée : CDI Contact : jerome.da_rugna@devinci.fr Date limite de publication : 2017-10-01 Contexte : L’ESILV – http://www.esilv.fr/ – est[...]
Oct 1 – Oct 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : De Vinci Research Center – ESILV Durée : CDI Contact : jerome.da_rugna@devinci.fr Date limite de publication : 2017-10-01 Contexte : L’ESILV – http://www.esilv.fr/ – est[...]
Oct 1 – Oct 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : De Vinci Research Center – ESILV Durée : CDI Contact : jerome.da_rugna@devinci.fr Date limite de publication : 2017-10-01 Contexte : L’ESILV – http://www.esilv.fr/ – est[...]
Sep 13 – Sep 14 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : TETIS / Cirad (Centre de coopération internationale en recherche agronomique pour le développement) Durée : Permanent (CDI) Contact : mathieu.roche@cirad.fr Date limite de publication :[...]
Sep 7 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Altran Research Durée : CDI Contact : marion.moliner@altran.com Date limite de publication : 2017-12-31 Contexte : Altran Research est le département de Recherche interne d’Altran[...]
Sep 1 – Sep 2 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : CESCO/MNHN Durée : 1 an Contact : romain.julliard@mnhn.fr Date limite de publication : 2017-09-01 Contexte : Since 2010, participants of our citizen science program Spipoll[...]
Aug 31 – Sep 1 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : UMR AMAP – Pl@ntNet project Durée : 18 months Contact : alexis.joly@inria.fr Date limite de publication : 2017-08-31 Contexte : The candidate will closely work[...]
Aug 30 – Aug 31 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : University of Technology Troyes, UMR CNRS 6281 ICD/ Département « Recherche Opérationnelle, Statistiques Appliquées, Simulation »/ Projet DataLab AnalyTrics (Analytics & Metrics) Durée : 12[...]
Aug 25 – Aug 26 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : I3S (Sophia Antipolis) Durée : 2 ans Contact : johan.montagnat@cnrs.fr Date limite de publication : 2017-08-25 Contexte : Le projet “Intégration et Analyse de Données[...]
Aug 15 – Aug 16 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : TICLab de l’Université Internationale de Rabat (Maroc) Durée : 1 an, renouvelable une fois Contact : m.ghogho@ieee.org Date limite de publication : 2017-08-15 Contexte :[...]
Jul 24 – Jul 25 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Ensai Durée : 2 ans Contact : romaric.gaudel@ensai.fr Date limite de publication : 2017-07-24 Contexte : L’Ensai est une école d’ingénieurs qui fait partie du[...]
Jun 30 – Jul 1 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : L3i, Université de La Rochelle Durée : 12 mois Contact : cyril.faucher@univ-lr.fr Date limite de publication : 2017-06-30 Contexte : In the context of recently[...]
Jun 30 – Jul 1 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Grenoble Data Science Institute Durée : 1 an Contact : adeline.leclercq-samson@imag.fr Date limite de publication : 2017-06-30 Contexte : Dans le cadre des investissements d’avenir,[...]
Jun 30 – Jul 1 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : CNRS UMR6072 GREYC, Caen, France Durée : 18 months Contact : francois.rioult@unicaen.fr Date limite de publication : 2017-06-30 Contexte : The AIMS project consists of[...]
Jun 30 – Jul 1 all-day
Annonce en lien avec l’Action/le Réseau : aucun Laboratoire/Entreprise : Université de Paris Dauphine Durée : 1 an renouvelable Contact : bruno.chavesferreira@dauphine.fr Date limite de publication : 2017-06-30 Contexte : The newly established multidisciplinary program[...]
Jun 23 all-day
Annonce en lien avec l’Action/le Réseau : RoD / Action MaDICS Thème : Raisonner sur les données Présentation : Cette première journée RoD a pour objectif d’identifier les équipes intéressées, de faire interagir les équipes[...]