RoD (2017-2020)

Action RoD – GdR IA (2017-2020)

Raisonner sur les données (Reasoning on Data)

Responsables

Correspondant ComDIR :

Thématiques

Cette action sest inter-GDR (MaDICS et IA), avec deux thématiques centrales :

  • la gestion de données hétérogènes (sciences des données)
  • la représentation de connaissances et les raisonnements (intelligence artificielle)

Données concernées

Nous considérons des données pour lesquelles l’ajout d’une couche « sémantique » a potentiellement une forte valeur ajoutée : Données hétérogènes (hétérogénéité des modèles de données et hétérogénéité sémantique) , Données du Web (Linked Open Data) , Données imparfaites (contradictoires, incomplètes, de fiabilité variable, …)

Mots clés

Algorithmes, Ontology-Based Data Access, Intégration de données hétérogènes, Liage de données et traitement de données liées, Raisonnements sur des données imparfaites

Contexte scientifique

Au niveau international, la question de l’exploitation de connaissances pour accéder à des données volumineuses et hétérogènes est très étudiée depuis quelques années. De nombreux travaux visent à prendre en compte des connaissances de nature ontologique (qui peuvent aller de la simple taxomomie à des connaissances décrites dans des langages logiques, comme les logiques de description, ou des langages à base de règles, organisés et étudiés en fragments d’expressivité variable) et à exploiter les inférences associées à ces connaissances dans tout le cycle de vie des données (accès, validation, enrichissement, etc.), le problème emblématique étant celui de l’interrogation (ou requêtage) des données (de nombreuses tâches complexes sur les données pouvant se reformuler en termes d’interrogation). On peut citer notamment la problématique d’Ontology-Based Data Access, très présente au niveau international dans les communautés Knowledge Representation and Reasoning, Data Management, et Semantic Web, mais dans une moindre mesure en France.

Cette action s’intéresse de façon générale au développement de techniques de représentation de connaissances et de raisonnements permettant de mieux tirer parti des données disponibles en masse dans différents formats, modèles et systèmes.

L’accent est particulièrement mis sur le développement d’algorithmes efficaces :

  • pour l’interrogation de données prenant en compte des connaissances ontologiques
  • pour l’intégration et l’analyse de données hétérogènes
  • pour le traitement de données liées, et le liage de données issues de différentes bases
  • pour raisonner sur des données incomplètes, pouvant être incertaines et de qualité variable (possiblement inconsistantes avec les connaissances ontologiques, issues de bases de diverse fiabilité, …).

L’objectif est de fédérer une communauté française sur le sujet.

Trois domaines d’application sont mis en avant, avec des fournisseurs de données prêts à mettre leurs données à disposition de la communauté de recherche : 


  • Agriculture numérique. L’institut de convergence #DigitAd (Human-Centred Digital Agriculture Convergence Lab) basé à Montpellier sera initié en janvier 2017. Son objectif général est de construire les briques scientifiques permettant le déploiement de l’agriculture numérique, en se basant sur une approche pluri-disciplinaire. En association avec #DigitAd, l’Irstea a été mandaté par les ministres de l’agriculture, de la recherche et de l’économie pour proposer un portail de données agricoles ouvertes. Dans ce domaine, de nombreuses bases de données relationnelles existent et stockent des données hétérogènes massives qu’il s’agit d’intégrer pour en faciliter l’accès à des usagers (décideurs, scientifiques, agriculteurs) ayant des besoins d’analyse très variés. Des ontologies, développées avec l’aide des experts du domaine, offrent un vocabulaire métier pour servir d’interfaces de requêtes adaptées au différents utilisateurs impliqués. Ce domaine est particulièrement adapté au développement d’approches de type Ontology-Based Data Access, et de méthodes de gestion d’inconsistances.
  • Contenus pédagogiques en santé. La totalité des examens facultaires des facultés de médecine en France sont réalisés depuis plus de 3 ans sur une plate-forme numérique nationale dédiée intitulée SIDES. Il est offert aussi à tous les étudiants (60 000 actuellement) la possibilité de réaliser des entrainements avec correction automatique. Toutes ces activités sont tracées. L’unité élémentaire est un cas clinique, intitulé “dossier progressif”, constitué de 15 questions et devant être réalisé en 30 minutes par l’étudiant. Il existe aujourd’hui plus de 2000 dossiers de ce type dans une banque nationale dite d’entrainement alimentée par toutes les facultés de médecine de France. A titre indicatif et seulement sur la partie entrainement, plus de 4 millions de dossiers réalisés ont été enregistrés dans une base de données relationnelle de logs d’activités. Ce jeu de données sera anonymisé et permettra de tester la valeur ajoutée de l’enrichissement de ces données par des méta-données RDF et des connaissances ontologiques pour l’analyse personnalisée, et à la demande, des résultats, des lacunes et de la progression d’un étudiant ou d’un groupe d’étudiants. Les enjeux dépassent la formation initiale en Médecine car SIDES a pour vocation de s’élargir à toutes les formations en santé, y compris la formation continue.
  • Données ouvertes du Web. DBpedia.fr regroupe 200 millions de triplets RDF extraits de Wikipedia francophone et le récent DBpedia historic représente toutes les révisions de pages depuis la création de Wikipedia Fr soit 1,9 milliard de triplets. Yago contient 120 millions de triplets RDF extraits également de Wikipedia. Web Data Commons met à disposition plusieurs gros jeux de données structurées extraites du Web sur des domaines variés. Ces jeux de données permettront de tester la faisabilité et l’apport d’algorithmes d’inférence pour améliorer la qualité et la complétude des données et des réponses aux requêtes, ainsi que pour le liage et la fusion de données. De plus, avec une moyenne de 70 000 requêtes par jour et des pics à 2,5 million de requêtes, le service DBpedia.fr publie des données sur le LOD depuis 2012 et place le chapitre francophone de DBpedia en deuxième position derrière l’Anglais. Dès lors il représente aussi un domaine d’application directe des recherches proposées ici.

Visitez le site web de l’Action RoD


Évènements à venir

Sep 5 – Sep 8 all-day
Date : 2022-09-05 => 2022-09-08Lieu : Torino, Italy******************* IMPORTANT DATES ****************** Paper submission: May 3, 2022 at 5 a.m. CET Notification of acceptance: May 23, 2022 Camera-ready due: June 7, 2022 Workshop day: September 5,[...]
Aug 29 – Sep 2 all-day
Date : 2022-08-29 => 2022-09-02Lieu : SCAI, Sorbonne Université, Paris, France. Dear colleagues, We are pleased to announce the ML4Oceans Summer School 2022, to be held from August 29th to September 2nd 2022 at SCAI/Sorbonne[...]
Aug 29 – Sep 2 all-day
Date : 2022-08-29 => 2022-09-02Lieu : Saarbrücken, Germany******************************************************************* Second Inria-DFKI European Summer School on AI (IDESSAI 2022) Trusted AI and Sustainable AI Saarbrücken, Germany August 29th – September 2nd, 2022 https://idessai.eu/ Registration deadline: May 9th,[...]
Aug 11 – Aug 13 all-day
Date : 2022-08-11 => 2022-08-13Lieu : Nanjing, ChinaThe Asia Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint International Conference on Web and Big Data (APWeb-WAIM) is aiming at attracting professionals of different communities related[...]
Jul 31 – Aug 1 all-day
Offre en lien avec l’Action/le Réseau : RoCED/– — – Laboratoire/Entreprise : CERI Systèmes Numériques – IMT Nord Europe Durée : 5 mois Contact : jerry.lonlac@imt-nord-europe.fr Date limite de publication : 2022-07-31 Contexte : L’objectif[...]
Jul 31 – Aug 1 all-day
Offre en lien avec l’Action/le Réseau : – — –/– — – Laboratoire/Entreprise : Institut de Neurosciences de la Timone, INT, Marse Durée : 4-6 mois Contact : sylvain.takerkart@univ-amu.fr Date limite de publication : 2022-07-31[...]
Jul 19 – Jul 23 all-day
Date : 2022-07-19 => 2022-07-23Lieu : Porto, Portugal17th Conference of the International Federation of Classification Societies Conference topics Big Data • Biplots • Clustering, Classification and Discrimination • Compositional Data Analysis • Computer Graphics and[...]
Jul 7 – Jul 8 all-day
Date : 2022-07-07 => 2022-07-08Lieu : Marseille, Campus saint-CharlesComSciCon France, le workshop gratuit de formation à la communication scientifique à destination des doctorant·es de toutes disciplines, revient pour une 3ème édition les 7 et 8[...]
Jul 5 all-day
Date : 2022-07-05Lieu : Grenoble, FranceAALTD 2022: CALL FOR PAPERS https://project.inria.fr/aaltd22/ ################################################################################   The 7th International Workshop on Advanced Analytics and Learning on Temporal Data (AALTD 2021) will be held on Friday, September 23, 2022,[...]
Jul 4 – Jul 7 all-day
Date : 2022-07-04 => 2022-07-07Lieu : Samatan, Gers, France Call for Papers Call for Papers SCOPE The second edition of CIRCLE will take place on July 4-7, 2022 at Samatan, Gers, south of France (50[...]
Jul 2 all-day
Date : 2022-07-02Web site: https://www.frontiersin.org/research-topics/34050/text-complexity-and-simplification Submission Deadlines 02 July 2022 Manuscript Context Text complexity assessment is one of the urgent problems of our time. Many modern texts, including classroom books and legislative acts, prove to[...]
Jun 30 – Jul 1 all-day
Offre en lien avec l’Action/le Réseau : – — –/– — – Laboratoire/Entreprise : Equipe PETRUS INRIA / UVSQ Durée : 6 mois Contact : luc.bouganim@inria.fr Date limite de publication : 2022-06-30 Contexte : The[...]
Jun 29 all-day
Date : 2022-06-29Lieu : PFIA 2022, Saint Etienne Cette journée est organisée avec le soutien de la Région Auvergne Rhone-Alpes et le Collège Industriel de l’AFIA dans le cadre de la Plate-Forme Intelligence Artificielle (PFIA)[...]
Jun 27 – Jun 30 all-day
Date : 2022-06-27 => 2022-06-30Lieu : Université de Caen NormandieÉcole Thématique BigSportData « Analyse de données sportives massives » Caen du 27 au 30 juin 2022 https://big-sports-data.sciencesconf.org Date limite d’inscription : 15 mai 2022 Public[...]
Jun 27 – Jun 30 all-day
Date : 2022-06-27 => 2022-06-30Lieu : ENSTA Bretagne, Brest, FranceLe workshop SERENADE 2022 (Surveillance, Etude et Reconnaissance de l’Environnement mariN par Acoustique DiscrètE http://serenade.ensta-bretagne.fr) se tiendra du 27 au 30 juin 2022 à Brest à[...]
Jun 20 – Jun 24 all-day
Date : 2022-06-20 => 2022-06-24Lieu : Paris, Université Paris Cité (Paris 13).We are glad to announce that the second edition of a workshop on Bayesian Deep Learning for Cosmology and Time Domain Astrophysics 2022 is[...]
Jun 19 – Jun 23 all-day
Date : 2022-06-19 => 2022-06-19Lieu : Bastia, Corse, France, Centre IGESA, La Marana ÉCOLE THÉMATIQUE DU CNRS : BDA MDD 19 – 24 juin 2022, Bastia, Corse, France https://cedric.cnam.fr/lab/confs/mdd2022/ LES INSCRIPTIONS SONT OUVERTES Date limite[...]
Jun 15 – Jun 16 all-day
Offre en lien avec l’Action/le Réseau : RoCED/– — – Laboratoire/Entreprise : Bioinformatics Institute, A*STAR Durée : 6 months Contact : woo_xing_yi@bii.a-star.edu.sg Date limite de publication : 2022-06-15 Contexte : This offer is proposed by[...]
Jun 14 – Jun 16 all-day
Date : 2022-06-14 => 2022-06-16Lieu : Palermo, ItalyWe are in the era of Earth Observation and free geo big data generated periodically with high revisiting time. Just to cite some sources of remote sensing data,[...]
Jun 6 – Jun 9 all-day
Date : 2022-06-06 => 2022-06-09Lieu : Paphos, Cyprus **************************************************************************** C A L L F O R P A P E R S – R E S E A R C H T R A C[...]
Jun 1 – Jun 2 all-day
Offre en lien avec l’Action/le Réseau : – — –/– — – Laboratoire/Entreprise : IBISC/LMEE, Université Paris-Saclay, Univ. Evry Durée : 4 à 6 mois Contact : Khalifa.Djemal@ibisc.univ-evry.fr Date limite de publication : 2022-06-01 Contexte[...]
Jun 1 – Jun 2 all-day
Offre en lien avec l’Action/le Réseau : – — –/– — – Laboratoire/Entreprise : LIRMM, CNRS et Univ Montpellier Durée : 6 mois Contact : marianne.huchard@lirmm.fr Date limite de publication : 2022-06-01 Contexte : Le[...]
Jun 1 – Jun 3 all-day
Date : 2022-06-01 => 2022-06-03Lieu : ParisScope As the number of sensors increases due to the development of Internet of Things (body sensors, weather station, …) and the improvement of existing devices (satellite, chirurgical robot,[...]
May 31 all-day
Date : 2022-05-31Lieu : Conférence Inforsid, Dijon, France Atelier ” Evolution des SI : vers des SI Pervasifs ? ” 3ème édition De l’intelligence à la résilience https://evolution-si.sciencesconf.org Les Systèmes d’Informations sont constamment en train[...]
May 31 all-day
Date : 2022-05-31Lieu : La Rochelle, FranceDAS 2020 CALL FOR PAPERS: DAS 2022 is the 15th international IAPR-sponsored workshop dedicated towards system-level approaches and related challenges in document analysis and recognition domain. Typically, the workshop[...]
May 31 all-day
Date : 2022-05-31Lieu : Université de Paris, Paris, FranceDOCTORAL CONSORTIUM This year, the steering committee of ICPRAI 2022 proposes the first version of the Doctoral Consortium (DC) as a satelite event to the main conference[...]
May 31 – Jun 1 all-day
Offre en lien avec l’Action/le Réseau : – — –/– — – Laboratoire/Entreprise : IBISC/LMEE, Université Paris-Saclay, Univ. Evry Durée : 4 à 6 mois Contact : Khalifa.Djemal@ibisc.univ-evry.fr Date limite de publication : 2022-05-31 Contexte[...]
May 30 – Jun 3 all-day
Date : 2022-05-30 => 2022-07-29Lieu : Online During the Inn’EO Summer School, attendees (PhD students and young researchers) will develop new skills both in excellence (modern EO applications using machine and deep learning techniques) and[...]
May 30 – Jun 3 all-day
Date : 2022-05-30 => 2022-06-03Lieu : OnlineThe Inn’EO Startech module aims at coaching PhD students and young researchers towards the spirit of innovation by putting them in a leadership position where they will have to[...]
May 18 – Jun 1 all-day
Date : 2022-05-18 => 2022-06-01Lieu : Grenoble, France Call For Papers: GRAPH-QUALITY Workshop Co-located with ECML-PKDD, 23 September 2022 https://graphquality.github.io/ ************************************************************* [Please accept our apologies if you receive multiple copies of this Call for Papers[...]