RoD (2017-2020)

Action RoD – GdR IA (2017-2020)

Raisonner sur les données (Reasoning on Data)

Responsables

Correspondant ComDIR :

Thématiques

Cette action sest inter-GDR (MaDICS et IA), avec deux thématiques centrales :

  • la gestion de données hétérogènes (sciences des données)
  • la représentation de connaissances et les raisonnements (intelligence artificielle)

Données concernées

Nous considérons des données pour lesquelles l’ajout d’une couche « sémantique » a potentiellement une forte valeur ajoutée : Données hétérogènes (hétérogénéité des modèles de données et hétérogénéité sémantique) , Données du Web (Linked Open Data) , Données imparfaites (contradictoires, incomplètes, de fiabilité variable, …)

Mots clés

Algorithmes, Ontology-Based Data Access, Intégration de données hétérogènes, Liage de données et traitement de données liées, Raisonnements sur des données imparfaites

Contexte scientifique

Au niveau international, la question de l’exploitation de connaissances pour accéder à des données volumineuses et hétérogènes est très étudiée depuis quelques années. De nombreux travaux visent à prendre en compte des connaissances de nature ontologique (qui peuvent aller de la simple taxomomie à des connaissances décrites dans des langages logiques, comme les logiques de description, ou des langages à base de règles, organisés et étudiés en fragments d’expressivité variable) et à exploiter les inférences associées à ces connaissances dans tout le cycle de vie des données (accès, validation, enrichissement, etc.), le problème emblématique étant celui de l’interrogation (ou requêtage) des données (de nombreuses tâches complexes sur les données pouvant se reformuler en termes d’interrogation). On peut citer notamment la problématique d’Ontology-Based Data Access, très présente au niveau international dans les communautés Knowledge Representation and Reasoning, Data Management, et Semantic Web, mais dans une moindre mesure en France.

Cette action s’intéresse de façon générale au développement de techniques de représentation de connaissances et de raisonnements permettant de mieux tirer parti des données disponibles en masse dans différents formats, modèles et systèmes.

L’accent est particulièrement mis sur le développement d’algorithmes efficaces :

  • pour l’interrogation de données prenant en compte des connaissances ontologiques
  • pour l’intégration et l’analyse de données hétérogènes
  • pour le traitement de données liées, et le liage de données issues de différentes bases
  • pour raisonner sur des données incomplètes, pouvant être incertaines et de qualité variable (possiblement inconsistantes avec les connaissances ontologiques, issues de bases de diverse fiabilité, …).

L’objectif est de fédérer une communauté française sur le sujet.

Trois domaines d’application sont mis en avant, avec des fournisseurs de données prêts à mettre leurs données à disposition de la communauté de recherche : 


  • Agriculture numérique. L’institut de convergence #DigitAd (Human-Centred Digital Agriculture Convergence Lab) basé à Montpellier sera initié en janvier 2017. Son objectif général est de construire les briques scientifiques permettant le déploiement de l’agriculture numérique, en se basant sur une approche pluri-disciplinaire. En association avec #DigitAd, l’Irstea a été mandaté par les ministres de l’agriculture, de la recherche et de l’économie pour proposer un portail de données agricoles ouvertes. Dans ce domaine, de nombreuses bases de données relationnelles existent et stockent des données hétérogènes massives qu’il s’agit d’intégrer pour en faciliter l’accès à des usagers (décideurs, scientifiques, agriculteurs) ayant des besoins d’analyse très variés. Des ontologies, développées avec l’aide des experts du domaine, offrent un vocabulaire métier pour servir d’interfaces de requêtes adaptées au différents utilisateurs impliqués. Ce domaine est particulièrement adapté au développement d’approches de type Ontology-Based Data Access, et de méthodes de gestion d’inconsistances.
  • Contenus pédagogiques en santé. La totalité des examens facultaires des facultés de médecine en France sont réalisés depuis plus de 3 ans sur une plate-forme numérique nationale dédiée intitulée SIDES. Il est offert aussi à tous les étudiants (60 000 actuellement) la possibilité de réaliser des entrainements avec correction automatique. Toutes ces activités sont tracées. L’unité élémentaire est un cas clinique, intitulé “dossier progressif”, constitué de 15 questions et devant être réalisé en 30 minutes par l’étudiant. Il existe aujourd’hui plus de 2000 dossiers de ce type dans une banque nationale dite d’entrainement alimentée par toutes les facultés de médecine de France. A titre indicatif et seulement sur la partie entrainement, plus de 4 millions de dossiers réalisés ont été enregistrés dans une base de données relationnelle de logs d’activités. Ce jeu de données sera anonymisé et permettra de tester la valeur ajoutée de l’enrichissement de ces données par des méta-données RDF et des connaissances ontologiques pour l’analyse personnalisée, et à la demande, des résultats, des lacunes et de la progression d’un étudiant ou d’un groupe d’étudiants. Les enjeux dépassent la formation initiale en Médecine car SIDES a pour vocation de s’élargir à toutes les formations en santé, y compris la formation continue.
  • Données ouvertes du Web. DBpedia.fr regroupe 200 millions de triplets RDF extraits de Wikipedia francophone et le récent DBpedia historic représente toutes les révisions de pages depuis la création de Wikipedia Fr soit 1,9 milliard de triplets. Yago contient 120 millions de triplets RDF extraits également de Wikipedia. Web Data Commons met à disposition plusieurs gros jeux de données structurées extraites du Web sur des domaines variés. Ces jeux de données permettront de tester la faisabilité et l’apport d’algorithmes d’inférence pour améliorer la qualité et la complétude des données et des réponses aux requêtes, ainsi que pour le liage et la fusion de données. De plus, avec une moyenne de 70 000 requêtes par jour et des pics à 2,5 million de requêtes, le service DBpedia.fr publie des données sur le LOD depuis 2012 et place le chapitre francophone de DBpedia en deuxième position derrière l’Anglais. Dès lors il représente aussi un domaine d’application directe des recherches proposées ici.

Visitez le site web de l’Action RoD


Évènements à venir

Nov 28 – Nov 30 all-day
Date : 2023-11-28 => 2023-11-30Lieu : French Riviera, FranceYou are cordially invited to submit your contribution until September 02, 2023. SPEAKERS • Michael Bronstein University of Oxford UK • Kathleen Carley Carnegie Mellon University USA[...]
Oct 30 – Nov 3 all-day
Date : 2023-10-30 => 2023-11-03Lieu : Le Lazaret La Corniche 223 Rue Pasteur Benoît 34200 Sète** Institut d’Automne en Intelligence Artificielle (IA2) L’Institut d’Automne en Intelligence Artificielle (IA2) a pour but de proposer une école[...]
Oct 29 – Nov 3 all-day
Date : 2023-10-29 => 2023-11-03Lieu : Ottawa, Canada In conjunction with ACM Multimedia 2023Call for Papers SUMAC 2023: 5th ACM International workshop on analySis, Understanding and proMotion of heritAge Contents Advances in machine learning, signal[...]
Oct 16 – Oct 19 all-day
Date : 2023-10-16 => 2023-10-19Lieu : Paris, FranceThe 12th International Conference on Image Processing Theory, Tools and Applications IPTA 2023 aims at gathering international researchers, innovators, educators, and practitioners in image processing for attending extensive[...]
Oct 5 – Oct 6 all-day
Date : 2023-10-05 => 2023-10-06Lieu : CaenLes prochaines journées de la SFCi (Société Française de ChemoInformatique) sont programmées les 5-6 octobre prochains à Caen. Les inscriptions sont ouvertes sur le site web de ces journées[...]
Sep 28 – Sep 30 all-day
Date : 2023-09-28 => 2023-03-07Lieu : Penang, Malaysia*************************************************************************** We apologize if you receive multiple copies of this CFP *************************************************************************** C A L L F O R P A P E R S The 34th International[...]
Sep 18 – Sep 19 all-day
Annonce en lien avec l’Action/le Réseau : Thème : Machine Learning for Earth Observation Data Présentation : This workshop aims to be an international forum where machine learning researchers and domain experts can meet each[...]
Sep 5 all-day
Date : 2023-09-05Lieu : ToulouseSéminaire de la Société Française de Photogrammétrie et Télédétection Inscription avant le 15 septembreLien direct Notre site web : www.madics.fr Suivez-nous sur Tweeter : @GDR_MADICS Pour vous désabonner de la liste,[...]
Sep 4 – Sep 5 all-day
Annonce en lien avec l’Action/le Réseau : DOING Thème : The workshop focuses on transforming data into information and then into knowledge. It addresses various aspects of information extraction from textual data, intelligent and efficient[...]
Aug 28 – Aug 30 all-day
Date : 2023-08-28 => 2023-08-30Lieu : Penang, Malaysia**** IMPORTANT DATES **** Paper submission: 07 April 2023 (SHARP – FINAL) Notification of acceptance: 10 May 2023 Camera-ready copies due: 1 June 2023 Conference days: 28-30 August[...]
Aug 8 all-day
Date : 2023-08-08Lieu : Lisbon, PortugalFirst Workshop on Conceptual design for Internet of Robotic Things (CD4IoRT) To be held in conjunction with ER 2023 (https://er2023.inesc-id.pt) November 6-9 2023 Lisbon, Portugal https://pros.unicam.it/cd4iort !!!!Selected regular papers will[...]
Jul 17 – Jul 20 all-day
Date : 2023-07-17 => 2023-07-20Lieu : July 17-20, 2023 : Sherbrooke, QC, Canada and Sept 18-20, 2023 : OnlineFOIS 2023 Call for papers Definition and scope The FOIS conference is a meeting point for all[...]
Jul 11 – Jul 14 all-day
Date : 2023-07-11 => 2023-07-14Lieu : Bangalore, India16th International Conference on Educational Data Mining (EDM 2023) Bangalore, July 11-14, 2023 https://educationaldatamining.org/edm2023/calls It is a pleasure to invite you to Educational Data Mining (EDM 2023). Educational[...]
Jul 11 – Jul 14 all-day
Date : 2023-07-11 => 2023-05-28Lieu : Osaka, Japan=============================================================== [Call for Papers] The 27th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2023) http://pakdd2023.org/ Conference date: May 25-28, 2023 – Osaka, Japan (Onsite/online hybrid) Paper[...]
Jul 10 – Jul 13 all-day
Date : 2023-07-10 => 2023-07-13Lieu : Rabat (Morocco) @page { size: 8.27in 11.69in; margin: 0.79in } p { margin-bottom: 0.1in; line-height: 115%; background: transparent } h5 { margin-top: 0.08in; margin-bottom: 0.04in; background: transparent; page-break-after: avoid[...]
Jul 7 all-day
Date : 2023-07-07Lieu : Strasbourg————– Atelier SOSEM — Présentation ————– Cet atelier s’intéresse à la question de la science ouverte sous l’angle de l’exploitation des outils du web sémantique. En particulier, l’apport des technologies sémantiques[...]
Jul 3 – Jul 5 all-day
Date : 2023-07-03 => 2023-07-05Lieu : StrasbourgCAp is an interdisciplinary gathering of researchers at the intersection of machine learning, applied mathematics, and related areas. This year it takes place at Strasbourg from July 3 to[...]
Jul 3 – Jul 5 all-day
Date : 2023-07-03 => 2023-07-05Lieu : StrasbourgThe submission information can be found here (https://pfia23.icube.unistra.fr/conferences/cap/index.html). Submitted papers can be either in English or in French and we encourage two types of submissions: Full research papers on[...]
Jul 3 – Jul 5 all-day
Date : 2023-07-03 => 2023-07-05Lieu : Nancy (Campus Lettres & Sciences humaines)[À l’attention des doctorants et doctorantes] Bonjour à toutes et à tous, ComSciCon France est un workshop de formation à la communication scientifique à[...]
Jul 3 – Jul 4 all-day
Annonce en lien avec l’Action/le Réseau : Thème : Stockage des données Présentation : L’objectif de cette journée est de faire le point sur les avancées technologiques et les grands défis à relever dans le[...]
Jul 3 – Jul 7 all-day
Date : 2023-07-03 => 2023-07-07Lieu : Paris & Online En cas de difficulté à visualiser ce courriel, veuillez cliquer sur le lien suivant Voir la version en ligne Registrations for the third edition of the[...]
Jun 26 – Jul 7 all-day
Date : 2023-06-26 => 2023-07-07Lieu : L’école aura lieu dans le Sud-Est de la France, hébergée par le Village de Vacances Igesa « Destremau » École Thematique AstroInformatique 2023 et Hackathon AstroInfo AISSAI La troisième[...]
Jun 5 – Jun 9 all-day
Date : 2023-06-05 => 2023-06-09Lieu : Paris, Site des CordeliersConférence TALN-CORIA-RECITAL-RJCRI 2023 Du 5 au 9 juin 2023 Paris, France Les laboratoires franciliens organisent du 5 au 9 juin 2023 sur le campus Sorbonne Université[...]
Jun 1 – Jun 2 all-day
Date : 2023-06-01 => 2023-06-02Lieu : Campus Scientifique Université Savoie Mont BlancCall for Papers TOTh 2023 CONFERENCE – ONSITE & ONLINE Terminology & Ontology: Theories and applications http://toth.condillac.org/ 1 & 2 June 2023 University Savoie[...]
Jun 1 – Jun 2 all-day
Date : 2023-06-01 => 2023-06-02Lieu : Campus Scientifique du Bourget du Lac Université Savoie Mont-BlancCreated in 2007, the TOTh Conferences bring together researchers and professionals interested in terminology and ontology, and, more generally in the[...]
May 31 – Jun 2 all-day
Date : 2023-05-31 => 2023-01-20Lieu : Lyon, FranceECOLE D’HIVER – APPEL A PARTICIPATION 9ème Ecole d’Hiver é-EGC sur le thème « Gestion et traitement intelligent des écosystèmes de graphes de connaissances » 16 – 20[...]
May 31 – Jun 2 all-day
Date : 2023-05-31 => 2023-06-02Lieu : Le Havre, France Third French Regional Conference on Complex Systems May 31 – June 02, 2023 Le Havre, France FRCCS 2023 You are cordially invited to submit your contribution[...]
May 30 – Jun 2 all-day
Date : 2023-05-30 => 2023-06-02Lieu : Université Savoie Mont Blanc Campus Scientifique du Bourget du Lac=========================================================================== TOTh 2023 – Terminology & Ontology: Theories and applications University Savoie Mont Blanc (France) Conference: 1 & 2 June[...]
May 30 – Jun 2 all-day
Date : 2023-05-30 => 2023-06-02Lieu : La RochelleAPPEL A COMMUNICATION 41ème Congrès INFORSID 2023 La Rochelle, 30 mai-2 Juin 2023 https://inforsid2023.sciencesconf.org Les organisations et le monde vivent actuellement de grandes transformations largement liées aux technologies[...]
May 30 – May 31 all-day
Date : 2023-05-30 => 2023-05-31Lieu : Campus Scientifique Université Savoie Mont BlancTOTh TRAINING 2023 “Terminology & Digital Humanities” Digital Humanities (DH) is a newly emerging interdisciplinary area at the intersection of Computer Science and the[...]