Techniques coopératives pour l’exploitation des bases de connaissances et passage à l’échelle

When:
07/05/2019 – 08/05/2019 all-day
2019-05-07T02:00:00+02:00
2019-05-08T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : ARQUADS

Laboratoire/Entreprise : Laboratoire d’Informatique et d’Automatique pour les Systèmes
Durée : 3 ans
Contact : stephane.jean@ensma.fr
Date limite de publication : 2019-05-07

Contexte :
Avec l’émergence et la multiplication des applications du Web sémantique, de nombreuses bases de connaissances, à la fois récentes, volumineuse et potentiellement incertaines deviennent disponibles. Ces bases de connaissances contiennent des entités nommées et des faits sur ces entités, mais aussi les classes sémantiques de ces entités et leurs liens mutuels. De plus, plusieurs bases de connaissance peuvent être interconnectées au niveau de leurs entités, formant ainsi le noyau du Web des données liées (ou ouvertes).

Au LIAS, nous cherchons à proposer des techniques facilitant la gestion et l’exploitation des bases de connaissances, en particulier pour aider l’utilisateur lorsque sa requête ne lui retourne aucun résultat. Les techniques développées consistent essentiellement à identifier les causes d’échec de cette requête en explorant le treillis formé par l’ensemble des sous-requêtes. Ce treillis étant d’une taille exponentielle par rapport à la taille de la requête originale, l’exploration s’appuie sur des heuristiques et des propriétés de monotonie permettant d’élaguer l’espace de recherche.

Sujet :
Jusqu’à présent, nous n’avons considéré que le problème des réponses vides. Cependant, d’autres types de résultats peuvent être considérés comme insatisfaisants par l’utilisateur, menant à de nouvelles notions d’échec. Un premier objectif de la thèse sera d’étudier comment adapter ou étendre les approches développées à ces nouveaux contextes. Le défi principal sera d’identifier sous quelles conditions les propriétés de monotonie sont maintenues et, si ce n’est pas le cas, quelles solutions alternatives peuvent être proposées pour explorer efficacement l’espace des sous-requêtes.

D’autre part, les expérimentations que nous avons menées pour le problème des réponses vides ont montré que nos approches proposent des temps de réponse raisonnables lorsqu’elles sont utilisées sur des bases de connaissance contenant des millions de faits. Pour répondre efficacement à des besoins de passage à l’échelle sur des bases plus conséquentes, un second objectif de la thèse sera d’étudier les techniques d’optimisation applicables pour améliorer les temps de traitement des approches proposées.

Profil du candidat :
Le candidat devra être titulaire d’un Master 2 ou d’un diplôme d’ingénieur et posséder des connaissances en algèbre, traitement de données, administration de bases de données et programmation. Un bon niveau en français et en anglais est également nécessaire.

Formation et compétences requises :
Master 2 ou équivalent.

Adresse d’emploi :
Poitiers (locaux de l’ISAE-ENSMA)

Document attaché : sujet.pdf