Enrichissement de ressources sémantiques du domaine par des connaissances de sens commun.

When:
31/05/2021 – 01/06/2021 all-day
2021-05-31T02:00:00+02:00
2021-06-01T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIPN
Durée : 5 mois
Contact : manel.zarrouk@lipn.univ-paris13.fr
Date limite de publication : 2021-05-31

Contexte :
Le projet BNI (Bibliothèque Numérique des Idées) [1] offre des fonctionnalités d’accès riches en exploitant des modèles sémantiques dans le domaine de la philosophie. La plateforme indexe actuellement les œuvres de Adam Smith et Francis Hutcheson. Deux types de ressources sémantiques sont exploitées : des thésaurus et des grilles de lecture qui sont des structures arborescentes qui cartographient le champ de pensée des auteurs.

Sujet :
L’objectif du stage est l’enrichissement des ressources sémantiques produites par des connaissances générales qui permet de mettre à profit leur complémentarité.

Cet enrichissement est envisagé en deux parties :
– L’enrichissement statique qui consiste en l’augmentation des ressources du domaine par des entités lexicales et des relations lexico-sémantiques en voisinage direct avec les nœuds déjà existants. Pour ceci nous utiliserons le réseau lexico-sémantique JeuxDeMots (JDM) [2] comme base de connaissance générale.
– L’enrichissement dynamique, qui peut s’appuyer sur des mécanismes d’inférence pour proposer automatiquement de nouvelles relations à partir de celles qui existaient déjà dans le réseau [3]. D’autres pistes sont envisagées qui intègrent l’apprentissage automatique.

Les différentes étapes du travail à réaliser sont les suivantes :
– Mise en place de techniques d’alignement lexical de l’état de l’art
– État de l’art sur les techniques d’enrichissement de connaissances
– Mise en œuvre d’enrichissement statique
– Mise en œuvre et comparaison d’enrichissement dynamique
– Évaluation des propositions dans le cadre du projet

Profil du candidat :
Master 2 en Informatique (orienté recherche).
Bon niveau en Anglais exigé.
Ce stage est proposé à des étudiants qui disposeraient d’un bon niveau académique, d’une curiosité scientifique affirmée et qui envisagent une orientation professionnelle future dans le domaine de la recherche.

Formation et compétences requises :
– Domaines techniques : Intelligence Artificielle, Traitement automatique des Langues, Ingénierie des Connaissances, Extraction d’information à partir de textes, Apprentissage automatique.
– Compétences en développement : Java, Python, PHP

Adresse d’emploi :
Ce stage d’une durée de 5 mois se déroulera au Laboratoire d’Informatique de Paris Nord (LIPN) dans l’équipe Représentation des Connaissances et Langage Naturel (RCLN). Les travaux de l’équipe visent à articuler langage et connaissances pour améliorer les processus d’acquisition de connaissances, d’analyse textuelle, d’exploitation et d’exploration des corpus. L’encadrement sera assuré par Haïfa Zargayouna et Manel Zarrouk. Compte tenu du contexte sanitaire, des arrangements de travail à distance sont envisageables.