Offre de thèse CIFRE : Extraction d’entités et de relations dans le domaine scientifique

When:
30/11/2020 – 01/12/2020 all-day
2020-11-30T01:00:00+01:00
2020-12-01T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’Informatique de Paris Nord (LIPN)
Durée : 3 ans
Contact : tomeh@lipn.fr
Date limite de publication : 2020-11-30

Contexte :
Laboratoire :
Le/la doctorant.e intégrera l’équipe de Représentations des Connaissances et Langage Naturel (RCLN; https://lipn.univ-paris13.fr/accueil/equipe/rcln/) du Laboratoire d’Informatique de Paris Nord (LIPN), UMR CNRS 7030 attaché à l’Université Sorbonne Paris Nord. L’équipe RCLN est membre du laboratoire d’excellence EFL (Empirical Foundations of Linguistics; http://www.labex-efl.com).

Société :
Un groupe international de conseil dans le domaine de la Recherche, du Développement et de l’Innovation, intervenant sur les aspects organisationnels, structurels, méthodologiques, scientifiques et financiers. La société conseille les entreprises les plus à la pointe dans leurs secteurs, celles qui innovent et fondent leur avance stratégique sur des travaux de recherche expérimentaux et fondamentaux, avec une expérience de plus de 20 ans et plusieurs milliers de collaborations à travers le monde, sur tous les continents. Au sein du groupe, la Direction Scientifique a pour mission de coordonner l’ensemble des actions scientifiques, tant sur les plans opérationnels, que méthodologiques et conceptuels. Elle s’appuie, en France, sur les ressources de plus de 60 docteurs de toutes disciplines. Au cœur de cette Direction Scientifique, le doctorant intégrera l’équipe du Research Lab, le département R&D interne du groupe basé à la Défense à Paris.

Sujet :
Le/la doctorant.e travaillera sur la conception et la mise en oeuvre d’un système d’extraction jointe d’entités et de relations sémantiques à partir de textes écrits par des experts dans des différents domaines techniques.

Sujet détaillé :
https://lipn.univ-paris13.fr/~tomeh/public/uploads/offers/phd-cifre-relation-extraction.pdf

Mots clés :
Traitement automatique des langues (natural language processing); Apprentissage profond (deep learning); Extraction d’entités et de relations (entity and relation extraction); Analyse de dépendances syntaxiques (dependency parsing); Apprentissage automatique (machine learning); Representations des connaissances (knowledge representation)

Profil du candidat :

Formation et compétences requises :
Master 2 (ou équivalent) en informatique ou mathématiques appliqués.
Spécialisation en traitement automatique des langues (TAL) ou en apprentissage automatique (machine learning) ;
Connaissances en réseaux de neurones et apprentissage profond (deep learning) ;
Des connaissances en représentations des connaissances seraient appréciées ;
Bonne maîtrise des langages python et C++ ;
Bon niveau d’anglais ;
Bon niveau de français.

Adresse d’emploi :
La Défense, Paris.