post-doc: désambiguïsation sémantique multimédia (Vision par ordinateur ou TAL)

When:
15/12/2017 – 16/12/2017 all-day
2017-12-15T01:00:00+01:00
2017-12-16T01:00:00+01:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : CEA LIST
Durée : 12 mois
Contact : herve.le-borgne@cea.fr
Date limite de publication : 2017-12-15

Contexte :
Le CEA LIST propose un post-doc sur la désambiguïsation sémantique multimédia dans le cadre d’une collaboration avec le CNRS LIMSI. Le sujet se situe à la croisée de la vision par ordinateur et du traitement du langage naturel, pour fabriquer des espaces communs aux deux média texte et image.
CDD de 12 mois au CEA à nanoinnov (Palaiseau, 91), à pourvoir en janvier 2018.

Le CEA-LIST est un laboratoire de 800 personnes, localisé sur le plateau de Saclay (91), dont les axes de recherche s’inscrivent dans le domaine des systèmes complexes à dominante logiciel. La mission du CEA LIST est le transfert d’innovation vers le monde industriel. Par ce positionnement, le CEA LIST occupe une place privilégiée dans les réseaux de collaboration entre laboratoires académiques, centre de recherche et acteurs industriels (grand groupes et PME) à l’échelle européenne et mondiale.
Au sein du CEA LIST, le Laboratoire Vision et Ingénierie des Contenus (www.kalisteo.eu) regroupe 80 chercheurs autour de thèmes de recherche qui sont l’analyse de document Multimédia (analyse jointe texte et image) et d’autres activité de vision par ordinateur. La personne recrutée travaillera notamment avec H. Le Borgne (vision par ordinateur), O. Ferret et R. Besançon (traitement automatique des langues).
Le post-doc sera co-encadré par Brigitte Grau, appartenant à l’équipe « Information Langue Écrite et Signée » du CNRS LIMSI (https://www.limsi.fr/fr/recherche/iles).
H. Le Borgne : https://sites.google.com/site/hleborgne
B. Grau : https://perso.limsi.fr/bg/

Sujet :
La liaison d’entités (ou entity linking) consiste à relier des mentions d’entités d’un texte à des entités d’une base de connaissance (BC) si elles existent, dans le but de normaliser ces mentions. C’est un problème qui se pose, par exemple, pour le peuplement de bases de connaissances par extraction d’information à partir de textes. Une difficulté de cette tâche est la résolution d’ambiguïtés car les systèmes ont à choisir parmi un nombre important de candidats.

La désambiguïsation d’entités en tant que telle concerne à ce jour des données textuelles exclusivement, mettant en regard des problématiques de traitement automatique de la langue et de représentation de la connaissance. Le post-doc de 12 mois proposé vise à étudier l’intérêt d’ajouter la dimension visuelle pour aider à la désambiguïsation, chaque fois que cela peut être utile.

La vision par ordinateur a connu une rupture significative de la qualité des résultats de reconnaissance visuelle faisant suite au retour en grâce des réseaux de neurones sous forme d’architectures profondes. L’apprentissage profond a également eu un impact bénéfique dans le domaine du traitement des langues naturelles, bien que moins significatif qu’en vision à ce jour. En particulier les modèles de word embedding tel celui de (Mikolov et al., 2013) offrent une représentation des mots qui ont permis des avancées dans plusieurs tâches. Ce post-doc se situe à la croisée de la vision par ordinateur et du traitement du langage naturel, pour fabriquer des espaces communs « texte et image ».

L’approche générale envisagée repose sur un couplage précoce des entités visuelles et textuelles, obtenu au sein d’un espace commun texte image résultant, par exemple, d’un apprentissage par un réseau neuronal profond tendant à optimiser le rapprochement des documents à lier (image et texte se correspondant). Il s’agira d’étudier comment prendre en compte les représentations construites soit pour améliorer la sélection d’entités candidates à partir d’une mention dans un texte soit pour sélectionner le meilleur candidat. La dernière tâche concernera l’évaluation de l’intérêt des méthodes développées. Elle sera menée prioritairement sur une tâche de désambiguïsation d’entités nommées au sein d’articles (de presse) illustrés. Étant donné la nouveauté de la problématique en tant que telle, un ou plusieurs corpus pourront être créés en vue d’être distribués auprès de la communauté scientifique.

Le post-doc devra aboutir à des publications dans les conférences et revues du meilleur niveau du domaine concerné. La personne recrutée participera à des séminaires et présentera les résultats de ses travaux devant les groupes de travail concernés du plateau de Saclay (DIGICOSME). Idéalement, les expérimentations s’appuieront sur un code suffisamment bien structuré pour qu’il puisse donner lieu à un démonstrateur. La mise en place d’un démonstrateur complet n’est pas requise dans le cadre du post-doc, celle-ci pouvant être réalisée par des ingénieurs des équipes co-encadrant le post-doc. Toutefois, si la personne recrutée estime que la réalisation d’un tel démonstrateur valorise sa carrière, elle aura la possibilité de s’y investir, notamment si cela peut faire l’objet d’une participation à un workshop dédié, adossé à l’une des conférences du domaine.

Profil du candidat :
Envoyer CV (format PDF ou URL), lettres de recommandation et lettre/mail de motivation personnalisée à herve.le-borgne@cea.fr et brigitte.grau@limsi.fr

Merci de ne pas envoyer votre manuscrit de thèse ni vos publications par mail (leur référence dans le CV suffisent).

Salaire selon expérience et diplôme (estimation sur demande à partir du CV).

Formation et compétences requises :
– Doctorat en vision par ordinateur ou traitement automatique des langues ou apprentissage
– Publications dans des revues et conférences du meilleur niveau de son domaine
– Autonome, rigoureux et doté d’une forte motivation.
– Appétence pour le travail collaboratif et en équipe.
– Expérience de l’environnement Linux. Maîtrise de langages de script (python, bash…)
– Idéalement, maîtrise de Tensorflow ou PyTorch ou Caffe ou Theano.
– Idéalement, maîtrise du C++.

Adresse d’emploi :
Le post-doc sera localisé à NanoInnov, avenue de la Vauve, à Palaiseau (91)

Document attaché : post_doc_mael.v3.pdf