Postdoc d’1 an, TAL & Deep Learning, Collaboration Laboratoire LGI2P avec la société ESII

When:
01/09/2019 – 02/09/2019 all-day
2019-09-01T02:00:00+02:00
2019-09-02T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : IMT Mines Alès – Laboratoire de Génie Informatique et d’Ingénierie de Production (LGI2P)
Durée : 12 mois
Contact : andon.tchechmedjiev@mines-ales.fr
Date limite de publication : 2019-09-01

Contexte :
ESII produit des bornes interactives permettant d’aiguillier des usagers sur des guichets adaptés à leur demande, par exemple dans les administrations (préfecture, mairie) ou autre services (par exemple hôpitaux). Les usagers arrivent au service en question et passent devant la borne sur laquelle ils sélectionnent la nature de leur demande. La borne assigne alors l’usager à la file d’attente du guichet le plus apte à répondre à sa requête et lui donne un ticket.

ESII souhaite maintenant développer une borne actionnée vocalement, c’est à dire qu’au lieu de choisir une procédure sur l’écran, l’usager peut maintenant énoncer naturellement le motif de sa venue.

La parole de l’usager est transcrite par une brique logicielle existant et notre travail vise à proposer une solution générique qui à partir de cette transcription (imparfaite) et de la base de données domaine doit être en mesure d’automatiquement suggérer le bon guichet (en temps contraint).

*Rémunération et bénéfices*

*Statut* : Contractuel de la fonction publique

*Durée du contrat* : 12 mois

*Lieu du contrat* : IMT Mines Alès, Campus de Croupillac, Alès

Rémunération brute annuelle 44 357€, soit 2052€ nets mensuels

Sujet :
Le travail de la personne recrutée consistera à travailler sur l’implémentation d’un système de machine learning à base de modèles de langue profonds contextualisés (deep contextualized language models, par exemple OpenAI ElMo ou Google BERT) pour permettre cette recommandation :

1. La première étape consistera à construire un système non-supervisé sur la base des plongements de mots extraits des couches supérieures d’un modèle de langue profond contextualisé et de mesures de similarité sémantiques hybrides (combinant plongements et mesures hiérarchiques).

2. Dans un deuxième temps, des données d’entraı̂nement seront disponibles. Il faudra partir du même modèle de langue contextualisé profond et proposer une architecture permettant de répondre à cette tâche. Cela qui permettra de spécialiser le modèle de langue pré-calculé en le raffinant au travers de l’entraı̂nement par les données annotées.

3. Les données d’entraı̂nement initiales (construites synthétiquement) seront complétées au fur et à mesure de l’utilisation de la solution par un feedback immédiat sur le résultat de l’affectation à un guichet (correct on non). Il faudra intégrer cette composante d’entraı̂nement actif dans le système pour permettre de déterminer le moment opportun pour faire la transition entre le modèle non-supervisé et le modèle supervisé et pour raffiner l’entraı̂nement du modèle supervisé.

Profil du candidat :
*Formation*: Doctorat en Informatique (TAL) avec une première expérience de mise en opération de systèmes de machine
learning et/ou une expérience en traitement automatique des langues par des approches en deep learning.

*Compétences recherche*: Apprentissage Automatique et Profond; Traitement Automatique des Langues (word embeddings, modèles de langue profonds); Des compétences en Web Sémantique seraient un plus (RDF, SPARQL, etc.)

*Compétences techniques*: Python3; scikit-learn; Pytorch ou Tensorflow

*Compétences transversales*: Maı̂trise native du Français ou assimilé (Niveau C1+); Anglais technique

*Savoir être*: Implication et sérieux; Être force de proposition, Savoir travailler en équipe, Savoir communiquer sur l’avancement du travail à la fois avec des chercheurs spécialistes et avec des des décideurs.

Formation et compétences requises :
*Formation*: Doctorat en Informatique (TAL) avec une première expérience de mise en opération de systèmes de machine
learning et/ou une expérience en traitement automatique des langues par des approches en deep learning.

Adresse d’emploi :
*Lieu du contrat* : IMT Mines Alès, Campus de Croupillac, Alès

Document attaché :