Ingénieur.e d’étude (H/F) Data Scientist ANR SUMM-RE

When:
28/10/2022 – 29/10/2022 all-day
2022-10-28T02:00:00+02:00
2022-10-29T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Parole et Langage
Durée : 12 mois
Contact : laurent.prevot@univ-amu.fr
Date limite de publication : 2022-10-28

Contexte :
L’objectif général du projet est d’utiliser les informations sémantiques riches fournies par la structure du discours pour améliorer les algorithmes de résumé automatique.

Un objectif central de SUMM-RE est de s’appuyer sur des travaux existants qui exploitent une faible supervision pour annoter automatiquement des ensembles de données pour la structure du discours en étendant ces méthodes au discours spontané et conversationnel.

Un deuxième objectif est de créer un corpus audio/vidéo de 100 heures d’interactions parlées, multipartites, de type réunion en français, qui sera utile aux chercheurs dans de nombreux domaines. Cet objectif est motivé non seulement par le manque général d’ensembles de données pour les tâches TAL en français, mais aussi par l’hypothèse centrale de SUMM-RE, selon laquelle les informations encodées dans les graphes de discours peuvent être exploitées pour améliorer le résumé automatique.

Sujet :
Le rôle de la personne recrutée sera de :

(i) Aider la curation des données brutes et des premières étapes de pré-traitement (détection parole / silence, transcription automatique) ;
(ii) préparer les données brutes en vue de leur diffusion à la communauté scientifique ;
(iii) Assurer la publication des données sur les entrepôts adaptés.

Profil du candidat :
Spécialiste dans l’analyse des données langagières.

Formation et compétences requises :
Master en Sciences des Données, Sciences du Langage, Sciences Cognitives

Compétences souhaitées:
– Expérience avec l’enregistrement et la gestion de données de parole et / ou comportementales ;
– Analyse d’erreurs / Annotation Manuelle / Evaluation des outils automatiques ;
– Data science (data wrangling, data viz…)

Compétences informatiques souhaitées:
– bash, python (notebooks)

Autres outils utilisés:
– SPPAS, praat, transcriber, elan

Adresse d’emploi :
5 avenue Pasteur, 13100 Aix-en-Provence