Offre de stage : Instanciation et enrichissement par machine learning des métadonnées du « Lac de données Pablo Picasso »

When:
01/02/2023 – 02/02/2023 all-day
2023-02-01T01:00:00+01:00
2023-02-02T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ERIC
Durée : 5-6 mois
Contact : jerome.darmont@univ-lyon2.fr
Date limite de publication : 2023-02-01

Contexte :
Le projet PICASSOLETTERS vise à analyser le réseau de relations qui a
contribué à la transnationalisation de Pablo Picasso. À l’aide des méthodes et des outils de la science des données, il s’agit de réaliser une étude inédite et systématique des correspondances du peintre pour construire le réseau d’acteurs et de relations du peintre. Le corpus épistolaire comporte plus de 20000 lettres jamais explorées de façon globale et détaillée à ce jour. Le but du projet PICASSOLETTERS est de contribuer à combler deux carences : la première concerne le déficit d’études sur la totalité du réseau du peintre, la seconde concerne l’absence de données ou de métadonnées accessibles en ligne et ouvertes à tous et toutes, recensant et décrivant ce corpus épistolaire. À travers le développement d’un lac de données permettant la saisie, l’interrogation et l’analyse de métadonnées décrivant la correspondance du peintre, le projet PICASSOLETTERS propose d’expérimenter un nouveau modèle pour l’exploration des corpus.

Sujet :
Le stage comportera plusieurs volets en étroite collaboration avec les
chercheur·es en littérature, en droit et du Musée national Picasso Paris :

• instancier et améliorer à la marge une base de métadonnées déjà créé

• étudier les méthodes de machine learning récentes et les appliquer sur les métadonnées afin de les enrichir

• développer un outil « intelligent » d’assistance à la création de métadonnées (collecte automatique d’informations, suggestions et recommandations d’enrichissement en utilisant le machine learning, etc.)

• mettre en œuvre le lac de données sur la base des tâches ci-dessus.

Profil du candidat :
Master ou équivalent

Formation et compétences requises :
Programmation/programmation web, gestion et bases de données, machine learning, technologies big data.

La connaissance des langages, standards et référentiels du Web sémantique et du Web de données serait un plus.

Adresse d’emploi :
Envoyer CV, lettre de motivation et ainsi que notes de l’année universitaire précédente à adresser à sabine.loudcher@univ-lyon2.fr et jerome.darmont@univ-lyon2.fr avec en objet « Candidature stage informatique PICASSOLETTERS » d’ici le 21 novembre 2022. Les candidat∙es retenu∙es après examen des dossiers seront convoqué∙es pour un entretien en visioconférence courant décembre.

Document attaché : 202210251629_stage-picassoletters-2023.pdf