Administrateur d’une base de données graphe (H/F)

When:
23/04/2023 – 24/04/2023 all-day
2023-04-23T02:00:00+02:00
2023-04-24T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT
Durée : 9 mois
Contact : pascal.dayre@irit.fr
Date limite de publication : 2023-04-23

Contexte :
Faisant suite à l’open data, le mouvement de la science ouverte prône les principes FAIR pour développer une culture de la gestion et du partage des données chez tous les acteurs de la recherche. Les principes FAIR formalisent des lignes directrices pour améliorer le repérage [F], l’accessibilité [A], l’interopérabilité [I] et la réutilisation [R] des ressources numériques scientifiques.
Le contexte métier est celui du dispositif de recherche (LabEx DRIIHM)
rassemblant 13 observatoires scientifiques, les observatoires « hommes-milieux » (OHM) qui étudient les dynamiques environnementales, culturelles et sociétales sur ces territoires, à différentes échelles spatiales et temporelles.
Des données hétérogènes et multidisciplinaires sont produites chaque année. Au-delà de leurs incontournables stockage et catalogage, il est crucial d’améliorer le partage et l’ouverture de ces données pour favoriser les analyses croisées interdisciplinaires et communiquer les résultats scientifiques auprès de la société.

Sujet :
Dans le cadre du projet ANR SO-DRIIHM, il/elle effectuera une mission d’administration et de gestion d’une base de données graphe d’une plateforme pour la science ouverte.

La plateforme internet est composée d’un backend (les services du serveur) et d’un frontend (IHM web). Le backend persiste ses métadonnées avec un serveur sparQL.

La base de données graphe est utilisée pour la gestion des métadonnées descriptives des données et aussi de la plateforme.

La mission consiste dans un premier temps à une prise en main des ontologies et vocabulaires de référence pour les données ouvertes sur le web des données, puis à faire un travail d’administration de la base de données (sauvegardes, restaurations, importations, exploitation des logs, métrologie et optimisation des requêtes, …) et aussi à écrire les requêtes selon les besoins des développements du frontend et du backend. Travail pour l’intégration de données sur des ETL et/ou ELT pour moissonner ou publier vers des services tiers.

Dans un deuxième temps, il/elle collaborera avec l’équipe à la modélisation des méta-données utilisées pour étendre les ontologies de référence et enrichir les services, les fonctionnalités et l’ergonomie de la plateforme et aussi à la mise en place du cycle de vie des métadonnées selon des règles de gestion.

SHACL sera étudié pour le contrôle de la qualité et des insertions des métadonnées.
Une participation aux développement peut être envisagée.

Profil du candidat :
Bac + 5 en informatique, en base de données graphes, en web des données, en développement web.

Formation et compétences requises :
Bac + 5 en informatique

– Construire et administrer un système de base de données (expertise).
– Connaître les bases de données graphe (sparQL endpoint, triple store). Avoir un usage avéré d’une moteur de base sparQL (graphDB, virtuoso, …).
– Maîtriser le langage de requête et du protocole sparQL.
– Connaître les outils et les standards du web des données: RDF/RDFS, OWL, les vocabulaires et ontologies.
– Savoir modéliser une base de données graphe.
– Connaître les standards du web des données comme DCAT est un plus.
– Connaître les technologies du web (http, JSON, XML, …).
– Connaître les langages python et javascript est un plus.
– Connaître SHACL et la qualité des données est un plus.
– Être curieux et souhaiter apprendre.
– Connaître Github ou gitlab et Docker (apprécié).
– Rédiger et mettre à jour la documentation fonctionnelle et technique.
– Travailler en équipe.

Adresse d’emploi :
https://emploi.cnrs.fr/Offres/CDD/UMR5602-EMILER-005/Default.aspx