Ingénierie dirigée par les modèles et gestion des données de la recherche (niveau CDO)

When:
31/12/2020 – 01/01/2021 all-day
2020-12-31T01:00:00+01:00
2021-01-01T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : DSI / INSERM
Durée : 24 mois
Contact : isabelle.perseil@inserm.fr
Date limite de publication : 2020-12-31

Contexte :
Le projet Européen EOSC-Life contribue à faire progresser les l’application des principes FAIR (Findable, Accessible, Interoperable, Reusable) dans le domaine des sciences de la vie. Ces principes définissent les fondements d’un partage des données faciles à trouver, accessibles, interopérables et réutilisables) devenu nécessaire pour pouvoir pratiquer la recherche sur de larges bases de données.
Dans ce projet, le DSI de l’Inserm travaille en étroite collaboration avec treize grandes infrastructures européennes en sciences de la vie pour mettre à disposition de toutes les communautés en science de la vie des services de FAIRification et de provenance des données. Notre objectif principal est de réaliser ces services dans le respect du budget et des délais impartis par le projet qui est d’une durée de 4 ans.
Au sein du Worpackage (6) que nous pilotons, nous sommes en particulier co-responsables de la tâche (6.3) dédiée à la Provenance des données de recherche.
Cette tâche consiste à développer un modèle de provenance dynamique pour le domaine des sciences de la vie dans le but d’améliorer fondamentalement les problèmes de reproductibilité que les sciences de la vie connaissent depuis deux décennies. Le manque de reproductibilité et donc de réutilisation réelle des données s’oppose finalement aux principes FAIR. Le développement et la normalisation du modèle de provenance devraient permettre la génération automatique de la provenance détaillée tout au long du workflow depuis l’acquisition du matériel biologique jusqu’aux méthodes d’analyse et au traitement des données. Idéalement, si ces normes sont développées et adoptées, les systèmes d’information des laboratoires ou les instruments d’analyse devraient générer automatiquement la partie correspondante des informations sur la provenance et celle-ci serait liée à la chaîne globale des informations sur la provenance. Actuellement, les travaux sont principalement menés en collaboration avec le groupe de travail 5 du comité technique 276 de l’ISO “Biotechnologie” (TC/276) sur l'”Intégration des données” (GT5).
• Le le/la chef-fe de projet rejoindra le DSI pour travailler à la réalisation d’un métamodèle standard (ou « Profil UML ») dédié à la provenance des données de recherche en sciences de la vie, instanciable sur tous les sous-domaines et implémentable sur les outils proposés par le projet EOSC-Life.
Sa mission sera de traduire la partie de la norme ISO consacrée au modèle commun de la Provenance (lui même basé sur le standard W3C PROV) et développée par le partenaire BBMRI en un méta modèle UML instanciable et implémentable.

• Il aura pour rôle de promouvoir et diffuser les principes FAIR (incluant la Provenance des données) à l’Inserm, sous la responsabilité du Chief Data Officer de l ‘Inserm.

Sujet :
Activités principales :
• Contribuer aux avancées de la Norme ISO 276 développée dans le cadre du Projet
EOSC-Life, sur la partie « Common Provenance Model
• Se former à l’utilisation de l’outil de réalisation de profil UML, PapyrusUML
• Développer un métamodèle générique UML à partir de la Norme ISO 276
• Instancier le métamodèle générique pour plusieurs sous-domaines (génomique…)
• Diffuser les principes FAIR, par le biais d’ateliers et de formations
• Diffuser les résultats du modèle générique de provenance, par le biais d’ateliers et de formations
• Double reporting au WP6 leader du projet EOSC-Life (CP VIS) et au Chief Data Officer de l’Inserm

Activités associées :
• Participation aux réunions du projet EOSC-Life (téléphone/visioconférence) et réunions de management des données de recherche Inserm
• Rédaction de rapports d’avancement, forte contribution aux livrables du projet EOSC-Life
• Participation à la rédaction de documents de référence pour le Chief Data Officer

Profil du candidat :
Connaissances :
• Formation générale en ingénierie logicielle
• Maîtrise du langage de modélisation UML (et autres langages de modélisation)
• Bonnes connaissance de l’ingénierie des modèles (MBE), aussi bien la transformation de modèles que la génération de code sûr
• Connaissance d’environnements de programmation comme Eclipse
• Formation générale en science des données
• Forte sensibilisation à la science ouverte (FAIR data)
• Notions de sécurité et confidentialité des données

Savoir faire :
• Maîtriser l’ingénierie des modèles
• Maîtriser la science des données
• Savoir anticiper les besoins, prioriser et planifier les activités
• Savoir communiquer, être à l’écoute et s’adapter à son interlocuteur
• Anglais courant

Formation et compétences requises :
• Doctorat ou diplôme d’ingénieur, domaine informatique, Ingénierie dirigée par les modèles

• Expérience préalable de 5 ans minimum dans le domaine de la recherche scientifique (sur de gros projets nationaux ou européens)

Adresse d’emploi :
DSI de l’INSERM
13 rue Watt
75013 Paris

Document attaché : 202011252132_DSI – Ingénieur informatique – 2021.pdf