CDD IE/IR Fouille de données pour qualification de données imparfaites

When:
30/01/2019 – 31/01/2019 all-day
2019-01-30T01:00:00+01:00
2019-01-31T01:00:00+01:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : Laboratoire LIENSS, U.M.R. 7266 à la Rochelle
Durée : 4 mois
Contact : christine.plumejeaud-perreau@univ-lr.fr
Date limite de publication : 2019-01-30

Contexte :
Le laboratoire Littoral Environnement et Société (Unité Mixte de Recherche n° 7266) propose un poste d’Ingénieur d’Etude ou de Recherche en informatique avec 0 à 5 années d’expérience. La mission consiste à implémenter et tester diverses méthodes de contrôles de cohérence sur une base de données historiques concernant le commerce maritime du XVIIIème siècle, dans le cadre d’un projet ANR nommé PORTIC. Les approches numériques qui seront implémentées ont pour objectif de tagger le corpus afin de distinguer différents niveaux de qualité dans les données. La mission qui commence le 1 Avril 2019 pour une durée de 5 mois se fera en interaction aussi avec Alain Bouju, maitre de conférences en informatique du L3I, à la Rochelle.

Au CNRS, l’ingénieur(e) intègrera l’UMR 7266 Littoral Environnement et Sociétés, à la Rochelle, 200 personnes. Ce laboratoire regroupe des experts scientifiques des disciplines de l’écologie, la géographie, la biologie, l’histoire, la chimie moléculaire et les sciences de la terre et interroge des questions liées au développement durable et au changement climatique autour des zones littorales (https://lienss.univ-larochelle.fr/). L’ingénieur(e) intègrera donc un milieu fortement interdisciplinaire et en particulier le service DISA, une plateforme base de données au croisement de nombreux projets scientifiques afin d’offrir une meilleure capacité de croisement de données fortement hétérogènes et de favoriser la mise en œuvre des principes FAIR dans la recherche.
L’équipe de PORTIC sur la Rochelle est coordonnée par Christine Plumejeaud-Perreau, informaticienne responsable de la plateforme DISA au LIENSs. Elle travaille depuis 5 ans avec Alain Bouju, Maitre de conférences avec Habilitation à Diriger des Recherches en informatique au Laboratoire d’Informatique, Images et Interactions (L3i) de l’Université de la Rochelle depuis 2014. L’ingénieur(e) sera donc en interaction forte avec ces deux personnes pour mener sa mission.
Il ou elle accèdera à toutes les facilités qu’offre la Très Grande Infrastructure de Recherche HumaNum (machine virtuelle pour déploiement en production des outils développés, GIT, espace de stockage). Tout ce qui sera développé par PORTIC sera sous licence libre. Ce contrat à durée déterminée est envisagé comme un prélude à un doctorat, dont l’offre est en ligne également.

Sujet :
L’ingénieur(e) réalisera sa mission de façon créative et autonome dans un milieu fortement interdisciplinaire, avec des outils open-source. Il s’agit de développer des services de qualification de données au dessus d’une base de données ouvertes. L’ingénieur utilisera des méthodes de fouille de données pour l’identification d’aberrations ou d’incohérence dans le corpus. Il s’agit ici de réutiliser des bibliothèques open-source: méthodes de classification non supervisées pour la détection de patrons et de similarités, statistiques non paramétriques pour la détection de valeurs exceptionnelles. Concrètement, en concevant et programmant une application permettant d’activer ces méthodes et d’exploiter leurs sorties pour tagger les données, la contribution de l’ingénieur permettra de connaitre finement le niveau de qualité des données.

Profil du candidat :
L’ingénieur(e) d’étude doit être diplômé avec un master ou comme ingénieur en informatique, ou en sciences de l’information.

– Le poste nécessite des compétences confirmées en système d’information, programmation (Service REST, Java, Python) ainsi qu’en base de données (Postgres, RDF, graphes, UML).
– Des compétences seraient appréciées en mathématiques et statistiques, et dans l’une ou plusieurs de ces technologies : Strasbon, Postgis, Neo4J, R.
– Le poste requiert un goût pour le dialogue avec les différents acteurs du projet et leurs diverses disciplines (histoire, économie, géomatique, informatique).

Formation et compétences requises :
Le poste nécessite donc des compétences en programmation (Service REST, Java, Python) ainsi qu’en base de données (Postgres, RDF, graphes, UML).
Des compétences seraient appréciées en mathématiques et statistiques, et dans l’une ou plusieurs de ces technologies : Strasbon, Postgis, Neo4J, R.
Le poste requiert un goût pour le dialogue avec les différents acteurs du projet et leurs diverses disciplines (histoire, économie, géomatique, informatique).

Adresse d’emploi :
Poste basé au LIENSS
2 rue Olympe de Gouges,
17000 La Rochelle

Candidater via le portail emploi du CNRS :
https://emploi.cnrs.fr/Offres/CDD/UMR7266-CHRPLU-001/Default.aspx

Joindre au CV le relevé de notes de master 2 ou dernière école d’ingénieur, une lettre de motivation, ainsi que le dernier rapport de stage et des exemples de travaux antérieurs si existants.

Document attaché : CDD_dataMining_fr_en_20181217.pdf