Stage M2 Identification automatique de diatomées par apprentissage profond

When:
31/12/2019 – 01/01/2020 all-day
2019-12-31T01:00:00+01:00
2020-01-01T01:00:00+01:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LIEC
Durée : 6 mois
Contact : martin.laviale@univ-lorraine.fr
Date limite de publication : 20191231

Contexte :
Les diatomées sont des microalgues omniprésentes dans tous les milieux aquatiques. En particulier, elles jouent un rôle essentiel dans les écosystèmes d’eau douce, notamment sous forme de biofilms. Leur grande diversité et leur ubiquité font de ces organismes des bioindicateurs reconnus dans le cadre du suivi de l’état écologique des cours d’eau. Les diatomées sont des organismes unicellulaires qui présentent un exosquelette en silice dont la forme et l’ornementation constituent les bases de l’identification taxonomique traditionnelle. Néanmoins l’identification de ces traits morphologiques est chronophage, souvent sujette à de multiples biais (expérience de l’opérateur, qualité de l’image) et nécessite un niveau élevé d’expertise. Le développement récent des approches d’apprentissage profond par réseaux de neurones pour identifier et quantifier les traits des organismes à partir d’images semble prometteur pour résoudre les problèmes rencontrés jusqu’à présent.
Dans ce contexte, l’objectif du stage proposé vise à développer un outil d’identification des diatomées basé sur des algorithmes de reconnaissance automatique de formes à partir d’images individuelles. Dans un premier temps, cet outil devrait permettre d’améliorer les outils disponibles pour le diagnostic écologique des milieux aquatiques basés sur les diatomées. In fine, l’objectif est de pouvoir utiliser cet outil comme indicateur précoce pour détecter l’apparition de formes rares (espèces exotiques potentiellement invasives, déformations des cellules sous l’effet de polluants).

Sujet :
Objectifs du stage :
1- Constituer une première banque d’images individuelles de diatomées, représentative de la variabilité morphologique observée chez différentes espèces bioindicatrices. Séjour prévu au CEREGE pour acquérir de manière automatique un grand nombre d’images en pseudo-3D (z-stalks) (plateforme d’imagerie “Micropaléontologie automatisée”).
2- Développer un algorithme de segmentations puis un algorithme de reconnaissance des images. Les images individuelles générées en étape 1 seront utilisées pour entrainer un réseau de neurones et lui apprendre à reconnaitre les différentes espèces de diatomées présentes dans un échantillon (lames permanentes). Le traitement d’image sera réalisé par une approche standard (réseaux de neurones de types Yolo v3 pour la détection d’instances ou de type SegNet, U-Net, DeepLab… pour la segmentation des individus). L’utilisation d’images 3D créera des structures de données plus riches, permettant de travailler sur l’extension des réseaux ci-dessus à des données 3D, ce qui a été peu traité dans la littérature.
3- Appliquer le réseau de neurones à des échantillons complexes (i.e. échantillons naturels).
Le travail pourra être poursuivi en thèse, sur une sujet co-construit avec l’étudiant(e).

Le stage de M2 se déroulera au LIEC à Metz. Il sera co-encadré par Martin Laviale et Philippe Usseglio-Polaterra (écologie des diatomées, bioindication). Il sera réalisé en étroite collaboration avec Cédric Pradalier (Georgia Tech Lorraine, apprentissage profond), Thibault de Garidel-Thoron (CEREGE, imagerie) et Sakina-Dorothée Ayata (Sorbonne Université, approche par traits, écologie). Il bénéficiera également du réseau international ARTIFACTZ (https://sites.google.com/view/artifacz/).

Profil du candidat :
Etudiant(e) Ecole d’ingénieur ou M2 en maths appliquées, idéalement à l’interface entre vision, apprentissage, et biologie et/ou écologie.

Formation et compétences requises :
– Solides bases en mathématiques appliqués et statistiques.
– Connaissances générales en statistiques et/ou imagerie et/ou machines learning.
– Idéalement : compétences pour l’acquisition, la gestion et l’analyses de données et d’images biologiques.
– Des connaissances pour la classification/régression par réseaux de neurones convolutionnels seraient un plus.
– Formation de base ou intérêt pour la biologie et/ou écologie.
– Un manque d’expérience dans un des domaines ci-dessus pourra être compensé par une forte motivation.

Adresse d’emploi :
Laboratoire Interdisciplinaire des Environnements Continentaux (LIEC), Université de Lorraine, Campus Bridoux, Metz.

Document attaché :