Apprentissage automatique sur données de spectroscopie de modifications d’ARN pour distinguer des stades de cancers

When:
30/06/2020 – 01/07/2020 all-day
2020-06-30T02:00:00+02:00
2020-07-01T02:00:00+02:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LIRMM, CNRS UMR 5506
Durée : 6
Contact : rivals@lirmm.fr
Date limite de publication : 2020-06-30

Contexte :

Mots-clé : apprentissage automatique, statistique, épitranscriptome, marques épitranscriptomiques, développement, cancer

L’identification de bio-marqueurs spécifiques du cancer sont essentiels pour diverses prévisions et décisions médicales (diagnostic, prognostic, stratification de patients, évaluation de la pertinence d’une thérapie). Récemment, il a été montré que la régulation de l’expression des gènes est influencée par des modifications des bases des ARNs. Ces modifications qui sont dynamiquement contrôlées (ajoutées, lues ou effacées) sur une grande partie des ARNs produits dans les cellules. Contrairement à des mutations génétiques, ces modifications dites “épitranscriptomiques” ne changent pas la base, mais en quelque sorte la “décorent”. En outre, certaines de ses modifications ont été associées à divers cancers. Grâce à une plateforme montpellièraine unique en France (mis en place au sein de notre consortium), on peut étudier globalement par spectroscopie de masse la présence de ces modifications dans un échantillon de cellules.

Dans ce projets nous disposons des mesures d’une cinquantaine de modifications effectuées sur des tissus de patients sains et cancéreux. L’objet de ce stage est de développer une approche d’apprentissage automatique qui recherchent les combinaisons de modifications permettant de distinguer les cellules saines de cellules cancéreuses, voire de les relier au stade cancéreux.
Les tissus de patients sont collectés par un des partenaires, le SIRIC de Montpellier.

Sujet :

Mettre en place un analyse permettant de normaliser les mesures, d’étudier les corrélations entre les mesures de différentes marques, et de proposer des stratégies d’apprentissage automatique (machine learning) qui 1/ distinguent les échantillons de cellules saines de ceux de cellules cancéreuses, puis 2/ déterminent les modifications associées à différents stades d’un cancer.

References :
1. Delaunay, S. and M. Frye, RNA modifications regulating cell fate in cancer. Nat Cell Biol, 2019. 21(5): p. 552-559.
2. A.C. Muller and S. Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists. O’Reilly (édition en Anglais et en Français).
3. Gilbert Saporta. Probabilités, analyse des données et Statistique. Technip. 2011.

Profil du candidat :
Prérequis et connaissances
– programmation en python
– apprentissage automatique
– analyse statistique
– goût pour les thématiques pluridisciplinaires

Qualités souhaitées :
– motivation
– programmation
– capacités de synthèse et d’analyse
– ouverture d’esprit.
– capacité d’échanges et de communication

Formation et compétences requises :
Master informatique, math appliquées, statistiques
Formation de “data analyst”

Adresse d’emploi :

Gratification : 520 euros mensuels.

Lieu : Montpellier
Structure d’accueil : équipe Méthodes et Algorithmes pour la Bioinformatique, LIRMM UMR 5506 CNRS & Univ Montpellier
Encadrants : E. Rivals (CNRS), A. David (INSERM)
Partenaires : IGF et SIRIC, tous deux à Montpellier.

Document attaché :