Synthèse et apprentissage de réseaux booléens prédictifs pour la différenciation cellulaire

When:
04/01/2021 – 05/01/2021 all-day
2021-01-04T01:00:00+01:00
2021-01-05T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : RoD/– — –

Laboratoire/Entreprise : LaBRI, Univ Bordeaux
Durée : 4-6 mois
Contact : loic.pauleve@lri.fr
Date limite de publication : 2021-01-04

Contexte :
L’apprentissage de modèles informatiques permettant de reproduire et prédire les processus de différenciation cellulaire est un défi majeur avec de nombreuses applications en biologie et en médecine. D’un côté, les modèles logiques, en particulier avec les réseaux booléens, sont de plus en plus employés par les équipes en biologie théorique et expérimentale car ils correspondent bien avec le niveau de granularité des connaissances actuelles. D’un autre côté, l’essor des technologies de mesures en cellule unique, en particulier avec le single-cell RNA-seq, offre des données précises sur l’évolution des expressions des gènes au cours de processus de différenciation cellulaire.
Actuellement, à l’aide de méthodes logiques, nous savons énumérer des réseaux booléens qui satisfont les pré-requis demandés sur leur comportement, mais nous ne savons pas encore comment sélectionner ceux qui ont de bonnes capacités prédictives.

Sujet :
L’objectif de ce stage est d’ouvrir la voie à l’apprentissage de réseaux booléens prédictifs, en mettant au point différents scores de prédiction et en appliquant des méthodes d’apprentissage pour mettre en avant des caractéristiques des réseaux à optimiser. Par exemple: vaut-il mieux privilégier les réseaux simples, ou au contraire les plus complexes?

Le travail consistera dans un premier temps à mettre au point différents scores de prédictions d’un réseau booléen vis-à-vis de données de tests, et de les appliquer à différents jeux de données relatifs à la différenciation cellulaire. Puis, il faudra explorer différentes méthodes de type “Random Forests” ou encore “Principal Feature Analysis” pour apprendre les caractéristiques des réseaux booléens qui influent leur score de prédiction.
Le résultat du stage sera intégré dans la bibliothèque Python BoNesis (github.com/bioasp/bonesis).

Profil du candidat :
Étudiant de master informatique ou bio-informatique, avec une spécialisation IA/machine learning

Formation et compétences requises :
Une bonne connaissance des méthodes de type “Random Forests” et “Principal Component Analysis” est requise.
Des connaissances générales en logique propositionnelle et SAT, et des compétences en programmation (Python préférable, mais pas nécessaire) sont recommandées.
Aucune connaissance particulière en biologie n’est nécessaire.

Adresse d’emploi :
LaBRI UMR CNRS 5800
351, cours de la Libération 33400 Talence
France