IA explicable pour la prévision de chutes de blocs rocheux

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISTIC
Durée : 3 ans
Contact : nicolas.meger@univ-smb.fr
Date limite de publication : 2024-04-01

Contexte :
Ces travaux de thèse s’inscrivent au sein du projet ANR C2R-IA et feront l’objet d’une
collaboration avancée entre le laboratoire LISTIC et le laboratoire ISTerre.
Les chutes de blocs rocheux sont des phénomènes rares aux conséquences catastrophiques :
victimes humaines, destruction d’infrastructures, perte permanente ou temporaire d’accès à
des zones socio-économiques stratégiques et aux services publics (urgences, écoles, etc.).

Actuellement, la gestion du risque d’éboulement fait face à deux difficultés principales. D’une
part, la connaissance préalable du lieu et du volume probable des futurs éboulements, ce qui
peut permettre le dimensionnement d’ouvrages de protection adaptés. En revanche, de tels
ouvrages peuvent représenter un coût disproportionné par rapport aux ressources financières
des municipalités et des opérateurs privés. D’autre part, la gestion du risque d’éboulement
nécessite également l’estimation du risque d’occurrence d’éboulement dans le temps, c’est à dire l’évolution de la probabilité d’occurrence en fonction des conditions climatiques du
moment, ce qui permettrait aux gestionnaires d’infrastructures de mettre en œuvre des
systèmes d’atténuation des risques (restriction d’accès, surveillance, mobilisation de kits
d’urgence, maintenance prédictive). Une telle gestion dynamique des risques est
potentiellement associée à des coûts socio-économiques élevés et sa mise en œuvre nécessite
une procédure de prise de décision justifiée.

Les deux aspects sont souvent abordés « à dire d’expert » ce qui pose un problème
méthodologique de biais induit par l’expérience et la connaissance de l’expert et se limite
souvent à des relations qualitatives entre les chutes de blocs rocheux et le forçage climatique.
Une description quantitative (nombre de chutes, volume rocheux) de l’augmentation du risque
serait plus pertinente mais reste à ce jour difficile à produire.

Sujet :
L’objectif de cette thèse est de surmonter la nécessité de construire une procédure de prise de
décision basée sur l’expertise. En effet, nous pensons que les méthodes d’Intelligence Artificielle
(IA) peuvent améliorer la compréhension du comportement des falaises sous l’effet du forçage
climatique et produire des modèles prédictifs efficaces. Afin d’être exploitable du point de vue
de la décision publique, il est nécessaire de pouvoir expliquer les décisions issues des méthodes
d’IA

Planning des travaux :
1) Prise en main des données et des outils mis à disposition.
2) Mise en œuvre de modèles d’IA standard de l’état de l’art (random forests, SVM, etc.) afin de
constituer une référence à partir des données disponibles pour la falaise du Saint Eynard.
3) Proposition d’un modèle d’IA (deep learning, motifs) permettant de dépasser l’état de l’art et
dont les résultats sont explicables. Ce dernier point est crucial car il s’agit de définir des règles
de gestion des risques opérationnels et de persuader les autorités publiques de mettre en place
des barrages routiers ou de procéder à des évacuations lorsque nécessaire.

Profil du candidat :
Master M2 ou équivalent

Formation et compétences requises :
Connaissances en traitement du signal, réseaux de neurones et fouille de données.

Compétences rédactionnelles et en informatique (C/C++, Python, Linux).

Autonomie et esprit d’initiative.

Adresse d’emploi :
Annecy-le-Vieux, France

Document attaché : 202311210948_2023_sujet_these_XAI_AFuTé_VERSION_FINALE.pdf

Stage M2 – Active learning and object detection in multimodal aerial images

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA/UBS
Durée : 6 mois
Contact : chloe.friguet@irisa.fr
Date limite de publication : 2024-04-01

Contexte :
Detailed topic at: http://www-obelix.irisa.fr/files/2023/11/2024_IRISA-UBS_internship_Active-learning-and-object-detection.pdf

The context of this internship is motivated by issues raised in studies
with data collected by airborne imagery. The automation of the processing of this data, by
object detection methods and supervised learning, requires annotated databases. The annotation
step is therefore a task of great interest, both in machine learning (ML) and computer vision
(CV). Carrying it out manually is tedious and costly in terms of time and human resources.
Furthermore, in the case of multimodal images (i.e. acquired by several sensors), annotation
must be performed for each modality.
Active Learning (AL) is related to semi-supervised Machine Learning in which a learning
algorithm can interact at each iteration with the user to get some information about labels of
new data during the training step. It is motivated by situations in which it is easy to collect
unlabeled data but costly (time, money, tedious task) to (manually) obtain their labels. It stems
from the idea that we should only acquire labels that actually improve the ability of the model
to make accurate predictions. Instances that are more useful than others according to some
performance measures have to be identified to create an optimal training dataset: well chosen,
fewer representative instances are needed to achieve similar performance as if we label and use
all available data. This selection process has been investigated as selective sampling [9]. The
importance of an instance is related to a high level of both the information and uncertainty
relative to the trained model, considering therefore a trade-off between informativeness (ability
to reduce the uncertainty of a statistical model) and representativeness (ability to represent the
whole input data space) of the selection process [6].
In remote sensing, AL has therefore become an important approach to collect informative
data for object detection and supervised classification tasks, and to assist the annotation process.
The effectiveness of object detection models is intricately tied to the quantity of annotated data
at their disposal. To overcome this challenge, AL attempts to formulate a strategy for cherrypicking pertinent data that an annotator should annotate, as elucidated by Choi et al. [5]. This
typically involves employing a scoring mechanism that is related to the model’s uncertainties
about the data. Computationally, ascertaining these uncertainties usually necessitates a multimodel approach. However, it’s noteworthy that these ensemble techniques are resource-intensive.
Hence, the overarching objective of AL lies in the formulation of a classification function that
faithfully mirrors the data’s contribution to the learning process.

Sujet :
In the paper by Brust et al. [3], a novel approach to object detection using
deep learning is introduced. Their approach incorporates AL strategies to explore unlabeled
data. The authors proposed and compared various learning metrics that are suitable for most
object detectors, taking into account class imbalance.
To start this project, the first step involves evaluating the performance of a multimodal
object detector (like YOLOrs [10], SuperYOLO [13], YOLOFusion [7] …) with respect to these
1
metrics by applying them to a single modality (RGB for example). This evaluation will be
carried out under different settings, including various sizes of the initial dataset and different
adjustments of algorithm parameters. Then, the aim is to extend the AL strategy to the case
of multimodal images. Indeed, for each object all modalities do not contribute equally to the
classification/localization tasks, one can be more informative than the other.
Finally, metrics proposed by Brust et al. [3], focus on classification uncertainty, however,
the aspect of localization is overlooked. To get the uncertainty of localization, we can use a
strategy like the one of the Gaussian YOLO approach [4, 5] that provides both classification
and localization uncertainties which we can then use with Brust et al. metrics.

Profil du candidat :
Student in computer science and/or machine learning and/or signal & image processing and/or applied statistics

Formation et compétences requises :
good programming skills in Python (Pytorch knowledge appreciated), knowledge of deep-learning for image analysis, and high interest to investigate machine learning methods.

Adresse d’emploi :
IRISA, UBS, Campus de Tohannic, 56000 Vannes

Document attaché : 202311201649_2024_IRISA-UBS_internship_Active learning and object detection.pdf

Stage M2 – Robust Multi-Task Learning from Multiple Remote Sensing Datasets

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA/UBS
Durée : 6 mois
Contact : minh-tan.pham@irisa.fr
Date limite de publication : 2024-04-01

Contexte :
Detailed topic at: http://www-obelix.irisa.fr/files/2023/11/2023_master_topic_MTL.pdf

In recent years, deep neural networks have been successfully adopted in almost every application
domains of computer vision, including remote sensing for earth observation. The vast number
of remote sensing images captured from frequent satellite passes or aerial acquisition, however,
are not readily usable to train deep networks developed for generic vision problems due to the
lack of task-specific annotations and possible domain gaps.
On the other hand, the individual development efforts of various research groups for their
particular problems result in cluttered annotations and modalities: each dataset is typically
annotated for a few tasks while many tasks may be related to one another and could be jointly
learned to leverage complementary information and improve their performance. Coupling solving
different but related tasks, or well-known in the ML community as multi-task learning, has also
gained increasing attention in the remote sensing community. As multi-task learning aims to
predict different targets from the same inputs, it typically requires annotations of all the target
tasks for each input example to learn the interrelationship at the shared encoder by optimizing
all tasks at the same time.
Obtaining extra annotations to maintain multi-task datasets, however, add extra burden
to the development process. Recently, it has been shown in the vision community that that
multi-task learning could be beneficial even when the tasks are partially annotated [2]. Training
a network for multiple task while the training examples are annotated for a single task can
improve the performance of both tasks. Such discovery could be of interest to explore for the
benefit of remote sensing community.

Sujet :
This project is aimed to research the combination of different datasets annotated for different
tasks which may follow different statistical distributions to benefit and improve performance of
one another. To that end, we will focus on the object detection, i.e. bounding boxes prediction,
and semantic segmentation tasks, which are closely related yet not trivial to combine due to differences in spatial structure and information granularity: object detection predicts bounding-box
coordinates at object instance level while semantic segmentation provides per-pixel predictions
of category including amorphous regions. A general scheme is shown in Figure 1. Another
challenge of the project is to bridge possible domain gaps between the participating datasets
with possible approaches including generative models (GANs, diffusion models, etc.)

Profil du candidat :
Student in computer science and/or machine learning and/or signal & image processing;

Formation et compétences requises :
Python programming and familiarity with deep learning framework (Pytorch/Tensorflow);

Adresse d’emploi :
IRISA (UMR 6074) is located in the UBS (Université Bretagne Sud), campus de Tohannic, Vannes 56000, France.

Document attaché : 202311201646_2023_master_topic_MTL.pdf

Exploring Gradient-Based Metalearning for RNA 3D Structure Prediction

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC. Université Paris Saclay, Univ Evry
Durée : 6 mois
Contact : fariza.tahi@univ-evry.fr
Date limite de publication : 2023-12-31

Contexte :
Determining the 3D structure of ribonucleic acid (RNA) chains is essential to understanding their function and role in the various stages of living organisms and viruses. Due to the high cost of experimental methods (NMR, cristallography, etc.), computational methods could be very helpful. Although methods have been proposed in the literature for several years, the task remains open. For proteins, this problem has witnessed tremendous advances in recent years: DeepMind’s AlphaFold2 [1] made a giant leap in solving the 3D structure prediction problem for many types of single-chain protein structures using deep learning. Unfortunately, RNA still remains challenging [2]: unlike for proteins, (i) data of known 3D RNA structures are not available in large quantities; (ii) RNA are not stable and thus may have different 3D conformations; (iii) RNA sequences can vary from a few nucleotides to several tens of thousands of nucleotides.
It is suggested in the literature that the only way to address these challenges is for the quantity of RNA structures or sequence alignments to catch up with the amount of protein data that is currently accessible for models like AlphaFold [2]. We think the solution does not solely lie in the quantity of data but in finding suitable search biases and principled ways to incorporate domain knowledge into the learning process. The metalearning paradigm can provide answers to these challenges. This paradigm aims to improve a learning model’s generalization capabilities by leveraging prior knowledge from a family of tasks and accumulating past experience in a meaningful way [5, 6, 3]. Gradient-based metalearning approaches are examples of this paradigm, where the goal is to learn a model that knows how to adapt to new tasks or domains using limited quantities of data [5, 13, 4]. These approaches made tremendous breakthroughs in many applications where adaptation to new tasks required only a few learning examples.

Sujet :
Recently, only a very few studies in the literature [7, 8, 9, 10] have started to address the use of metalearning in computational biology. Works like [7] and [8] have been limited to the prediction of non-coding RNA using metalearning, leaving the structural level unexplored. In this internship, we want to investigate metalearning for the problem of 3D structure prediction of RNA chains. In particular, the ability to leverage the 3D conformations coming from multiple known species and know how to adapt rapidly to new ones under few available samples.
Furthermore, we want to investigate how prior knowledge can be leveraged to guide the adaptation process further [6]. For example, we can exploit the knowledge base of prominent RNA structural patterns provided in the CaRNAval dataset maintained by the LISN laboratory at UPSaclay [11]. Concretely, the prior knowledge in the form of RNA structural patterns can, for example, be used to devise better parameterizations for the optimization landscapes induced by the initial learning problem.
We will use the RNANet [12] database, developed by our research team, that integrates various information on RNA, including sequences, families (e.g., MSA multiple sequence alignments), secondary structures, 3D structures, etc.
The steps of the internship will, first, consist of the study of the state-of-the-art on RNA 3D structure prediction and gradient-based metalearning approaches. Second, frame the problem of RNA 3D prediction in the metalearning setting and build a first metalearning-based architecture for RNA 3D structure prediction. Third, study the prominent RNA structural patterns included in the CaRNAval knowledge base and propose a way to leverage such structural patterns to devise better parameterizations for the learning process. Finally, benchmark with RNANet dataset and possibly other datasets.
From a methodological point of view, we want to develop new metalearning approaches that can effectively deal with limited data in predicting the 3D structure of RNA and incorporate prior knowledge into the learning process.
From a bioinformatic perspective, we would like to propose an efficient tool for predicting RNA 3D structures, a tool that could be used in a personalized medicine project we are involved in, the IHU Prometheus project (2024-2034) on Sepsis, where RNAs can be potential biomarkers and/or therapeutic targets.
The developed tool will be available through our EvryRNA bioinformatics platform (http://evryrna.ibisc.univ-evry.fr), a platform providing the scientific community with several tools developed under the team for the analysis and prediction of non-coding RNAs.
The internship can lead to a Ph.D. thesis to further deepen the use of metalearning for the prediction of RNA 3D structures.
References
[1] Jumper, John, et al. “Highly accurate protein structure prediction with AlphaFold.” Nature 596.7873 (2021): 583-589.
[2] Schneider, Bohdan, et al. “When will RNA get its AlphaFold moment?.” Nucleic Acids Research 51.18 (2023): 9522-9532.
[3] Hospedales, Timothy, et al. “Meta-learning in neural networks: A survey.” IEEE transactions on pattern analysis and machine intelligence 44.9 (2021): 5149-5169.
[4] Nichol, Alex, and John Schulman. “Reptile: a scalable metalearning algorithm.” arXiv preprint arXiv:1803.02999 2.3 (2018): 4.
[5] Finn, Chelsea, Pieter Abbeel, and Sergey Levine. “Model-agnostic meta-learning for fast adaptation of deep networks.” International conference on machine learning. PMLR, 2017.
[6] Hamidi, Massinissa. Metalearning guided by domain knowledge. Diss. Université Paris-Nord-Paris XIII, 2022.
[7] Li, Zhongshen, et al. “CoraL: interpretable contrastive meta-learning for the prediction of cancer- associated ncRNA-encoded small peptides.” Briefings in Bioinformatics 24.6 (2023): bbad352.
[8] Bonidia, Robson P., et al. “BioAutoML: automated feature engineering and metalearning to predict noncoding RNAs in bacteria.” Briefings in Bioinformatics 23.4 (2022): bbac218.
[9] Wu, Xue, et al. “Meta-learning shows great potential in plant disease recognition under few available samples.” The Plant Journal (2023).
[10] Rodrigues, Vânia, and Sérgio Deusdado. “Metalearning approach for leukemia informative genes prioritization.” Journal of Integrative Bioinformatics 17.1 (2020): 20190069.
[11] Reinharz, Vladimir, et al. “Mining for recurrent long-range interactions in RNA structures reveals embedded hierarchies in network families.” Nucleic acids research 46.8 (2018): 3841-3851.
[12] Becquey, Louis, Eric Angel, and Fariza Tahi. “RNANet: an automatically built dual-source dataset integrating homologous sequences and RNA structures.” Bioinformatics 37.9 (2021): 1218-1224.
[13] Raghu, Aniruddh, et al. “Rapid Learning or Feature Reuse? Towards Understanding the Effectiveness of MAML.” International Conference on Learning Representations. 2019.

Profil du candidat :
Master 2 (or equivalent) in DataSciences, Computer Sciences or bioinformatics / Computational Biology

Formation et compétences requises :
Master 2 (or equivalent) in DataSciences, Computer Sciences or bioinformatics / Computational Biology

Adresse d’emploi :
IBGBI building. 23 bv. de France, Evry

Document attaché : 202311191845_Internship-Metalarning-RNA3D.pdf

RESEAUX DE NEURONES GUIDES PAR LA PHYSIQUE pour l’ETUDE D’UNE CHRONIQUE PIEZOMETRIQUE

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Aprona et UMR ITES, Strasbourg
Durée : 6 mois
Contact : fahs@unistra.fr
Date limite de publication : 2024-01-30

Contexte :
L’APRONA (Association pour la Protection de la Nappe Phréatique de la plaine d’Alsace – www.aprona.net/), a pour principales missions la surveillance qualitative et quantitative de la nappe d’alsace et des aquifères du Sundgau. Elle assure ainsi la gestion des réseaux d’observation des eaux souterraines, la collecte et l’exploitation des données ainsi que leur diffusion et leur communication.

La nappe d’Alsace, partie intégrante du réservoir aquifère le plus important d’Europe, constitue un patrimoine naturel et un enjeu économique majeur pour l’alimentation en eau potable, en eau d’irrigation et en eau industrielle. Les échanges eaux superficielles – eaux souterraines, très fréquents, sont la caractéristique principale de ce hydro-système unique par sa taille. Les fluctuations de niveau, plus ou moins importantes suivant l’endroit et les types d’événements qui en sont la cause, ne sont pas sans conséquence sur le milieu naturel et les activités humaines : assèchement des zones humides, remontées d’eau dans les caves et les parkings souterrains, incidences sur l’importance et la propagation des pollutions.

Sujet :
Face à ces enjeux accentués par les impacts du changement climatique1, comment prédire efficacement la réaction de la nappe afin de mieux faire face aux situations de crises (crue et sècheresse) ?
Connaissant les facteurs responsables de l’évolution de la recharge2 des nappes, plusieurs approches modélisation sont alors possibles. Avec les progrès dans le domaine de développement des cartes graphiques (GPU), les réseaux de neurones d’apprentissage profond émergent comme une nouvelle technique pour la modélisation avec d’excellents résultats dans de nombreux domaines et applications scientifiques. Un intérêt particulier est porté actuellement à l’utilisation de ces techniques pour la gestion des ressources en eaux souterraines. Cependant, dans contexte, la mise en œuvre des réseaux de neurones est limitée par la disponibilité et la qualité des données. Très récemment (en 2019), une nouvelle classe des réseaux de neurones a fait son apparition pour pallier ce problème. Dans cette classe, connue sous le nom PINNs (Physics Informed Neural Networks), l’apprentissage du réseau est guidé par les lois physiques et peut se faire d’une façon efficace même avec peu de données. L’intégration des lois physiques dans l’apprentissage des réseaux permet de les rendre plus fiables pour la prédiction des effets des changements climatiques, où les modèles basés uniquement sur les données peuvent être moins fiables dans des conditions différentes de celles observées. Les PINNs sont prometteurs dans différentes applications scientifiques. Leur application dans le domaine de la gestion des eaux souterraines est actuellement l’un des défis de la communauté scientifique. Ceci représente l’objectif principal de ce stage.
Une formation spécifique est prévue pour faciliter l’accès vers cette méthode.

La méthodologie du stage repose sur les trois tâches suivantes :
1. Formation
a. Synthèse bibliographique (analyse des documents fournis)
b. Compréhension des processus physiques et des modèles mathématiques
c. Prise en main des outils (PINNs, Python et modèle éléments finis)
2. Modèle PINNS (cas synthétique)
a. Construction d’un modèle PINNs sans données pour l’écoulement souterrain en nappe libre
b. Vérification du modèle par comparaison à un modèle éléments finis
3. Cas réel (échange nappe et cours d’eau)
a. Construction d’un modèle PINNs pour un cas réel impliquant des processus d’échange nappe-rivière et utilisation des données d’observation avec les PINNs.
b. Evaluation de la fiabilité des prédictions du modèle PINNs.
c. Evaluation de l’intérêt d’utiliser PINNs par rapport à un modèle de réseaux de neurones standard.

Profil du candidat :
Master 2 ou 3ème année d’école d’ingénieur dans les domaines suivants : Mathématiques appliquées (méthodes numériques, statistiques, probabilités) ; Sciences des données ; Mécanique des fluides ; Physique ; Sciences de la terre et de l’environnement.

Formation et compétences requises :
– Des connaissances en Python sont impératives. Une volonté de développer ces compétences est indispensable.
– Capacité à travailler en groupe ; Bonne aptitude à la communication interpersonnelle ; Assimilation de nouvelles connaissances.

Adresse d’emploi :
Le stage aura lieu dans l’Institut Terre et Environnement de Strasbourg (ITES : https://ites.unistra.fr/).
Le stagiaire sera encadré par un hydrogéologue (APRONA) et par François Lehmann et Marwan Fahs enseignant-chercheurs à ITES

Document attaché : 202311191633_FICHE_STAGE_2024_ITES.PDF

Study Engineer Position – Bioinformatics & systems modeling for neurodegenerative disease research, Paris, France

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Brain-C Lab, Institute of Biology Paris-Seine (IBP
Durée : 2 years (CDD)
Contact : christian.neri@inserm.fr
Date limite de publication : 2024-01-30

Contexte :
Research on neurodegenerative disease mechanisms and targets

Sujet :
A two-year position is immediately available in the Brain-C Lab in Paris for a bioinformatician at the Study Engineer (IE) level (post-master position). The selected candidate will work with a team of mathematicians, bioinformaticians, and neurobiologists on modeling time- and cell-resolved omics data to built computational models of molecular pathogenesis in neurodegenerative diseases such as amyotrophic lateral sclerosis (ALS), integrate data from other diseases such as Huntington’s disease (HD) and disseminate data via online platforms. The selected candidate will use BioGemix, our post-omics machine learning platform and related databases. This position is a unique opportunity to further develop expertise and skills in a multidisciplinary team and network of direct collaborators that cover systems modeling, database development, and cellular neurobiology for breakthrough in neurodegenerative disease research.

Profil du candidat :
The candidates should hold a Master in Biofinformatics or a Master in Informatics and they should have no more than 3-4 years of post-master experience. The position is full time, on site, and candidates should have strong collaborative skills and commitment to team work along with strong ability to work independently in addition to strong interest for research.

Interested candidates should apply immediately by sending a letter of motivation, a full CV, and the names and emails of two-three references to christian.neri@inserm.fr and lucile.megret@sorbonne-universite.fr

Formation et compétences requises :
• Programming autonomy on at least one of the following languages: python, R, C / C ++.
• Good knowledge of basic web technologies: PHP, MySQL, JavaScript, jQuery.
• Fluency in using Ubuntu.
• Hands-on experience with in house server maintenance (Backup, shared space, and webserver).
• Scientific English essential
• Skills in data visualization will be a plus.
• Experience working with NGS data and performing respective bioinformatic pipelines in order to process sequencing data will be a plus.
• Basic knowledge in statistics and machine learning are desirable but not mandatory.

Adresse d’emploi :
IBPS, Campus de Jussieu
9 Quai St Bernard
75005 Paris – France

Postdoctoral Position – Systems Biology of Neuronal Vulnerability in Neurodegenerative Diseases, Paris, France

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Brain-C Lab, Institute of Biology Paris-Seine (IBP
Durée : 2 years (CDD)
Contact : christian.neri@inserm.fr
Date limite de publication : 2024-01-30

Contexte :
Brain-C Lab, Institute of Biology Paris-Seine (IBPS), Paris

see http://www.ibps.upmc.fr/en/research/biological-adaptation-and-ageing/brainc)

Research on neurodegenerative disease mechanisms and targets

Sujet :
the project addresses outstanding questions about the temporal and molecular dynamic of neurodegenerative disorders and define new therapeutic rationales for early-stage intervention in these disorders. The successful applicant will use BioGemix —our machine learning platform for biological precision in leveraging complex omics data— to analyze omics data (e.g., epigenomic data, transcriptomic data) obtained in models of amyotrophic lateral sclerosis (ALS) and compare resulting models to computational models of neurodegenerative disorders such as Huntington’s disease (HD). In addition to using existing approaches (feature selection, network inference, shape analysis), the successful applicant will also have the possibility to develop innovative machine-learning approaches for modeling and simulating gene regulatory networks and for optimal target selection, in collaboration with mathematicians and bioinformaticians inside and outside the team. This position is a unique opportunity to further develop expertise and skills in a multidisciplinary team and network of direct collaborators that cover systems modeling, cellular neurobiology and preclinical/clinical research.

Profil du candidat :
The candidates are expected to be highly-qualified and to have strong collaborative skills and commitment to team work along with strong ability to work independently, and to have track record of expertise & writing papers as demonstrated by publications and pre-prints. The position is full time and on site, and candidates should have less than 5 years of postdoctoral experience and a strong interest for research in biology.

Formation et compétences requises :
Candidates should hold a Ph.D. in Informatics/Bioinformatics or Mathematics or Probability & Statistics or Physics. Candidates that hold a diploma from high-profile Engineer Schools (e.g. Ecole Polytechnique, Supelec, Centrale, EPFL, ETZ) are welcome to apply.

• Demonstrated experience and autonomy in probability and statistics for the analysis of complex datasets (probabilistic models, R)
• Good autonomy in machine programming (at least one of the following languages: Python, C/C++, Java).
• Skills in database management or web technologies (javascript, Php) are desirable but not mandatory.
• Knowledge of genome sciences and omics technologies will be a plus.

Adresse d’emploi :
IBPS, Campus de Jussieu
9 Quai St Bernard
75005 Paris – France

Poste d’ingénieur (IR): Analyse d’images de microscopie électronique par « Deep Learning »

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS UMR7020
Durée : CDD 1an renouvelable
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre du projet de recherche AMIDEX SEMENDO-BASE, Aix-Marseille Université recrute un ingénieur de recherche en analyse d’images biologiques. L’objectif est de mettre en place des méthodes et des outils de gestion et d’analyse des images générées par microscopie électronique à balayage. Le projet est co-développé par le LIS (UMR CNRS 7020, laboratoire d’informatique) et l’IHU Méditerranée Infection – APHM, Hôpital de la Timone.

Sujet :
Résumé du projet
L’endocardite infectieuse (IE) est une maladie grave dont le diagnostic est difficile et dont la morbidité et la mortalité sont élevées. Elle se caractérise par une infection bactérienne ou fongique de l’endocarde entraînant la destruction d’une valve cardiaque et la formation de végétations dues au développement d’un dépôt fibrino-plaquettaire inflammatoire et infecté. Nous avons récemment développé une approche innovante pour analyser les végétations. La microscopie électronique à balayage fournit des images à l’échelle nanométrique du tissu valvulaire afin d’observer les principaux composants de la végétation qui diffèrent en abondance selon l’espèce bactérienne. Le processus d’analyse actuel est manuel et dépend de l’opérateur. L’objectif du projet est de réaliser l’analyse des images par des approches d’apprentissage profond. Elles devraient permettre de détecter et de quantifier automatiquement chaque composant des végétations pour mieux comprendre leur développement et leur structure afin de proposer des thérapeutiques adaptées. L’objectif principal de cette mission est de mettre en place le pipeline principal depuis la collecte des données jusqu’au traitement des images.

Profil du candidat :
Description du poste / Missions principales
Les activités seront dédiées à :
– Utiliser la microscopie électronique à balayage (MEB) pour l’acquisition d’images d’essai et d’une base de données d’incrémentation.
– Établir le modèle des données et définir une procédure pour faciliter le transfert du microscope à la base de données dédiée au stockage des images.
– Annoter les images en fonction de la classe de microbes détectés dans le corpus d’images actuel.
– Mettre en place des modèles d’apprentissage profond.
– Réaliser les expériences d’apprentissage profond nécessaires.
– Participer à la rédaction des livrables.

Formation et compétences requises :
Profil du candidat
Le candidat mettra en place des outils informatiques de gestion et de traitement d’images.

Formation et compétences requises :
– Master ou diplôme d’ingénieur (Bac +5) ou doctorat en biologie, traitement d’images ou bio-informatique.
– Maîtrise des outils d’analyse d’images de microscopie.
– Maîtrise de Python et/ou Java pour le développement de logiciels.
– Connaissance de la microscopie.
– Connaissance de la gestion de bases de données.
– Capacité à travailler de manière indépendante et à collaborer efficacement au sein d’une équipe pluridisciplinaire.
– Maîtrise de l’anglais professionnel.
– La connaissance/expertise antérieure de l’apprentissage profond pour les images de microscopie biologique est un plus.

Modalités de la candidature
Le dossier de candidature doit comprendre une lettre de motivation ainsi qu’un curriculum vitae précisant les derniers diplômes obtenus et les éléments d’expérience professionnelle.
L’examen des candidatures débutera le 1er décembre 2023.
Date d’entrée en fonction prévue : début 2024.

Veuillez soumettre les documents de candidature par courrier électronique à :
• Dr. Marc-Emmanuel Bellemare : marc-emmanuel.bellemare@univ-amu.fr
• Dr. Jean-Pierre Baudoin : jpbaudoin@live.fr
• Pr. Laurence Camoin Jau : Laurence.CAMOIN@ap-hm.fr

Adresse d’emploi :
Laboratoire d’Informatique et Systèmes – LIS – UMR CNRS 7020 – Aix-Marseille Université
Campus scientifique de St Jérôme – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20
www.lis-lab.fr

Document attaché : 202311171647_Poste_IR_SEMENDO-Base.pdf

Simulation biomécanique, fondée sur IRM, du comportement dynamique des organes pelviens

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS UMR7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre d’un projet de recherche concernant la modélisation de la dynamique des organes pelviens , nous nous intéressons particulièrement à la déformation d’organes à tissus mous [1]. Ce projet développé en collaboration avec le service de chirurgie digestive du CHU La Timone (APHMarseille) et l’équipe ICB-COM (UTBM) vise à terme la réalisation d’un simulateur de la dynamique des organes pelviens utile à la préparation du geste chirurgical.

Sujet :
A partir de l’exploration IRM volumique un modèle géométrique 3D maillé est construit. Il s’agit de « plonger » ce modèle dans un environnement de simulation biomécanique pour tester des lois de comportement hyper-élastique (Mooney-Rivlin, Ogden, Yeoh…). L’imagerie IRM 2D dynamique permet d’observer le comportement des organes en charge dans le plan médian sagittal. Une méthode basée sur les Large Deformation Diffeomorphic Metric Mapping (LDDMM) permet de suivre des points spécifiques sur les contours se déformant [2]. Ces mêmes points seront suivis sur les modèles simulés. Les expériences de simulation seront évaluées par comparaison des résultats de simulation avec les séquences observées grâce à l’IRM (Figure). Les conditions limites et les caractéristiques mécaniques seront celles disponibles dans la littérature associées à nos hypothèses expérimentales, ces questions étant particulièrement ouvertes.
Les notions fondamentales concernent les interactions entre modèles maillés pour la gestion des collisions et le respect de contraintes mécaniques (conservation du volume…). Les développements seront produits avec une plateforme dédiée à la simulation.

Contexte de travail :
Le stage se déroulera entre Février 2024 et Juillet 2024, essentiellement dans les locaux de :
– Université de Technologie de Belfort-Montbéliard (Site Sévenans)
– ICB UMR 6303, CNRS, Univ. Bourgogne Franche-Comté, Département COMM (Conception, Optimisation, Modélisation en Mécanique), UTBM.
Le transfert de « savoir-faire » pourra induire des séjours à Marseille au laboratoire d’informatique et des systèmes (LIS) dans l’équipe Images & Modèles sur le campus de St Jérome (LIS UMR 7020, www.lis-lab.fr ).
La gratification d’usage (de l’ordre de 600€) sera perçue. Une poursuite en thèse pourrait-être envisagée

Profil du candidat :
Le candidat ou la candidate sera intéressé(e) par un projet pluridisciplinaire et par l’imagerie médicale. Il ou elle sera de préférence issu de formation de master 2 ou master Ingénieur en mécanique numérique.

Formation et compétences requises :
Des compétences en simulation mécanique, en mathématiques appliquées ou dans le développement de jeux vidéo seront particulièrement appréciées. Une expérience de la programmation avec l’environnement python serait un plus.

Adresse d’emploi :
ICB UMR 6303, CNRS, Univ. Bourgogne Franche-Comté, Département COMM (Conception, Optimisation, Modélisation en
Mécanique), UTBM.
10 r Château 90400 Sevenans

Document attaché : 202311171639_Sujet_Master2_RecalageSimu.pdf

Analyse d’images de microscopie électronique par réseaux profonds : Augmentation de données.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS-UMR 7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@lis-lab.fr
Date limite de publication : 2023-12-31

Contexte :
Dans le cadre d’un projet collaboratif de recherche biomédicale sur l’endocardite infectieuse (EI) nous souhaitons développer une approche par réseaux profonds (deep-learning) pour la segmentation d’images de microscopie électronique à balayage dans le but d’analyser l’ultrastructure de valves cardiaques.
Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes (LIS), expert dans l’analyse d’image, et le laboratoire Mephi (IHU Méditerranée Infection), expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité (Habib 2019). L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon (lien). Par une approche innovante par MEB, on a démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux (Hannachi 2020 ; vidéo). Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse.

Sujet :
L’objectif du stage est de développer une méthode à base de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Nous nous proposons d’utiliser une architecture qui permettra à la fois la détection et la segmentation des objets d’intérêt dans l’image. L’entrainement de réseaux profonds demande une quantité importante d’images annotées. Le nombre des images disponibles étant limité, il s’agira alors de mettre en œuvre une stratégie d’augmentation de données qui pourrait profiter d’une architecture GAN (Hostin 2023). Aussi dans le cadre de ce stage les 2 types d’architectures seront considérées, une architecture d’analyse d’images pour détecter les microbes et une architecture générative pour son entrainement.

Financement:
Le stagiaire recevra la gratification d’usage, de l’ordre de 600€ par mois, prise en charge par l’institut d’établissement Marseille Imaging.

Candidature :
Les candidats sont invités à transmettre leurs candidatures par mél. Le dossier de candidature comprendra un CV détaillé, une lettre de motivation pour le projet et les derniers relevés de notes.

Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale.

Formation et compétences requises :
La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées

Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’) ou dans ceux de l’équipe MEPHI de l’IHU Méditerranée Infection, selon les besoins.

Laboratoire d’Informatique et Systèmes – LIS – UMR CNRS 7020 – Aix-Marseille Université
Campus scientifique de St Jérôme – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20
www.lis-lab.fr

Document attaché : 202311171631_Sujet_Master2_SegmentationAugmentationDL-SEM.pdf