Développement de méthodes biométriques pour l’identification et la traçabilité des grumes de chêne

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LORIA
Durée : 18 mois
Contact : hoai-diem-phuc.ngo@loria.fr
Date limite de publication : 2023-07-31

Contexte :
Le chêne est une ressource stratégique pour la France. L’industrie du bois fait face à une très forte demande d’exportation vers l’Asie. Depuis 2015, un la- bel “Transformation UE” a été créé pour permettre aux clients qui s’engagent à transformer ou faire transformer le bois à l’intérieur de l’UE d’accéder en priorité aux ressources en chêne des forêts publiques1. Dans ce contexte, la traçabilité des bois devient une nécessité. Différent systèmes d’identification ont été testés par les acteurs de la filière forêt-bois sans donner satisfaction; c’est le cas par exemple des plaquettes en plastique (avec un numéro ou code-barre imprimé) ou des puces RFID qui sont trop facilement substituables ou falsifiables. Pour résoudre ce problème de traçabilité des grumes, des méthodes alternatives à ces marqueurs physiques susceptibles d’être utilisées partout et d’identifier chaque grume individuellement doivent être développées. En se basant sur les caracté- ristiques intrinsèques des grumes, de la même façon que les empreintes digitales identifient un humain, il pourrait être simple et peu coûteux d’atteindre cet objectif.

Sujet :
La première étape consistera à comprendre et tester sur des images de chêne les algorithmes développés sur des résineux par nos collègues autrichiens.
Très rapidement, il sera nécessaire de développer des méthodes capables d’iden- tifier les grumes de chêne, peut-être en utilisant dans un premier temps toutes les singularités disponibles, puis en en interdisant certaines. Plusieurs types d’al- gorithmes pourraient être considérés, y compris des adaptations des réseaux de neurones les plus efficaces.
Pour cela, une base de 10 000 à 20 000 images de culées de chêne, actuellement

Profil du candidat :
Un doctorat, master ou diplôme d’ingénieur en informatique.

Formation et compétences requises :
De bonnes compétences en programmation (C++ et/ou Python), en analyse et traitement d’images, et en rédaction scientifique sont attendues. Une bonne connaissance des réseaux de neurones convolutifs serait appréciée.

Adresse d’emploi :
LORIA
Campus Scientifique, 615 Rue du Jardin-Botanique, 54506 Vandœuvre-lès-Nancy

Document attaché : 202306021010_post-doc_Biomtrace_fr.pdf

Tools on Causality

Date : 2023-09-24 => 2023-09-29
Lieu : Escandille – Autrans-Méaudre-en-Vercors (France)

We invite you to attend the research school on Tools on Causality (https://quarter-on-causality.github.io/tools/). It will be held at the Escandille, Autrans-Méaudre-en-Vercors, France, from September 24th to September 29th, 2023. It represents an opportunity to practice state-of-the-art causal inference algorithms.

We offer the entire board at the Escandille from Sunday, September 24th, evening, to Friday, September 29th, at noon, including a shuttle from the Grenoble train station to the Escandille on Sunday and from the Escandille to Grenoble train station on Friday.

In addition to attending the tutorials, you can present a poster describing your research work.

The contribution costs are:

350 euros for a single room
300 euros for a twin room

Please register at https://causalityschool.sciencesconf.org/registration before July 15th AoE.

We look forward to seeing you there.


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Apprentissage collaboratif multiparadigme interactif pour l’analyse de séries temporelles

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : AgroParisTech – ICube
Durée : 12 à 16 mois
Contact : gancarski@unistra.fr
Date limite de publication : 2023-08-31

Contexte :

Durée : Un an (démarrage dès que possible!)
Salaire : de 2000€/mois à 2300€/mois (net) en fonction de l’expérience.
Contact : Antoine Cornuéjols antoine.cornuejols@agroparistech.fr et Pierre Gançarski, pierre.gancarski@unistra.fr

Sujet :
Le projet post-doctoral vise à proposer une méthode innovante d’apprentissage collaboratif interactif multi-paradigme, qui combine des méthodes supervisées et non-supervisées tout en permettant l’interaction avec l’expert.

La personne recrutée proposera et définira de nouveaux mécanismes permettant aux méthodes supervisées et non supervisées de collaborer efficacement pour atteindre un consensus de classification. Les modalités d’échange d’informations entre elles devront être précisées. Elle devra également définir un protocole d’interaction entre l’utilisateur et les méthodes d’apprentissage par l’utilisation de contraintes. Enfin,elle devra mettre en œuvre concrètement les approches proposées pour permettre leur test et leur validation.

Profil du candidat :
– Doctorat en informatique et spécialisé en apprentissage automatique/fouille de données.

Formation et compétences requises :
– Connaissances solides en Science des Données et plus particulièrement sur les méthodes standards de classification et de clustering. Une première expérience sur l’utilisation de modèles collaboratifs/ensemblistes ou d’intégration de contraintes serait un plus.
– Bonnes compétences en communication verbale (anglais ou français) et écrite (anglais).
– Compétences interpersonnelles et la capacité à travailler individuellement ou en tant que membre d’une équipe de projet.
– Si possible, connaissance en JAVA, python et scikit-lean
– De connaissances en télédétection serait un plus indéniable

Adresse d’emploi :
– Saclay (Campus d’AgroParisTech, 22 place de l’Agronomie, 91120 Palaiseau)
ou au choix
– Strasbourg (ICube, 300 bld Sébastien Brant 37400 Illkirch)

Document attaché : 202305300842_Sujet_HERELLES_2023.pdf

Appel à contributions/participations: 11èmes Journées de la Société Française de Chémoinformatique, 5-6 Oct 2023 CAEN (France)

Date : 2023-10-05 => 2023-10-06
Lieu : Caen

Les prochaines journées de la SFCi (Société Française de ChemoInformatique) sont programmées les 5-6 octobre prochains à Caen.

Les inscriptions sont ouvertes sur le site web de ces journées : https://sfci-11.sciencesconf.org/.

Ces journées sont une occasion pour les jeunes chercheurs de présenter les travaux avec notamment des communications orales dédiées. La première limite a été fixée le 26 juin pour les demandes de communications orales afin de nous permettre de réaliser une sélection. Les affiches pourraient être proposées par la suite (indication du 26 juin sur le site web mais on peut aller au delà).

Nous sommes aussi à votre écoute pour tous les problèmes lors de l’inscription.

Les journées seront réalisées au Château de Caen. Vous pouvez par conséquent réserver vos hôtels dans le centre ville.

En espérant vous voir nombreux et nombreux lors de ces journées,
Bonne journée et à bientôt,
L’équipe d’Organisation de ces journées (CERMN/ GREYC)

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Offre de post-doc (18 mois) au CIRAD – UMR TETIS (Montpellier) sur l’apprentissage automatique pour la sécurité alimentaire

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 18 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2023-07-31

Contexte :
La sécurité alimentaire (SA) est un problème central dans de nombreuses régions du monde, comme en témoigne sa présence parmi les 17 objectifs de développement durable (ODD 2 – Faim zéro).
Pour surveiller les situations d’insécurité alimentaire, plusieurs systèmes d’alerte précoce sont actifs aujourd’hui, tels que GIEWS (FAO) et FEWSNET (USAID).
Ces systèmes utilisent un ensemble limité de types de données, i.e., données agroclimatiques provenant d’images satellites et indicateurs extraits d’enquêtes auprès des ménages sur les facteurs nutritionnels, économiques et liés à la production. De plus, une intervention humaine est souvent nécessaire pour combiner et résumer toutes les sources d’information.

Les recherches menées précédemment par TETIS ont montré que des données ouvertes hétérogènes, liées à différents niveaux à la sécurité alimentaire, peuvent être utilisées pour développer des méthodes d’apprentissage automatique capables de produire des indicateurs de SA. L’idée est d’utiliser des données qui représentent des proxys pour les raisons multiples et interdépendantes à l’origine de ce phénomène. Quelques exemples peuvent être des rasters d’informations spatiales, information géographique bénévole, données météorologiques, indicateurs économiques et données textuelles issus des médias locaux.

Sujet :
L’objectif de ce post-doc est de consolider et d’étendre les travaux récents sur ce sujet [1], en exploitant des stratégies d’apprentissage automatique et profond de dernière génération qui peuvent faire face à des aspects critiques, tels qu’une grande hétérogénéité des données et des données de vérité de terrain limitées. Plus précisément, Le travail est structuré au tour des trois questions de recherche :

– Quels types de données en accès libre peuvent être ciblés pour produire des indicateurs de Sécurité Alimentaire ?
– Comment des données hétérogènes en termes de thématique, de structure et de résolution spatio-temporelle peuvent-elles être prétraitées pour obtenir des prédictions cohérentes de la Sécurité Alimentaire pour un site d’étude donné ?

– Comment les techniques plus récentes d’apprentissage automatique et profond peuvent-elles être exploitées et combinées pour traiter ces données hétérogènes ?

En plus de la publication d’articles de recherche originaux dans des revues scientifiques de premier plan, l’objectif de ce travail sera également de développer une suite de méthodes (p.ex., une bibliothèque Python) capables de récupérer et d’exploiter des données hétérogènes pour produire efficacement des indicateurs de SA à l’échelle nationale.
L’utilisation de données de référence fournies par le CIRAD et le CGIAR permettra de tester les méthodologies proposées dans différents pays d’Afrique et d’Asie du Sud-Est.

Le Post-Doc est financé dans le contexte de l’Institut Convergences Agriculture Numérique #DigitAg ( www.hdigitag.fr ).

Profil du candidat :
Doctorat en informatique.

La préférence sera donnée aux candidats très motivés ayant une expérience de recherche en apprentissage automatique et profond, en science des données hétérogènes et en science des données appliquée à des sujets liés à la sécurité alimentaire et à l’agriculture.

De solides compétences en programmation (de préférence en Python) sont nécessaires.

Formation et compétences requises :
Doctorat en informatique.

La préférence sera donnée aux candidats très motivés ayant une expérience de recherche en apprentissage automatique et profond, en science des données hétérogènes et en science des données appliquée à des sujets liés à la sécurité alimentaire et à l’agriculture.

De solides compétences en programmation (de préférence en Python) sont nécessaires.

Adresse d’emploi :
500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202305261434_PostDoc #DigitAg 2023 FR.pdf

INTELLIGENCE ARTIFICIELLE et GESTION DES INFORMATIONS ET DES DONNEES IMPARFAITES ET HÉTÉROGÈNES

Date : 2023-10-30 => 2023-11-03
Lieu : Le Lazaret
La Corniche
223 Rue Pasteur Benoît
34200 Sète

** Institut d’Automne en Intelligence Artificielle (IA2)
L’Institut d’Automne en Intelligence Artificielle (IA2) a pour but de proposer une école généraliste en intelligence artificielle, afin d’offrir un panorama des différentes sous-disciplines de l’intelligence artificielle et de leurs principales techniques.
Cette édition IA2 2023 concerne la gestion des informations et données hétérogènes et imparfaites. Il est bien connu que les industriels, ainsi que les institutions publiques, doivent de plus en plus faire face à une grande quantité d’informations/données de nature différente et issues de sources multiples. A côté de la notion de données, on trouve également des contraintes, des connaissances et des préférences qui sont souvent sous-exploitées dans des applications réelles.

** Programme
Le programme (en pièce jointe avec ce message) de cette école est disponible à l’adresse : https://sites.google.com/view/ecole-ia2-2023/programme.
Il est étalé sur 5 jours (du lundi 30 octobre au vendredi 03 novembre), est principalement composé de cours fondamentaux (les matinées) complétés par des exposés avancés (les après-midis) sur des sujets spécifiques. Le programme contient également des présentations sur des applications/études de cas/projets ainsi qu’une session spéciale, sous forme de posters et d’exposés courts pour les doctorants.
Les cours auront lieu en anglais.

** Inscriptions
Le lien pour s’inscrire est : https://www.azur-colloque.fr/DR07/inscription/inscription/312/fr
Les inscriptions comprennent l’ensemble des prestations (hébergement, repas, pauses cafés). L’hébergement est prévu du dimanche 29 octobre au vendredi 3 novembre.
Tarifs :
– Doctorants, étudiants (la carte d’étudiant sera demandée) : 350 euros en chambre double et 650 euros en chambre individuelle.
– Académiques (hors CNRS) : 525 euros en chambre double et 650 euros en chambre individuelle.
– Personnels CNRS (un justificatif sera demandé) : Gratuit.
– Industriels : 1000 euros en chambre individuelle.
Pour plus d’informations sur les inscriptions, merci de consulter la page : https://sites.google.com/view/ecole-ia2-2023/inscriptions

** Lieu de l’école :
L’édition IA2 2023 se déroulera dans le domaine du Lazaret (https://www.lazaretsete.com/reunions-congres-seminaires-professionnels-2/) dans la ville de Sète.

Le plan d’accès au site de l’école peut-être téléchargé depuis l’URL https://www.lazaretsete.com/wp-content/uploads/2014/10/Nvx_plan_lazaret.pdf.

** Contacts :
Pour toute information sur l’école IA2 (édition 2023), merci d’envoyer un message à : IA2.2023@cril.fr

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Machine learning and graph-based techniques to predict long-term bacterial community structure

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Lorraine Research Laboratory in Computer Science a
Durée : 36 mois
Contact : sabeur.aridhi@loria.fr
Date limite de publication : 2023-06-30

Contexte :
We propose a fully funded 3-years PhD position in computer science with application to biomolecule analysis. The proposed position is funded by the Lorraine Université d’Excellence (LUE) through a multidisciplinary project that involves 2 researchers in computer science and 4 researchers in microbiology. A PhD thesis in microbiology will be conducted in parallel.

Context and motivations

Bacteriocins are antimicrobial peptides of bacterial origin with a very high economic potential in the agri-food sector. They are used in biopreservation/biocontrol applications to fight against undesirable microorganisms in the agronomy and food industry. LIBio has recently developed a technology based on the selection of two strains of the lactic acid bacterium Carnobacterium maltaromaticum producing anti-Listeria monocytogenes bacteriocins [9]. These strains inhibit the growth of this pathogen in cheeses when added to the manufacturing milk to produce the antimicrobial agents in the cheese matrix. These remarkable properties have led to a patent [10] that has very recently been licensed to a ferment producer. However, like the vast majority of biopreservation technologies, the effect is at best bacteriostatic: there is little or no decay of the pathogenic bacteria, which can then be maintained at low concentrations in the food. The biopreservation technologies described in the literature are based on engineering approaches that do not take advantage of the properties of the microbial communities forming the microbiomes of food products. Yet microbiome engineering is among the 12 promising technologies that could transform food systems over the next decade [11]. Indeed, in the case of biopreservation, assemblies of microorganisms could allow obtaining communities producing multiple antimicrobial agents and moreover being able to occupy the ecological niche of the undesirable microorganism to exclude it more efficiently. However, knowledge in the field of microbial community engineering is insufficient to fully exploit their potential. Indeed, due to the complexity of microbial communities, there is no available method to predict microbial community structure based on the knowledge of the ecological properties of microorganisms. Moreover, assembling microorganisms whose properties is to produce antimicrobial agents is a major difficulty because these agents can lead to the mutual exclusion of the microorganisms producing them.

Positioning

In a microbial ecosystem in which members produce antimicrobial substances like bacteriocins, three actors can be considered: the bacteriocin-producing microorganism (P) and the microorganisms sensitive (S) and resistant (R) to this bacteriocin. It was experimentally shown that in simple ecosystems mixing three such actors, all three actors are able to maintain equilibrium [12]. In these systems, S is more competitive than R because it does not pay the cost of resistance, and R is more competitive than P because it does not pay the cost of bacteriocin production. This cyclical relationship between P, S, and R is similar to that of the popular game « rock paper scissors » where no one player has an advantage over the other two: each player can overtake one player and each can be defeated by another. These simple experimental systems suggest that it is possible to implement engineering tools to predict the structure of complex communities based on the interactive properties of microorganisms. Thanks to the emergence of high throughput investigation methods, it is now possible to produce interaction data between large sets of microorganisms and thus reconstitute models of microorganism interaction networks. [6] [7] Lately, Ramia et al. [4] [5] built the interaction network corresponding to 73 Carnobacterium maltaromaticum strains. Like previously, the graph is sender-determined and also shows a highly nested structure [7], which means that it is different from a randomly built network with the same number of nodes and edges. The results also show that the competitive interaction network is very dense making C. maltaromaticum a very interesting model to develop community engineering approaches producing high performance antimicrobial substances cocktails for the fight against undesirable microorganisms. This project will use the data published in Ramia et al. [5] and will try to provide a rather computer science approach to the study of those interaction graph properties.

The originality of this project is that it will make it possible to integrate experimental variables describing the properties of interaction between microorganisms for the prediction of community structure which is not possible by existing methods.

Sujet :
Objectives of the thesis

The main goal of the thesis is to use advanced machine learning and graph-based approaches in order to predict the long-term community structure in microbiological ecosystems [3] [1]. Particularly, it aims at providing approaches to deduce diversity directly from the static, inner properties of the interaction graph the entities are involved in. The practical objectives of this interdisciplinary PhD project, which will be carried out in collaboration with researchers from the Laboratoire d’Ingénierie des Biomolécules (LIBio), are as follows:

to study existing research works on the analysis of interaction networks and long-term diversity prediction in bacteria.
to propose machine learning and graph-based approaches in order to learn models that are able to predict diversity based on the interaction graphs. In this context, regression methods could be used to learn the relation between the interaction graph properties and the diversity.
to study how graph embedding could help in predicting the level of development for each strain. In this context, we aim to study the impact of graph embedding methods on the prediction results. A specific embedding method could be proposed in the context of this project.

Profil du candidat :
Required qualification: Candidates must have a master degree in computer science. Good programming skills in a procedural language are essential. Experience of machine learning and graph mining is also desirable but not essential. A strong interest in bioinformatics would also be highly desirable.

Formation et compétences requises :
Required qualification: Candidates must have a master degree in computer science. Good programming skills in a procedural language are essential. Experience of machine learning and graph mining is also desirable but not essential. A strong interest in bioinformatics would also be highly desirable.

Adresse d’emploi :
Lorraine Research Laboratory in Computer Science and its Applications (LORIA), Nancy, France

Document attaché : 202305240952_PROJET-DE-THESE-LORIA-LUE.pdf

Deep learning semantic segmentation guided by underwater acoustics for seafloor mapping

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Lab-sticc / ENSTA Bretagne
Durée : 3 ans
Contact : gilles.le_chenadec@ensta-bretagne.fr
Date limite de publication : 2023-06-30

Contexte :
The SeabAId project is being carried out in partnership with Shom and funded by the Defence Innovation Agency within the framework of the
Ingéblue Institute over a period of 4 years. It concerns the analysis and exploitation of the acoustic reflectivity of the seabed using multibeam sonar.
The project has three scientific aspects. The first aspect is the processing of acoustic data from Shom multibeam echosounders to estimate the reflectivity of the seafloor and assess its uncertainty. The second aspect is to develop a semantic segmentation approach using deep learning adapted to automatic seafloor prediction. The last aspect aims at developing a hybrid data-driven, deep learning and acoustically guided
approach.

Sujet :
is post-doc offer concerns the last two deep learning aspects of this project, i.e. the automatic processing of acoustic data recorded on the seafloor by multibeam echosounders in order to automatically generate maps (homogeneous zones).
The initial work will be based on the team’s previous work on the semantic segmentation of side-scan sonar images. Adapting this algorithm to multibeam echosounder data is the first objective of the study. For this task, a large database of labelled images has been created, recorded on various seabeds with a labelled map as additional information. For the learning process, the labels considered will come from the sedimentological expertise already produced in the various coastal areas through the Shom sedimentary maps (“carte G”).
There are several issues that need to be analysed and resolved in this study.
A first issue is how to train a semantic segmentation neural network when the labels are underresolved compared to the observations? A first idea is to generate the reflectivity mosaic at label resolution and train the model. The analysis should then focus on increasing the resolution of the observations to see how accurate the method can be.
A second issue will be to assess the relevance of using all the classes of the sedimentary map. It may not be possible to obtain the same level of detail from the reflectivity observations as the sedimentologists (which are often the result of multi-sensor analyses supplemented by sediment samples). The analysis to be undertaken will be to understand these possible cases where the algorithm cannot discriminate between two sedimentary classes. A fusion of sedimentary classes could be carried out or a complementary method could be proposed.
Finally, here semantic segmentation concerns the ability to create acoustically homogeneous zones. The second and last objective of this post-doc is to inform the semantic segmentation algorithm by acoustic models and/or by a-priori acoustic information. These recent frameworks [1,2,3,4,5] make it possible to develop algorithms that allow massive processing of the data while taking into account the physics of the problem. This consideration may be particularly interesting for improving models; promoting explainability; using less data for learning; taking advantage of all available information to predict the seafloor.

Profil du candidat :
The successful candidate should have a strong background (phd or science degree) in machine learning. He/She should have good programming skills (Python). The successful candidates should have the ability to work in a team, be curious and have rigorous spirit.

Formation et compétences requises :
machine learning, deep learning, pytorch, tensorflow ,python
computer vision

Adresse d’emploi :
ENSTA Bretagne – Lab-STICC UMR CNRS 6285 – 2 rue François Verny, 29806 Brest

Document attaché : 202305231631_seabaid_postdoc_ia.pdf

Candidate genes prioritization using knowledge graphs and AI

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : University of Montpellier. LIRMM computer science
Durée : 3 years
Contact : pierre.larmande@ird.fr
Date limite de publication : 2023-06-23

Contexte :
To meet the challenges of the global demand for food in a context of climate change, a better understanding of agronomically important traits, such as yield, quality, and resistance to abiotic and biotic stresses is crucial to improve crops production capacities. Deciphering molecular mechanisms that drive a particular trait is one of the most critical research areas in biology. However, these genotype-phenotype interactions are difficult to identify because they occur at different molecular levels in the plant and are strongly influenced by environmental factors (i.e., climate change). For biologists, it is difficult to search for relevant information as it is often dispersed in several databases on the Internet each with different data models, scales or distinct means of access. Today’s major challenges are related to the development of methods to integrate these heterogeneous data and to enrich biological knowledge. The scientists also need methods to dig into this mass of data and to highlight relevant information that identifies key genes. To this end, we developed the AgroLD [1] platform which is a knowledge graph that uses Semantic Web technologies to integrate heterogeneous agronomic data from the genome to the phenome (i.e., from the set of genes to the set of phenotypes observed in a plant organism). AgroLD is actively developed. As of today, AgroLD contains more than 900 million triples resulting from the integration of around 100 datasets gathered in 33 named graphs.

Sujet :
The thesis is proposed under the frame of the DIG-AI ANR project which aims to develop machine learning methods combined with knowledge graphs such as AgroLD to study the molecular interactions driving the phenotype development in crops.

Objective 1: The current challenges are related to the development of methods for functional analysis of genes and in particular to methods for prioritization of candidate genes. Indeed, the data integrated from databases are incomplete, heterogeneous, insufficient to infer genes function with good accuracy. One of the first objectives of the thesis will be the development of knowledge extraction methods to extract functional information on genes in scientific documents.

Objective 2: The recent success of graph neural networks (GNNs) suggests the possibility of systematically incorporating multiple sources of information into a heterogeneous network and learning the nonlinear relationship between phenotypes and genes [2]. However, knowledge graphs like AgroLD can be complex and contain interference information. Therefore, as proposed by [3, 4], some GNN models could reduce the influence of noisy data on the overall prediction effect by assigning low weights to unreliable nodes/edges. The second objective will be to develop an adapted approach to the AgroLD context by building meaningful representations from the high dimensional and complex gene data.

Objective 3: Finally, based on previous candidate gene studies in the biomedical field [5, 6] and because inferring gene regulatory networks (GRN) can be formulated as a link prediction problem in Graph Neural Networks (GNN) [7], the third objective will be to apply GNN models to implement candidate gene prioritization and GRN methods to answer biological questions related to adaptation of crops to drought stress and plant diseases.

References

1. Venkatesan A, Tagny Ngompe G, Hassouni NE, Chentli I, Guignon V, Jonquet C, et al. Agronomic Linked Data (AgroLD): A knowledge-based system to enable integrative biology in agronomy. PLOS ONE. 2018;13:1–17.
2. Zhang X-M, Liang L, Liu L, Tang M-J. Graph Neural Networks and Their Current Applications in Bioinformatics. Front Genet. 2021;12.
3. Neil D, Briody J, Lacoste A, Sim A, Creed P, Saffari A. Interpretable Graph Convolutional Neural Networks for Inference on Noisy Knowledge Graphs. ArXiv181200279 Cs Stat. 2018.
4. Li X, Saude J. Explain Graph Neural Networks to Understand Weighted Graph Features in Node Classification. ArXiv200200514 Cs. 2020.
5. Alshahrani M, Hoehndorf R. Semantic Disease Gene Embeddings (SmuDGE): phenotype-based disease gene prioritization without phenotypes. Bioinform. 2018;34:i901–7.
6. Chen J, Althagafi A, Hoehndorf R. Predicting candidate genes from phenotypes, functions and anatomical site of expression. Bioinformatics. 2021;37:853–60.
7. Gligorijević V, Barot M, Bonneau R. deepNF: deep network fusion for protein function prediction. Bioinformatics. 2018;34:3873–81.

Profil du candidat :
Expected profile:
The candidate must have the equivalent of a BAC+5 degree from a University or Engineering School, with specialization in applied mathematics, data science-related, graph theory and machine learning fields. A good understanding of molecular biology and bioinformatics is a plus. We are expecting applicants to have a solid background in programming (Python). The candidate must have a good understanding of English.

Formation et compétences requises :

How to apply:
Applications have to be send before June 23th 2023 and require the following documents:
1) Motivation letter
2) 2-pages max CV
3) M1, M2 academic transcripts
4) references if possible
to be sent by mail to: pierre.larmande@ird.fr and francois.scharffe@umontpellier.fr

Adresse d’emploi :
Link to the full description: https://sites.google.com/site/larmandepierre/positions/phd-in-computational-biology-and-bioinformatics