Physics-Aware Deep Learning for Modeling Spatio-Temporal Dynamics.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Sorbonne Universite – ISIR – Institut des Systèmes
Durée : 36 mois
Contact : patrick.gallinari@sorbonne-universite.fr
Date limite de publication : 2023-12-15

Contexte :
Physics-aware deep learning is an emerging research field aiming at investigating the potential of AI methods to advance scientific research for the modeling of complex natural phenomena. This research topic investigates how to leverage prior knowledge of first principles (physics) together with the ability of machine learning at extracting information from data. This is a fast-growing field with the potential to boost scientific progress and to change the way we develop research in a whole range of scientific domains. An area where this idea raises high hopes is the modeling of complex dynamics characterizing natural phenomena occurring in domains as diverse as climate science, earth science, biology, fluid dynamics, etc.

Sujet :
The objective of the PhD project is the development of Physics-aware deep learning methods for the modeling of complex spatio-temporal dynamics. The direct application of state-of-the-art deep learning (DL) methods for modeling and solving physical dynamics occurring in nature is limited by the complexity of the underlying phenomena, the need for large amounts of data and their inability to learn physically consistent laws. This has motivated the recent exploration of physics-aware methods incorporating prior physical knowledge. Although promising and rapidly developing, this research field faces several challenges. For this PhD project we will address two main challenges, namely the construction of hybrid models for integrating physics with DL and generalization issues which condition the usability of DL for physics.

— Integrating DL and physics for spatio-temporal dynamics forecasting and solving PDEs

In physics and many related fields, partial differential equations (PDEs) are the main tool for modeling and characterizing the dynamics underlying complex phenomena. Combining PDE models with ML is a natural idea when building physics-aware DL models and it is one of the key challenges in the field. This has been explored for two main directions: (i) augmenting low resolution solvers with ML in order to reach the accuracy of high-fidelity models at a reduced computational cost, and (ii) complementing incomplete physical models with ML by integrating observation data through machine learning. A first direction of the PhD will then be to investigate hybrid physics-DL models using the recently proposed framework of neural operators. The latter opens the possibility of combining and learning multiple spatio-temporal scales within a unified formalism, a challenge in DL.

— Domain generalization for deep learning based dynamical models

Explicit physical models come with guarantees and can be used in any context (also called domain or environment) where the model is valid. These models reflect explicit causality relations between the different variables involved in the model. This is not the case for DL: statistical models learn correlations from sample observations, their validity is usually limited to the context of the training domain. This is a critical issue for the adoption of ML for modeling the physical world. In relation with the construction of hybrid models as described above, one will investigate this issue along two main directions. The first one is a purely data-based approach and exploits ideas from learning from multiple environments through task decomposition. The second one, takes a dual perspective, relying on prior physical knowledge of the system equations and directly targets the problem of solving parametric PDEs, exploiting ideas from meta-learning.

Profil du candidat :
Computer science or applied mathematics. Good programming skills.

Formation et compétences requises :
Master degree in computer science or applied mathematics, Engineering school. Background and experience in machine learning.

Adresse d’emploi :
Sorbonne Université (S.U.), Pierre et Marie Campus in the center of Paris. The candidate will integrate the MLIA team (Machine Learning and Deep Learning for Information Access) at ISIR (Institut des Systèmes Intelligents et de Robotique).

Document attaché : 202306130923_2023-04-PhD-Description-Physics-Aware-Deep-Learning.pdf

modèles génératifs pour les données de mobilité maritime

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : Ecole navale (EA3634)
Durée : 36 mois (+12)
Contact : cyril.ray@ecole-navale.fr
Date limite de publication : 2023-06-30

Contexte :
L’École navale recherche une/un doctorant(e) en informatique / science des données. En complément de ses travaux de recherche, elle/il interviendra dans les domaines de formation des élèves officiers ingénieurs et des étudiants de masters de l’Ecole navale.

Titulaire d’un master (ou équivalent) en informatique, la personne recrutée devra s’investir dans les activités d’enseignement et au sein du laboratoire dans des travaux de recherche liés au traitement de l’information maritime, à l’intelligence artificielle et plus généralement aux sciences des données. La thèse s’effectuera au sein de l’équipe de recherche MoTIM dans l’objectif de contribuer au domaine du Traitement de l’Information Maritime issue de sources hétérogènes (données capteurs, signaux, images, vidéos, informations géographiques, données textuelles) à l’aide d’algorithme d’intelligence artificielle.

Sujet :
La génération de données et de jeux données pseudo-synthétiques est utilisée pour un large éventail d’activités, notamment comme données de test pour de nouveaux outils ou algorithmes, pour la validation de modèles et dans la formation de modèles d’IA. Plus récemment la génération de données synthétiques créées artificiellement plutôt que générées par des événements réels a pris un essor avec l’apparition de modèles génératifs. Les données synthétiques constituent un type d’augmentation de données pour lequel les « Generative Adversarial Nets (GAN) » ont montré des performances prometteuses sur divers types de données. Dans le domaine maritime, le suivi et l’analyse des mobilités a été accéléré avec l’apparition du Système Automatiquement d’Identification (AIS) qui permet la localisation des navires équipés en temps-réel et à travers tous les océans. Les données produites sont des séries spatio-temporelles impactées par des données manquantes, des problèmes d’intégrité issues des capteurs et/ou de la transmission, et des malversations de natures diverses telles que la falsification de localisation, de trajectoire ou encore d’identité. Dans ce contexte, l’objectif de cette thèse est d’aborder la génération de données synthétiques et l’annotation sémantique de cette donnée. Les travaux de thèse pourront s’articuler notamment au travers des objectifs suivants :

– Développer un modèle génératif pour les données de mobilités maritimes permettant de produire des jeux de données
– Évaluer la prise en compte de données hétérogènes complémentaires ; eg. État de la mer.
– Aborder la scénarisation / annotation des jeux de données et évaluer l’utilité et l’impact de techniques « classiques » d’imputation de données pour aborder la variabilité de scénarios conçus.
– Considérer le problème de classification et de détection de nouveauté en simultanée, notamment pour la prise en compte de données falsifiées.
– Évaluer les performances / généricité de la démarche en fonction de la localisation géographique des données produites.

Profil du candidat :
Diplôme : Master (ou équivalent) en informatique.

Intérêt pour l’enseignement.
Intérêt pour un travail de recherche sur les problématiques maritimes et navales.
Compétences techniques en traitement de l’information.
Bonnes capacités de rédaction scientifique.
Bonnes capacités relationnelles et humaines

Formation et compétences requises :
Compétences : bonne connaissance des outils et des modèles de base de l’Intelligence Artificielle (apprentissage automatique / profond, etc.) et des techniques de représentation et de traitement de données (géographiques) hétérogènes (corrélation de données, analyse de séries temporelles, imputation de données, etc.)

Adresse d’emploi :
Institut de recherche de l’école navale
Lanvéoc-Poulmic / Brest

Document attaché : 202306121519_FDP_2023_DFS_DDR_E5033_AER_IA.pdf

LOD et IA pour l’intégration continue centrée utilisateur de services et données dans le contexte de l’IoT/IoMT : Application à la recommandation et réalisation de parcours personnalisés de soin de support en Oncologie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT
Durée : 3 ans
Contact : nizar.messai@univ-tours.fr
Date limite de publication : 2023-06-15

Contexte :
La thèse est proposée dans le cadre du projet région Centre Val de Loire SQVALD pour l’accompagnement de patients dans la coordination des parcours de soins de support en Oncologie en exploitant le contexte technologique du patient et des structures de soins et de soins de support.

Sujet :
La problématique scientifique de ce travail se situe dans le cadre global de l’intégration sémantique contextuelle et centrée utilisateur de données et d’applications à travers les architectures orientées services dans le contexte de l’Internet des Objets (IoT, pour Internet of Things) et de l’Internet des Objets Médicaux (IoMT, pour Internet of Medical Things). Elle se décompose en trois parties : la première consiste à partir des architectures orientées services et de leurs standards de mise en œuvre, services Web et Mashup, pour proposer une solution centrée utilisateur capable de répondre à l’hétérogénéité et volatilité des données issues des différentes sources d’intérêt allant des plateforme de e-santé aux objets connectés dans le contexte de l’utilisateur et des structures de soins et qui respecte les standards des architectures du type one Machine to Machine (oneM2M) .

Cela suppose en particulier de s’appuyer sur des mesures de similarités adaptées pour proposer les services et données les plus pertinents. Ceci qui nous amène à la deuxième partie qui consiste à définir des mesures de similarité entre services, données, objets et profils utilisateurs en (i) exploitant les données offertes sous forme de graphes de connaissances du Linked Open Data (LOD) et (ii) en appliquant des algorithmes d’IA (symbolique ou non) sur des données textuelles (avis médicaux, retours d’utilisateurs, etc.)

Une fois un parcours personnalisé proposé, la troisième partie consiste à accompagner l’utilisateur dans sa réalisation en définissant les métriques adéquates de l’évaluation continue de l’impact du parcours sur l’utilisateur et aux éventuels ajustements de ces parcours.

Profil du candidat :
Étudiants en Master 2 d’Informatique ou élèves-ingénieurs en dernière année (BAC+5) intéressés par la gestion des données et d’applications dans le cadre du Web sémantique et disposant de bonnes compétences en développement Web/Mobile (Java Android) et d’une initiation à la recherche (relecture et synthèse d’articles scientifiques). La connaissance du domaine de la santé est un plus.

Formation et compétences requises :
Étudiants en Master 2 d’Informatique ou élèves-ingénieurs en dernière année (BAC+5)

Adresse d’emploi :
Campus Grandmont – Faculté des Sciences et Techniques
2 Avenue Monge
37200 Tours

Document attaché : 202306081149_Thèse-SQVALD-LIFAT LOD-IA-IoT-Santé.pdf

Offre d’un ingénieur en informatique (IA)

Offre en lien avec l’Action/le Réseau : RoCED/– — –

Laboratoire/Entreprise : Laboratoire ICube, Strasbourg
Durée : 12M (Possible de pou
Contact : seo@unistra.fr
Date limite de publication : 2023-07-31

Contexte :
ICube Laboratory (Le laboratoire des sciences de l’ingénieur, de l’informatique et de l’imagerie) à l’Université de Strasbourg est un centre de recherche de premier plan en informatique, avec plus de 300 chercheurs permanents. Dans le cadre d’un projet binational et tri-institutionnel (HuMoCar : Realistic Human Models for Care Robots for Aged People, oct. 2021 – oct. 2025) avec CNRS, INRIA et ETRI, nous visons à repousser les limites actuelles de la vision robotique dans la cognition humaine par des robots soignant en situation interne. Notre objectif spécifique est de rendre les performances de la vision-intelligence robustes aux grandes variations (dans la forme du corps, les mouvements,..) à l’occlusion (tissu, meuble, mur,..), et capable de comprendre l’interaction en développant un modèle humain 4D photo-réaliste et sensible à la physique. Le projet se déroulera dans l’équipe de recherche MLMS (Machine Learning, Modélisation & Simulation, https://mlms.icube.unistra.fr/), située sur le site hospitalier du laboratoire.

Sujet :
Développement d’un modèle prédictif/génératif pour les humains habillés en mouvement à l’aide de l’apprentissage profond sur des ensembles de données annotées. Plusieurs tâches secondaires seront définies, impliquant différentes générations conditionnelles.

Profil du candidat :
− Master en informatique, génie électronique et électrique ou en mathématiques appliquées (2020 ou plus tard).

Formation et compétences requises :
− Compétences en programmation, communication et conception d’algorithmes efficaces.
− Solides connaissances et expérience en apprentissage en profondeur.
− Maîtriser l’anglais de niveau B2.
− Aptitude au travail en équipe et en autonomie.

Adresse d’emploi :
2 Rue Marie Hamm, 67000 Strasbourg

Offre de postdoc en informatique (IA)

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire ICube, Strasbourg
Durée : 12M (possible de pro
Contact : seo@unistra.fr
Date limite de publication : 2023-07-31

Contexte :
ICube Laboratory (Le laboratoire des sciences de l’ingénieur, de l’informatique et de l’imagerie) à l’Université de Strasbourg est un centre de recherche de premier plan en informatique, avec plus de 300 chercheurs permanents, avec l’école doctorale IA récemment ouverte soutenue par le gouvernement français. Dans le cadre d’un projet binational et tri-institutionnel (Real-World Human Cognition by Care Robots for Aged People, oct. 2021 – oct. 2025), nous visons à repousser les limites actuelles de la vision robotique dans la cognition humaine par des robots soignant en situation interne. Notre objectif est de rendre les performances de la vision-intelligence robustes aux grandes variations (dans la forme du corps, les mouvements,..) à l’occlusion (tissu, meuble, mur,..), et capable de comprendre l’interaction en développant un modèle humain 4D photo-réaliste et sensible à la physique. Le projet se déroulera dans l’équipe de recherche MLMS (Machine Learning, Modélisation & Simulation), située sur le site hospitalier du laboratoire.

Sujet :
− Modèle de prédiction/génération de mouvement d’humain habillé, conditionné par l’action via un apprentissage en profondeur sur des ensembles de données de mouvement annotés.
− Reconstruction de modèle humain 4D de bout en bout à partir d’une entrée vidéo 2D/3D via un ajustement optimal du modèle

Profil du candidat :
− Doctorat en informatique, génie électronique et électrique ou en mathématiques appliquées (2020 ou plus tard).

Formation et compétences requises :
− Compétences en programmation, communication et conception d’algorithmes efficaces.
− Solides connaissances et expérience en apprentissage en profondeur.

Adresse d’emploi :
2 Rue Marie Hamm, 67000 Strasbourg

Ingénieur / Ingénieure de Recherche Traitement Données 3D (H/F)

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : NORM3D
Durée : CDI
Contact : contact@norm3d.com
Date limite de publication : 2023-09-01

Contexte :
NORM3D est une entreprise qui crée des solutions innovantes de traitement de données 3D en menant une activité de recherche et développement. Les solutions créées s’appuient sur un socle de connaissances et de savoir-faire dans le domaine de la 3D avec des travaux scientifiques reconnus internationalement.

L’entreprise NORM3D propose une plateforme de services de traitements de données 3D, pour apporter des solutions adaptées aux entreprises dans le domaine de la 3D. Les champs d’applications incluent notamment le Building Information Modeling (BIM) pour fournir un gain de temps dans la reconstruction de maquette numérique 3D, la numérisation 3D pour la personnalisation d’objet (industrie 4.0), la valorisation du patrimoine culturel, ou la correction de la géométrie d’un maillage 3D pour l’impression 3D.

Sujet :
Votre mission sera d’étudier, de prototyper et améliorer des algorithmes de traitement sur nuage de points 3D. Vous contribuerez à la recherche et l’innovation en étant force de proposition dans l’élaboration de traitements adaptés.

Vous devrez :
– Effectuer des missions de veille technologique pour vous tenir informé des évolutions technologiques.
– Réaliser des études de recherches appliquées et des analyses pour l’élaboration de nouveaux procédés.
– Concevoir et développer de nouveaux traitements sur nuage de points 3D.
– Recherche sur l’amélioration des services déjà existants, en fonction des besoins et des retours émis par les utilisateurs.

Profil du candidat :
BAC+8, doctorat en informatique

Formation et compétences requises :
spécialisé traitement d’image

Adresse d’emploi :
NORM3D
2, rue Jean Perrin
14460 Colombelles

Document attaché : 202306071331_NORM3D_offre_emploi_ir.pdf

Continual/life long learning for time series prediction in environmental sciences

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT / RFAI, Université de Tours, France
Durée : 3 years
Contact : nicolas.ragot@univ-tours.fr
Date limite de publication : 2023-06-30

Contexte :
More details here: http://www.rfai.lifat.univ-tours.fr/phd-position-continual-life-long-learning-for-time-series-prediction-in-environmental-sciences/

The JUNON project, driven by the BRGM, is granted from the Centre-Val de Loire region through ARD program (« Ambition Recherche Développement »). The main goal of JUNON is to elaborate digital services through large scale digital twins in order to improve the monitoring, understanding and prediction of environmental resources evolution and phenomena, for a better management of natural resources. Digital twins will allow to virtually reproduce natural processes and phenomena using combination of AI and environmental tools.
JUNON will focus on the elaboration of digital twins concerning quality and quantity of ground waters, as well as emissions of greenhouse gases and pollutants with health effects, at the scale of geographical area corresponding to the North part of the Centre-Val-de-Loire region. These digital twins will rely on geological and meteorological knowledge and data (time series), as well as physic-based models.
The project actors are: BRGM, Université d’Orléans, Université de Tours, CNRS, INRAE, and ATOS and ANTEA companies.

Sujet :
The PhD position will be in the WP4 of Junon, focused on the prediction of quantity of ground waters and/or prediction of ground/air pollutants. Postdocs at the BRGM and LIFAT will have in charge respectively to collect and arrange data (ground waters levels at different locations) and to benchmark predictions with mechanistic models as well as with classical prediction AI tools integrating several sources of information like:
– meteorological data
– spatial information, i.e. geolocalization of sensors and locations of predictions to be made; topological information such as altitude
– integration of knowledge from mechanistic models as well as from expert knowledge (impact of attributes and variables used)
– etc.

The goal of the PhD will be, relying on these data and protocols, to work on new learning algorithms to allow these AI models to learn continuously giving new observed data as a stream. The scientific locks are clearly related to continual learning for Deep Learning prediction models and especially to deal with:
– few shot learning in DL
– drift and anomaly detection,
– plasticity/stability dilemma
– adapting such algorithms to suggested models by postdoc, based on Transformers or Spatio-Temporal Graph Neural networks using heterogeneous data.

Profil du candidat :
Student having a master degree in computer sciences with experiences in deep learning.

To apply, send the following documents by e-mail to nicolas.ragot [at] univ-tours.fr before 20th of June: a CV, a motivation letter, a short description of your experiences in machine/deep learning, references from academics.

Formation et compétences requises :
Master or Engineering degree or equivalent in computer sciences (Machine learning, data sciences) or applied mathematics

– a good experience in data analysis and machine learning (theory and practice of deep learning in python) is required
– experiences/knowledge in time series prediction and environmental science is welcome
– curiosity and ability to communicate (in English at least) and work in collaboration with scientists from other fields
– autonomy and good organization skills

Adresse d’emploi :
The RFAI group (Pattern Recognition and Image Analysis) is part of the LIFAT (EA 6300) computer science lab.
64 avenue Jean Portalis
37200 Tours , FRANCE

Document attaché : 202306051525_Thèse Junon apprentissage continu.pdf

Partial differential equation discovery for spatio-temporal simulations in cells

Offre en lien avec l’Action/le Réseau : DSChem/– — –

Laboratoire/Entreprise : Inria Lyon / AIstroSight
Durée : 36 mois
Contact : thomas.guyet@inria.fr
Date limite de publication : 2023-07-07

Contexte :
A funded PhD position is available in the AIstroSight team, INRIA, Lyon, France (https://team.inria.fr/aistrosight/), starting in November 2023. Our interdisciplinary team aims at developing innovative numerical methods for the search of new drug candidates to treat brain diseases, targeting neurons as well as glial cells. We value diversity, trust, growth, equity and creativity.

Sujet :
The goal of this PhD project is to develop a data-driven partial differential equation (PDE) discovery method for complex dynamical systems such as brain cells. The algorithm will be evaluated on its ability to robustly and accurately learn cell function at the macroscopic scale from data simulated at the nanoscopic level.

Profil du candidat :
We are looking for a student with a Master degree who has experience in at least one of the following areas: data science/machine learning/mathematical modeling as well as an interest in cell biology/neuroscience. Proficiency in written and oral English is required. No knowledge of French is needed. Most importantly, we are looking for future colleagues who are eager to learn and grow, and who are driven by scientific curiosity.

Formation et compétences requises :
We are looking for a student with a Master degree who has experience in at least one of the following areas: data science/machine learning/mathematical modeling as well as an interest in cell biology/neuroscience. Proficiency in written and oral English is required. No knowledge of French is needed. Most importantly, we are looking for future colleagues who are eager to learn and grow, and who are driven by scientific curiosity.

Adresse d’emploi :
Inria Lyon, Campus de la Doua et/ou HCL

Document attaché : 202306041943_PDE_Discovery_AIstroSight_2023.pdf

Jumeaux Numériques et Réseaux de Neurones appliqués au diagnostic de Systèmes Industriels

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CReSTIC – Université de Reims Champagne-Ardenne
Durée : 3 ans
Contact : bart.lamiroy@univ-reims.fr
Date limite de publication : 2023-06-12

Contexte :
Le contexte de cette thèse est le diagnostic des systèmes industriels. Elle contribuera à rendre ces systèmes plus flexibles et résilients par contribution à l’état de l’art du diagnostic et par l’intégration de l’apprentissage automatique. Cette intégration doit d’une part permettre de diagnostiquer des systèmes plus complexes avec moins de ressources de calcul, tout en permettant aux opérateurs humains de valider les diagnostics et d’engager des démarches correctives par une explicabilité suffisante des résultats produits par les outils de diagnostic et d’isolation.
Le travail se placera initialement dans le cadre de systèmes qui possèdent des capteurs et des actionneurs délivrant des signaux binaires (Systèmes à Evènements Discrets – SED) et commandés par des automates programmables industriels. Il pourra être envisagé que le l’étude s’élargisse par la suite à des systèmes hybrides incluant capteurs et actionneurs continus.

Sujet :
Dans cette thèse nous aborderons le diagnostic à travers des approches d’analyse automatique des données opérationnels sans modèle explicite, mais en mettant en œuvre des approches d’apprentissage automatique (notamment les réseaux de neurones) pour détecter et isoler les fautes.
La thèse poursuivra les deux objectifs suivants :
1. Extension des résultats préliminaires de diagnostic présentés dans (Saddem et al., 2022(a,b)) et de pouvoir dimensionner la taille des réseaux de neurones et ses hyper-paramètres en fonction du système surveillé.
2. Faire en sorte que les approches développées dépassent le stade de classifieur ou prédicteur en boite noire, et qu’elles puissent fournir un niveau d’explicabilité utile à un opérateur humain ; soit par formalisation des démarches de vérification (Fawzi et al. 2022) ou autres, soit par l’analyse des réseaux entrainés (Rojat et al. (2022).
L’ensemble de ce travail s’appuiera sur la plateforme Cellflex4.0 de l’Université Reims Champagne-Ardenne (https://crestic.univ-reims.fr/fr/plateformes/cellflex-4-0) et les Jumeaux Numériques associés pour la partie acquisition de données et validation expérimentale. Il bénéficiera également des capacités de calcul de la plateforme HPC Romeo.
L’accompagnement du/de la doctorant.e, assurée par les encadrants lui permettra de prioriser et de choisir les orientations scientifiques pour atteindre les objectifs précités. Les encadrants de thèse feront en sorte qu’elle.il acquière une méthodologie scientifique rigoureuse et pertinente.
Le déroulé de la thèse pourra s’envisager comme suit :
Etape 1 : Appropriation du sujet et développements de pistes scientifiques par l’établissement d’un état de l’art et la réalisation d’une étude bibliographique sur le diagnostic de systèmes industriels d’une part et une étude bibliographique sur les techniques d’apprentissage automatique focalisées sur le diagnostic d’autre part.
Etape 2 : Collecte et préparation des données nécessaires aux approches d’apprentissage identifiées à l’étape précédente. Il s’agit notamment de spécifier les données disponibles ainsi que les techniques qui doivent être utilisées pour leur collecte et ensuite les préparer pour les méthodes de diagnostic en ligne choisies.
Etape 3 : Développement et implémentation d’algorithmes de diagnostic par apprentissage automatique, entraîner l’algorithme pour retourner l’état du système (normal ou défaillant et si défaillant quelle classe de fautes). Valider l’algorithme sur les jumeaux numériques et sur la plateforme Cellflex.
Etape 4 : Explication du diagnostic fourni par un réseau de neurones à travers l’identification des composants défaillants. Cette vérification pourra notamment se faire par recherche explicite dans l’espace en utilisant de l’apprentissage par renforcement profond ou par l’analyse des réseaux entrainés et des approches de XAI plus habituelles.

Profil du candidat :
Ce sujet de thèse s’adresse aux étudiant.e.s ayant un diplôme de Master II ou d’ingénieur, soit issu.e.s d’un parcours ayant donné accès à des connaissances approfondies en systèmes industriels (notamment systèmes à évènements discrets et hybrides) et avec une envie d’investir le champ de l’Intelligence Artificielle, soit des étudiant.e.s de formation informatique avec de très bons acquis théoriques et applicatifs en apprentissage automatique souhaitant les appliquer à des contextes de systèmes industriels.
Au-delà des bases scientifiques citées ci-dessus, les autres compétences principales recherchées sont la curiosité et l’envie d’apprendre, la capacité de travail en équipe, la rigueur scientifique et la capacité de formalisation du raisonnement. Une grande partie du travail étant consacrée à la validation expérimentale des modèles, des compétences solides en programmation seront également nécessaires.

Formation et compétences requises :
Master II ou d’ingénieur, soit en Automatique, soit en Informatique

Adresse d’emploi :
Reims

Generation of graphical structures through deep reinforcement learning: application to molecular chemistry

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LERIA – Université d’Angers
Durée : 3 years
Contact : nicolas.gutowski@univ-angers.fr
Date limite de publication : 2023-06-12

Contexte :
In many areas of chemistry, the discovery of new molecules often involves building upon an existing effective compound through chemical reactions (addition, substitution, etc.) to enhance its properties. The emergence of truly new molecules is a rarer phenomenon but can pave the way for intensification and profound transformations in the field. It is precisely with this goal in mind that research on de novo generation of molecules with desired properties has been developed, particularly for drug and material discovery. Challenges in this research domain include the size of the search space and the difficulty of generating molecules that can be synthesized.

Molecules can be represented as graphs, where the vertices are labeled according to atom types and the edges represent bond types. This is a problem of generating graph structures, where the objective is the combination of one or more functions to optimize and constraints to satisfy. To address our application in chemistry, we have recently proposed an evolutionary algorithm for molecule generation called EvoMol [1], which can freely explore the chemical space and tackle diverse problems. This generator has achieved benchmark results in multi-property optimization and applied problems. It is capable of incorporating synthesizability constraints [2] and promoting diversity in the generated molecules [3]. However, significant challenges still need to be addressed, and two of these challenges are at the core of the proposed topic.

The first area of improvement is the selection of actions on the graph, which is currently random in EvoMol. One would expect an intelligent method to apply a policy for choosing actions that have been successful in the past, similar to a chemist adding a known chemical function to enhance a target property. Preliminary work by N. Gutowski and B. Da Mota has shown the potential of reinforcement learning using bandit algorithms and Q-Learning for certain problems, highlighting the need for further methods. The second area of improvement relates to synthesizability, which is a crucial objective for real-world applications. We have proposed synthesizability constraints [2] that make the generated molecules likely to be synthesizable. Other works propose heuristic scores [4,5], sometimes based on retrosynthesis [6]. A method capable of constructing a molecule with the desired properties, along with the steps for its synthesis, would have many advantages. Although some work has emerged in this field [7], they are limited to simple problems.

Artificial learning involving graphs is a promising theme with numerous applications that has benefited from major advances in deep learning, such as Graph Neural Networks (GNN [8]), Graph Convolutional Networks (GCN [9]), and more recently, Graph Transformer Networks (GTN [10]). These approaches have been quickly adapted and applied to various applications, including molecular generation [11,12]. However, these powerful architectures have been relatively less explored in the context of constrained exploration and diverse optimization objectives, such as those of interest in our project (e.g., organic solar cells). For these complex objectives of sequentially constructing useful and realistic molecules, reinforcement learning appears to be a promising alternative to the meta-heuristics and latent space manipulation approaches [13] (such as variational autoencoders for molecules [14]) that have been employed thus far. The latter approaches face well-known challenges of posterior collapse and are limited to optimizing simple (i.e., differentiable) properties. While reinforcement learning is primarily used in the domain of games and robotics to learn optimal sequences of actions, its application for controlled generation of complex data has recently shown diverse promising developments, particularly in the field of natural language generation [15,16]. In protein chemistry, it has achieved widespread success through tools like AlphaFold [17]. However, although there are some works on molecular optimization problems [11,18,19], the issue of synthesizability is almost always minimized or neglected, leaving this task to retrosynthesis tools. However, even if such methods were used on molecules generated by current generative models, there is no guarantee that the necessary reagents to produce these molecules themselves can be obtained. This top-down method, performed a posteriori, is computationally expensive and weak. It does not allow setting objectives for the construction cost of the structure or other criteria that would help narrow down the search space. In chemistry, for example, one might want to minimize synthesis costs, the number of steps, minimize hazardous or difficult-to-recycle waste, etc. The joint integration of the bottom-up graph construction process and the optimization of these properties would be an elegant, effective, and original approach.

The application of deep reinforcement learning techniques for the discovery of molecules that are both stable, synthesizable, and exhibit properties of interest in the target domains is not without various scientific challenges that need to be overcome, based on the expertise of the supervising team in sequential learning: the input objects for policies are graphs, the actions are non-trivial in the case of reaction patterns, and the underlying problem is a multi-objective optimization problem. However, this type of application lends itself well to transfer or progressive learning (curriculum learning [20]), with the possibility of learning a policy on a simpler problem such as constraint optimization or synthesizability heuristics, and then improving this policy to optimize more complex objectives that include these synthesizability issues.

Beyond the intended application, the development of reinforcement learning (RL) techniques for policies conditioned on objective graphs, as suggested by the synthesis of molecules using available reactions, is an important theme for the Machine Learning community. While multi-task RL, specifically goal-conditioned RL, is expanding in the literature of the field, very few approaches deal with complex graph structures. In this context, the search for invariants in the manipulated structures will be a key lever for establishing effective policies. Additionally, automatic curriculum learning, which has seen numerous recent developments [20,21,22,23] by dynamically determining task specification distributions adapted to the current level of the learning agent, has not yet been deployed to our knowledge in environments with known dynamics, as in the case of our application. The exploitation and adaptation of Monte Carlo Tree Search (MCTS) planning algorithms for this framework seems to be a particularly promising research direction that we intend to develop in this thesis.

Références
[1] J. Leguy, T. Cauchy, M. Glavatskikh, B. Duval, et B. Da Mota. EvoMol: a flexible and interpretable evolutionary algorithm for unbiased de novo molecular generation. Journal of Cheminformatics, 2020.
[2] T. Cauchy, J. Leguy et B. Da Mota. Definition and exploration of realistic chemical spaces using the connectivity and cyclic features of ChEMBL and ZINC. Digital Discovery, Royal Society of Chemistry, under review.
[3] J. Leguy, M. Glavatskikh, T. Cauchy, et B. Da Mota. Scalable Estimator of the Diversity for De Novo Molecular Generation Resulting in a More Robust QM Dataset (OD9) and a More Efficient Molecular Optimization. Journal of Cheminformatics, 2021.
[4] Voršilák et al. SYBA: Bayesian estimation of synthetic accessibility of organic compounds. Journal of Cheminformatics, 2020.
[5] Bühlmann et al. ChEMBL-Likeness Score and Database GDBChEMBL. Frontiers in Chemistry, 2020.
[6] Thakkar et al. Retrosynthetic accessibility score (RAscore) – rapid machine learned synthesizability classification from AI driven retrosynthetic planning. Chemical Science, 2021.
[7] Bradshaw et al. Generating Molecules via Chemical Reactions. Workshop DeepGenStruct, ICLR 2019.
[8] Scarselli et al. The Graph Neural Network Model. IEEE Transactions on Neural Networks, 2009.
[9] Kipf et al. Semi-Supervised Classification with Graph Convolutional Networks. 5th International Conference on Learning Representations (ICLR), 2017.
[10] Yun et al. Graph Transformer Networks. Advances in Neural Information Processing Systems, NeurIPS, 2019.
[11] J. Leguy, T. Cauchy, B. Duval, et B. Da Mota. Goal-directed generation of new molecules by AI methods. Chapter of Computational and Data-Driven Chemistry Using Artificial Intelligence, Elsevier, 2022.
[12] Thölke et al. TorchMD-NET: Equivariant Transformers for Neural Network based Molecular Potentials. arXiv preprint arXiv:2202.02541, 2022.
[13] Zhang et al. Comparative Study of Deep Generative Models on Chemical Space Coverage. Journal of Chemical Information and Modeling, 2021.
[14] Liu et al. Constrained Graph Variational Autoencoders for Molecule Design. Advances in Neural Information Processing Systems, 2019.
[15] S. Lamprier, T. Scialom, A. Chaffin, V. Claveau, E. Kijak, J. Staiano, B. Piwowarski. Generative Cooperative Networks for Natural Language Generation. ICML, 2022
[16] T. Scialom, S. Lamprier, B. Piwowarski, J. Staiano. Answers Unite! Unsupervised Metrics for Reinforced Summarization Models. EMNLP/IJCNLP, 2019.
[17] Jumper et al. Highly accurate protein structure prediction with AlphaFold. Nature, 2021
[18] Khemchandani et al. DeepGraphMolGen, a multi-objective, computational strategy for generating molecules with desirable properties: a graph convolution and reinforcement learning approach. Journal of Cheminformatics, 2020.
[19] Zhou et al. Optimization of Molecules via Deep Reinforcement Learning. Scientific Reports, Nature, 2019.
[20] N. Castanet, S. Lamprier, O. Sigaud. Stein Variational Goal Generation For Reinforcement Learning in Hard Exploration Problems. CoRR 2022
[21] Andrychowicz et al. Hindsight Experience Replay. arXiv preprint arXiv:1707.01495, 2017.
[22] Florensa et al. Automatic goal generation for reinforcement learning agents. International conference on machine learning, PMLR, 2018.
[23] P-A Kamienny, J. Tarbouriech, S. Lamprier, A. Lazaric, L. Denoyer: Direct then Diffuse: Incremental Unsupervised Skill Discovery for State Covering and Goal Reaching. ICLR 2022

Sujet :
The first objective of the thesis will be to propose and implement reinforcement learning methods adapted to the problem, and then conduct a methodological study on toy problems, domain benchmarks, and realistic applications proposed by our chemistry partner. Learning a policy for generating molecules can be studied within the framework of classical reinforcement algorithms. Since the inputs to the policies are molecular graphs, it will be possible to use the descriptors proposed in our previous work or neural networks (Graph Neural Networks) from recent research that need to be adapted to the characteristics of molecular graphs.

The second objective of the thesis will be to transform a list of known reactions into actions applicable to molecular graphs, and then learn to sequence these chemical reactions to synthesize a target molecule (i.e., goal-conditioned RL, in the perspective of innovative conditioned bottom-up generation, rather than the usual top-down approaches involving complex and non-generalizable retrosynthesis calculations). It will also be possible to derive a fine-grained estimator of synthesizability. This objective will be the main focus of the research effort in machine learning, with valuable contributions to the statistical learning community (e.g., adaptation of planning approaches to the automatic curriculum framework).

The third and final objective will be to apply the sequencing of chemical reactions within the algorithms and developments proposed in the first part of the thesis, and then study the use of these actions in terms of performance and synthesizability criteria. The secondary benefit of this method is the possibility of not only proposing an optimized target but also justifying our proposal through the sequence of reactions that led to its elaboration.

Profil du candidat :
– H/F
– Master 2 ou école d’ingénieur

Formation et compétences requises :
– Bac+5
– Apprentissage par renforcement
– Deep Learning / Machine Learning
– Python

Adresse d’emploi :
UFR Sciences, 2 Bd de Lavoisier, 49000 Angers