Post-Doc position available at LS2N, Nantes, France with mobility at NII Tokyo, Japan

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N, Nantes, France with mobility at NII Tokyo, J
Durée : 12 mois
Contact : Fabrice.Guillet@univ-nantes.fr
Date limite de publication : 2022-02-28

Contexte :
Title : Combining graph embedding and topic modelling for ontology/KG learning from large scale data

Key words : Topic modelling, Knowledge graph learning, Ontology learning, Graph embedding, Deep learning

Description. Ontology learning from the web data is a major challenging topic within the semantic web field and many approaches have been developed to tackle it. However, due to sparsity and heterogeneity of data, they lack to provide good quality results with a high semantical relevance for humans. The post-doc work aims to define a new approach for ontology learning/knowledge graph learning by incorporating embedded knowledge graphs in a clustering technique (topic modelling) dealing better with the sparsity and the heterogeneity of texts available in the Web and the semantical relevance of the results. The research domain of this post-doc position is model learning, linked data and graph embedding for ontology/knowledge graph learning from texts. Model learning/Topic modelling is one of the area expertise of the DUKe team (Data User Knowledge) of LS2N, one of the France’s leading public research labs in digital sciences. Linked data, graph building from texts and knowledge graph embedding are fields of expertise of the Japanese Ichise Laboratory from the National Institute of Informatics (NII), one of the leading research institute in Japan.

Duration : 12 months from (1 January 2022 -31 December 2022) including a mobility of 3 months in Japan .

Localization : Polytech Nantes, France , Ichise Laboratory, Tokyo Japan

Salary: 2900€ gross monthly + mobility expenses in Japan, during three months, about 350.000 yens / month.

Application: Candidates should have a PhD in computer science or applied mathematics, with strong experience in machine learning and related coding ecosystems in python. A background in semantic web and probability/statistics would be a plus.
Applicants should send a full CV including a complete list of publications and completed projects, a cover letter, and letters of recommendation or the names of two people who have worked with them.

Contact: Mounira Harzallah (Mounira.harzallah@univ-nantes.fr, Fabrice Guillet fabrice.guillet@univ-nantes.fr), DUKe, LS2N, France

Sujet :
Description. Ontology learning from the web data is a major challenging topic within the semantic web field and many approaches have been developed to tackle it. However, due to sparsity and heterogeneity of data, they lack to provide good quality results with a high semantical relevance for humans. The post-doc work aims to define a new approach for ontology learning/knowledge graph learning by incorporating embedded knowledge graphs in a clustering technique (topic modelling) dealing better with the sparsity and the heterogeneity of texts available in the Web and the semantical relevance of the results. The research domain of this post-doc position is model learning, linked data and graph embedding for ontology/knowledge graph learning from texts. Model learning/Topic modelling is one of the area expertise of the DUKe team (Data User Knowledge) of LS2N, one of the France’s leading public research labs in digital sciences. Linked data, graph building from texts and knowledge graph embedding are fields of expertise of the Japanese Ichise Laboratory from the National Institute of Informatics (NII), one of the leading research institute in Japan.

Duration : 12 months from (1 January 2022 -31 December 2022) including a mobility of 3 months in Japan .

Localization : Polytech Nantes, France , Ichise Laboratory, Tokyo Japan

Salary: 2900€ gross monthly + mobility expenses in Japan, during three months, about 350.000 yens / month.

Profil du candidat :
Application: Candidates should have a PhD in computer science or applied mathematics, with strong experience in machine learning and related coding ecosystems in python. A background in semantic web and probability/statistics would be a plus.
Applicants should send a full CV including a complete list of publications and completed projects, a cover letter, and letters of recommendation or the names of two people who have worked with them.

Contact: Mounira Harzallah (Mounira.harzallah@univ-nantes.fr, Fabrice Guillet fabrice.guillet@univ-nantes.fr), DUKe, LS2N, France

Formation et compétences requises :
see above

Adresse d’emploi :
see above

Software Research Engineer in Astronomy (M/F)

Offre en lien avec l’Action/le Réseau : SimpleText/– — –

Laboratoire/Entreprise : Observatoire Astronomique de Strasbourg UMR 7550
Durée : 12 mois
Contact : gilles.landais@astro.unistra.fr
Date limite de publication : 2022-01-31

Contexte :
L’annonce du poste est publiée via les offres d’emploi du CNRS – https://bit.ly/3IskUCz

Poste de développeur au Centre de données de Strasbourg (CDS) sur le service de catalogue VizieR (https://vizier.cds.unistra.fr).

Le CDS est hébergé dans L’Observatoire Astronomique de Strasbourg,
il regroupe une trentaine de personnes : des astronomes, des documentalistes et des ingénieurs qui fournissent des services dont les données sont libre d’accès et sont largement utilisées dans la communauté (https://cds.unistra.fr/).

————————————————————————————————
(english version)
The job announcement is published via CNRS job offers – https://bit.ly/3IskUCz

Developer position at the Strasbourg Data Centre (CDS) on the VizieR catalogue service (https://vizier.cds.unistra.fr).

The CDS is hosted in the Observatoire Astronomique de Strasbourg,
It gathers about 38 people: astronomers, documentalists and engineers who provide services whose data are freely accessible and widely used in the community (https://cds.unistra.fr/).

Sujet :
Le Centre de Données astronomiques de Strasbourg (CDS) recherche un-e développeur(euse) pour faire évoluer le Système d’Information de publication des données en astronomie. Il/elle viendra renforcer l’équipe d’ingénieur(e)s informaticien(ne)s en charge du service Vizier pour faire évoluer les workflows qui mettent en base de données les tables publiées dans les journaux ou missions spatiales. Les développements incluront l’évolution de l’indexation des données temporelles et spatiales.

———————————————————————————————————-
(english version)
The Astronomy Data Centre of Strasbourg (CDS) is looking for a software engineer to work on the Astronomy Data Publication Information System. He/she will reinforce the team of computer engineers in charge of the Vizier service in order to develop the workflows that put in the database the tables published in the journals or space missions. The developments will include the evolution of the system for the indexing of temporal and spatial data.

Profil du candidat :
Nous recherchons un développeur de logiciels pour travailler sur le service de catalogue VizieR qui est utilisé par les astronomes du monde entier.

————————————————————————————————————
(english version)
We are looking for a software developer to work on the VizieR catalogue service which is used by astronomers all over the world.

Formation et compétences requises :
– Maîtrise des développements C, Python en environnement Linux
– Bonne Connaissances en bases de données relationnelles (PostgreSQL) et du langage SQL
– La connaissance d’un autre langage comme Java ou Rust serait un plus
– Une expérience de création d’un analyseur syntaxique serait utile et appréciée
– Anglais niveau B1 minimum
– Capacité à présenter son travail (collaborations techniques en anglais dans le cadre de projets internationaux)
– Autonomie, qualités relationnelles, sens de l’organisation, capacités d’adaptation et des aptitudes à travailler en interaction avec une ou plusieurs équipes
– Le/la candidat(e) aura un diplôme d’école d’ingénieur (ou équivalent)

———————————————————————————————————-
(english version)
– Expertise in C or Python developments in Linux environment
– Good knowledge of relational databases (PostgreSQL) and SQL language
– Knowledge of another language such as Java or Rust would be a plus
– Experience in creating a parser would be useful and appreciated
– English level B1 minimum
– Ability to present your work (technical collaborations in English in the context of international projects)
– Autonomy, interpersonal skills, organisational skills, adaptability and ability to work in interaction with one or more teams
– The candidate should have a diploma from an engineering school (or equivalent)

Adresse d’emploi :
Observatoire Astronomique de Strasbourg
11, rue de l’université
67000 Strasbourg

Machine Learning in Computational Fluid Dynamics

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Sorbonne Universite – Equipe Machine Learning and
Durée : 6 mois
Contact : patrick.gallinari@sorbonne-universite.fr
Date limite de publication : 2022-02-28

Contexte :
Numerical simulation of fluids plays an essential role in modeling complex physical phenomena in domains ranging from climate to aerodynamics. Fluid flows are well described by Navier-Stokes equations, but solving these equations at all scales remains extremely complex in many situations and only an averaged solution supplemented by a turbulence model is simulated in practice (Xiao and Cinnella, 2019). The increased availability of large amounts of high fidelity data and the recent development and deployment of powerful machine learning methods has motivated a surge of recent work for using machine learning in the context of computational fluid dynamics (CFD) (Durasaimy et al., 2019). Combining powerful statistical techniques and model-based methods leads to an entirely new perspective for modeling physics phenomena (Willard 2020). From the machine learning (ML) side, modeling complex dynamical systems and combining model-based and data-based approaches is the topic of active new research directions. This is then the context of this project, and our aim is to develop the interplay between Deep Learning (DL) and CFD in order to improve turbulence modeling and to challenge state of the art ML techniques.

Sujet :
Combining CFD models and Deep Learning

Our objective is to improve traditional CFD models, both in terms of complexity and of accuracy of the predictions, with the addition of ML components. Recent progresses, and the generalized use of automatic differentiation both for differentiable solvers and DL algorithms have paved the road to the integration of DL techniques and ODE/PDE solvers. In the ML community, a starting point for such investigations was the Neural ODE paper (Chen 2018) that promoted the use of ODE solvers for ML problems. We advocate for this research the use of DL modules for complementing CFD solvers, in the spirit of (Yin 2021) who introduced a principled approach however still limited to basic PDEs. In our new context, our final objective is to analyze how to model unclosed terms in the Reynolds-Averaged Navier-Stokes (RANS) equations. In order to simplify the problem, for the internship, the approach will be developed for a scalar surrogate of the Navier-Stokes equations, namely, the nonlinear Burgers’ equation, which has been widely used in the literature as a simplified ansatz for Navier-Stokes The whole system will be trained end to end with the DL modules and the numerical solvers using high-fidelity data.

In order to be useful for CFD applications a learned model must accurately simulate flows outside of the training distribution: operational conditions and environment may vary according to different physical factors thus requiring models to extrapolate to these new conditions. For providing such capabilities, we will adopt a new perspective by considering learning dynamical models from multiple environments and analyze the ability of this framework to extrapolate to new conditions.

Profil du candidat :
Master or engineering degree in engineering, computer science or applied mathematics.

Formation et compétences requises :
The candidate should have a strong scientific background with good technical skills in programming.

Adresse d’emploi :
Machine Learning and Information Access team – MLIA – https://mlia.lip6.fr, Sorbonne University, 75005 Paris, Fr

Document attaché : 202112141459_2021-12-MLIA-JLRA-Machine-Learning-Computational-Fluid-Dynamics.pdf

Scalabilité horizontale dans les pipelines de données

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : SAP / LIP6 Sorbonne Université
Durée : 6 Mois
Contact : hubert.naacke@lip6.fr
Date limite de publication : 2022-01-07

Contexte :
Aujourd’hui des entreprises gèrent leurs données avec une grande variété d’applications développées indépendamment. Or ces applications n’ont pas été conçues pour communiquer entre elles et il n’est pas envisagé de les migrer vers un système commun. Néanmoins, le besoin est fort de Concevoir des nouveaux services de gestion et d’analyse de données qui valoriseront la donnée présente. Cela pose le problème de faire coopérer efficacement des applications, en particulier celles qui gèrent des grands volumes de données. Ainsi, pour faciliter la circulation de données entre les applications et définir des nouveaux services intégrant des données massives, des pipelines de données sont conçus.

Un pipeline de données [JHM04] est une séquence ou un graphe d’opérations sur des données. Une opération peut simplement déplacer des données ou effectuer des traitements complexes incluant la collecte de données de plusieurs sources, leur transformation, la génération de modèles par apprentissage et le stockage dans plusieurs destinations. En pratique, un pipeline peut contenir des centaines d’opérations et il peut évoluer à plusieurs reprises en étant complété avec des nouvelles opérations ou de nouvelles données. Ainsi, face au nombre croissant de pipelines à concevoir et déployer, il est crucial de disposer :

1. d’un langage de haut niveau pour définir des pipelines,

2. d’outils automatiques pour déployer et contrôler l’exécution d’un pipeline.

Les avancées technologiques récentes en matière de virtualisation et de conteneurisation telles que Kubernetes [Pou21] permettent de configurer, en langage Yaml, le déploiement d’un ensemble de tâches afin d’automatiser leur déploiement. Toutefois, Yaml décrit les objets déployés (services, pod, conteneur) mais manque d’abstraction pour décrire des pipelines de données de manière suffisamment déclarative et extensible. C’est pourquoi, la société SAP a conçu un nouveau langage de définition de pipeline qui décrit l’enchainement des opérations (tâches) en spécifiant les échanges de données et la configuration de l’environnement d’exécution (techniques de virtualisation et conteneurisation).

[Ber14] David Bernstein. Containers and cloud: From lxc to docker to kubernetes. IEEE Cloud Computing, 1(3):81–84, 2014.

[JHM04] Wesley M Johnston, JR Paul Hanna, and Richard J Millar. Advances in dataflow programming languages. ACM computing surveys (CSUR), 36(1):1–34, 2004.

[Pou21] Nigel Poulton. The Kubernetes Book. Amazon, 2021.

Sujet :
L’objectif de ce stage est de proposer une méthode pour instancier et déployer automatiquement et efficacement des pipelines de données. Cela soulève plusieurs défis scientifiques et techniques :

– Déploiement automatique : chaque opération du pipeline correspond à un programme (Python, node.JS, …) ou à un appel vers une API externe (par exemple, job Spark) qui est déployé en utilisant une image/containeur Docker [Ber14] adaptée. A partir de la description d’un pipeline, il s’agit de le déployer sur une plateforme Kubernetes dans le cloud (par exemple Google Kubernetes Engine ou Elastic Kubernetes Service d’Amazon).

– La parallélisation des opérations dans plusieurs pods permet d’augmenter la scalabilité horizontale du pipeline, mais nécessite également la définition d’opérateurs de partitionnement de données (par clé ou fenêtrage) pour répartir les traitements sur des partitions indépendantes.

– Le regroupement de plusieurs opérations dans le même pod: ceci permet réduire les échanges de données entre pods qui sont remplacées par des communications moins couteuses entre les threads dans le même pod.

Travail à réaliser: Le ou la stagiaire abordera en priorité le défi de la parallélisation et traitera les points suivants :

1. Prise en main de l’environnement d’exécution. Etat de l’art sur les services Kubernetes, le déploiement automatique de pods et la génération d’images docker.

2. Parallélisation d’une opération : Implanter différents opérateurs de partitionnement adaptés à la distribution de données ordonnées (séquences, flux) et non-ordonnées (ensembles).

3. Traduire la spécification d’un pipeline, contenant des opérations parallélisées, en un déploiement yaml qui doit répliquer les pods s’exécutant en parallèle et contenir des nouveaux pods dédiés au
partitionnement des données.

4. Définir des use-cases et conduire des expérimentations pour mesurer les performances obtenues.

5. Selon le temps disponible le ou la stagiaire pourra étudier l’optimisation du pipeline en combinant les stratégies de regroupement d’opérations dans un même pod et de parallélisation d’un pod. En particulier, ces stratégies sont limitées par un certain nombre de contraintes liées aux types d’images dockers disponibles et au protocole de communication entre pods. Il s’agit de proposer une méthode pour déterminer quelles sont les opérations à regrouper et quelles sont celles à paralléliser afin de maximiser les performances d’un pipeline.

Une perspective intéressante est de répondre aux besoins d’élasticité dans des scénarios sur des flux de données dynamiques (avec des changements de fréquence et des “bursts”). Il s’agit d’étudier l’implantation de stratégies dynamiques qui prennent un compte ces changements pour adapter le nombre de pods déployés aux besoins. Ceci est particulièrement important dans les déploiements sur des services cloud qui impliquent des coûts financiers.

Profil du candidat :
On cherche un étudiant ou une étudiante motivé(e) avec une bonne expérience en programmation (Python, Java) et en bases de données (optimisation, big data). Des connaissances techniques sur Docker/Kubernetes et sur les pipelines de données sont un atout.

Formation et compétences requises :
M2 Informatique ou équivalent

Adresse d’emploi :
SAP-France, Levallois-Perret

LIP/Sorbonne Université, Paris

Document attaché : 202112141329_Stage_LIP6_SAP_2021(1).pdf

Etude de l’espace des caractéristiques dans les auto-encodeurs variationnels (Imagerie médicale))

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS (Rouen)
Durée : 6 mois
Contact : jerome.lapuyade-lahorgue@univ-rouen.fr
Date limite de publication : 2022-02-01

Contexte :
Un auto-encodeur variationnel est un type de réseau de neurones utilisé généralement pour la reconstruction de données et ainsi extraire les caractéristiques principales des données. Celui-ci prend en entrée un vecteur ou matrice de données x, l’encode sous forme d’un vecteur z de caractéristiques et décode la sortie à partir de z. Cette sortie doit être la plus fidèle possible à l’entrée. Les caractéristiques obtenues sont des valeurs évoluant dans un espace de dimension plus faible que celle des données brutes à analyser. Ainsi, un auto-encodeur peut être considéré comme un algorithme de réduction de dimension.

Sujet :
L’objectif principal du projet est de proposer des distributions a priori pour les caractéristiques alternatives à la distribution normale habituellement utilisée. Ces lois statistiques seront des distributions sur variétés différentielles. Les variétés différentielles pourront être représentées, via leur discrétisation, comme des graphes dans lesquels les opérateurs classiques de gradient et laplacien, ainsi que la notion de géodésique peuvent être étendus. Les auto-encodeurs ainsi implémentés pourront également être utilisés dans les réseaux multitâches actuellement d´enveloppés dans notre équipe et appliqués pour la classification de cancers et la prédiction de l’évolution d’un cancer après un traitement à partir des images TDM/TEP ou IRM.

Profil du candidat :
L’étudiant(e) devra être à l’aise en programmation avec le langage Python. Il/elle devra apprécier la démarche scientifique, le travail en équipe. Une bonne culture dans le domaine de l’apprentissage machine et/ou de l’imagerie sera appréciée.

Formation et compétences requises :
Étudiant(e) en dernière année de Master en Informatique, Science des Données, Traitement et Analyse d’Images.

Compétences en analyse statistique, apprentissage machine, programmation python.

Adresse d’emploi :
LITIS, Université de Rouen, 76800 Saint-Étienne-du-Rouvray

Postdoc – Deep learning for brain imaging

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICM – Institut du Cerveau (CNRS/Inria/Inserm/Sorbo
Durée : 18 mois
Contact : olivier.colliot@sorbonne-universite.fr
Date limite de publication : 2022-06-01

Contexte :
You will work within the ARAMIS lab (www.aramislab.fr) at the Paris Brain Institute. The institute is ideally located at the heart of the Pitié-Salpêtrière hospital, downtown Paris.
The ARAMIS lab, which is also part of Inria (the French National Institute for Research in Computer Science and Applied Mathematics), is dedicated to the development of new computational approaches for the analysis of large neuroimaging and clinical data sets. With about 35 people, the lab has a multidisciplinary composition, bringing together researchers in machine learning and statistics and medical doctors (neurologists, neuroradiologists).

Sujet :
Working within the ARAMIS team, the postdoc’s mission will be to develop research on the topic of deep learning for brain imaging. More specifically, the research project can tackle one of the following subjects or their combination:
– self-supervised machine learning
– machine learning for prognosis and diagnosis
– integration of medical image analysis and natural language processing
– reproducibility of machine learning systems
– segmentation of brain structures and pathologies
– applications to brain tumours, Parkinson’s disease and other neurological diseases
He/she will be able to contribute to the training and co-supervision of students (Master, PhD).

Profil du candidat :
– Research experience in Deep Learning
– Experience in the field of medical imaging would be a plus but is not mandatory
– Genuine interest for applications in medicine
– Good writing skills
– Good communication skills

Formation et compétences requises :
– PhD in computer science, electrical engineering or a related field

Adresse d’emploi :
Brain Institute, ARAMIS Team, Pitié Salpêtrière Hospital, 47 Bd. de l’hôpital, 75013 Paris

Navigation dans des règles d’implication extraites de connaissances agroécologiques en santé animale

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRMM, CNRS et Univ Montpellier
Durée : 6 mois
Contact : marianne.huchard@lirmm.fr
Date limite de publication : 2022-06-01

Contexte :
Le stage est financé par l’institut de convergence #Digitag (https://www.hdigitag.fr/fr/) et pourra être complété par un mois de CDD.

Sujet :
Pour un producteur agricole, implémenter les pratiques agroécologiques au sein de son exploitation lui impose de disposer d’un système d’aide à la décision (SAD) pour les identifier, ce SAD comportant une base de connaissances suffisamment étoffée et un système de navigation adapté à ses besoins. La base de connaissances Knomana, par exemple, rassemble plus de 46000 descriptions d’usage de plantes à effet pesticide et antibiotique en santé végétale, animale et humaine (Silvie et al. 2021). La plateforme de visualisation RCAviz (https://info-demo.lirmm.fr/rcaviz/) permet de naviguer dans ce type de base de connaissances. Basé sur l’Analyse de Concepts Relationnels (RCA), une méthode de classification de données relationnelles, RCAviz permet de naviguer dans des structures conceptuelles de type graphe et d’identifier facilement, par exemple, une plante locale susceptible de protéger une culture contre un bioagresseur invasif, ou des plantes en partie équivalentes pour un problème sanitaire donné.
Outre les structures conceptuelles, RCA propose de représenter les connaissances sous forme de règles d’implication, un formalisme qui, proche du langage naturel, est bien adapté aux utilisateurs du monde rural (e.g. « F_Meliaceae => no-food » : les plantes de la famillle Meliaceae ne sont pas consommées). Pour autant, identifier la règle la mieux appropriée dans un grand ensemble de règles est difficile.

L’objectif du stage est de développer un prototype logiciel de visualisation de connaissances, exprimées sous forme de règles d’implications produites par la librairie FCA4J (http://www.lirmm.fr/fca4j). Cette application présentera les règles en regard de mesures d’intérêt ou d’après une formulation symbolique donnée par l’utilisateur, e.g. les règles relatives à un certain ensemble de conditions, pour les exploiter facilement.

Profil du candidat :
Etudiant de Master 2 (informatique ou bioinformatique) avec un intérêt pour l’ingénierie des connaissances, l’analyse visuelle (visual analytics), et à trouver des solutions alternatives aux pesticides et antibiotiques de synthèse pour l’agriculture biologique.

Formation et compétences requises :
Compétences solides en programmation d’application web (notamment javascript) et connaissances en ingénierie des connaissances.

Adresse d’emploi :
LIRMM, Univ. Montpellier, CNRS
161 rue Ada
35095 Montpellier Cedex 5
France

Document attaché : 202112111817_SujetDigitag2022_diffusion.pdf

Postdoc position at Météo-France (CNRM) in Artificial Intelligence for Numerical Weather Prediction

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Météo-France research department (CNRM), Toulouse,
Durée : 21 to 27 months
Contact : laure.raynaud@meteo.fr
Date limite de publication : 2022-01-31

Contexte :
High-Impact Weather (HIW) events have devastating effects on society, causing human losses, degradation of infrastructures and large economic impacts. Severe precipitating events, damaging thunderstorms and strong winds are among the most impacting events from a meteorological point of view, with various severe indirect effects such as flooding, landslides and marine submersion. Being rare, HIW events lie in the tail of climatological distribution of weather events. Although meteorological services such as Météo-France have done significant progress in predicting weather for the last decades, accurately predicting the occurrence, intensity, location and timing of HIW still remains challenging.
Currently operational weather forecasts rely on physically-based modelling approaches, and Numerical Weather Prediction (NWP) models are operated daily to determine the future atmospheric states and the risk of HIW. In particular, Ensemble prediction systems (EPSs) aim at sampling the probability distribution of future atmospheric states. They consist in running several NWP forecasts in order to account for the different sources of uncertainty. At Météo-France, the operational AROME-EPS, which runs 16 perturbed forecasts with a spatial resolution of 1.3km, is used to anticipate the risk of HIW. However, properly capturing the associated uncertainty requires very high resolution (few hundred meters) large-size (few hundred members) ensembles. Nonetheless, such enhanced systems are currently unfeasible for operational NWP because of the associated computational cost.
In this context, the main objective of the POESY project is to explore the scientific feasibility and relevance of an innovative hybrid EPS design, combining standard physical modelling with computationally-efficient Artificial Intelligence (AI) techniques, in order to produce disruptive probabilistic forecasts for high-impact weather.

Sujet :
The goal of this post-doctoral position is to improve the representation of forecast probability distributions by increasing the AROME-EPS sampling from O(10) to 0(1000) forecasts thanks to complementary AI-generated forecasts. For that purpose, physically-constrained deep generative models such as GANs and Variational AutoEncoders will be developed and evaluated. Besombes et al. (2021) provides a first example of GAN-based weather scenario. A crucial part of the work will be to adapt off-the-shelf learning architectures to the particularities of this geophysical problem. A specific attention will be paid to the following points : the learning of extremes, ensuring spatial, temporal and physical consistencies in the generated forecasts, mode collapse problem.

Profil du candidat :
The ideal candidate would have the following qualifications :
– a strong background in deep learning algorithms, in particular convolutional neural networks and deep generative models
– experience in geophysical problems would be appreciated, at least a strong interest for applied research in atmopsheric physics is highly recommended
– Proficiency with Python programming and AI librairies
– Experience with processing large volumes of data
– Experience of working in a Linux-based environment
– Aptitude for scientific work, written and oral communication in English, meetings abroad possible
– A scientific curiosity, autonomy, rigor in the interpretation of the results

Formation et compétences requises :
PhD degree in atmopsheric sciences, statistics or artificial intelligence.

Adresse d’emploi :
Toulouse, France.

Document attaché : 202112101209_PostdocPOESY.pdf

Analyse de données relationnelles – définition de quantificateurs pour l’ARC

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube Strasbourg
Durée : 5 à 6 mois
Contact : florence.leber@engees.unistra.fr
Date limite de publication : 2022-03-31

Contexte :
L’analyse de concepts formels (ACF) [1] est une méthode mathématique de classification, largement appliquée sur différents types de données et dans de nombreux domaines (par exemple [2,3]). Elle consiste, à partir d’une table (appelée contexte) décrivant des objets par des attributs, à construire un treillis de concepts, i.e. des couples (extension ; intension) d’ensembles fermés décrivant les objets et les attributs qui les définissent. Cette méthode est étendue aux données relationnelles dans le cadre de l’analyse relationnelle de concepts (ARC) [4]. L’ARC considère deux types de contextes, des contextes objets-attributs et des contextes objets-objets décrivant les relations entre objets. L’ARC étend les contextes objets-attributs par des attributs relationnels de la forme qrC, où q est un quantificateur, r une relation et C un concept issu du co-domaine de r. Le résultat de l’ARC est une famille de treillis (un par contexte objets-attributs) reliés entre eux par ces attributs relationnels.

Sujet :
Il s’agit de définir des quantificateur spécifiques à certains types de relations (temporelles ou spatiales par exemple) et qu’on pourra utiliser directement pour créer des jeux de données sur lesquels on applique ensuite l’ARC. On s’appuiera pour cela sur les quantificateurs existants (existentiel, universel ou de dénombrement [5]) et sur les modèles qualitatifs de l’espace et du temps [6]. Le stage s’organisera de la façon suivante :
• bibliographie sur l’ARC et les quantificateurs
• prise en main des outils existants (RCAexplore, Galicia ?)
• définition de quantificateurs pour un type de relation, formalisation du schéma relationnel associé
• intégration dans RCAexplore
• application sur une base de données (données sur l’eau ou agricoles)

Profil du candidat :
En cours Master 2 en Informatique ou équivalent

Formation et compétences requises :
Formation en logique, représentation de connaissances et programmation

Adresse d’emploi :
Laboratoire ICube, équipe SDC
300 bd Sébastien Brant – CS 10413 – F-67412 Illkirch Cedex

Document attaché : 202112081445_sujet-stage2022.pdf

CNRS researcher position on advanced methods of artificial intelligence for particle physics

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : any CNRS laboratory
Durée : permanent, tenured p
Contact : jan.stark@l2it.in2p3.fr
Date limite de publication : 2022-01-11

Contexte :
One of the novelties at this year’s edition of the “concours chercheurs CNRS”,

https://www.dgdr.cnrs.fr/drhchercheurs/concoursch/default-en.htm

is the availability of five permanent positions as junior full-time researchers in the newly created interdisciplinary section “sciences and data”. They can be found at the very end of the list of positions on the website quoted above (“interdisciplinary committee no. 55”). The “concours chercheurs” is a competitive recruitment process used by CNRS to hire its researchers.

None of the five positions is attached to a given CNRS laboratory, i.e. candidates are free to propose a research project with any CNRS laboratory. One of the five positions is on the subject

“Advanced methods of artificial intelligence for the processing, reconstruction and analysis of ATLAS experiment data at the Large Hadron Collider”.

Are you a young colleague with demonstrated experience in the field of advanced artificial intelligence? Are you interested in applications to particle physics, but do not have much/any hands-on experience with physics? Please do not hesitate to get in touch with members of the ATLAS team at the “Laboratoire des 2 Infinis – Toulouse” (L2IT). We are happy to discuss ATLAS and the LHC with you.

One of our recent conference proceedings on the use of artificial intelligence for ATLAS and the LHC can be found here:

https://www.epj-conferences.org/articles/epjconf/abs/2021/05/epjconf_chep2021_03047/epjconf_chep2021_03047.html

More general information on L2IT, a new laboratory created in January 2020, can be found here:

https://indico.in2p3.fr/event/24978/

Sujet :

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :