Postdoc position at Météo-France (CNRM) in Artificial Intelligence for Numerical Weather Prediction

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Météo-France research department (CNRM), Toulouse,
Durée : 21 to 27 months
Contact : laure.raynaud@meteo.fr
Date limite de publication : 2022-01-31

Contexte :
High-Impact Weather (HIW) events have devastating effects on society, causing human losses, degradation of infrastructures and large economic impacts. Severe precipitating events, damaging thunderstorms and strong winds are among the most impacting events from a meteorological point of view, with various severe indirect effects such as flooding, landslides and marine submersion. Being rare, HIW events lie in the tail of climatological distribution of weather events. Although meteorological services such as Météo-France have done significant progress in predicting weather for the last decades, accurately predicting the occurrence, intensity, location and timing of HIW still remains challenging.
Currently operational weather forecasts rely on physically-based modelling approaches, and Numerical Weather Prediction (NWP) models are operated daily to determine the future atmospheric states and the risk of HIW. In particular, Ensemble prediction systems (EPSs) aim at sampling the probability distribution of future atmospheric states. They consist in running several NWP forecasts in order to account for the different sources of uncertainty. At Météo-France, the operational AROME-EPS, which runs 16 perturbed forecasts with a spatial resolution of 1.3km, is used to anticipate the risk of HIW. However, properly capturing the associated uncertainty requires very high resolution (few hundred meters) large-size (few hundred members) ensembles. Nonetheless, such enhanced systems are currently unfeasible for operational NWP because of the associated computational cost.
In this context, the main objective of the POESY project is to explore the scientific feasibility and relevance of an innovative hybrid EPS design, combining standard physical modelling with computationally-efficient Artificial Intelligence (AI) techniques, in order to produce disruptive probabilistic forecasts for high-impact weather.

Sujet :
The goal of this post-doctoral position is to improve the representation of forecast probability distributions by increasing the AROME-EPS sampling from O(10) to 0(1000) forecasts thanks to complementary AI-generated forecasts. For that purpose, physically-constrained deep generative models such as GANs and Variational AutoEncoders will be developed and evaluated. Besombes et al. (2021) provides a first example of GAN-based weather scenario. A crucial part of the work will be to adapt off-the-shelf learning architectures to the particularities of this geophysical problem. A specific attention will be paid to the following points : the learning of extremes, ensuring spatial, temporal and physical consistencies in the generated forecasts, mode collapse problem.

Profil du candidat :
The ideal candidate would have the following qualifications :
– a strong background in deep learning algorithms, in particular convolutional neural networks and deep generative models
– experience in geophysical problems would be appreciated, at least a strong interest for applied research in atmopsheric physics is highly recommended
– Proficiency with Python programming and AI librairies
– Experience with processing large volumes of data
– Experience of working in a Linux-based environment
– Aptitude for scientific work, written and oral communication in English, meetings abroad possible
– A scientific curiosity, autonomy, rigor in the interpretation of the results

Formation et compétences requises :
PhD degree in atmopsheric sciences, statistics or artificial intelligence.

Adresse d’emploi :
Toulouse, France.

Document attaché : 202112101209_PostdocPOESY.pdf

Analyse de données relationnelles – définition de quantificateurs pour l’ARC

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube Strasbourg
Durée : 5 à 6 mois
Contact : florence.leber@engees.unistra.fr
Date limite de publication : 2022-03-31

Contexte :
L’analyse de concepts formels (ACF) [1] est une méthode mathématique de classification, largement appliquée sur différents types de données et dans de nombreux domaines (par exemple [2,3]). Elle consiste, à partir d’une table (appelée contexte) décrivant des objets par des attributs, à construire un treillis de concepts, i.e. des couples (extension ; intension) d’ensembles fermés décrivant les objets et les attributs qui les définissent. Cette méthode est étendue aux données relationnelles dans le cadre de l’analyse relationnelle de concepts (ARC) [4]. L’ARC considère deux types de contextes, des contextes objets-attributs et des contextes objets-objets décrivant les relations entre objets. L’ARC étend les contextes objets-attributs par des attributs relationnels de la forme qrC, où q est un quantificateur, r une relation et C un concept issu du co-domaine de r. Le résultat de l’ARC est une famille de treillis (un par contexte objets-attributs) reliés entre eux par ces attributs relationnels.

Sujet :
Il s’agit de définir des quantificateur spécifiques à certains types de relations (temporelles ou spatiales par exemple) et qu’on pourra utiliser directement pour créer des jeux de données sur lesquels on applique ensuite l’ARC. On s’appuiera pour cela sur les quantificateurs existants (existentiel, universel ou de dénombrement [5]) et sur les modèles qualitatifs de l’espace et du temps [6]. Le stage s’organisera de la façon suivante :
• bibliographie sur l’ARC et les quantificateurs
• prise en main des outils existants (RCAexplore, Galicia ?)
• définition de quantificateurs pour un type de relation, formalisation du schéma relationnel associé
• intégration dans RCAexplore
• application sur une base de données (données sur l’eau ou agricoles)

Profil du candidat :
En cours Master 2 en Informatique ou équivalent

Formation et compétences requises :
Formation en logique, représentation de connaissances et programmation

Adresse d’emploi :
Laboratoire ICube, équipe SDC
300 bd Sébastien Brant – CS 10413 – F-67412 Illkirch Cedex

Document attaché : 202112081445_sujet-stage2022.pdf

CNRS researcher position on advanced methods of artificial intelligence for particle physics

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : any CNRS laboratory
Durée : permanent, tenured p
Contact : jan.stark@l2it.in2p3.fr
Date limite de publication : 2022-01-11

Contexte :
One of the novelties at this year’s edition of the “concours chercheurs CNRS”,

https://www.dgdr.cnrs.fr/drhchercheurs/concoursch/default-en.htm

is the availability of five permanent positions as junior full-time researchers in the newly created interdisciplinary section “sciences and data”. They can be found at the very end of the list of positions on the website quoted above (“interdisciplinary committee no. 55”). The “concours chercheurs” is a competitive recruitment process used by CNRS to hire its researchers.

None of the five positions is attached to a given CNRS laboratory, i.e. candidates are free to propose a research project with any CNRS laboratory. One of the five positions is on the subject

“Advanced methods of artificial intelligence for the processing, reconstruction and analysis of ATLAS experiment data at the Large Hadron Collider”.

Are you a young colleague with demonstrated experience in the field of advanced artificial intelligence? Are you interested in applications to particle physics, but do not have much/any hands-on experience with physics? Please do not hesitate to get in touch with members of the ATLAS team at the “Laboratoire des 2 Infinis – Toulouse” (L2IT). We are happy to discuss ATLAS and the LHC with you.

One of our recent conference proceedings on the use of artificial intelligence for ATLAS and the LHC can be found here:

https://www.epj-conferences.org/articles/epjconf/abs/2021/05/epjconf_chep2021_03047/epjconf_chep2021_03047.html

More general information on L2IT, a new laboratory created in January 2020, can be found here:

https://indico.in2p3.fr/event/24978/

Sujet :

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :

Université De Bourgogne: 2 poste de MCF 27 ouverts pour la rentrée 2022

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Informatique de Bourgogne
Durée : NC
Contact : hocine.cherifi@u-bourgogne.fr
Date limite de publication : 2022-06-07

Contexte :
Deux postes de Maître de Conférence titulaires sont ouverts au concours pour la rentrée 2022. Ces postes sont destinés au Département IEM (Informatique, Électronique, Mécanique) de l’UFR Sciences et Techniques de l’Université de Bourgogne.

Le département IEM propose un cursus complet de formation en informatique : Licence , Licence professionnelle, un tronc commun en M1 et 2 parcours de M2 ( Base de Données Intelligence Artificielle, Image Intelligence Artificielle). Un projet d’ouverture d’un parcours Santé et intelligence artificielle en anglais est en cours (rentrée 2021-2022), en collaboration avec l’UFR Sciences de Santé. Les personnes recrutées sur ces postes ont vocation à renforcer l’équipe pédagogique des Licence et du Master Informatique.
Les candidats(es) recruté(es) intégreront le Laboratoire d’Informatique de Bourgogne (LIB) Ils/elles développeront leurs activités de recherche dans l’équipe Sciences des Données
Profil MCF 1159 : Gestion des données massives, distribuées, hétérogènes : archi-tectures, modèles de données et connaissances (voir ci-dessous)
Profil MCF 0468 : Systèmes Complexes. (voir ci-dessous)
Les potentiel·les candidat·es peuvent contacter :
Olivier Togni – Directeur du LIB – olivier.togni@u-bourgogne.fr
Les autres, n’hésitez pas à faire suivre cette annonce aux personnes qui pourraient être intéressé·es et sur les mailing-lists pertinentes.
Cordialement,
Hocine

Sujet :
——————————————————————————————— 

Désignation de l’emploi

Nature du concours : Maître de Conférences
Numéro de l’emploi : 0468
Section(s) CNU : 27ème
Composante d’affectation (localisation) : UFR Sciences et Technique – Campus Dijon –Mirande
Laboratoire d’accueil : Laboratoire d’Informatique de Bourgogne (LIB) – EA 7534
Date de nomination demandée : 1er septembre 2022
Vacance du poste : vacant
Profil de publication : Systèmes Complexes
Profil en Anglais / « Job Profil » : Complex Systems

Enseignement

Objectifs pédagogiques et besoins d’encadrement :

Le département IEM (Informatique, Électronique, Mécanique) de l’UFR Sciences et techniques propose un cursus complet de formation en informatique : Licence informatique (L1, L2, et L3) et Master informatique avec deux parcours : Bases de données et intelligence artificielle et Image et intelligence artificielle. L’alternance est proposée en Master (M1 et M2). Un projet d’ouverture d’un parcours Santé et intelligence artificielle en anglais est en cours (rentrée 2021-2022), en collaboration avec l’UFR Sciences de Santé.
Le département I.E.M. comporte également une licence professionnelle (Métiers de l’informatique).

Le/La candidat(e) recruté(e) viendra renforcer l’équipe pédagogique de la Licence (L1, L2 et L3) et du Master Informatique. Il interviendra prioritairement dans les équipes pédagogiques pour les enseignements de système, systèmes distribuée et réseaux (en licence et master) et dans les enseignements de programmation et algorithmique en licence et master. Il intégrera également l’équipe pédagogique de la licence professionnelle pour ces enseignements.
Il /Elle a vocation à être responsable d’unités d’enseignement en licence et en master. Il/Elle devra également participer à l’encadrement de projets tuteurés et au suivi des alternants notamment en M1.

Contacts enseignement :
Nadine Cullot– Directrice adjointe du département IEM – Nadine.Cullot@u-bourgogne.fr

Recherche

Le/La candidat(e) recruté(e) intégrera le laboratoire LIB (Laboratoire d’Informatique de Bourgogne) de l’Université de Bourgogne (Dijon). Il/elle développera ses activités de recherche dans l’équipe Sciences des Données en lien avec les thématiques transversales des systèmes complexes.

Dans ce contexte, la personne recrutée devra faire preuve d’un savoir-faire et d’une maîtrise de haut niveau en science des données, science des réseaux, systèmes complexes, sciences computationnelles. Il/Elle sera familièr(e) des démarches scientifiques à l’interface de plusieurs disciplines (Informatique, Santé, Sociologie, Transport, etc.). Il/Elle participera à la structuration et au développement des projets pluridisciplinaires du laboratoire en favorisant les interactions entre les approches expérimentales (biologie, médecine, sciences cognitives, sciences sociales, etc.) et les sciences de la modélisation (informatique, mathématiques).

Le/La maître de conférences devra contribuer à renforcer les activités de recherche existantes et/ou développer de manière cohérente des orientations nouvelles. La capacité à s’investir dans de nouveaux projets (Région, ANR, Europe, Industriel, etc.) sera un des éléments décisifs du recrutement. Il/Elle devra s’impliquer dans les actions scientifiques régionales, nationales et internationales de l’équipe sciences des données dans le domaine des systèmes complexes.

Le profil de ce poste s’inscrit dans les thématiques soutenues par la politique de site de l’université fédérale UBFC (Université de Bourgogne Franche-Comté) au travers de son pôle « Sciences Fondamentales, Appliquées et Technologiques ».

Contacts recherche :
Olivier Togni – Directeur du LIB – olivier.togni@u-bourgogne.fr
Hocine Cherifi – Directeur-Adjoint du LIB – hocine.cherifi@u-bourgogne.fr
Éric Leclercq – Responsable Équipe – Science des Données – eric.leclercq@u-bourgogne.fr

Désignation de l’emploi :

Nature du concours : Maître de Conférences
Numéro de l’emploi : 1159
Section(s) CNU : 27ème
Composante d’affectation (localisation) : UFR Sciences et Technique – Campus Dijon – Mirande
Laboratoire d’accueil : Laboratoire d’Informatique de Bourgogne (LIB) – EA 7534
Date de nomination demandée : 1er septembre 2022
Vacance du poste : susceptible d’être vacant
Profil de publication : Gestion des données massives, distribuées, hétérogènes : architectures, modèles de données et connaissances
Profil en Anglais / « Job Profil » : Management of massive, distributed, heterogene-ous data: architectures, data models and knowledge

Enseignement

Objectifs pédagogiques et besoins d’encadrement :

Le département IEM (Informatique, Électronique, Mécanique) de l’UFR Sciences et techniques propose un cursus complet de formation en informatique : Licence informatique (L1, L2, et L3) et Master informatique avec deux parcours : Bases de données et intelligence artificielle et Image et intelligence artificielle. L’alternance est proposée en Master (M1 et M2). Il comporte également une licence professionnelle (Métiers de l’informatique).

Le/La candidat(e) recruté(e) viendra renforcer l’équipe pédagogique de la Licence (L3) et du Master Informatique. Il devra intervenir prioritairement sur les thématiques liées au stockage des données : Systèmes de gestion de bases de données, Bases de données NoSQL, Gestion des données dans des environnements distribués, Entrepôt de données. Des compétences en Intelligence Artificielle en analyses des données seraient appréciées. Il/Elle renforcera également les équipes pédagogiques en L1 et L2 (programmation, programmation orientée objet, algorithmes avancés). Il/Elle a vocation d’être rapidement responsable d’unités d’enseignement en licence et en master.

Contacts enseignement :
Nadine Cullot– Directrice adjointe du département IEM – Nadine.Cullot@u-bourgogne.fr

Recherche

Le/La candidat(e) recruté(e) devra s’intégrer dans le laboratoire LIB (Laboratoire d’Informatique de Bourgogne) de l’Université de Bourgogne (Dijon). Il développera ses activités de recherche dans l’équipe Sciences des Données.

L’équipe Science de Données du LIB conduit des travaux innovants et reconnus dans des domaines appliqués tels que l’analyse des données des réseaux sociaux numériques, la combinaison de techniques d’IA symbolique et numérique pour améliorer les techniques d’analyse.

L’équipe s’appuie sur un positionnement original exploitant des approches multi-paradigmes pour le stockage (polystore) ou l’entreprosage (data warehouse, data lake) des données massives et des techniques de traitement temps réel (stream processing) pour l’analyse des données avec des algorithmes de graphe, de machine learning éventuellement couplés à des ontologies ou des mécanismes de raisonnement.

Le profil de ce poste s’inscrit dans les thématiques soutenues par la politique de site de l’université fédérale UBFC (Université de Bourgogne Franche-Comté) au travers de son pôle « Sciences Fondamentales, Appliquées et Technologiques ».

Contacts recherche :
Olivier Togni – Directeur du LIB – Olivier.Togni@u-bourgogne.fr
Hocine Cherifi – Directeur Adjoint du LIB – Hocine.Cherifi@u-bourgogne.fr
Eric Leclercq – Responsable de l’équipe Science des Données du LIB – Eric.Leclercq@u-bourgogne.fr

Profil du candidat :
NC

Formation et compétences requises :
NC

Adresse d’emploi :
NC

CfP – RCIS 2022

Date : 2022-05-17 => 2022-05-20
Lieu : Barcelona, Spain

RCIS aims to bring together scientists, researchers, engineers, and practitioners from a wide range of information science fields and to provide opportunities for knowledge sharing and dissemination.
The special theme of RCIS 2022 is ***Ethics and Trustworthiness in Information Science***.

SUBMISSION OF CONTRIBUTIONS
https://www.easychair.org/conferences/?conf=rcis2022

SUBMISSION DATES

  • Abstract for Main Track and Forum: January 15, 2022
  • Paper for Main Track, Forum and DC: January 22, 2022
  • Tutorial Proposal: March 1, 2022
  • Research Project | Workshop paper: March 18, 2022

CALLS
The detailed calls for contributions to different tracks are available online:

  • Main conference track: http://www.rcis-conf.com/rcis2022/callPapers.php/
  • Forum: https://www.rcis-conf.com/rcis2022/callForum.php
  • Doctoral consortium: https://www.rcis-conf.com/rcis2022/callDoctoral.php
  • Tutorials: https://www.rcis-conf.com/rcis2022/tutorials.php
  • Research Projects: https://www.rcis-conf.com/rcis2022/researchProjects.php

CONFERENCE ORGANIZATION
General Chair: Xavier Franch, Universitat Politècnica de Catalunya, Spain

Program Committee Chairs:
Renata Guizzardi, University of Twente, The Netherlands
Jolita Ralyté, University of Geneva, Switzerland

Forum Chairs:
Marcela Ruiz, Zurich University of Applied Sciences, Switzerland
Estefania Serral, Katholieke Universiteit Leuven, Belgium

Doctoral Consortium Chairs:
Marko Bajec, University of Ljubljana, Slovenia
Andreas L. Opdahl, University of Bergen, Norway

Tutorial Chairs
Paola Spoletini, Kennesaw State University, USA
Cinzia Cappiello, Politecnico di Milano, Italy

Research Projects Chairs
Alessandra Bagnato, Softeam, France
Lidia López, Barcelona Supercomputing Center, Spain

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Call for internship proposals, M2 PSL IASD

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PSL University
Durée : 5 mois
Contact : pierre@senellart.com
Date limite de publication : 2022-02-28

Contexte :
The IASD M2 (Artificial Intelligence, Systems, Data) is a track of the Master in Computer Science of PSL University (involving Université Paris-Dauphine, the École normale supérieure, Mines ParisTech).

Sujet :
The IASD M2 calls for internship proposals for its students. Students follow a curriculum covering various aspects of artificial intelligence, data science, machine learning, data management. The curriculum is available at https://www.masteriasd.eu/

Internship proposals can be submitted at https://db.masteriasd.eu/internships/submit

Internships last roughly 5 months, from April to August.

Profil du candidat :
M2 student

Formation et compétences requises :

Adresse d’emploi :
TBD

Analyse comparative de méthodes neuronales de normalisation d’entités en domaine biologique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Unité MaIAGE, INRAE, Université Paris-Saclay
Durée : 6 mois
Contact : arnaud.ferre@inrae.fr
Date limite de publication : 2022-02-28

Contexte :
La quantité de données textuelles ne cesse d’augmenter, et c’est en particulier le cas de la publication d’articles scientifiques. Face à cette énorme quantité de données produites, de nombreuses informations et connaissances sont perdues ou ne sont simplement jamais exploitées. L’extraction d’information est le domaine de l’intelligence artificielle visant à extraire et à structurer automatiquement des informations contenues dans des grandes quantités de textes.

Aujourd’hui, quelle que soit la tâche d’extraction concernée, les approches état de l’art s’appuient sur de l’apprentissage profond (deep learning). C’est en particulier le cas pour la tâche de normalisation d’entités, dont l’objectif est de classer des mentions extraites de textes dans des classes contenues dans une référence du domaine concerné, telles que des bio-ontologies (ex : la mention “monoclonal B cells” représente un , qui est une classe de l’ontologie OntoBiotope). Cette tâche permet de compléter/produire automatiquement des bases de données d’intérêt beaucoup plus précises pour le domaine d’étude concerné. Le domaine biologique/biomédical a d’importants besoins de ce genre (ex : bases de données de phénotypes, de biotopes bactériens, d’effets secondaires de médicaments, …), et est le domaine d’application principal pour la recherche en normalisation.

Sujet :
Malgré un intérêt croissant de la communauté de recherche en extraction d’information, la normalisation d’entités reste un défi de taille. En domaine biologique/biomédical notamment, on observe une rareté et une dispersion des exemples d’entraînement, qui posaient jusqu’à récemment des difficultés aux approches par apprentissage. Mais depuis quelques années, des méthodes par apprentissage neuronal profond (ex : BioSyn – Sung et al., 2020 ; C-Norm – Ferré et al., 2020 ; Pattisapu et al., 2020) ont réussi à se démarquer sur certains jeux de données d’évaluation (ex : NCBI Disease Corpus, Bacteria Biotope 4, Custom CADEC).

Néanmoins, ces méthodes sont encore trop rarement évaluées sur plusieurs jeux de données distincts. Des travaux de notre équipe de recherche ont pourtant montré récemment une certaine sur-adaptation, c’est-à-dire qu’une méthode est souvent performante sur un jeu de données, sur lequel elle a été développée et publiquement évaluée, mais pas sur d’autres. Dans ce stage, nous proposons donc d’étudier la robustesse de méthodes état de l’art sur plusieurs jeux de données, et d’analyser comparativement les erreurs qui semblent encore résister aux approches neuronales profondes récentes.

Dans ce stage, les tâches suivantes seront à réaliser :
– Exécution/Implémentation de méthodes neuronales état de l’art sur des jeux de données standards utilisés pour l’évaluation (choix d’au moins 2 méthodes et 2 jeux de données) ;
– Comparaison des scores obtenus et de leur significativité ;
– Analyse et catégorisation des erreurs produites ;
– Comparaison des profils de prédictions des différentes méthodes.

Le stagiaire aura accès aux serveurs de calculs du laboratoire, ou, au besoin, à des infrastructures de calcul haute performance (ex : Lab-IA).

Les travaux effectués pourront mener à une publication.

Profil du candidat :
Autonome en programmation Python.
Connaissances en sciences du vivant/biomédical et fondamentaux en algèbre linéaire (ex : espace vectoriel, opération matricielle).
Une connaissance de la théorie derrière les réseaux de neurones et des compétences dans au moins une des libraires Python standards PyTorch/TensorFlow serait un plus.
Une expérience en traitement automatique des langues naturelles ou plus particulièrement en extraction d’information serait appréciée.

Formation et compétences requises :
Master 2 / dernière année d’école d’ingénieur en bio-informatique, informatique, mathématiques appliquées ou équivalent.

Adresse d’emploi :
Centre de recherche INRAE de Jouy-en-Josas (78)

Stage M2 au LIFO Orléans – IA et Education

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFO – Orléans
Durée : 5 mois
Contact : guillaume.cleuziou@univ-orleans.fr
Date limite de publication : 2022-01-10

Contexte :
Améliorer l’efficacité pédagogique des plateformes d’entraînement à la programmation est une problématique en pleine effervescence qui nécessite de construire des représentations fines et exploitables des programmes d’apprenants. Nous nous intéresserons dans ce stage à l’apprentissage de représentations (ou embeddings) de programmes à des fins pédagogiques.

Sujet :
L’apprentissage d’embeddings de programmes consiste à apprendre une représentation riche et condensée d’un programmes informatique sous forme d’un vecteur numérique de faible dimension. Il existe différentes stratégies d’apprentissage d’embeddings de programmes selon que l’on considère d’une part des méthodes supervisées ou non-supervisées et d’autre part selon la nature de la (ou des) représentation(s) primaire(s) exploitée(s) (séquence textuelle du code, arbre syntaxique abstrait, traces de variables, traces d’exécution, etc.).

L’objet de ce stage sera de réaliser une étude comparative des approches supervisées et non-supervisées parmi ces méthodes. En particulier nous nous intéresserons d’une part à l’approche code2vec (Alon et al., 2019) qui exploite de manière supervisée les arbres syntaxiques abstraits (AST) des programmes et d’autre part à l’approche code2aes2vec (Cleuziou&Flouvat, 2021) qui génère de façon non-supervisée des embeddings de programmes à partir de l’analyse conjointe des AST et des traces d’exécution des programmes.

Références.

Alon, U., M. Zilberstein, O. Levy & E. Yahav (2019). code2vec : Learning distributed repre-sentations of code. Proceedings of the ACM on Programming Languages 3(POPL), 1–29.

Cleuziou, G. & F. Flouvat (2021). Learning student program embeddings using abstract execution traces, in 14th International Conference on Educational Data Mining. Paris, France, Pp. 252-262. 06. 2021.

Wang, K., R. Singh, and Z. Su (2018). Dynamic neural program embeddings for program repair. In International Conference on Learning Representations (ICLR’2018).

Profil du candidat :
Étudiant en master et/ou en école d’ingénieur en Mathématiques/Informatique. Une expérience en Machine Learning et un intérêt pour l’analyse de données d’éducation seraient un plus.

Formation et compétences requises :
Étudiant en master et/ou en école d’ingénieur en Mathématiques/Informatique. Une expérience en Machine Learning et un intérêt pour l’analyse de données d’éducation seraient un plus.

Adresse d’emploi :
LIFO – Université d’Orléans

Document attaché : 202112060829_Annonce_StageM2_EDM_LIFO-LIFAT.pdf

AI for Science: Physics Based Deep Learning for Modeling Complex Dynamics. Application to Climate

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Sorbonne Universite – Equipe Machine Learning and
Durée : 6 mois
Contact : patrick.gallinari@sorbonne-universite.fr
Date limite de publication : 2022-01-10

Contexte :
AI for science is concerned with the exploration of machine learning for scientific computing in domains traditionally dominated by physics models (first principles). We consider here the modeling of complex dynamical systems characterizing natural phenomena, a recent and fast growing research direction with a focus on climate modeling applications and with the objective of combining model based physics and machine learning approaches.

Sujet :
Objective

The global objective is the development of new models integrating physics prior knowledge and deep learning (DL) for the modeling of spatio-temporal dynamics characterizing physical phenomena such as those underlying earth-science and climate observations. The classical modeling tools for such dynamics in physics and applied mathematics rely on partial differential equations (PDE). We then consider situations where the physical prior background is provided by PDEs. Two main directions will be explored:

– Hybrid systems – Interfacing Deep neural Networks (DNNs) and PDE

– Domain generalization for deep learning as dynamical models
Depending on the progress on the first topic, one will consider the issue of domain generalization of hybrid models.

– Application to climate data: the application will target the modeling of the dynamics of ocean circulation, which is a component of climate models.

Profil du candidat :
Master or engineering degree in computer science or applied mathematics.

Formation et compétences requises :
The candidate should have a strong scientific background with good technical skills in programming.

Adresse d’emploi :
Machine Learning and Information Access team – MLIA – https://mlia.lip6.fr, Sorbonne University, 75005 Paris, Fr

Document attaché : 202112031804_2021-12-MLIA-Internship-Deep-Learning-Physics.pdf

Segmentation d’images de microscopie électronique par réseaux profonds.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIS UMR 7020
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@univ-amu.fr
Date limite de publication : 2022-01-10

Contexte :
Dans le cadre d’un projet collaboratif de recherche biomédicale sur l’endocardite infectieuse (EI) nous souhaitons développer une approche par réseaux profonds (deep-learning) pour la segmentation d’images de microscopie électronique à balayage dans le but d’analyser l’ultrastructure de valves cardiaques. Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes (LIS), expert dans l’analyse d’image, et le laboratoire Mephi (IHU Méditerranée Infection), expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité (Habib 2019). L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. Malgré l’amélioration des stratégies diagnostiques et thérapeutiques, l’incidence et la gravité de la maladie semblent rester inchangées au fil des ans. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon. Par une approche innovante par MEB, nous avons démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux (Hannachi 2020). Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse.

Sujet :
L’objectif du stage est de développer une méthode de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Pour cela, il s’agira dans un 1er temps de définir la meilleure stratégie en terme de résolution/grossissement des acquisitions en MEB pour appliquer une segmentation. Dans un 2nd temps nous appliquerons des algorithmes par apprentissage profond (Khadangi 2021) avec un « pipeline » de traitements adaptés. Nous disposons déjà d’une base importante d’images d’échantillons de valves cardiaques pathologiques qui permettra grâce à nos expertises de définir le meilleur protocole d’étude à implémenter en routine avec une attention particulière portée sur la précision des réseaux profonds (Hostin 2021).

Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale.

Formation et compétences requises :
La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées.

Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe MEPHI de l’IHU Méditerranée Infection ou dans ceux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’), selon les besoins.

Document attaché : 202112031634_Sujet_Master2_SegmentationSEM_final.pdf