Stage M2 — Apprentissage de prior pour les problèmes inverses

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : Laboratoire des Signaux et Systèmes
Durée : 5 mois
Contact : francois.orieux@l2s.centralesupelec.fr
Date limite de publication : 2024-07-01

Contexte :
Le traitement de mesures instrumentales nécessite souvent d’utiliser le modèle de données, ou modèle direct, dans la méthode. Par exemple les mesures sont affectées d’un bruit, d’un flou, ou vivent dans un autre espace que celui des inconnues (des coefficients de Fourier versus une image pour le cas de l’IRM).

Autant le modèle direct est stable et bien posé (à partir des paramètres on peut générer des données), autant le problème inverse est le plus souvent instable et mal-posé.

Sujet :
Les techniques de résolution de problèmes inverses ont fortement évolué ces dernières années avec les nouvelles techniques d’apprentissage machine. On peut mentionner le déroulage d’algorithmes itératif (unrolling), les approches plug-and-play, le RED (regularization by denoising), ou encore les a priori basés donnés.

Le travail consistera à comprendre et mettre en œuvre les approches utilisant les réseaux génératifs comme les VAE ou encore les réseaux inversibles. Il s’agit d’une approche reposant sur la minimisation d’un critère mixte

J(x) = |y – H x|² + R(x)

où le terme d’attache aux données utilise le modèle d’observation connu H (flou, inpainting, debruitage…) et le terme de régularisation R(x) est appris à partir de données. La solution est alors définie comme x = argminₓ J(x).

* Dans un premier temps, le stagiaire se familiarisera sur les problèmes inverses et leurs méthodes de résolution.

* Ensuite, il devra faire un état de l’art sur les méthodes basées données et apprentissage statistique pour la résolution de problèmes inverses. Le sujet étant récent, la littérature est abondante et diverse. Des points d’entrée bibliographique seront fournis.

* Nous nous attacherons à mettre en œuvre une des deux méthodes mentionnées plus haut. Les résultats devront être comparés aux résultats obtenus avec les approches classiques : filtre de Wiener, parcimonie… pour lesquels des codes sont à disposition.

* L’application sera à déterminer parmi celles de l’équipe : synthèse de Fourier pour la radioastronomie, la microscopie ou encore reconstruction d’image en tomographie.

Le travail se fera sur un poste équipé d’une carte GPU Nvidia 3080 ou 4090 avec Linux, TensorFlow et Python.

Profil du candidat :
L’étudiant devra avoir une formation type ingénieur ou Master~2 en traitement du signal ou d’images, data science ou machine learning. Il devra posséder des connaissances en mathématiques appliquées ou en programmation.

Formation et compétences requises :
L’étudiant acquerra au cours du stage des compétences en estimation, optimisation, apprentissage machine, inférence statistique, traitement de données et python.

Adresse d’emploi :
L2S, 3 rue Joliot-Curie, 91190 Gif-sur-Yvette

Document attaché : 202311010608_stage-dnn-orieux-l2s.pdf

Stage M2 — Déconvolution rapide pour le radio télescope SKA

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Laboratoire des Signaux et Systèmes
Durée : 5
Contact : francois.orieux@l2s.centralesupelec.fr
Date limite de publication : 2024-07-01

Contexte :
L’augmentation de la puissance des machines de calcul a incité à la conception d’instrument générant des quantités importantes de données. Parallèlement, le désir de travailler sur des inconnues de grande taille telle que des images hautes ou très haute résolution est de plus en plus présent en particulier dans les sciences expérimentales ou observationnelles.

Le stage s’inscrit dans le cadre du projet international SKA, Square Kilometer Array, et de l’ANR DarkEra. SKA est un observatoire pour la radioastronomie qui produira un volume de données considérable pour produire des images à une résolution spatiale et spectrale inégalées. Les antennes sont réparties en australie et en afrique du Sud, ce qui en fera le plus grand interféromètre radio à ce jour. L’équipe est impliquée dans le projet par le biais de l’ANR DarkEra et du LabCom ECLAT (ATOS, IETR, INRIA…).

Sujet :
Pour exploiter pleinement l’ensemble des informations disponibles, une modélisation fine du processus d’acquisition est nécessaire. Cela définit un modèle direct H, ou simulateur, capable de reproduire des données y à partir d’une image x comme y = Hx. Cependant l’utilisation naïve de H conduisant à des problèmes inverses généralement mal posés, c’est à dire ne produisant pas de résultats satisfaisant.

Les approches standard pour l’inversion reposent généralement sur la minimisation de critères régularisés, la régularisation permettant de rendre le problème bien posé.

* Dans un premier temps le stagiaire se familiarisera sur les problèmes inverses et leurs méthodes de résolution.

* Ensuite le stagiaire s’appuiera sur le travail de thèse de Nicolas Monnier qui a travaillé sur l’accélération du modèle H. L’objectif est de réutiliser son travail pour partir d’un modèle de donnée fiable et rapide.

* Enfin nous travaillerons à l’élaboration de méthode plus modernes de résolution de problèmes inverse exploitant cette accélération. On explorera notamment les algorithmes de Majorisation-Minimisation (ou MM) et l’utilisation de préconditionneur.

* En fonction de la formation du stagiaire on pourra également plutôt s’orienter sur la mise en œuvre efficaces des algorithmes sur GPU.

Profil du candidat :
L’étudiant devra avoir une formation type ingénieur ou Master~2 en traitement du signal ou d’images, data science ou machine learning. Des
connaissances en mathématiques appliquées, programmation ou architecture de calcul seront appréciés.

Formation et compétences requises :
L’étudiant acquerra aux cours du stage des compétences en estimation,
optimisation, inférence statistique, traitement de données, calculs intensifs, radioastronomie et python.

Adresse d’emploi :
L2S, 3 rue Joliot-Curie, 91190 Gif-sur-Yvette

Document attaché : 202311010558_stage-ska-orieux-l2s.pdf

Internship position + PhD funding

Offre en lien avec l’Action/le Réseau : EducAction/– — –

Laboratoire/Entreprise : IRIMAS
Durée : 5 mois
Contact : nour.el-mawas@univ-lorraine.fr
Date limite de publication : 2024-07-01

Contexte :
The ANR COPCOT project involves members from Pixel team (CREM), MSD Team (IRIMAS), Trigone team (CIREL), and France-IOI association. Our aim is to understand learners’ skills-building in the Technology Enhanced Learning platform Quick-Pi, and to facilitate skills-building through content and feedback personalization.

Sujet :
The goal of this internship is to analyze learners’ data from the Quick-Pi platform (https://quick-pi.org/contenu.html) in order to identify relevant learner behaviors and extract data indicators contributing to the skills construction in programming among learners.
In particular, the candidate will work on the following tasks:
• Learners’ data analysis. Analysis of trace logs data from users’ interactions help us to better understand their learning process, distinguish groups of learners, and predict learners’ success in each Quick-Pi exercise.
Trace logs data can be seen as time series, hence this task will start by reviewing existing Machine Learning algorithms [1] used for time series analysis. Then the candidate will identify and adapt these algorithms to our sequential data in order to predict the learners’ success in each exercise on the Quick-Pi platform. The implicit data provided by Quick-Pi logs (like time spent on an exercise, navigation logs, code lengths, etc.) will be used. Once the pertinent algorithm to predict students’ success is found,
indicators can be found. Existing learners’ data analysis techniques such as knowledge tracing [2, 3] will be investigated to predict the success of students in each exercise.
• Indicators identification. The candidate will analyze which logs in the selected algorithm of the previous task were used by the algorithm itself to predict the success. This will help us to identify indicators. We believe that if the selected algorithm successfully predicts learners’ success, we should be aware of which specific log lines contributed to this prediction the most. For example, we can find that the time spent on an exercise may have a correlation with the learners’ success in a specific exercise.
These indicators are crucial to understand skills-building and learners’ difficulties. Features selection techniques [4] and explainability techniques [5] will be investigated in order to identify pertinent indicators for skills- building.

References
[1] H. Ismail Fawaz, G. Forestier, J. Weber, L. Idoumghar, and P.-A. Muller, “Deep learning for time series classification: a review,” Data mining and knowledge discovery, vol. 33, no. 4, pp. 917–963, 2019.
[2] M. Sao Pedro, R. Baker, and J. Gobert, “Incorporating scaffolding and tutor context into bayesian knowledge tracing to predict inquiry skill acquisition,” in Educational Data Mining 2013, Citeseer, 2013.
[3] S. I. Ram´ırez Luelmo, N. El Mawas, and J. Heutte, “Existing machine learning techniques for knowledge tracing: A review using the prisma guidelines,” in International Conference on Computer Supported Education, pp. 73–94, Springer, 2022.
[4] V. Vijayalakshmi and A. Prakash, “Developing an optimized feature selection process for designing efficient content management system using educational data,” International Journal of Advanced Research in Science Technology (IJARST), vol. 7, no. 1, pp. 15–24, 2020.
[5] R. Alamri and B. Alharbi, “Explainable student performance prediction models: a systematic review,” IEEE Access, vol. 9, pp. 33132–33143, 2021.

Profil du candidat :
The candidate must be registered in Master 2 or last year of Engineering School (or equivalent) in Computer Science

Formation et compétences requises :
• Good skills in Python programming are mandatory
• Good skills in Machine Learning are required
• Interest, knowledge and/or a first experience in Technology Enhanced Learning (learning programming in particular) will be appreciated

Adresse d’emploi :
UHA/IRIMAS EA 7499, Mulhouse, France

Document attaché : 202310310845_internship_position_COPCOT_2023_VF.pdf

Post-doctoral researcher on deep learning methods for the reconstruction and analysis of data from the ATLAS experiment at the LHC (M/W)

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire des 2 Infinis – Toulouse (L2IT)
Durée : two years
Contact : jan.stark@l2it.in2p3.fr
Date limite de publication : 2024-07-01

Contexte :
The Laboratoire des 2 Infinis – Toulouse (L2IT) is a laboratory created in 2020 to conduct research in fundamental physics with new numerical and theoretical approaches to data analysis. The laboratory’s research focuses on particle physics, gravitational waves and the equation of state of nuclear matter, and is supported by the concurrent development of data science and analysis methodologies. L2IT is operated by CNRS/IN2P3 and Université Toulouse III – Paul Sabatier. The L2IT Particle Physics team contributes to understanding the dynamics of the scalar sector of the Standard Model through studies of the Higgs boson and of the polarisation of vector bosons. It contributes to the development of data reconstruction software for the new tracker (ITk) that the ATLAS collaboration will install for the high-luminosity phase of the LHC. The successful candidate will work in close collaboration with other members of the Particle Physics team, and with members of the Computing, Algorithms and Data team at L2IT.

Sujet :
The successful candidate will develop innovative analysis methods for the reconstruction or the analysis of data from the ATLAS experiment. The L2IT team plays a leading role within the ATLAS collaboration in the reconstruction of charged particle tracks using deep geometric learning (GDL). The person joining us can contribute to this effort, for example by applying GDL to signatures not considered in the existing studies (electrons or tracks produced far away from the centre of the detector). Other applications of machine learning for the reconstruction or the analysis of ATLAS data are possible, depending on the candidate’s experience and motivation.

Profil du candidat :
We are looking for a colleague with a PhD in particle physics or in computer science with a strong specialisation in machine learning. Proven experience with machine learning to solve a scientific problem, or experience with algorithms for particle physics would be a plus.

Formation et compétences requises :
PhD in particle physics or in computer science obtained less than three years before the start date at L2IT.

Adresse d’emploi :
Laboratoire des 2 Infinis – Toulouse (L2IT)
Maison de la Recherche et de la Valorisation
75 cours des Sciences
31400 Toulouse

Document attaché : 202310301004_PostdocML_L2IT.pdf

CDD/Post-doctorate at CEA: Machine/deep learning approaches for the elucidation of small molecule structures

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CEA
Durée : 12 months
Contact : etienne.thevenot@cea.fr
Date limite de publication : 2023-11-30

Contexte :
Mass Spectrometry (MS) based metabolomics is a powerful technology for the discovery of biomarkers that can stratify patients. Within the MetaboHUB French infrastructure for metabolomics and fluxomics, a significant effort is dedicated to the development of innovative computational methods, software libraries and workflows for the processing, analysis, and interpretation of metabolomics data.
Determining the 2D structure of a metabolite from MS data is a major challenge. Since spectral libraries of reference compounds are scarce, in silico strategies have been developed to match experimental spectra directly to molecules, for which the structure is known, but no spectra is available [1]. The current reference method relies on the prediction of a vector of chemical descriptors using a set of Support Vector Machines; this fingerprint can subsequently be matched to those from known compounds in databases [2]. Performances, however, remain currently limited to 30% of correct structures [3]. Recently, alternatives based on artificial neural networks have been suggested to further take into account the interactions between features [4].

[1] Nguyen et al. (2019) Recent advances and prospects of computational methods for metabolite identification: a review with emphasis on machine learning approaches. Briefings in Bioinformatics, 20, 2028–2043.
[2] Dührkop et al. (2015) Searching molecular structure databases with tandem mass spectra using CSI:FingerID. PNAS, 112, 12580–12585.
[3] Schymanski et al. (2017) Critical Assessment of Small Molecule Identification 2016: automated methods. Journal of Cheminformatics, 9, 22.
[4] Fan et al. (2020) MetFID: artificial neural network-based compound fingerprint prediction for metabolite annotation. Metabolomics, 16, 104.

Sujet :
The first task will focus on the benchmark of the recent prediction tools against the consortium’s data (peakforest.org), as well as against those from the CASMI challenge data [3]. The model will then be enriched with new input features and output molecular properties, and the architecture will be optimized to improve the performances. Finally, the algorithms will be implemented into FAIR software libraries and computational workflows for high-throughput and reproducible structure recommendation.
Main responsibilities:
– Identify the open source prediction tools
– Implement a pipeline for FAIR comparison of their performances
– Build a training database of all publicly available spectra
– Build a comprehensive list of molecular descriptors
– Propose alternative learning architectures to increase the prediction performances
– Implement the selected solution in FAIR software libraries and computational workflows

Keywords: machine learning, deep learning, cheminformatics

Profil du candidat :
Bachelor’s degree (Bac +5) or PhD in machine learning, deep learning, cheminformatics or computational mass spectrometry.

MetaboHUB and CEA are committed to promoting gender equality, and female candidates are encouraged to apply.

Formation et compétences requises :
– Proficiency in Python and PyTorch
– Familiarity with RDKit
– Familiarity with QSAR approaches (an advantage)
– Familiarity with Singularity containers (an advantage)
– Ability to work independently and collaborate effectively within a multidisciplinary consortium.
– Good communication and documentation skills.

Adresse d’emploi :
You will join the metabolomics data science team (Odiscé; odisce.github.io) at CEA Saclay and interact with the colleagues from the MetaboHUB consortium.

Document attaché : 202310271615_CDD_Offer_MetaboHUB_MS2learning_madics.pdf

Apprentissage collaboratif multiparadigme interactif pour l’analyse de séries temporelles

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : AgroParisTech – ICube
Durée : 12 mois
Contact : gancarski@unistra.fr
Date limite de publication : 2023-11-24

Contexte :
Projet ANR Hérelles “Hétérogénéité des données – Hétérogénéité des méthodes : Un cadre collaboratif unifié pour l’analyse interactive de données temporelles”

https://seafile.unistra.fr/f/6453ca212850438684bc/

Salaire : de 2000€/mois à 2300€/mois (net) en fonction de l’expérience.
Contact : Antoine Cornuéjols antoine.cornuejols@agroparistech.fr et Pierre Gançarski, pierre.gancarski@unistra.fr

Sujet :
La personne recrutée devra proposer et définir des mécanismes originaux permettant à des méthodes supervisées et non-supervisées de collaborer de façon efficace pour arriver à un consensus de classification. Les modalités d’échange d’information entre celles-ci devront être précisées. Elle devra aussi définir un protocole d’interaction entre l’utilisateur et les méthodes d’apprentissage à travers l’utilisation de contraintes. Enfin, elle devra implanter concrètement les approches proposées pour permettre le test et la validation de celles-ci. Un ingénieur dédié à la plateforme FoDoMuST l’aidera dans cette tâche.

Profil du candidat :
Doctorat en informatique et spécialisé en apprentissage automatique/fouille de données.

Formation et compétences requises :
– Connaissances solides en Science des Données et plus particulièrement sur les méthodes standards de classification et de clustering. Une première expérience sur l’utilisation de modèles collaboratifs/ensemblistes ou d’intégration de contraintes serait un plus.
– Bonnes compétences en communication verbale (anglais ou français) et écrite (anglais).
– Compétences interpersonnelles et la capacité à travailler individuellement ou en tant que membre d’une équipe de projet.

Adresse d’emploi :
Lieu : Saclay (Campus d’AgroParisTech, 22 place de l’Agronomie, 91120 Palaiseau) ou au choix
Strasbourg (ICube, 300 bld Sébastien Brant 37400 Illkirch)
Durée : Un an
Date : Au plus tôt

Document attaché : 202310261121_Sujet_HERELLES_2023.pdf

Postdoc in Human Factor in Data-Intensive Applications for Health at Lyon1

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LIRIS
Durée : 1 year
Contact : andrea.mauri@univ-lyon1.fr
Date limite de publication : 2024-01-31

Contexte :
We are looking to hire one Postdoctoral Researcher to work on Human Data-Intensive Applications for Health. The position will be based at the Université Claude Bernard Lyon 1 in the Laboratoire d’InfoRmatique en Image et Systèmes d’information ((https://liris.cnrs.fr/liris).

In particular, the candidate will be part of the Database Team (DB) and co-supervised by Prof. Angela Bonifati and Dr. Andrea Mauri.

Sujet :
As a part of the role, you work on the integration of machine and human intelligence to design healthcare data-intensive systems more scalable, efficient, effective, and sustainable. This includes the investigation of how to integrate different kinds of data (from social media, sensors, lab studies, clinical trials, interviews, etc..), how to embed technology in a usually human-driven process, and how to provide trustworthy human-machine interactions in data-intensive applications.

You’ll be responsible for writing academic papers, technical reports, as well as attending academic conferences or meetings to present your findings and serve as a representative for the team.

Profil du candidat :
A Ph.D. in Computer Science or related topics such as Data Management, Human-Computer Interaction, Human-Centered AI, etc..

Formation et compétences requises :
Provable fluency in at least one programming language, e.g., Python/R, Java, C++, Rust.
Curiosity and passion for learning
Not being afraid of multidisciplinarity and transdisciplinarity
Experience in the health domain is a plus.

Adresse d’emploi :
Bâtiment Nautibus
Campus de la Doua
25 avenue Pierre de Coubertin
69622 Villeurbanne Cedex

To apply send an email to andrea.mauri@univ-lyon1.fr and angela.bonifati@univ-lyon1.fr with attached a single PDF containing
– Cover letter in which you describe your motivation and qualifications for the position.
– A research statement (max 2 pages, excluding references) where you describe the research you would like to do.
– Curriculum vitae, including a list of your publications and the contact information of three references.

We strongly encourage interested candidates to contact us to learn more about the position before sending the application.

Postdoc (2y) Bayesian inference for cosmology: Inferring initial conditions of the local cosmic web

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : CRIStAL UMR 9189 – Lille, France
Durée : 24 months
Contact : pierre.chainais@centralelille.fr
Date limite de publication : 2024-01-26

Contexte :
Postdoc Jan.2024 – Dec. 2025

The project is part of the ANR Chaire IA SHERLOCK (Fast inference with controlled uncertainty: application to astrophysical observations) led by Pierre Chainais (co-funded by Agence Nationale de la Recherche (ANR), I-SITE, Centrale Lille Institut and Région Haut-de-France). The successful candidate will be jointly supervised by Jenny Sorce (CNRS Researcher in cosmology), Pierre Chainais (Professor, Centrale Lille) and Pierre-Antoine Thouvenin (Assoc. Prof., Centrale Lille) in the CRIStAL lab (UMR 9189), Lille, France.
Access to the medium scale computing center from the Universtiy of Lille is acquired, with the possiblility to apply for computing resources from the national flagship Jean Zay supercomputer. In addition, 7 million cpu.hours have been secured at TGCC on the Irene/Rome partition. They will be used to produce the simulations required to trained the surrogate model.

Sujet :
According to the standard cosmological model, about 95% of the Universe is dark. Recent large survey analyses reveal tensions with this model. For instance, the local measurement of the expansion rate and the estimate of the Universe homogeneity differ by more than three standard deviations from those inferred with the first light of the Universe. The cosmological heated debate is to work out whether these tensions are a signature of new physics or of systematic biases in the observation processing pipeline. Part of this pipeline relies on cosmological simulations to act as the missing ground truth. However, the simulations only statistically reproduce the local cosmic web. A new type of simulations, qualified as constrained, is emerging. Initial velocity and density fields of such simulations stem from observational constraints.
This post-doctoral project is aimed at inferring the initial velocity and density fields of the local cosmic web from today’s luminosity distances and observational redshifts measurements. This high-dimensional astrophysical inverse problem is challenging. In particular, it will leverage a large number of measurements (Bayer et al. 2023; Prideaux-Ghee et al. 2023). The absence of ground truth data calls for reliable estimators with associated uncertainty quantification. This motivates the use of Markov chain Monte-Carlo (MCMC) algorithms to access posterior distributions. The hierarchical model relies on a costly cosmological simulator to describe the evolution of cosmological objects from the initial conditions. A first step will be to replace the black-box simulator in the inference algorithm by a tractable surrogate model trained on a grid of simulations, in the spirit of (Dai et al. 2023; Jindal et al. 2023; Raissi et al. 2019). The second step will focus on the design of a high-dimensional MCMC algorithm to infer the parameters of interest (Coeurdoux et al. 2023a,b; Durmus et al. 2018; Vono et al. 2020).

Keywords. Inverse problem, cosmological simulation model, Bayesian inference, MCMC algorithms.

Profil du candidat :
PhD in signal/image processing, computer science or applied mathematics.

Formation et compétences requises :
The project requires a strong background in data science and/or machine learning (statistics, optimization), signal & image processing. Very good
Python coding skills are expected. A B2 English level is mandatory.
Knowledge in C++ programming, as well as experience or interest in parallel/distributed code development (MPI, OpenMP, CUDA, …) will be appreciated.

Adresse d’emploi :
CRIStAL / Centrale Lille Institut
Centre de Recherche en Informatique, Signal et Automatique de Lille (UMR 9189 CRIStAL),
Avenue Henri Poincaré
59655 Villeneuve d’Ascq, France

Contacts:
Pierre CHAINAIS (pierre.chainais@centralelille.fr),
€ http://pierrechainais.ec-lille.fr/
Jenny SORCE (jenny.sorce@univ-lille.fr),
€ https://jennygsorce.appspot.com
Pierre-Antoine THOUVENIN (pierre-antoine.thouvenin@centralelille.fr),
€ https://pthouvenin.github.io/

Applicants are invited to email the following documents as a single .pdf file to all the co-advisors:
• a detailed curriculum, including a list of publications;
• link to the PhD manuscript (or PhD project if upcoming defense);
• reports from PhD reviewers if available;
• a cover letter;
• references: recommendation letters or names of 2 researchers/professors recommending your application.
For further information, please contact the co-advisors of the project:
• Jenny Sorce, jenny.sorce@univ-lille.fr
• Pierre-Antoine Thouvenin, pierre-antoine.thouvenin@centralelille.fr
• Pierre Chainais, pierre.chainais@centralelille.fr.

Document attaché : 202310260740_postdoc_Bayes_cosmology_Lille2024.pdf

Développement d’IA pour la prédiction de besoins de lit dans les hôpitaux.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : école d’ingénieur ISIS Castres
Durée : 5 à 6 mois
Contact : imen.megdiche@univ-jfc.fr
Date limite de publication : 2024-01-26

Contexte :
Actuellement, le temps d’attente moyen dans les services d’urgence est alarmant, atteignant une moyenne de 9 heures, principalement en raison d’une gestion perfectible des ressources disponibles à l’hôpital. Il est essentiel de noter que 75 % des admissions à l’hôpital découlent d’admissions non programmées suite à des passages aux urgences.

Sujet :
L’objectif de ce stage est d’élaborer un modèle d’intelligence artificielle visant à anticiper les besoins en lits pour chaque service hospitalier suite aux admissions non programmées aux urgences. Actuellement, le temps d’attente moyen dans les services d’urgence est alarmant, atteignant une moyenne de 9 heures, principalement en raison d’une gestion perfectible des ressources disponibles à l’hôpital. Il est essentiel de noter que 75 % des admissions à l’hôpital découlent d’admissions non programmées suite à des passages aux urgences.
Ce stage s’inscrit dans un projet recherche avec l’entreprise Atout Majeur Concept (AMC). Nous envisageons de croiser plusieurs types de données issues du SI de l’entreprise pour propose une approche IA , basée sur du MultiTask Leanring afin de prédire des besoins en lits sur une période de 7 à 15 jours.
Le stagiaire sera chargé de : faire une revue des travaux connexes dans la littérature, mettre en œuvre l’intégralité de la chaîne de développement de l’intelligence artificielle et de produire un livrable à tester avec l’ entreprise AMC.

Profil du candidat :
Des compétences en pyhton pour la data science
Connaissances solides en IA .
Rigoureux et autonome.
Très bon niveau de communication orale et écrite (anglais/ Français )

Formation et compétences requises :
formation en IA ou machine learning requise ( master ou école d’ingénieur)

Adresse d’emploi :
95 rue firmin Oulès , 81100 Castres

Développement et évaluation d’une descente d’échelle statistique des prévisions météorologiques sur la Réunion avec des méthodes de deep learning

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Centre National de Recherches Météorologiques
Durée : 6 mois
Contact : laure.raynaud@meteo.fr
Date limite de publication : 2024-01-26

Contexte :
Les prévisions météorologiques opérationnelles sur les domaines Outre-Mer ont vu leur résolution spatiale augmenter de 2.5km à 1.3km à l’été 2022. Cette évolution a permis d’améliorer la performance des prévisions, en particulier pour les événements à enjeux tels que les cyclones tropicaux et les fortes pluies. Des résolutions hectométriques permettraient de gagner encore en réalisme, en particulier sur l’île de la Réunion dont le relief est complexe. Néanmoins, le coût des prévisions à des résolutions de quelques centaines de mètres ne permet pas d’envisager leur utilisation opérationnelle avant plusieurs années.

Une alternative moins coûteuse à cette descente d’échelle dynamique est la descente d’échelle statistique. L’objectif est d’apprendre une relation statistique entre les prévisions basse résolution (par exemple 2.5km ou 1.3km) et les prévisions haute résolution (par exemple 500m). Les méthodes de descente d’échelle les plus classiques reposent sur des interpolations simples ou des approches de régression linéaire. Récemment, plusieurs études ont montré que des méthodes d’apprentissage profond tels que les réseaux de neurones convolutifs offrent des perspectives intéressantes pour la descente d’échelle (Vandal et al., 2018; Baño-Medina et al., 2019, Leinonen et al., 2020; Höhlein et al. 2020, Sha et al., 2020).

Sujet :
L’objectif du travail proposé est de développer une descente d’échelle à 500m des prévisions sur la Réunion, par apprentissage profond, et pour des variables de temps sensible telles que la température, le vent et les précipitations. Un premier stage en 2023 a permis de mettre en place les jeux de données et d’évaluer deux architectures : un réseau convolutif simple de type U-Net et un modèle de diffusion. Les premiers résultats sont encourageants et plusieurs pistes d’approfondissement et d’amélioration sont envisagées, qui feront l’objet du présent stage, parmi lesquelles :
1. l’intégration de contraintes physiques dans les réseaux
2. l’amélioration des modèles de diffusion et de leur coût d’inférence : des variantes telles que les modèles implicites (Song et al., 2021), la diffusion latente ou la distillation progressive (Salimans et Ho, 2022) pourront être implémentées
3. la descente d’échelle stochastique, au travers de la génération d’ensembles de prévisions
4. la descente d’échelle pour les précipitations.

Profil du candidat :
Le stage requiert un réel intérêt pour la prévision du temps. De bonnes compétences en statistiques également sont attendues. Le langage de programmation utilisé sera Python. Une connaissance préalable du fonctionnement des réseaux de neurones profonds (en particulier des réseaux convolutifs) est souhaitée. Une première expérience d’une bibliothèque de Deep Learning (PyTorch, TensorFlow, …) serait un plus.

Formation et compétences requises :
Ecole d’ingénieur ou M2.

Adresse d’emploi :
CNRM, Toulouse.

Document attaché : 202310251324_Fiche-proposition-PFE_IENM_IA500m_2024.pdf