Assimilation de données de phénotypage numérique par deep learning pour la simulation d’un modèle Structure-Fonction 3D d’arbres fruitiers

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR AGAP Institut, CIRAD, Montpellier
Durée : 6 mois
Contact : frederic.boudon@cirad.fr
Date limite de publication : 2024-12-30

Contexte :
Pour analyser finement le fonctionnement et la croissance des plantes, les modèles structure-fonction de plantes (FSPM) prennent en compte la structure modulaire des plantes, leur distribution spatiale 3D, leur fonctionnement interne en interaction avec l’environnement (Prusinkiewicz, 2004 ; Fourcaud et al., 2008 ; Louarn et Song 2020). Leur développement est motivé par l’idée que la structure tridimensionnelle des plantes forme son interface avec l’environnement et module sa croissance et sa productivité (Costes et al., 2006). Ils ont notamment été utilisés pour la modélisation d’arbres fruitiers (Costes et al., 2008 ; Allen et al., 2005 ; Lescourret et al., 2011 ; Boudon et al., 2020) chez lesquels la compétition interne pour les ressources entre organes nécessite d’avoir des représentations dynamiques spatialisées. Un verrou majeur de cette approche est la paramétrisation du modèle qui rend difficile son adoption pour construire des outils d’aide à la décision pour la gestion des vergers (DeJong, 2019) et plus généralement qui freine son utilisation dans la communauté scientifique.

La télédétection, couplée au traitement de données par deep learning, ont un potentiel important pour aider à la caractérisation du fonctionnement et de la croissance des plantes et donc paramétrer de tels modèles. En particulier, la disponibilité récente de caméras (RGB, Lidar, thermique, etc.) et vecteurs (drone, phénomobile, etc) permet d’envisager des solutions innovantes pour le phénotypage haut débit et le suivi des cultures. Récemment de nombreuses initiatives visent à automatiser le phénotypage des plantes, mais se concentrent sur un ensemble limité de traits, souvent peu compatible avec la définition d’un FSPM (Streit et al., 2023). L’objectif de ce stage est de rapprocher méthodes de phénotypage haut débit des vergers et construction d’un modèle 3D détaillé d’arbres fruitiers, en prenant comme cas d’application les pommiers.

Sujet :
L’objectif premier de ce stage sera d’extraire des règles de développement et de ramification à partir de reconstructions 3D issues de scans LiDAR en hiver par des méthodes d’assimilation de données, basées sur du machine ou deep learning (i.e. CNNS, RNNs, LSTMs et Transformers). Le second objectif sera de réaliser une première étape de reformulation d’un modèle FSPM d’arbre fruitier, MAppleT (Costes et al., 2008) pour préparer son couplage avec les données numériques issues de différents protocoles d’acquisition (LiDAR, imagerie aéroportée).

• Le stage débutera par une analyse bibliographique des traits accessibles par phénotypage pour la modélisation structure-fonction. Un bilan sera fait des différents traits mesurés par phénotypage LiDAR et imagerie qui seront mis en regard des paramètres des modèles de simulation. En particulier, les aspects de topologie de l’architecture des arbres, notamment leur ramification seront analysés.
• A partir de reconstructions issues de scans LiDAR en hiver, des méthodes d’assimilation de données, basées sur des méthodes de machine ou deep learning, pour permettre de reproduire les séquences d’événements développementaux observées en fonction des génotypes, seront développées. Pour modéliser et simuler ces séquences, différents types d’architecture de réseaux seront testés, (i.e. CNNS, RNNs, LSTMs et Transformers). Les séquences déduites de la reconstruction 3D devront prendre en compte l’incertitude des mesures. Les modèles initiaux de séquences de ramification, construits à partir de modèles de semi chaînes de Markov cachées, seront utilisés pour pré-entraîner les modèles de réseaux. Ceux-ci seront évalués pour leur capacité à prendre en compte les effets génotypiques.
• Le FSPM MappleT sera ensuite modifié pour prendre en compte ce nouveau type de modélisation des paramètres de ramification, basé sur la donnée. Des validations en termes de quantité d’organes reconstruites, de volume de plantes, etc. seront mise en place.

Profil du candidat :

Formation et compétences requises :
– Dernière année de Formation Supérieure BAC + 5
– Connaissances : Master en maths-infos, programmation en langage Python, des connaissances en statistiques seront appréciées
– Compétences opérationnelles : Goût pour le travail en équipe et l’inter-disciplinarité
– Langues : français, anglais

Adresse d’emploi :
Avenue Agropolis TA A-108 / 01
34398 Montpellier Cedex 5, France

Document attaché : 202410090946_stageM2-assimilation-vf.pdf

Anchor-free small ship detection from Sentinel-2 images

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA, Université Bretagne Sud
Durée : 6 mois
Contact : minh-tan.pham@univ-ubs.fr
Date limite de publication : 2024-12-31

Contexte :
For information, please consult the offer on this link:
http://www-obelix.irisa.fr/files/2024/10/Master_topic_ship_detection_2024.pdf

Sujet :
Keywords: Deep learning, small object detection, anchor-free detection, ship detection, Sentinel-2

Profil du candidat :
Student Master 2, Ecole d’Ing´enieur or equivalent with excellent academic track;
Ability to communicate in English;

Formation et compétences requises :
Background in computer science and/or machine/statistical learning and/or applied mathematics for signal and image processing;
Excellent programming in Python (familiar with one of deep learning packages is a must,
preferable PyTorch).

Adresse d’emploi :
The expected intern will join the OBELIX research group (www.irisa.fr/obelix) from IRISA (UMR 6074) is located in the UBS (Universit´e Bretagne Sud) campus in Vannes 56000, France.

Document attaché : 202410090849_Master_topic_ship_detection_2024.pdf

Learning with heavy-tailed inputs: Out-of-domain Generalization on Extremes

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire MAP5, Université Paris-Cité,
Durée : 4-6 months + opportu
Contact : anne.sabourin@u-paris.fr
Date limite de publication : 2025-05-04

Contexte :
The internship is intended to lead to a PhD thesis if everything goes as planned. The PhD will be funded by the ANR project EXSTA led by A. Sabourin. The Phd Candidate will benefit from interactions with other researchers in the field e.g. through workshops organised within the project’s framework, in addition to usual participation in conferences.

Sujet :
Context: Extreme Value Theory (EVT) is a field of probability and statistics concerned with tails of distributions, that is, regions of the sample space located far away from the bulk, associated with rare and extreme events. Poviding probabilistic descriptions and statistical inference methods for the tails requires sound theoretical assumptions pertaining to the theory of regular variation and maximum domains of attraction, ensuring that a limit distribution of extremes exists. This setting encompasses a wide range of applications in various disciplines where extremes have tremendous impact, such as climate science, insurance, environmental risks and industrial monitoring systems [1].

In a supervised learning framework, the goal is to learn a good prediction function to predict new, unobserved labels. In many contexts (covariate-shifts, climate change), extrapolation (or out-of-sample) properties of the predictors thus constructed are crucial, and obtaining good generalization properties on unobserved regions of the covariate space is key. Recently, there has been significant interest in the ML literature regarding out-of-domain generalization (see e.g. [2]).

Recent works [3,4,5] focus on the problem of learning a tail predictor based on a small of the most, with non-asymptotic guarantees regarding the risk on extreme regions . For simplicity, the theoretical study in both works is limited to Empirical Risk Minimization (ERM) algorithms without a penalty term. In addition, the regression problem analysed in [5] covers least squares regression only. Also, with heavy-tailed targets, non-linear transformations of the target are required in order to satisfy boundedness assumptions.

Research Objectives: The general purpose of this internship and subsequent thesis is to extend the scope of applications of the supervised learning methods described above to a wider class of learning algorithms. One main limitation of least squares regression is that the optimal predictor (i.e. the conditional expectation given the covariate) is not invariant under non-linear transformations of the target. As a starting point, the least-squares framework will be extended to the quantile regression framework which, in contrast to least squares, is compatible with non-linear transformations. From a statistical learning perspective, we shall extend the ERM framework considered thus far to encompass penalized risk minimizations procedures amenable to high dimensional covariates or non-linear regression functions. SVM quantile regression [6] is a natural candidate for this purpose. The goal will be to obtain finite sample guarantees on the generalization error of quantile regression functions learnt with the a subsample made of the largest observations and hopefully recover learning rates of comparable order as the ones obtained in the classical framework, with the full sample size n replaced with the reduced sample size. The bottleneck is that these largest observations may not be considered as an independent sample because they are order statistics of a full sample. However it is anticipated that proof techniques from recent works [7,8,9] based on conditioning arguments and concentration inequalities incorporating (small) variance terms can be leveraged for this purpose.

References
[1] Beirlant, J., Goegebeur, Y., Segers, J., and Teugels, J. L. (2004). Statistics of Extremes: Theory and
Applications, volume 558. John Wiley & Sons.

[2] Zhou, K., Liu, Z., Qiao, Y., Xiang, T., and Loy, C. C. (2022). Domain generalization: A survey. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 45(4):4396–4415.

[3] Jalalzai, H., Clémençon, S., and Sabourin, A. (2018). On binary classification in extreme regions. In
NeurIPS Proceedings, volume 31.

[4] Clémençon, S., Jalalzai, H., Lhaut, S., Sabourin, A., and Segers, J. (2023). Concentration bounds for the
empirical angular measure with statistical learning applications. Bernoulli, 29(4):2797–2827.

[5] Huet, N., Clémençon, S., and Sabourin, A. (2023). On Regression in Extreme Regions. arXiv preprint
arXiv:2303.03084.

[6] Takeuchi, I., Le, Q. V., Sears, T. D., Smola, A. J., and Williams, C. (2006). Nonparametric quantile
estimation. Journal of machine learning research, 7(7).

Supervisory Team/contact: Anne Sabourin (MAP5, Université Paris-Cité), Clément Dombry (LMB, Université de Franche-Comté)

Profil du candidat :
Master’s student (2nd year) in Applied Mathematics/Statistics/Statistical Machine Learning with an excellent track record and a strong interest for mathematical statistics and learning theory. Some knowledge of R or Python.

Application to the PhD thesis from candidates having already graduated from a Master’s program will also be considered.

Formation et compétences requises :
Being enrolled in or having graduated from a Master’s program in Mathematics/Statistics/Statistical Machine Learning

Adresse d’emploi :
Laboratoire MAP5, Université Paris Cité, 45 rue des Saint Pères, Paris.

Document attaché : 202410081334_offreStage2024.pdf

Détection automatique d’interaction médicamenteuse en réanimation médicale

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube
Durée : 6 mois
Contact : nicolas.lachiche@unistra.fr
Date limite de publication : 2025-05-04

Contexte :
Collaboration avec le service de réanimation de l’hôpital de Hautepierre à Strasbourg

Sujet :
Description de l’offre

Les patients admis en réanimation médicale sont souvent atteints de maladies graves, voire potentiellement mortelles, nécessitant de multiples traitements. L’incidence des interactions médicamenteuses y est donc élevée, avec des conséquences parfois sévères, telles qu’une exacerbation des effets secondaires ou une augmentation de la toxicité des médicaments.
De plus, ces patients présentent fréquemment des insuffisances rénale et/ou hépatique, ce qui peut entraîner des surdosages médicamenteux en raison d’une élimination altérée. Cela complexifie davantage la tâche du prescripteur, qui doit quotidiennement évaluer le rapport bénéfice/risque des traitements administrés.
Aujourd’hui, un grand nombre de données sont automatiquement collectées chez les patients de réanimation. L’objectif de ce stage est d’utiliser ces informations pour apprendre à détecter les interactions médicamenteuses et ainsi assister le clinicien dans ses décisions thérapeutiques.
Dans le cadre de ce projet, nous nous concentrerons sur l’allongement de l’intervalle QT comme indicateur mesurable des interactions médicamenteuses touchant le cœur. Cet intervalle, mesuré sur l’électrocardiogramme, est influencé par de nombreux facteurs et médicaments (CredibleMeds). En cas d’allongement excessif, il peut induire des troubles du rythme cardiaque
potentiellement mortels.

Travail à réaliser

– Calculer l’intervalle QT à partir des électrocardiogrammes en utilisant les librairies de traitement
du signal existantes
– Vérifier l’influence de situations et médicaments connus sur le QT extrait des bases de données
– Identifier et extraire les médicaments et autres informations pertinentes des données
– Utiliser des algorithmes d’apprentissage machine pour prédire la variation du QT

Profil du candidat :
Bac +4-5 en informatique, science des données, intelligence artificielle, apprentissage automatique

Formation et compétences requises :
Python et les librairies classiques de l’apprentissage profond et des séries temporelles

Adresse d’emploi :
ICube
300 Boulevard Brant
67412 Illkirch

Document attaché : 202410071201_StageM2_Interactions2024.pdf

Postdoc – Temporal Graph Auto-Encoders for Anomaly Detection in Industrial Internet of Things

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Univ. Littoral Côte d’Opale
Durée : 24 months
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2024-11-15

Contexte :
The Industrial Internet of Things (IIoT) connects industrial devices, sensors, and machines to the internet, facilitating real-time data exchange. Detecting anomalies in IIoT systems is critical for ensuring security and operational efficiency. Anomalies can arise from two main data sources: communication logs, where devices are vulnerable to attacks or intrusions, and measurements, where equipment issues can disrupt production. While IIoT data can be very well modeled as an attributed temporal graph, most approaches tackle the above challenges using graph or time-series approaches, which often results in loss of important information. This postdoc project proposes to develop new algorithms that directly analyze temporal graphs, capturing both dynamic and structural information to improve anomaly detection in IIoT systems.

Sujet :
The recruited postdoc will collaborate with us on three research axes:
————————–
1. Temporal graph-based auto-encoder architecture.

We aim to build an anomaly detector based on an auto-encoder architecture that extends time-series and static graph ones to temporal graphs. We plan to address this challenge by building upon recent results that combine graph theory and signal processing into a unified formalism for temporal graphs.

————————–
2. Detection of network intrusions and attacks in communication logs.

We plan to evaluate the proposed architecture in real-world IIoT traffic datasets that capture various types of intrusions and
attacks. We would like in particular to exploit the properties of the latent space to localize the anomalous temporal graph region.

————————–
3. Detection of faults in IIoT measurements.

We aim to explore whether capturing the non-stationary dependencies of sensor measurements through temporal graphs can enhance the time-space localization of anomalies in applications such as machine health monitoring and transportation network monitoring.

Profil du candidat :
We look for highly motivated candidates with relevant experience in anomaly detection, graph machine learning, and/or deep learning. Experience in Python programming, cybersecurity and/or streaming algorithms is a plus. Ideal candidates will have a publication record in selective AI conferences.

Formation et compétences requises :
PhD in computer science or related fields.

Adresse d’emploi :
Saint-Omer, France

Document attaché : 202410062130_postdoc_ADIIOT_description_.pdf

PPR Océan & Climat : Appel à propositions de data challenges.

Date : 2024-10-04 => 2026-10-04

Chers collègues,

Nous avons le plaisir de vous annoncer le lancement d’une action IA dans le cadre du PPR Océan & Climat (https://www.ocean-climat.fr/). Cette action nationale vise à soutenir le développement de solutions nativement IA pour la modélisation, la prévision et l’observation des océans.

Suivant une démarche inspirée des avancées récentes pour la prévision météorologique court-terme, la première phase (octobre 2024-septembre 2025) visera via un appel à propositions à définir de manière collaborative des “data challenges” dont la mise en oeuvre (e.g., jeux de données, cadre d’évaluation) bénéficiera du soutien du PPR en termes d’ingénierie support. La deuxième phase (septembre 2025-décembre 2027) s’appuiera sur la sélection de 8 à 9 postdoctorats de deux ans pour laquelle un appel sera ouvert début 2025.

Nous organisons deux webinaires les 4/10 et 11/10 (12.00-13.00) pour présenter cette action et répondre à toute question (cf. lien zoom ci-dessous). Nous vous invitons également à rejoindre un espace slack dédié en complétant le formulaire d’inscription ci-dessous. Nous proposons que cet espace slack soit la plateforme principale pour les échanges autour de cette action.

Merci de faire suivre ce mail à toute personne potentiellement intéressée.
N’hésitez pas à me contacter pour tout complément d’information.

Bien cordialement,
Ronan Fablet pour le comité de suivi

Exemples de data challenges:

– WeatherBench 2.0 : https://sites.research.google/weatherbench/
– Ocean Data Challenge – Global SSH mapping: https://2023a-ssh-mapping-ose.readthedocs.io/en/latest/

Dates importantes :
– 4 et 11 Octobre 2024, 12.00-13.00: wébinaires (cf. lien zoom ci-dessous)
– 18 Octobre 2024 : date limite de proposition de “data challenges”
– 19 Octobre – 22 Novembre 2024 : mise en commun et révision des data challenges proposés
– 13 Décembre 2024 : publication des data challenges sélectionnés
– Janvier 2024 : ouverture de l’appel postdocs
– Septembre 2025 : démarrage des postdocs et workshop de lancement des data challenges

Formulaire d’inscription : https://forms.gle/R7QhGe4VwBrXXPWV7
Lien zoom du webinaire du 04/10/2024, 12.00-13.00:
https://cnrs.zoom.us/j/91635362763?pwd=bv146gsjDkT9SQ7lUcxHY1n4bi0jpU.1

Lien zoom du webinaire du 11/10/2024, 12.00-13.00:
https://univ-grenoble-alpes-fr.zoom.us/j/93226799086?pwd=agYwgn1IYRYhwD3x63VXyhCSfRZDns.1

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Stage M2 au CEA : Nouvelles approches par apprentissage statistique profond pour l’identification structurale de biomarqueurs en métabolomique par spectrométrie de masse

Offre en lien avec l’Action/le Réseau : DSChem/– — –

Laboratoire/Entreprise : CEA
Durée : 6 mois
Contact : etienne.thevenot@cea.fr
Date limite de publication : 2024-11-30

Contexte :
La spectrométrie de masse haute résolution couplée à la chromatographie liquide (LC-HRMS) est une technologie puissante en santé pour détecter et caractériser l’ensemble des petites molécules dans un échantillon biologique (métabolomique), afin de découvrir de nouveaux biomarqueurs et médicaments. L’identification des métabolites (i.e. la détermination de leur structure 2D) à partir de l’analyse du spectre de masse obtenu après fragmentation du composé (MS/MS) représente un défi majeur en raison de la taille limitée des bases de données de spectres de référence expérimentaux comparée à la diversité chimique du métabolome. C’est pourquoi les approches in silico, et en particulier les méthodes d’apprentissage statistique se sont développées ces dernières années [1] pour prédire à partir d’un spectre MS/MS (liste de pics correspondant à des couples « masse, intensité ») une représentation de la molécule et/ou de son processus de fragmentation en sous-structures sous forme de descripteurs chimiques ou de chaine de caractères (e.g. SMILES). Toutefois, les performances des modèles actuels restent limitées à 26% de prédiction correcte de la structure 2D. Pour enrichir l’information chimique dans les spectres MS/MS, notre laboratoire a développé de nouvelles approches expérimentales multiplexées qui permettent d’acquérir en parallèle une grande quantité de spectres sur le même composé dans des conditions de fragmentation distinctes.

Sujet :
L’objectif du stage est de développer de nouveaux modèles d’apprentissage profond pour l’identification structurale à partir des données MS/MS multiplexées. A partir d’une base de données originale de composés récemment caractérisés expérimentalement de manière approfondie au laboratoire, les performances prédictives des modèles de l’état de l’art seront d’abord évaluées (e.g. par prédiction de descripteurs chimiques ou de SMILES grâce à un transformer ou un auto-encoder [2]). Un nouveau type d’architecture sera ensuite développé pour intégrer l’ensemble des informations multiplexées et montrer leur impact sur la qualité de la prédiction. L’ensemble des algorithmes seront implémentés avec les librairies PyTorch et RDKit notamment, et appliqués à la recherche de biomarqueurs dans les données de plusieurs cohortes cliniques disponibles au laboratoire.
Mots clés : apprentissage statistique, théorie des graphes, chimie numérique, spectrométrie de masse, santé
Références :
[1] Liu et al. (2021) Current and future deep learning algorithms for tandem mass spectrometry (MS/MS)-based small molecule structure elucidation. Rapid Commun Mass Spectrom, DOI:10.1002/rcm.9120.
[2] Russo et al. (2024) Machine learning methods for compound annotation in non-targeted mass spectrometry—A brief overview of fingerprinting, in silico fragmentation and de novo methods. Rapid Commun Mass Spectrom. DOI: 10.1002/rcm.9876.

Profil du candidat :
Nous recherchons un.e candidat.e avec un bon dossier en mathématiques appliquées (apprentissage statistique, théorie des graphes) et motivé.e par les applications multidisciplinaires (chimie, physique, biologie).

Formation et compétences requises :

Adresse d’emploi :
Le stage s’effectuera au centre CEA de Saclay, dans l’équipe science des données métabolomiques du laboratoire Innovations en Spectrométrie de Masse pour la Santé.
Merci d’adresser votre candidature (CV détaillé, lettre de motivation, notes de licence et master et nom de deux référents) à :
Etienne Thévenot (etienne.thevenot@cea.fr)
Equipe sciences des données (https://odisce.github.io)
Laboratoire Innovations en Spectrométrie de Masse pour la Santé (LI-MS)
UMR Médicaments et Technologies pour la Santé (MTS)
CEA, Centre de Saclay, F-91191 Gif sur Yvette, France

Document attaché : 202410041921_240924_stage_M2_cea_ai-ms2_EThevenot.pdf

1st cfp: 14th IAPR-TC15 International Workshop on Graph-Based Representations in Pattern Recognition

Date : 2025-06-25 => 2025-06-27
Lieu : Caen, France.

Dear All,

We are pleased to announce the first call for papers for the upcoming IAPR Workshop on Graph-Based Representations in Pattern Recognition (GbRPR). The workshop will be held in Caen, France, from June 25 to June 27, 2025. The scope of GbR2025 includes, but is not limited to, the following topics :

  • Data mining on/with graphs
  • Deep learning on graphs: Graph Neural Networks, Graph pooling, Graph autoencoders, …
  • Graph Signal Processing
  • Graph matching and classification
  • Graph distance and similarity measures
  • Graph kernels and graph embeddings
  • Graphs in bioinformatics/chemoinformatics
  • Graphs in social network analysis
  • Graph-based methodologies for pattern recognition
  • Graph-based learning and clustering
  • Graph based image segmentation
  • Irregular (graph) pyramids
  • Graph representation of images and shapes
  • Other graph-based applications in pattern recognition

GbR has been a biannual event for nearly 30 years and has consistently served as a meeting place for algorithmic and machine learning approaches dealing with data defined either on a graph or by a graph.
Scientific applications of our methods is wide but concern primarily domains like the one addressed by DSchem, where structural information between objects is a key information.

The proceedings of the workshop will be published in the LNCS series, and we are currently in discussions with Pattern Recognition Letters to create a special virtual issue related to GbR topics following the workshop. The workshop will include two invited talks on Graph matching (provided by Christine Solnon) and ML on graphs. The planned registration fees are approximately 100 €.

Important dates

  • Paper submissions due: February 3, 2025
  • Notification of acceptances: March 3, 2025
  • Final camera-ready papers due: April 1, 2025
  • Registration: June 2, 2025

Please do not hesitate to submit papers and/or join us for three days of intense scientific activity in a warm atmosphere.

Regards,

Luc Brun, Benoit Gaüzère, Sébastien Bougleux, Vincenzo Carletti.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Développement et évaluation d’un passage à l’échelle des prévisions Arome sur l’Europe avec des méthodes d’Intelligence Artificielle Générative.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Ce stage n’est plus disponible

Laboratoire/Entreprise : CNRM – Centre National de Recherches Météorologiqu
Durée : 6 mois
Contact : victor.sanchez@meteo.fr
Date limite de publication : 2025-01-15

Contexte :
L’utilisation de l’intelligence artificielle (IA) pour la Prévision Numérique du Temps (PNT) se démocratise progressivement depuis plusieurs années. Les algorithmes d’apprentissage profond et les approches génératives ont d’ailleurs récemment fait leur preuve dans ce domaine d’application. Désormais, ces méthodes ont la capacité de produire des champs physiques avec une certaine cohérence physique, pour un coût numérique très inférieur aux méthodes classiques d’intégration numérique.

Le stage proposé se place dans le cadre de Destination Earth (DestinE). DestinE est une initiative de la Commission européenne dans le cadre du programme EU Digital Europe. Ce projet vise à déployer plusieurs jumeaux numériques de la Terre, qui aideront à surveiller et à prévoir les changements environnementaux et l’impact humain, afin de développer et de tester des scénarios qui soutiendraient le développement durable et les politiques européennes correspondantes pour le Green Deal. L’IA, et en particulier l’apprentissage profond, sont un des axes développés dans DestinE. Le travail durant le stage sera à destination du projet DE_371, auquel l’équipe d’accueil participe.
L’objectif du projet DE_371 est de démontrer que des méthodologies utilisant les algorithmes d’IA à l’état de l’art peuvent aider à améliorer l’estimation de l’incertitude des prévisions, en permettant de produire des prévisions d’ensemble de grande taille et à haute résolution spatiale et temporelle.

Sujet :
L’objectif du travail proposé est d’utiliser des techniques d’IA dites génératives comme les Réseaux Antagonistes Génératifs (GAN) [1] pour améliorer les performances du système opérationnel de prévision d’ensemble Arome. L’équipe d’accueil a développé un prototype StyleGAN [2][3] capable de générer des membres Arome physiquement cohérents sur un quart sud-est de la France et pour quelques variables de surface. Ce stage se propose d’utiliser ce prototype comme base de
développement. Les résultats encourageants mènent vers plusieurs pistes d’approfondissement et d’amélioration, qui feront l’objet du présent stage, parmi lesquelles :
• Adaptation du modèle à une extension du domaine actuel.
• Exploration de méthodes de Transfer Learning [4] sur le domaine nordique (Norvège, Suède).
• Evaluation des prévisions StyleGAN sur des évènements à fort impact.

[1] Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., … & Bengio, Y. (2020). Generative adversarial networks. Communications of the ACM, 63(11), 139-144. https://dl.acm.org/doi/pdf/10.1145/3422622.

[2] Karras, T., Laine, S., Aittala, M., Hellsten, J., Lehtinen, J., & Aila, T. (2020). Analyzing and improving the image quality of stylegan. In Proceedings of the IEEE/CVF conference on computer vision and
pattern recognition (pp. 8110-8119).https://openaccess.thecvf.com/content_CVPR_2020/papers/
Karras_Analyzing_and_Improving_the_Image_Quality_of_StyleGAN_CVPR_2020_paper.pdf

[3] Brochet, C., Raynaud, L., Thome, N., Plu, M., & Rambour, C. (2023). Multivariate Emulation of Kilometer-Scale Numerical Weather Predictions with Generative Adversarial Networks: A Proof of Concept. Artificial Intelligence for the Earth Systems, 2(4), 230006. https://doi.org/10.2496.

[4] Lee, D., Lee, J. Y., Kim, D., Choi, J., & Kim, J. (2022). Fix the noise: Disentangling source feature for transfer
learning of StyleGAN. arXiv preprint arXiv:2204.14079. https://arxiv.org/pdf/2204.14079

Profil du candidat :
Le ou la stagiaire pourra disposer de moyens de calculs sur GPU importants (plate-forme Météo France et/ou super-calculateur EuroHPC), au sein d’une équipe expérimentée et motivée. Il ou elle bénéficiera
des outils et méthodes déjà développés dans l’équipe. Ce stage sera l’occasion de développer ses compétences, notamment :
• expérience de développement d’algorithmes d’apprentissage profond à l’état de l’art
• manipulation d’une infrastructure de calcul haute-performance
• gestion d’une base de code commune et ajout de fonctionnalités
• intéractions avec des partenaires internationaux (centres météorologiques en Norvège et Suède)

Formation et compétences requises :
Ce stage requiert un réel intérêt pour la prévision numérique du temps (des connaissances préalable à ce sujet seraient un plus mais ne sont pas nécessaire). De solides compétences en statistiques et une bonne maîtrise du langage Python seront également nécessaires. Une connaissance préalable du fonctionnement des réseaux de neurones profonds (en particulier des réseaux convolutifs CNN) est souhaitée. Une première expérience d’une bibliothèque de Deep Learning (PyTorch, TensorFlow, …) serait un plus.

Adresse d’emploi :
42 Av. Gaspard Coriolis, 31100 Toulouse

Document attaché : 202410040756_Fiche-proposition-PFE_IENM_IA_2025.pdf

Deep Generative Models for Next-Generation Search and Recommendation

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Criteo AI Lab Paris / Sorbonne Universite
Durée : 36 mois
Contact : patrick.gallinari@sorbonne-universite.fr
Date limite de publication : 2025-01-15

Contexte :
New paradigms like Generative Information Retrieval (GenIR) and Generative Recommendation (GenREC), built on foundation models, aim to transform how information is accessed. GenIR combines all components of traditional IR systems into one model that generates responses directly from user queries, while GenREC does something similar for recommendations. The goal of this PhD project is to explore the convergence of generative models for search, recommendation and related downstream tasks.

Sujet :
A first step will be to develop a unified generative engine for both search and recommendation, allowing for seamless alternation between the two modes during interactive sessions using a single engine. This is also a step toward realizing foundation models that offer a variety of functions to enhance user interactions. The second step will involve adapting this model to the large-scale, dynamic corpora characteristic of recommendation systems in the adtech industry, which presents additional research challenges. A brief description of the two directions is provided below.

Task 1: Unifying Generative IR and Recommendation

This task aims to develop a unified engine for search and recommendation, allowing for alternating between the two modes in interactive sessions. The goal is to enhance performance in both domains through a multi-task framework, enriching training data for both. While search and recommendation share similarities, they also have key differences, such as query intent. Search is driven by user queries, while recommendation relies on past user behavior. We aim to address these differences by defining a joint architecture and multi-task training strategy that captures the semantic distinctions between search (similarity-based) and recommendation (collaborative).

Task 2: Enhancing ID Associations for Large and Dynamic Collections

In this task, the goal is to improve document and item ID representations in large-scale, dynamic collections for a joint search/recommendation system. We will explore methods such as hierarchical structures and prior knowledge (e.g., product taxonomies) to optimize ID design. By leveraging additional information like brands or categorizations, we aim to improve the retrieval and recommendation process, particularly for large and evolving datasets.

Profil du candidat :
Computer science or applied mathematics. Good programming skills.

Formation et compétences requises :
Master degree in computer science or applied mathematics, Engineering school. Good background and experience in machine learning.

Adresse d’emploi :
Criteo AI Lab Paris

Document attaché : 202410031512_2024-09-PhD position-description-Generative-IR-Criteo.pdf