Apprentissage profond implicite de prior pour les problèmes inverses. Étude de cas en radioastronomie.

When:
30/06/2024 – 01/07/2024 all-day
2024-06-30T02:00:00+02:00
2024-07-01T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Laboratoire des Signaux et Systèmes
Durée : 3 ans
Contact : francois.orieux@l2s.centralesupelec.fr
Date limite de publication : 2024-06-30

Contexte :

Sujet :
https://pro.orieux.fr/assets/thesis-dnn-orieux-l2s.pdf

Contexte
========

Le traitement de mesures instrumentales nécessite souvent d’utiliser le modèle de données, ou modèle direct , dans la méthode. Par exemple les mesures sont affectées d’un bruit, d’un flou, ou vivent dans un autre espace que celui des inconnues (des coefficients de Fourier *versus* une image pour le cas de l’IRM ou de l’interférométrique).

Autant le modèle direct est stable et bien posé (à partir des paramètres on peut générer des données), autant le problème inverse est le plus souvent instable et mal-posé.

Le projet s’inscrit dans le cadre du projet international SKA, *Square Kilometer Array*. SKA est un observatoire pour la radioastronomie qui produira un volume de données considérable pour produire des images à une résolution spatiale et spectrale inégalées. Les antennes sont réparties en australie et en afrique du Sud, ce qui en fera le plus grand interféromètre radio à ce jour. L’équipe est impliquée dans le projet par le biais de l’ANR Dark-Era  et du LabCom ECLAT (ATOS, IETR, INRIA, …). Le travail se fera *en collaboration avec N. Gac du SATIE*, porteur de l’ANR Dark-Era, et qui apportera en outre son expertise sur l’adéquation algorithme-architecture pour les problèmes inverses.

Sujet
=====

Les techniques de résolution de problèmes inverses ont fortement évolué ces dernières années avec les nouvelles techniques d’apprentissage machine. On peut mentionner le déroulage d’algorithmes itératif (*unrolling*), les approches *plug-and-play*, le RED (*regularization by denoising*), ou encore les *a priori* basés donnés.

Le travail se déroulera en plusieurs temps.

– Tout d’abord, le doctorant devra faire un état de l’art sur les méthodes basées données et apprentissage statistique pour la résolution de problèmes inverses et se concentrer sur une nouvelle méthode d’apprentissage, l’*Implicit Deep Learning*.

– Ensuite il faudra, à partir de cette revue bibliographique, comprendre et mettre en œuvre les approches utilisant les réseaux génératifs comme les VAE ou encore les réseaux inversibles. Il s’agit d’une approche reposant sur la minimisation d’un critère mixte $$J(x) = | y – H x|_2^2 + R(x)$$ où le terme d’attache aux données utilise le modèle d’observation connu $H$ (flou, inpainting, debruitage…) et le terme de régularisation $R(x)$ est appris à partir de données. La solution est alors définie comme $$hat x = argmin_{xb} J(x) y.$$

– Il faudra identifier les apports et les limites de cette approche pour les problèmes inverses et proposer des résolutions possibles aux verroux rencontrés. On regardera notamment d’autres algorithme de point fixe que l’algorithme classique de descente de gradient.

– Nous nous attacherons à mettre en œuvre cette nouvelle méthode et les résultats devront être comparés aux résultats obtenus avec les approches classiques : filtre de Wiener, parcimonie…pour lesquels des codes sont à disposition.

– L’application sera sur un problème de synthèse de Fourier pour la radioastronomie dans le cadre de SKA.

– Le travail se fera sur un poste équipé d’une carte GPU Nvidia 3080 ou 4090 avec Linux, TensorFlow et Python ou le cluster de calcul Ruche de l’Université Paris-Saclay.

Ce travail propose des innovations sur deux plans, à la fois méthodologique sur l’utilisation de l’apprentissage pour les problèmes inverses, mais également sur la proposition de nouveaux algorithmes plus performants pour la synthèse de Fourier en radioastronomie. La perspective d’avoir des algorithmes plus rapides grâce à l’*unrolling* pour le traitement de données massives issues de SKA est un enjeu important.

Profil — compétences acquises
==============================

Le candidat devra avoir une formation type ingénieur ou Master 2 en traitement du signal ou d’images, *data science* ou *machine learning*. Il devra posséder des connaissances en mathématiques appliquées ou en programmation. Des compétences en estimation et statistiques sera apprécié.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Laboratoire des Signaux et Systèmes
3 rue Joliot-Curie
91190 Gif-sur-Yvette

Document attaché : 202404041508_thesis-dnn-orieux-l2s.pdf