Green CNN : Optimisation multi-objective des architectures de réseaux de neurones convolutifs pour maximiser leurs performances et réduire leur consommation d’énergie

When:
04/05/2024 – 05/05/2024 all-day
2024-05-04T02:00:00+02:00
2024-05-05T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LISTIC
Durée : 3 ans
Contact : Khadija.arfaoui@univ-smb.fr
Date limite de publication : 2024-05-04

Contexte :

Sujet :
La Recherche d’Architecture de Neurones (Neural Architecture Search ou NAS) a révolutionné l’apprentissage automatique en automatisant la conception des architectures neuronales, dépassant les méthodes d’apprentissage classiques sur des tâches telles que la classification d’images, la détection d’objets et la segmentation sémantique. En se situant dans le domaine de l’AutoML, le NAS présente un chevauchement avec l’optimisation des hyper-paramètres et l’apprentissage méta. Classées selon trois dimensions, les méthodes de NAS nécessitent une définition efficace de l’espace de recherche, des algorithmes de recherche avancés et des techniques d’évaluation appropriées. Les architectures de réseaux de neurones, en particulier les CNN, émergent comme prédominantes, mais leur performance est étroitement liée à la configuration de leurs paramètres, nécessitant une exploration systématique de l’espace paramétrique. Cependant, des défis matériels tels que la complexité computationnelle, la taille des modèles, l’hétérogénéité matérielle et la consommation d’énergie persistent. Dans ce contexte, les approches d’optimisation multi-objectifs des architectures de réseaux de neurones, visant à améliorer les performances tout en réduisant la consommation d’énergie, deviennent cruciales. Ce projet de thèse envisage d’explorer ces aspects en utilisant des approches évolutives pour évaluer l’impact des différentes configurations de paramètres et en se concentrant sur les architectures compactes pour réduire la consommation d’énergie des CNNs. La validation de ces travaux à travers des cas d’utilisation concrets avec des ensembles de données réels permettra de démontrer la pertinence et l’applicabilité des avancées dans le domaine de l’optimisation des architectures des réseaux de neurones pour les CNNs.

Profil du candidat :
Le candidat idéal pour ce sujet de thèse devrait posséder des connaissances approfondies en apprentissage automatique et en optimisation, avec une maîtrise des techniques telles que les algorithmes évolutionnaires et l’apprentissage par renforcement. Une solide expérience en programmation, en particulier avec des langages comme Python et des bibliothèques telles que TensorFlow ou PyTorch, est essentielle pour la mise en œuvre pratique des méthodes proposées. De plus, une compréhension approfondie des architectures de réseau de neurones, en particulier des CNN, ainsi que des hyper-paramètres associés et de leur impact sur les performances des modèles, est nécessaire. La capacité à travailler avec des ensembles de données réels et à analyser les résultats de manière statistiquement significative est également importante. Enfin, une connaissance des défis matériels et de l’efficacité énergétique dans le contexte de l’implémentation des architectures de réseau de neurones serait un avantage.

Formation et compétences requises :

Adresse d’emploi :
LISTIC (Laboratoire d’Informatique, Systèmes, Traitement de l’Information et de la Connaissance), 5 Chem. de Bellevue, 74940 Annecy

Document attaché : 202404080618_sujet de thèse.pdf