Évaluation de l’impact environnemental des méthodes de traitement automatique de la langue

When:
30/01/2021 – 31/01/2021 all-day
2021-01-30T01:00:00+01:00
2021-01-31T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISN
Durée : 5 mois
Contact : anne-laure.ligozat@universite-paris-saclay.fr
Date limite de publication : 2021-01-30

Contexte :
De nombreux travaux en Traitement Automatique de la Langue (TAL) s’appuient sur des méthodes d’apprentissage. Ainsi, l’apprentissage profond offre des performances souvent intéressantes pour de nombreuses tâches d’analyse de textes. L’essor récent des méthodes neuronales donne lieu à une utilisation croissante de ressources numériques pour un large éventail de problèmes. Dans ce contexte, les méthodes symboliques ou méthodes d’apprentissage “classiques” sont délaissées alors qu’une comparaison systématique serait intéressante du point de vue scientifique, opérationnel et environnemental. En particulier, les méthodes neuronales ont un impact environnemental élevé qui ne cesse d’augmenter avec les années (Schwartz et al., 2019). Un exemple de travail pertinent en traitement automatique des langues est (Strubell et al., 2019), qui a étudié la consommation énergétique de l’apprentissage de plusieurs modèles. (Schwartz et al., 2019) prône donc l’émergence de travaux de Green AI, en parallèle de travaux standards, dans lesquels l’efficience des méthodes serait mise en valeur, c’est-à-dire la capacité à obtenir une performance avec un minimum de ressources.

Sujet :
Ce projet a pour objectif à long terme de proposer une comparaison détaillée de l’utilisation d’un large panel de méthodes de traitement automatique de la langue du point de vue de leur performance, de leur complexité algorithmique, du temps humain et machine requis pour les mettre en oeuvre.
Dans un premier temps, il s’agira de réaliser une revue systématique des outils de mesure de l’impact environnemental des expériences informatiques. Une veille de la littérature récente montre que divers outils existent afin d’estimer l’impact des expériences informatiques. On recense notamment des outils en ligne comme par exemple, Green Algorithms (http://www.green-algorithms.org/) et ML CO2 impact (https://mlco2.github.io/impact/) ou des outils à intégrer dans la mise en oeuvre des expériences, par exemple, “experiment impact tracker” (Henderson et al., 2020) et “carbon tracker” (Anthony et al., 2020). Nous souhaitons recenser systématiquement les outils existant et les étudier afin de déterminer les mesures d’impact calculées, la facilité de mise en oeuvre, la portée d’utilisation possible.

Profil du candidat :
M2 ou école d’ingénieur en fin d’études, avec spécialisation en informatique

Formation et compétences requises :
Le.a stagiaire devra avoir de bonnes compétences en informatique. Des connaissances en traitement automatique de la langue seront particulièrement appréciées. Le contenu et l’ambition du stage pourront être modulés en fonction du niveau d’étude et de la durée du stage du/de la candidat.e.

Adresse d’emploi :
rue du Belvédère, Orsay

Document attaché : 202012011258_StageM2_GreenNLP2020_FR.pdf