Stage M2 au LIFO Orléans – IA et Education

When:
10/01/2022 – 11/01/2022 all-day
2022-01-10T01:00:00+01:00
2022-01-11T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFO – Orléans
Durée : 5 mois
Contact : guillaume.cleuziou@univ-orleans.fr
Date limite de publication : 2022-01-10

Contexte :
Améliorer l’efficacité pédagogique des plateformes d’entraînement à la programmation est une problématique en pleine effervescence qui nécessite de construire des représentations fines et exploitables des programmes d’apprenants. Nous nous intéresserons dans ce stage à l’apprentissage de représentations (ou embeddings) de programmes à des fins pédagogiques.

Sujet :
L’apprentissage d’embeddings de programmes consiste à apprendre une représentation riche et condensée d’un programmes informatique sous forme d’un vecteur numérique de faible dimension. Il existe différentes stratégies d’apprentissage d’embeddings de programmes selon que l’on considère d’une part des méthodes supervisées ou non-supervisées et d’autre part selon la nature de la (ou des) représentation(s) primaire(s) exploitée(s) (séquence textuelle du code, arbre syntaxique abstrait, traces de variables, traces d’exécution, etc.).

L’objet de ce stage sera de réaliser une étude comparative des approches supervisées et non-supervisées parmi ces méthodes. En particulier nous nous intéresserons d’une part à l’approche code2vec (Alon et al., 2019) qui exploite de manière supervisée les arbres syntaxiques abstraits (AST) des programmes et d’autre part à l’approche code2aes2vec (Cleuziou&Flouvat, 2021) qui génère de façon non-supervisée des embeddings de programmes à partir de l’analyse conjointe des AST et des traces d’exécution des programmes.

Références.

Alon, U., M. Zilberstein, O. Levy & E. Yahav (2019). code2vec : Learning distributed repre-sentations of code. Proceedings of the ACM on Programming Languages 3(POPL), 1–29.

Cleuziou, G. & F. Flouvat (2021). Learning student program embeddings using abstract execution traces, in 14th International Conference on Educational Data Mining. Paris, France, Pp. 252-262. 06. 2021.

Wang, K., R. Singh, and Z. Su (2018). Dynamic neural program embeddings for program repair. In International Conference on Learning Representations (ICLR’2018).

Profil du candidat :
Étudiant en master et/ou en école d’ingénieur en Mathématiques/Informatique. Une expérience en Machine Learning et un intérêt pour l’analyse de données d’éducation seraient un plus.

Formation et compétences requises :
Étudiant en master et/ou en école d’ingénieur en Mathématiques/Informatique. Une expérience en Machine Learning et un intérêt pour l’analyse de données d’éducation seraient un plus.

Adresse d’emploi :
LIFO – Université d’Orléans

Document attaché : 202112060829_Annonce_StageM2_EDM_LIFO-LIFAT.pdf