Extraction et enrichissement de contenu multimodal – Application au cas des manuels scolaires

When:
23/10/2022 – 24/10/2022 all-day
2022-10-23T02:00:00+02:00
2022-10-24T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire CEDRIC du CNAM à Paris et Laboratoire
Durée : 36 mois
Contact : guinaudeau@limsi.fr
Date limite de publication : 2022-10-23

Contexte :
Le projet ANR MALIN a pour objectif de rendre utilisables les manuels scolaires numériques par les enfants en situation de handicap. En effet, les manuels numériques actuellement disponibles nécessitent d’être adaptés pour être accessibles à ces enfants. Ces adaptations concernent aussi bien les aspects techniques que pédagogiques. Dans la plupart des cas, les manuels sont adaptés de façon artisanale et les délais de livraison peuvent être de plusieurs mois. Ces contraintes ne permettent pas de rendre efficiente l’inclusion scolaire des enfants en situation de handicap. L’objectif du projet ANR MALIN est donc de développer des solutions techniques afin d’aboutir à l’automatisation de l’adaptation des manuels scolaires numériques pour les rendre accessibles (accès, traitement et interaction avec les contenus) aux élèves en situation de handicap.
Le projet ANR repose sur une collaboration entre quatre laboratoires : LISN (Université Paris Saclay), MICS (Ecole CentraleSupelec), CEDRIC (CNAM), Inserm 1284 (CRI, Université de Paris). Le doctorant ou la doctorante travaillera en interaction avec des stagiaires de master, des ingénieurs et un autre doctorant associés au projet.

Sujet :
Le premier objectif est de concevoir des approches d’extraction automatique de la structure d’un manuel (leçons, blocs d’exercices [eux-mêmes composés de consignes, enoncés, exemples…], memo, synthèse…) et de son contenu multimédia (textes, images, dessins, graphiques, équations, courbes…) à partir des fichiers fournis par les éditeurs (ceux-ci sont le plus souvent au format pdf). Plusieurs approches seront à envisager : une approche d’adaptation et d’enrichissement de systèmes de structuration automatique de documents textuels (segmentation thématique, segmentation discursive) prenant en compte la spécificité et la multi-modalité des données traitées et une approche basée sur le traitement automatique des images visant à identifier les différents blocs en se basant sur les caractéristiques de l’image, connue sous le nom de « Document Layout Segmentation and Analysis » [1, 2]. Des approches récentes d’apprentissage profond seront testées sur des jeux de données annotées manuellement afin d’adapter des modèles existants et obtenir des résultats d’extraction satisfaisants.

Le second objectif est d’analyser le contenu de chaque bloc extrait dans l’étape précédente afin de les catégoriser en activités pédagogiques. Ainsi pour chaque exercice, il faudra déterminer quelle(s) activité(s) pédagogique(s) devra(ont) être mise(s) en œuvre pour le réaliser. Dans cet objectif, le doctorant ou la doctorante devra développer des techniques d’apprentissage spécifiques novatrices, supervisées ou non, à la rencontre entre le traitement du langage naturel et la linguistique d’une part et l’analyse de données multimédia d’autre part [3, 4]. Dans ce cas, les modalités visuelles et textuelles seront représentées dans un espace commun pour effectuer une classification multimodale. L’une des pistes à explorer consiste à employer des modèles appris sur des données et des problématiques similaires en français et de travailler sur l’adaptation (fine-tuning) de ces modèles à partir d’un petit jeu de données annotées [5, 6, 7].

Profil du candidat :
● Master en informatique ou TAL avec une spécialisation dans au moins un des domaines suivants :
○ traitement automatique des langues
○ apprentissage automatique

Formation et compétences requises :
● Maîtrise de Python (langage de prédilection du projet)
La connaissance des principales librairies d’apprentissage sera appréciée.

Adresse d’emploi :
Laboratoire CEDRIC du CNAM à Paris et Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) à Orsay

Document attaché : 202206230848_SujetThèseMALIN.pdf