Un système de recommandation basé sur l’apprentissage profond et les ontologies

When:
05/01/2020 – 06/01/2020 all-day
2020-01-05T01:00:00+01:00
2020-01-06T01:00:00+01:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : AUF, direction du numérique, CY Cergy Paris Université, site de Gennevilliers, ZAC des Barbanniers, Avenue Marcel Paul, 92230 GENNEVILLIERS, et Laboratoire ETIS, équipe MIDI team, CY Cergy Paris Université, 2 avenue Adolphe-Chauvin BP 222, 95302 Cergy-Pontoise cedex
Durée : 6 mois
Contact : claudia.marinica@ensea.fr
Date limite de publication : 01/05/2020

Contexte :
La bibliothèque numérique de l’espace académique francophone (B-NEUF) développé par l’AUF (1) souhaite identifier, catégoriser et indexer les ressources numériques éducationnelles, scientifiques, culturelles, documentaires publiés dans l’espace francophone (10 000 000 en 2019), (2) propose un atlas international des experts francophones (20 000 en 2019), (3) propose un réseau social pour le travail collaboratif, et (4) fournit une visualisation dynamique des relations inter-entités. Etant donné le grand volume de données disponible (ressources numériques ou experts), il est nécessaire de fournir à l’utilisateur un moyen efficace pour trouver rapidement une ressource qui pourrait l’intéresser.
Les systèmes de recommandation (RS) ont reçu beaucoup d’intérêt dans la littérature, mais les approches proposées traitent à la fois des types de données et de ressources limités. Par exemple, Amazon recommande des produits à un acheteur via les produits commandés en même temps que certains produits qui intéressent l’acheteur. La différence entre ce projet et les approches existantes est la complexité et la diversité des données disponibles dans la B-NEUF de l’AUF, et, de plus, la diversité d’utilisateurs. Ces conclusions nous ont amené des questionnements, parmi lequel comment les différentes données et la diversité des utilisateurs infèrent dans le RS ? En répondant à ces questions, dans ce projet, le principal objectif est de construire un module additionnel au sein du B-NUF comme un système de recommandation afin de suggérer des ressources à l’utilisateur.

Sujet :
Objectifs scientifiques :
Le service B-NEUF regroupe des ressources comme des données complexes : (1) un ensemble de documents distribués sur le réseau dans des formats différents et avec des utilisations diverses : des cours, des tutoriels, des auto-évaluations, des rapports techniques, des publications scientifiques ; (2) un atlas international des experts francophones décrits à travers leur expertise, etc. ; (3) un ensemble de données à partir du réseau social des utilisateurs. De plus, les utilisateurs B-NEUF sont différents avec des intérêts variés : des professeurs/chercheurs qui publient/cherchent des productions pédagogiques/scientifiques, des étudiants qui ont accès à des différentes et nombreuses ressources, les directeurs/présidents d’institut qui peut publier du matériel de promotion et des productions relatifs à son institut, mais aussi qui évaluent l’utilisation de leurs ressources, les institutions gouvernementales qui analysent les échanges.
Dans ce contexte, et étant donné les données complexes disponibles, les objectifs scientifiques sont :
(1) Construire une ontologie représentant les connaissances de l’utilisateur du système. A cette fin, on propose d’extraire les plus signifiants termes à partir de documents l’utilisateur a consulté, de déterminer la catégorie de chaque personne que l’utilisateur a interagit avec, and d’extraire les intérêts de l’utilisateur à partir du réseau social. On peut imaginer d’utiliser des techniques de fouilles d’itemets fréquents afin de construire le profil de l’utilisateur. On peut noter que l’ontologie est différente en fonction de l’utilisateur et différents types d’utilisateur existent dans le système comme vu ci-dessus.
(2) Construire un système de recommandation intégrant une ontologie et utilisant des méthodes d’apprentissage profond. A cette fin, nous devons comprendre comment nous pouvons modéliser le processus d’apprentissage profond afin d’intégrer l’ontologie. A cette fin, nous devons évaluer si un nouveau système de recommandation hybride pourrait être une combinaison d’outils de recommandation basés sur les ontologies et du filtrage collaboratif. De plus, nous devons modéliser le classement des résultats pendant la mise ensemble des deux éléments précédents.

Objectifs du stage :
Le stage s’intéresse aux points suivants :
Tâche 1 : Etat de l’art. Dans cette tâche l’étudiant devrait investiguer les domaines de recherche des systèmes de recommandation, des RS basés sur les ontologies, ou les RS basés sur les techniques d’apprentissage profond.
Tâche 2 : Construire une ontologie. Dans cette tâche, l’étudiant devrait proposer un premier modèle d’une ontologie d’un utilisateur.
Tâche 3 : Construire un Système de Recommandation. Dans cette tâche, l’étudiant devrait proposer un premier modèle de système de recommandation.

Profil du candidat :
Etudiant Master 2 en Sciences de Données avec des connaissances d’apprentissage automatique, systèmes de recommandation, web sémantique.

Formation et compétences requises :
Etudiant Master 2 en Sciences de Données avec des connaissances d’apprentissage automatique, systèmes de recommandation, web sémantique.

Adresse d’emploi :
AUF, direction du numérique, CY Cergy Paris Université, site de Gennevilliers, ZAC des Barbanniers, Avenue Marcel Paul, 92230 GENNEVILLIERS

Document attaché : sujet_stage_eng-fr.pdf