Généricité et explicabilité dans les systèmes de recommandation

When:

30/03/2019 – 31/03/2019 all-day

2019-03-30T01:00:00+01:00

2019-03-31T01:00:00+01:00

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LAMSADE (UMR CNRS), Université Paris-Dauphine
Durée : 3 ans
Contact : elsa.negre@dauphine.fr
Date limite de publication : 2019-03-30

Contexte :
Ce sujet est prioritaire pour une demande de bourse de thèse du ministère.

Candidatures : Les candidats intéressés sont invités à envoyer une lettre de motivation, un CV, un relevé de notes (Licence + Master) avec classements (Master 2 également, éventuellement partiel), le plus tôt possible, avant le 30 mars 2019. Une seconde sélection sera ensuite faite par l’école doctorale et le laboratoire sur la base d’une audition en mai 2019.

Sujet :
La recommandation peut se résumer par le problème d’estimation de scores pour des entités qui n’ont pas encore été vues/évaluées par un utilisateur. En effet, le nombre d’entités ainsi que le nombre d’utilisateurs du système peuvent être très importants ; il est, de ce fait, difficile que chaque utilisateur voit toutes les entités ou que chaque entité soit évaluée par tous les utilisateurs. Il est donc nécessaire d’estimer les scores pour les entités non encore évaluées. Cette évaluation est habituellement basée sur les scores donnés par un utilisateur à d’autres entités. Lorsqu’il est possible d’estimer les scores pour les entités non encore évaluées, les entités ayant les scores les plus élevés peuvent être recommandées à l’utilisateur.

Les systèmes de recommandation s’appliquent dans de nombreux domaines, que ce soit dans le cadre d’applications commerciales, industrielles ou académiques. En fait, parmi les systèmes de recommandation les plus connus, nous pouvons citer ceux utilisés dans le commerce électronique : Amazon.com pour la recommandation de produits et Netflix pour la recommandation de films.
Mais de nos jours, de nombreux systèmes que nous utilisons tous les jours proposent des recommandations à leurs utilisateurs (des groupes de travail ou des individus dans LinkedIn, des amis sur Facebook, de la musique pour last.fm ou des nouvelles pour Forbes.com). Les systèmes de recommandation existants diffèrent donc par leur portée, leur contexte d’application ainsi que par les données qu’ils manipulent. Mais ils ont également de nombreux points communs : (i) le besoin : aider à la prise de décision ; (ii) l’objectif de recommander des éléments/utilisateurs ; (iii) la formalisation : la fameuse matrice d’utilité ; (iv) l’algorithme : prédire les scores. Pourtant, malgré leurs similitudes, les systèmes de recommandation existants sont spécifiques à une application et sont développés/mis en œuvre via des cadres ad hoc.
Or, les systèmes de recommandation, comme tout système informatisé, sont régis par les principes de l’ingénierie et de la qualité logicielle. Le génie logiciel repose sur sept principes : la rigueur, la décomposition en sous-problèmes, la modularité, l’abstraction, l’anticipation des évolutions, la généricité (selon laquelle un système réutilisable/adaptable a beaucoup plus de valeur qu’un système dédié) et une construction incrémentale. De plus, la norme ISO 9126 définit six groupes d’indicateurs de qualité logicielle : la capacité fonctionnelle, la facilité d’utilisation, la fiabilité, la performance, la maintenabilité et la portabilité. Actuellement, les systèmes de recommandation sont définis pour des cas d’application spécifiques, ce qui limite leur adaptabilité, leur réutilisabilité et leur généricité. Ainsi, la spécialisation des systèmes de recommandation va à l’encontre du principe de généricité et donc, de l’ingénierie et de la qualité logicielle. Par conséquent, tendre vers la généricité des systèmes de recommandation, c’est-à-dire un système de recommandation qui fonctionne quel que soit le cas d’application afin d’avoir un système adaptatif, avec un niveau d’abstraction, favorisant, entre autres, l’interopérabilité et la réutilisabilité est un enjeu important. Or, à notre connaissance, il n’existe pas, à ce jour, un tel système de recommandation.

Par ailleurs, l’interaction du système de recommandation avec l’utilisateur est importante. En général, les utilisateurs souhaitent avoir un contrôle sur les recommandations faites et pouvoir indiquer si une recommandation ne leur convient pas. Cette démarche s’inscrit dans la recherche de systèmes plus centrés sur l’utilisateur. De plus, le fait de donner une explication personnalisée à l’utilisateur peut également nous aider à gagner sa confiance. En effet, réussir à indiquer la raison pour laquelle une recommandation est proposée à l’utilisateur peut contribuer à améliorer la confiance qu’il a du système mais aussi, si l’utilisateur peut interagir avec le système de recommandation, améliorer le système lui-même en mettant en adéquation les raisons d’une telle recommandation et les raisons d’accord ou de refus de celle-ci par l’utilisateur. Des travaux se sont déjà intéressés à l’explication des recommandations. Cependant, nombre d’entre eux se limitent à afficher des valeurs numériques ou à donner une explication du type « Ceux qui ont acheté A ont aussi acheté B ». Être capable d’expliquer la recommandation soulève des problèmes tels qu’expliquer comment fonctionne le système de recommandation, permettre aux utilisateurs d’indiquer au système de recommandation que la recommandation ne convient pas, convaincre les utilisateurs de suivre la recommandation, améliorer la facilité d’utilisation. Une explication du type « Ce livre appartient à votre genre préféré : Thriller/Policier, il a obtenu une note moyenne de 4/5 auprès des autres utilisateurs et il est disponible à la librairie de votre quartier » pourrait être une meilleure explication. Or, à notre connaissance, il n’existe pas, à ce jour, un tel système de recommandation.

L’objectif principal de cette thèse est d’étudier la diversité des systèmes de recommandation, leurs points communs et différences (d’un point de vue algorithmique mais aussi applicatif) dans un contexte de grande masse de données en constante évolution, ainsi que de comprendre de tels systèmes dans leur contexte. Il s’agira ensuite de tendre vers un modèle de système générique de recommandation capable d’expliquer à l’utilisateur les recommandations retournées.

Profil du candidat :
Mots-clés : Systèmes de recommandation, Machine learning, Systèmes d’Informations.

Formation et compétences requises :
Niveau Bac+5 en Informatique, spécialisé en Machine learning

Adresse d’emploi :
Université Paris-Dauphine, Paris, France

Document attaché : Proposition_sujet_thèse1819_FR2.pdf

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Généricité et explicabilité dans les systèmes de recommandation