Estimation de l’uplift dans les systèmes de recommandation d’offres

When:
31/08/2023 all-day
2023-08-31T02:00:00+02:00
2023-08-31T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Innovation Orange (Lannion) et GREYC CNRS UMR 6072
Durée : 3 ans
Contact : bruno.cremilleux@unicaen.fr
Date limite de publication : 2023-08-31

Contexte :
Pour candidater :
déposer votre candidature à
https://orange.jobs/jobs/v3/offers/124860?lang=fr

Les systèmes de recommandation d’offres tels que les NBO (Next Best Offer) sont de plus en plus courants dans les entreprises comme Orange qui cherchent à améliorer leurs relations avec les usagers de leurs services. On propose aux clients ou visiteurs une action personnalisée en fonction de leurs profils et de leurs préférences. Cependant, le traitement personnalisé en recommandant une offre sur ces critères ne suffit pas toujours à satisfaire un client. Il est donc important pour les entreprises de mesurer l’uplift [1], c’est-à-dire la différence de revenu ou de satisfaction entre les choix que le client aurait effectué sans recommandation et ceux qu’il effectue avec recommandation. Le défi des systèmes de recommandation d’offres est donc de trouver des algorithmes pour mesurer l’uplift et estimer des politiques du système de recommandation efficaces. Le choix de la mesure d’uplift et de la modélisation de la politique du système est un enjeu important pour maximiser l’impact des actions. Une difficulté intrinsèque de l’uplift est qu’on ne peut pas faire un traitement et un non-traitement pour un même individu. Ce qui implique que l’uplift ne peut pas être mesuré directement pour un individu mais uniquement pour un groupe d’individus, ce qu’on appelle le CATE (Conditional Average Treatment Effect). Hors la mesure du CATE dans un système ou les profils changent selon le traitement que l’on veut faire devient difficile à estimer [4]. De plus, les biais entre les données issues de différents traitements biaisent la mesure de CATE. La littérature propose différentes approches pour résoudre ce problème. Certaines visent à débiaiser les données et utiliser un estimateur robuste [2] et d’autres à utiliser directement les approches causales [5].

Sujet :
L’objectif de la thèse consiste à proposer de nouvelles métriques d’évaluation et des méthodes de modélisation pour l’uplift dans un système de recommandation d’offres. Les défis principaux défis sont l’évaluation de l’uplift dans un système de recommandation et l’apprentissage de politique de recommandation optimisant l’uplift dans un contexte de données biaisées. On s’intéressera en particulier aux approches causales [3, 5] et approche bayésienne connues [2] pour leur robustesse.

[1] Sato Masahiro et al. “Uplift-based evaluation and optimization of recommenders”, proceedings of the 13th ACM Conference on Recommender Systems, 2019.
[2] Rafla Mina, et al. “A Non-Parametric Bayesian Approach for Uplift Discretization and Feature Selection”, ECML PKDD 2022.
[3] Verlelst Théo et al. “Partial counterfactual identification and uplift modeling: theoretical results and real-world assessment”, Machine Learning, 2023, p. 1-25.
[4] Qian Xufeng et al. “Intelligent Request Strategy Design in Recommender System”, proceedings of the 28th ACM SIGKDD 2022.
[5] Bang Heejung et Robins James M. “Doubly robust estimation in missing data and causal inference models”, Biometrics, 2005.

Profil du candidat :
Le profil souhaité est BAC + 5, école d’ingénieur ou Master Recherche statistiques et/ou mathématiques appliquées et/ou data sciences.

Formation et compétences requises :
– la doctorante ou le doctorant devra avoir une bonne connaissance des statistiques et des mathématiques.
– des connaissances en apprentissage machine sont un réel plus.
– des compétences en programmation sont indispensables : maîtrise d’un langage de script dédié à l’analyse de données (Python, éventuellement R ou Matlab).
– une forte motivation, des capacités de synthèse, à bien rédiger et présenter les travaux (anglais) et à s’intégrer dans une équipe sont également demandées
– une expérience sous la forme d’un stage de recherche dans le domaine statistique/ apprentissage machine.

Adresse d’emploi :
Innovation Orange (Lannion) et laboratoire GREYC CNRS UMR 6072 (Caen)

Au sein de Innovation Orange, vous serez intégré(e) dans une équipe de recherche à la pointe de l’innovation et de l’expertise en Machine Learning travaillant sur diverses thématiques, comme par exemple les modèles génératifs, le traitement de séries temporelles, l’IA éthique et la modélisation de l’Uplift. Vous ferez partie d’un écosystème de recherche côtoyant les unités opérationnelles, ayant pour but de développer des algorithmes à la pointe et de les diffuser dans le groupe.

Sujet porteur permettant l’évolution vers les métiers de la recherche en apprentissage artificiel ou de la data-science

Valorisation des travaux via la collaboration au développement d’une librairie open source python sur la modélisation de l’uplift (Kuplift).

Salaire : Vous percevez une rémunération annuelle brute de 33 848 € en 1ère et 2ème année et de 38 480 € en troisième année.

Pour candidater :
déposer votre candidature à
https://orange.jobs/jobs/v3/offers/124860?lang=fr