Post-Doc – Fouille de motifs fréquents pour l’analyse de comportement touristique circulatoire

When:
12/07/2023 all-day
2023-07-12T02:00:00+02:00
2023-07-12T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : DVRC/ESILV
Durée : 12 mois
Contact : nicolas.travers@devinci.fr
Date limite de publication : 2023-07-12

Contexte :
L’appréciation des visites effectuées par les touristes est un enjeu majeur dans le monde du tourisme afin d’anticiper les évolutions de tendances, mais aussi la manière dont ils circulent sur le territoire. Une approche permettant d’estimer cette appréciation est de reposer sur l’extraction de motifs fréquents sur un graphe de circulation, comme l’extraction de Graphlet [1], k-decomposition [2], ou encore les structures cohésives comme les k-plex [6]. Ainsi, les tendances touristiques sont extraites grâce à leurs fréquences d’apparition de manière topologique.
Toutefois, les données touristiques provenant de sites prescripteurs d’expérience, tels que TripAdvisor, donnent lieu à des volumes difficiles à intégrer dans les techniques traditionnelles de fouille de données. En effet, avec un grand nombre de lieux visité (millions), et un nombre énorme de commentaires laissés par les utilisateurs (milliards), il est nécessaire de développer une nouvelle approche pour le passage à l’échelle d’algorithmes basés sur les graphes. De plus, la compréhension du territoire se fait également par l’analyse du graphe à plusieurs échelles.

Sujet :
Pour ce faire, au sein du groupe digital du DVRC, nous travaillons sur le développement en Pregel [3] de différentes approches existantes pour pouvoir définir la meilleure stratégie de fouille de motifs tout en les adaptant à des problématiques de résumer de graphes à différentes échelles. De plus, l’aspect géodésique des données est un facteur important lié à la topologie des données [4, 5, 7], tout autant que la fréquentation. Nous étudions donc l’adaptation des méthodes existantes pour améliorer l’efficacité de la fouille de motifs basée sur ces informations [8, 9, 10, 11].
Ce postdoctorat est financé grâce à un projet lié à la Métropole Européenne de Lille (MEL2). Dans ce cadre, nous collaborons avec la Métropole et l’ADULM pour les questions métiers, mais surtout avec le laboratoire EIREST de Panthéon-Sorbonne sur la recherche en géographie liée au tourisme. Un autre postdoctorant sur ces aspects a déjà débuté ses travaux et sera en interaction avec le candidat. Le but étant d’apporter de la transdisciplinarité dans ces travaux en intégrant les questions métiers du tourisme au sein même des stratégies de fouille de motifs. Nous accorderons aussi une importance à l’interprétation des résultats pour traduire les motifs pour la compréhension des comportements touristiques sur le territoire Lillois. Pour finir, les données pourront être complétées avec des informations multidimensionnelles disponibles au sein du projet MEL2 (Booking, Airbnb, Observatoire du tourisme à la MEL, etc.).
Le but de ce postdoc est donc multiple :
– Intégrer des méthodes de fouille de motifs dans une base de données Neo4j (en Pregel/Java) ;
– Améliorer une méthode pour donner une heuristique de fouille adaptée au contexte géodésique ; – Traduction des motifs fréquents sur un comportement touristique à différentes échelles ;
– Développement sur la plateforme eKhonsou avec données multidimensionnelles.

Profil du candidat :
Niveau Doctorat en informatique.

Formation et compétences requises :
Connaissances en bases de données, Data Mining, BD graph (Neo4j, Cypher), Java programmation répartie, node.js.

Adresse d’emploi :
Laboratoire de recherche De Vinci Research Center au sein de l’École Supérieure d’Ingénieurs Léonard de Vinci ; Paris, la Défense.

Document attaché : 202305151624_2023_PostDoc_GraphMining.pdf