Fouille de données/Machine Learning pour la prédiction du comportement de courses de bus

When:
31/03/2022 – 01/04/2022 all-day
2022-03-31T02:00:00+02:00
2022-04-01T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N, Polytech’Nantes
Durée : 12 mois
Contact : francois.queyroi@univ-nantes.fr
Date limite de publication : 2022-03-31

Contexte :
Ce contrat s’intègre dans le cadre du projet R&D Collaborative Pays de la Loire SIMULBUS. Ce projet implique les équipes DUKe et PSI du LS2N et les entreprises A1 Statistiques et TELLAE.

Le développement des technologies Big Data et la prolifération des données des réseaux de transports publics ont favorisé le développement de solutions pour l’analyse des temps de parcours et de la performance des réseaux. Les données de base sont celles fournies par les Systèmes d’Aide à l’Exploitation (SAE) des réseaux de transports publics. Les données plus précises spatialement ne sont pas exploitées. Le croisement des sources de données est de plus un élément absent de ces technologies qui s’appliquent à restituer une source de données sans faire le lien avec le contexte de ligne (voirie, contexte urbain, météo, etc). Enfin, ces technologies sont également déconnectées des approches de simulation et fournissent simplement des analyses sans pouvoir évaluer de nouveaux scénarios de gestion.
L’objectif du projet est de croiser des données variées en termes de format, structure ou représentation en termes de nature (données temporelles, déterminants géographiques, voirie, météo, etc.), mais également des données avec une hétérogénéité sémantique afin de créer de modèles riches expliquant avec fiabilité la ponctualité et la régularité d’une course.

Sujet :
Le ou la candidat(e) retenu(e) devra participer activement à la proposition et à l’implémentation d’une approche combinant la fouille de motifs séquentiels et les modèles de mélanges de régressions, intégrant des données variées, pour modéliser une course d’un bus et prédire son comportement. La validation des modèles obtenus sera réalisée en partie à l’aide de la simulation dans un processus itératif et incrémental. Les modèles développés dans ce travail seront testées sur des données de deux de réseaux de transports publics : SEMITAN exploitant du réseau de l’agglomération nantaise et RTM exploitant du réseau de la métropole de Marseille.

Le ou la candidat(e) retenu(e) participera aussi à la vie du projet :

– organisation des réunions,
– interactions avec les différents partenaires,
– participation à la rédaction des livrables du projet (rapport, publications scientifiques, etc.).

Au LS2N, DUKe, le.a post-doctorant.a sera encadré.e par Mounira Harzallah et François Queyroi, en collaboration avec Bruno Rivière de A1 Statistiques et Vincent Leblond de TELLAE.

Profil du candidat :
Doctorat en Informatique/Mathématiques, avec des compétences en fouille de données/machine learning. Une expérience en clustering à base de modèles et aspects temporels serait un vrai plus.

Calendrier: Début 01/01/2022 (durée 12 mois).

Formation et compétences requises :
Doctorat en Informatique/Mathématiques, avec des compétences en fouille de données/machine learning. Une expérience en clustering à base de modèles et aspects temporels serait un vrai plus.

Calendrier: Début 01/01/2022 (durée 12 mois).

Adresse d’emploi :
Polytech’Nantes – Site de la Chantrerie rue Christian Pauc BP 50609 44306 Nantes cedex 3

Document attaché : 202109061509_simulbus_offre_postdoc_2022.pdf