Modèle génératif pour les données de mobilité maritime

When:
31/12/2022 all-day
2022-12-31T01:00:00+01:00
2022-12-31T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : RoCED/– — –

Laboratoire/Entreprise : Ecole Navale
Durée : 48 mois
Contact : cyril.ray@ecole-navale.fr
Date limite de publication : 2022-12-31

Contexte :
La thèse s’effectuera au sein de l’équipe de recherche MoTIM de l’ecole navale dans l’objectif de contribuer au domaine du Traitement de l’Information Maritime issue de sources hétérogènes (données capteurs, signaux, images, vidéos, informations géographiques, données textuelles) à l’aide d’algorithme d’intelligence artificielle.

La personne recrutée assure une charge d ’enseignement
annuelle maximale de 96 heures sous forme de travaux pratiques (TP), travaux dirigés (TD) ou encadrement de projets. Ces interventions s’effectuent dans le cadre de la formation d’ingénieur des élèves-officiers de l’Ecole Navale (niveau L3, M1 et M2). Elles peuvent aussi concerner les masters soutenus par l’Ecole Navale (niveau M1 et M2).

Sujet :
La génération de données et de jeux données pseudo-synthétiques est utilisée pour un large éventail d’activités, notamment comme données de test pour de nouveaux outils ou algorithmes, pour la validation de modèles et dans la formation de modèles d’IA [1]. Plus récemment la génération de données synthétiques créées artificiellement plutôt que générées par des événements réels a pris un essor avec l’apparition de modèles génératifs. Les données synthétiques constituent un type d’augmentation de données pour lequel les « Generative Adversarial Nets (GAN) » [2] ont montré des performances prometteuses sur divers types de données. Dans le domaine maritime, le suivi et l’analyse des mobilités a été accéléré avec l’apparition du Système Automatiquement d’Identification (AIS) qui permet la localisation des navires équipés en temps-réel et à travers tous les océans. Les données produites sont des séries spatio-temporelles impactées par
des données manquantes, des problèmes d’intégrité issues des capteurs et/ou de la transmission, et des malv ers ations de
natures diverses telles que la falsification de localisation, de trajectoire ou encore d’identité [3]. Dans ce contexte,
l’objectif de cette thèse est d’aborder la génération de données synthétiques et l’annotation sémantique d e c e tte d o nné e.
Les travaux de thèse pourront s’articuler notamment au travers des objectifs suivants :
− Développer un modèle génératif pour les données de mobilités maritimes permettant de produire des jeux de données
− Évaluer la prise en compte de données hétérogènes complémentaires ; eg. État de la mer.
− Aborder la scénarisation / annotation des jeux de données et évaluer l’utilité et l’impact de techniques « classiques »
d’imputation de données pour aborder la variabilité de scénarios conçus.
− Considérer le problème de classification et de détection de nouveauté en simultanée, notamment pour la prise en
compte de données falsifiées.
− Évaluer les performances / généricité de la démarche en fonction de la localisation géographique des données
produites.

Ressources : La recherche sera essentiellement basée sur les données issues par le système AIS qui fournit la localisation
des navires sur le globe (~ 4 TO / an) ainsi que des informations nominatives [4]. La plateforme TIM (Traitement de
l’Information Maritime) dispose de stations de travail (24 à 112 threads, 64 à 578 Go RAM), un serveur GPU 8*Nvidia
A100, un serveur GPU 8* Nvidia V100.

[1] C. Iphar, A.-L. Jousselme, C. Ray, Pseudo-synthetic datasets in support to maritime surveillance algorithms
assessment, 12 pages, In proceedings of VERITA, 19ème Journées Francophones Extraction et Gestion des
Connaissances (EGC) 2019, RNTI, Marie-Christine Rousset, Lydia Boudjeloud-Assala (eds.), 22 Jan 2019, Metz, France
[2] I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, and Y. Bengio.
Generative adversarial nets. Advances in neural information processing systems, 27, 2014
[3] C. Iphar, B. Costé, A. Napoli, C. Ray, R. Devillers, Integrity and Trust of Geographic Information, Chapter 4, pages
45-72, Geographic Data Imperfection 1: From Theory to Applications, Mireille Batton-Hubert, Eric Desjardin and
François Pinet (eds.), ISTE éditions, August 2019
[4] C. Ray, R. Dréo, E. Camossi, A.-L. Jousselme, C. Iphar, Heterogeneous Integrated Dataset for Maritime Intelligence,
Surveillance, and Reconnaissance, Data in Brief, Elsevier, 17 pages, Volume 25, August 2019

Profil du candidat :
Master (ou équivalent) en informatique.

Formation et compétences requises :
bonne connaissance des outils et des modèles de base de l’Intelligence Artificielle (apprentissage automatique / profond, etc.) et des techniques de représentation et de traitement de données (géographiques) hétérogènes (corrélation de données, analyse de séries temporelles, imputation de données, etc.)

Intérêt pour l’enseignement.

Adresse d’emploi :
Ecole Navale
Lanveoc
France

Document attaché : 202211090956_FDP_2022_DFS_DDR_AER_IA.pdf