Fouille de motifs fréquents pour l’analyse de comportement touristique

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : DVRC/ESILV
Durée : 5 mois
Contact : nicolas.travers@devinci.fr
Date limite de publication : 2023-01-14

Contexte :
L’appréciation des visites effectuées par les touristes est un enjeu majeur dans le monde du tourisme afin d’anticiper les évolutions de tendances, mais aussi la manière dont ils circulent sur le territoire. Une approche permettant d’estimer cette appréciation est de reposer sur l’extraction de motifs fréquents sur un graphe de circulation, comme l’extraction de Graphlet [1], k-decomposition [2], ou encore les structures cohésives comme les k-plex [6]. Ainsi, les tendances touristiques sont extraites grâce à leurs fréquences d’apparition de manière topologique.

Sujet :
Toutefois, les données touristiques provenant de sites prescripteurs d’expérience tels que TripAdvisor donnent lieu à des volumes difficiles à intégrer dans les techniques traditionnelles de fouille de données. En effet, avec un grand nombre de lieux visité (millions), et un nombre énorme de commentaires laissés par les utilisateurs (milliards), il est nécessaire de développer une nouvelle approche pour le passage à l’échelle d’algorithmes basés sur les graphes.
Pour ce faire, au sein du groupe digital du DVRC, nous travaillons sur le développement en Pregel [3] de différentes approches existantes pour pouvoir définir la meilleure stratégie de fouille de motifs. De plus, l’aspect géodésique des données est un facteur important lié à la topologie des données [4, 5, 7], tout autant que la fréquentation. Nous étudions donc l’adaptation des méthodes existantes pour améliorer l’efficacité de la fouille de motifs basée sur ces informations.
Le but de ce stage est donc double :
– Intégrer des méthodes de fouille de motifs dans une base de données Neo4j (en Pregel/Java).
– Améliorer une méthode pour donner une heuristique de fouille adaptée au contexte géodésique.

Profil du candidat :
Étudiante ou étudiant de niveau M2 en informatique (Master ou école d’ingénieurs).
Connaissances en bases de données, Data Mining, BD graph (Neo4j, Cypher), Java, programmation répartie.

Formation et compétences requises :
Étudiante ou étudiant de niveau M2 en informatique (Master ou école d’ingénieurs).

Adresse d’emploi :
Laboratoire de recherche De Vinci Research Center au sein de l’École Supérieure d’Ingénieurs Léonard de Vinci ; Paris, la Défense.

Document attaché : 202301131702_2023_Stage_GraphMining.pdf

Professeur des universités en Intelligence Artificielle au Cnam Paris

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CEDRIC (EA4629)
Durée : indéterminée
Contact : michel.crucianu@cnam.fr
Date limite de publication : 2023-01-14

Contexte :
e Conservatoire national des arts et métiers (Cnam) est un établissement public à caractère scientifique, culturel et professionnel doté d’un statut de « grand établissement » régi par le décret du 22 avril 1988. C’est un établissement en réseau dont le siège est à Paris qui se caractérise par :
• des formations déployées sur l’ensemble des régions métropolitaines, dans les centres ultra-marins et à l’étranger,
• des activités de recherche académique , technologique et partenariale au sein d’équipes reconnues par le HCERES,
• sa mission de diffusion de la culture scientifique et technique (notamment via le musée des arts et métiers).
La diversité et la richesse des équipes du Cnam dotent l’établissement d’un large spectre de compétences, couvrant les champs professionnels allant des sciences de l’ingénieur.e aux domaines de l’économie, de la gestion et des sciences humaines et sociales.

Le laboratoire Cédric (http://cedric.cnam.fr) consacre ses recherches à l’informatique et aux communications, en particulier à la numérisation et l’automatisation des processus intelligents d’interaction, d’apprentissage, de raisonnement, de décision et d’action. Le Cédric développe des réponses sur trois axes : Systèmes communicants et interactifs ; Science des données ; Confiance et sécurité numérique. Chacune des huit équipes du Cédric contribue à l’animation et au développement des axes en fonction de son expertise scientifique.

Sujet :
La personne recrutée intégrera une des équipes suivantes de l’axe ‘Science des données’ :

• Vertigo (http://cedric.cnam.fr/lab/equipes/vertigo/, équipe prioritaire). L’équipe Vertigo s’est engagée dans la création d’interfaces transdisciplinaires au sein du Cnam ainsi qu’à l’extérieur autour de problématiques liées en particulier au couplage IA et physique, à la télédétection ou à l’imagerie médicale. Il est attendu que la personne recrutée puisse accompagner et alimenter cette dynamique en renforçant ou en créant des collaborations avec d’autres laboratoires de l’établissement.
• MSDMA (http://cedric.cnam.fr/lab/equipes/msdma/). Les activités de l’équipe concernent le traitement de données par des méthodes statistiques et informatiques.

L’équipe de rattachement pressentie doit être mentionnée dans la lettre de candidature. La personne recrutée devra jouer un rôle moteur dans le développement des recherches de l’une de ces équipes, notamment en apprentissage statistique, apprentissage profond (supervisé et non-supervisé) et/ou apprentissage par renforcement. Des compétences dans les domaines suivants seront particulièrement appréciées: extraction de représentations et de connaissances, explicabilité et interprétabilité des modèles IA, compréhension et raisonnement sur des données hétérogènes non-structurées.

Contacts :
• Samira Cherfi (samira.cherfi@cnam.fr), directrice de l’EPN 5 (département d’informatique)
• Philippe Rigaux (philippe.rigaux@cnam.fr), directeur du laboratoire
• Michel Crucianu (michel.crucianu@cnam.fr) pour l’équipe Vertigo
• Ndeye Niang (ndeye.niang_keita@cnam.fr) pour l’équipe MSDMA

Date de prise de poste : 1er septembre 2023.

Profil du candidat :
Profil détaillé : http://cedric.cnam.fr/lab/wp-content/uploads/2023/01/CnamParisPUIA2023.pdf

Formation et compétences requises :
Habilitation à Diriger des Recherches

Adresse d’emploi :
Conservatoire National des Arts et Métiers
292 rue Saint-Martin
75003 Paris

Post-doc : 3D+t reconstruction and segmentation from non-destructive imaging for grapevine trunk diseases diagnosis.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IFV – CIRAD
Durée : 3 years
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2023-01-14

Contexte :
Our research aims to develop imaging approaches for non-destructive detection and diagnosis of trunk diseases in grapevines (Vitis vinifera L.). Protocols [1] and methods [2][3] for 3D imaging and analysis of trunks under controlled conditions (i.e., laboratory) have already been developed in our lab. We now aim to transfer this non-destructive diagnosis directly into the field, using a portable device that can be used to detect and quantify these diseases. This transfer involves the development of novel solutions for data analysis (project “Scan Me If You Can”, 2023-2026). For this purpose, we seek a highly motivated and initiative-taking candidate, qualified for the conception of innovative image analysis pipelines.

Sujet :
Your mission will be to scale up different approaches to work across two work streams :

*Whole plant 3D+t reconstruction and segmentation from multi-angle X-ray images: You will be in charge of retrofitting models to allow the deployment of these solutions in the field, on a larger scale, and for temporal monitoring of tissue condition. In order to estimate the degradations present in the plant and their progression over time, you will design solutions for image analysis and 3D+t reconstruction applicable to 2D images collected in situ on living plants.

* 3D+t characterization of degradation by MRI monitoring under controlled conditions: You will build upon the developments of Fijiyama [1] and FijiRelax [3] plugins to analyze a large set of MRI data collected during the dynamic monitoring of living vines inoculated with fungal pathogens. You will design pipelines to study the host-pathogen interaction in 3D+t; and develop tools for the comparison of grapevine varieties tolerance, and pathogen aggressiveness.

BIBLIOGRAPHY:
[1] R Fernandez, L Le Cunff, S Mérigeaud, et.al. An end-to-end workflow based on multimodal 3D imaging and machine learning for nondestructive diagnosis of grapevine trunk diseases. bioRxiv preprint (BioRxiV 2022) https://doi.org/10.1101/2022.06.09.495457
[2] R Fernandez, and C Moisy, Fijiyama: a registration tool for 3D multimodal time-lapse imaging, Bioinformatics, Volume 37, Issue 10, 15 May 2021, Pages 1482–1484, https://doi.org/10.1093/bioinformatics/btaa846
[3] R Fernandez, and C Moisy: FijiRelax: Fast and noise-corrected estimation of MRI relaxation maps in 3D + t (under review in JOSS) current version: https://github.com/Rocsg/FijiRelax/actions/runs/3307397950

Profil du candidat :
* Titles/Diplomas: PhD or M.Sc. in computer science, mathematical modeling, image analysis, with a demonstrated capacity for publication in image analysis and/or design of solutions.

* Advanced skills in:
Image Analysis (3D reconstruction, segmentation).
Programming (Java and Python).
Machine Learning (scikit-learn, …) and Deep Learning (TF / Pytorch, …).
2D/3D image processing and visualization (Fiji, Napari, VTK, …).
Optional:
Basic knowledge in 3D imagery (X-rays tomography, MRI);
plant biology and anatomy; and/or pathogens.
French speaking.

* Aptitudes:
Interpersonal skills and ability to work with multiple stakeholders.
Autonomy in programming and image processing.
Organizational skills and rigor.
Adaptability and reactivity.
Ability to synthesize and pedagogy (interactions with non-specialists in image processing).
Scientific English.
Driving license.

Formation et compétences requises :
The selected candidate will work in interaction with two research teams located in Montpellier, France (at Campus Lavalette, 389 Av. Agropolis, 34980 Montferrier-sur-Lez, France). The team “GénoVigne”, IFV (French Institute for Vine and wine, www.vignevin.com), is specialized in grapevine genetics and diseases. The team “Phenomen”, CIRAD (French Agricultural Research Centre for International Development), is specialized in mathematics and computer science for plant modeling. The candidate will also interact with several scientific and technical partners, including INRAE, Montpellier University, CIVC Champagne and BIVB Bourgogne, as well as imaging platforms.
Remuneration: between 2.4 and 2.6KEUR, raw, monthly, depending on qualification.
Advantages: meal vouchers, paid holidays, and Health Mutual.

Adresse d’emploi :
Campus Lavalette, 389 Av. Agropolis, 34980 Montferrier-sur-Lez, France (Montpellier)

APPLICATION: Please, send CV, application letter, and references to romain.fernandez@cirad.fr and cedric.moisy@vignevin.com. Deadline: Applications will be reviewed until the position is filled. Position opening: Starting in January 2023.

Document attaché : 202301130937_Postdoc_position.pdf

Analyse des données environnementales

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT – Université de Tours
Durée : 5 à 6 mois
Contact : cyril.derunz@univ-tours.fr
Date limite de publication : 2023-02-04

Contexte :

Ce stage s’inscrit dans le cadre de la tâche visualisation de données du projet JUNON. Le sujet de la tâche est le suivant.

L’analyse des données environnementales est un enjeu majeur pour l’étude des dynamiques des phénomènes environnementaux dans leur territoire (spatialité). Afin de mieux appréhender ces phénomènes et faciliter leur observation, il semble important de fournir une suite automatisée de traitements allant de l’analyse au rendu visuel. Relever ce défi est essentiel afin de limiter la charge cognitive des experts impliqués dans l’exploration interactive tout en offrant des informations de contextualisation des phénomènes observés/observables pour une meilleure explicabilité.

Cette dernière est importante tant pour les experts que pour les décideurs notamment pour l’analyse des risques (e.g. sécheresse, inondations, pollutions). Il s’agira de proposer des outils visuels permettant une exploration spatiale et temporelle de données permettant de naviguer dans les données issues des capteurs (e.g. capteurs piézométriques) selon plusieurs vues complémentaires tout en ayant à disposition directe des données contextualisant leur analyse. Les outils proposeront aussi des tableaux de bords différenciés pour les décideurs mettant en évidence les possibles risques. Nous souhaitons dans cette tâche répondre aux verrous scientifiques liés aux données environnementales autour de la détection automatique de signaux faibles pour l’identification de phénomènes émergents, de l’explicabilité des phénomènes par la construction de résumés visuels informant sur les possibles facteurs, de la gestion des flux de données et donc le choix des données et des agrégations.

Sujet :
Les données à visualiser sont des séries temporelles multivariées géolocalisées décrivant un territoire. Elles peuvent représenter de gros volume de données. Nous cherchons à construire des méthodes de regroupement prenant en considération les relations spatiales et topologiques.

Objectifs du stage :

État de l’art sur la visualisation et le clustering de séries spatio-temporelles.

Proposition d’un prototype adapté aux données du projet JUNON.

Profil du candidat :
Etudiant.e en master ou en école d’ingénieur en informatique (bac +5 prioritairement, ou bac +4).

Formation et compétences requises :
Etudiant en master ou école d’ingénieur en informatique.
Des connaissances en visualisation, information géographique, analyse de série de données temporelles ou spatiotemporelles sont des plus.

Adresse d’emploi :
34 avenue Portalis, 37000 Tours
ou
3 place Jean Jaures 41000 Blois

Poste permanent en statistique à l’ISAE SUPAERO

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ISAE SUPAERO
Durée : permanent
Contact : florian.simatos@isae.fr
Date limite de publication : 2023-02-04

Contexte :
Recrutement d’un poste (niveau MCF ou PU, tous les niveaux seront considérés) à l’ISAE SUPAERO

Sujet :
Statistique mathématique et apprentissage

Profil du candidat :
Personne titulaire d’un doctorat en Mathématiques Appliquées, spécialisée en Statistique Mathématique ou dans un domaine connexe, et peut justifier d’un bon équilibre entre recherche fondamentale (théorique) et recherche appliquée (numérique). En particulier, des connaissances en algorithmes stochastiques seraient appréciées ;

Formation et compétences requises :
Personne titulaire d’un doctorat en Mathématiques Appliquées, spécialisée en Statistique Mathématique ou dans un domaine connexe, et peut justifier d’un bon équilibre entre recherche fondamentale (théorique) et recherche appliquée (numérique). En particulier, des connaissances en algorithmes stochastiques seraient appréciées ;

Adresse d’emploi :
12 avenue edouard belin, 31055 Toulouse

Document attaché : 202301121452_ISAE-906-stat.pdf

Deep Learning Meets Numerical Modelling AI and Biophysics for Computational Cardiology

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Epione research team, Inria Sophia Antipolis – Mé
Durée : 36 mois
Contact : maxime.sermesant@inria.fr
Date limite de publication : 2023-12-15

Contexte :
Clinical Context

Cardiac Arrhythmias are a major healthcare issue. For instance, atrial fibrillation (AF) is the most common cardiac arrhythmia, characterized by chaotic electrical activation of the atria, preventing synchronized contraction. More than 6 million Europeans suffer from it and age is the most powerful predictor of risk. Life-threatening complications and fast progression to persistent or permanent forms call for as early as possible diagnosis and effective treatment. Arrhythmias are often treated with anti-arrhythmic drugs, with limited efficacy and safety. Catheter ablation, an invasive procedure, is more effective. This procedure is by no means optimized, however, and arrhythmias may reoccur. The efficacy of first-time ablation may range from 30%-75% depending on the individual patient and disease, such that multiple ablation procedures may be recommended.

Deep learning context

AI and more precisely machine learning have obtained impressive results in several domains like vision, natural language processing, bioinformatics. However, this data intensive paradigm leads to model that often lack interpretability and robustness. Also, it does not allow an easy integration of prior knowledge available in many scientific fields. This can explain its difficult adoption in domains like healthcare. On the other hand, biophysical modelling of the human body is a well-posed mathematical framework to introduce physiology into predictive analysis of clinical data. Moreover, it provides a natural mechanistic framework to interpret results. However, there is often a large computational cost, even more when the quantification of uncertainty has to be performed. And it is sometimes difficult to circumvent model approximations. A major scientific challenge today consists in combining the versatility of data intensive approaches with the physically grounded modelling approaches developed in scientific fields like biophysics.

Sujet :

The scientific objective of this project is to combine the advantages of biophysics and machine learning, more specifically deep learning methods, and to develop hybrid models exploiting the complementarity of the two approaches. We propose to introduce physiological priors in learning systems through biophysical modelling by learning spatiotemporal dynamics from simulations and by introducing physically motivated constraints relative to these dynamics. The objective is to exploit optimally the large amounts of data available in this field together with well-known properties of biophysical cardiac dynamics. Besides, this would also enable us to propose a data-driven correction of biophysical model error. Finally, we will seek a principled integration of uncertainty quantification within this framework. This will encompass both uncertainty on the training data and in the prediction. The vast amount of knowledge in mathematical analysis and data assimilation will be leveraged to optimise the machine learning formulation and understanding.
This project will be done in collaboration with cardiologists and radiologists to access clinical databases in order to evaluate the proposed methods on diagnosis, therapy planning and prognosis for cardiac pathologies.

Profil du candidat :
Master in computer science or applied mathematics, Engineering school. Background and experience in machine learning. Good technical skills in programming. Eager to work in the medical field.

Formation et compétences requises :
Master in computer science or applied mathematics, Engineering school. Background and experience in machine learning. Good technical skills in programming. Eager to work in the medical field.

Adresse d’emploi :
Epione Research Project

Inria, Sophia Antipolis

2004 route des Lucioles BP 93

06 902 SOPHIA ANTIPOLIS Cedex

FRANCE

Document attaché : 202301120851_2023 – PhD_DeepNum-Cardiac-Electrophysiology.pdf

Conception et implémentation d’un lac de données de robotique agricole

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : INRAE – Unité TSCF, équipe ROMEA
Durée : 6 mois
Contact : sandro.bimonte@inrae.fr
Date limite de publication : 2023-12-15

Contexte :
Pour accompagner la transition agroécologique, les robots ont un rôle essentiel à jouer dans le domaine de l’agriculture intelligente. Ils sont capables d’effectuer des opérations agricoles répétitives et précises sur une longue période avec un faible impact sur l’environnement.

Avec des équipements particuliers, et associés à des technologies d’acquisition et de traitement de données, les robots sont capables d’effectuer de manière autonome des tâches ciblées de manière efficace dans les champs.

De nombreux travaux de recherche portent sur l’agriculture intelligente. Dans le cadre du projet ISITE CAP2025, une architecture Big Data a été conçue pour le traitement des données temps réel issues des robots et des capteurs (avec Apache Kafka et Spark), ainsi qu’une base de données relationnelle pour stocker ces données.

Dans ce travail de stage, nous visons à mettre en place un lac de données (data lake) pour le stockage et l’exploration des données sources.

Sujet :
En particulier le travail consiste à :

étudier et comparer les travaux existants sur les lac de données données spatiales : stockage et exploration

implémenter le système de stockage des données (ex. Apache Hadoop HDFS ou PostGIS)

concevoir un modèle de métadonnées et implémenter un système de métadonnées

implémenter un système d’exploration des données (ex. Apache Atlas, Open Metadata, Geonetwork, etc.)

Profil du candidat :
Master 2 en informatique ou équivalent

Formation et compétences requises :
Architectures big data
Gestion de données

Adresse d’emploi :
INRAE, Campus des Cézeaux, Aubière

Document attaché : 202301111441_M2 datalake.pdf

Ingénieur(e) conception, consolidation et prototypage – jumeaux numériques

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LASTIG
Durée : 3 ans (CDI très prob
Contact : clement.mallet@ign.fr
Date limite de publication : 2023-12-15

Contexte :
L’Unité Mixte de Recherche (UMR) LASTIG, sous la tutelle de l’IGN et de l’Université Gustave Eiffel, mène des recherches variées en sciences de l’information géographique pour la ville durable et les territoires
numériques. Il comporte plus de 60 membres, permanents et contractuels. Le LASTIG est confronté à des problématiques de recherche fondamentale et opérationnelle sur les sujets suivants :
— l’acquisition et le traitement de données massives et multimodales (équipe ACTE) ;
— la géovisualisation, l’interaction et l’immersion (équipe GEOVIS) ;
— la médiation et l’enrichissement de données géographiques (équipe MEIG) ;
— l’analyse de la dynamique spatio-temporelle des territoires (équipe STRUDEL).

Le Service Innovation Maturation Valorisation de l’IGN a pour but d’accompagner le transfert technologique entre recherche et production et entre l’IGN et ses partenaires. Les missions du service sont :
— l’animation de l’innovation au sein de l’IGN et aussi à destination des partenaires,
— la montée en maturité des codes de recherche vers les souches de production,
— la validation de méthodes, d’algorithmes et de technologies dans l’objectif d’aider à l’amélioration des souches de production,
— le maintien des plateformes d’innovation et leurs relations avec les plateformes de recherche (amont) et de développement (aval),
— la veille technologique et méthodologique

La constitution d’un Jumeau Numérique National (JNN) est un projet ambitieux de l’IGN qui vise entre autres la cartographie précise en 3D de l’ensemble du territoire français pour de multiples usages : développement durable, gestion énergétique, urbanisme, sécurité, smart city, gestion des réseaux enterrés, tourisme… Cette cartographie 3D s’appuiera sur l’intégration de données d’acquisition multicapteur (image/LiDAR) et multiplateforme (aérien/terrestre fixe et mobile), de données topographiques et de données thématiques multi-sources, multi-dimensionnelles et multi-échelles (pays, région, département, ville, quartier, rue, bâtiment). Il met en jeu des problématiques de recalage, de reconstruction de maillages et d’objets structurés, de texturation et de sémantisation, par des approches automatiques ou semi-automatiques interactives, de détection de changement et de mise à jour, tout en visant un passage à l’échelle sur des données de plus en plus massives et de plus en plus précises.

Sujet :
L’ENSG souhaite recruter un·e ingénieur·e dont l’objectif principal sera de développer des méthodes et des outils sur ces problématiques de cartographie 3D à large échelle, en se reposant sur des travaux du LASTIG en recalage, en reconstruction automatique ou semi-automatique (interactive) de modèles de ville 3D+T (c’est à dire incluant les problématiques de détection de changements et de mise à
jour), en structuration pour leur diffusion dans une visualisation interactive. Il s’agira ainsi de participer au développement d’outils et de faciliter la consolidation et le prototypage de méthodes produites par des membres du laboratoire LASTIG pour répondre à des besoins exprimés par l’IGN, ses tutelles, ses partenaires, ainsi que les collaborateurs du LASTIG.

Les missions principales de la personne recrutée seront de :
— Contribuer au développement des méthodes et des outils pour la reconstruction et la visualisation interactive du jumeau numérique national ;
— Participer à la capitalisation sur les travaux et le code produits lors de projets, thèses, stages après la fin de ceux-ci ou lors de leur dernière phase, et en lien avec les missions du poste ;
— Participer à la valorisation des activités de recherche (y compris publications) ;
— Développer des prototypes et participer aux activités d’innovation de l’IGN utilisant les recherches du LASTIG ;
— Participer aux enseignements de l’ENSG ;

En particulier, la personne recrutée contribuera à 3 axes du projet de Jumeau Numérique National :
1. L’axe 1 consistera à concevoir, prototyper et consolider des méthodes en acquisition et en modélisation automatique ou interactive fondées sur des données LiDAR HD et des données
PCRS (Plan de Corps de Rue Simplifié : imagerie aérienne très haute résolution, 5cm ou mieux) pour une reconstruction fine des différents thèmes du Jumeau numérique (bâtiments, végétation, réseaux, ouvrages d’art,…), et à travailler à l’intégration de données multi-sources et multi-échelles adaptées à des usages multiples (visualisation, concertation, simulation, …).
2. L’axe 2 consistera à concevoir, prototyper et consolider des méthodes d’analyse de données multi dates pour s’assurer que le Jumeau Numérique National reste fidèle à l’évolution temporelle du
territoire en s’intéressant en particulier à la détection de changements et à la mise à jour à partir de sources de données diverses (données d’acquisition, autres bases de données).
3. L’axe 3 consistera à concevoir, prototyper et consolider des méthodes de structuration 3D+T de données et de méta-données d’acquisition possiblement multi-sources : aérien (notamment images PCRS ou LiDAR HD) et terrestre (cartographie mobile et fixe) : entrepôt de données hétérogènes, recalage, diffusion pour la visualisation, la saisie interactive et la réalité augmentée.

Profil du candidat :
L’ENSG recherche un ingénieur diplômé, disposant des compétences suivantes :

Compétences techniques:

Maîtriser des environnements et langages de programmation (python, Java, JavaScript, C++, etc.)
Avoir des notions en architecture de données massives (Hadoop, etc.)
Maîtriser les outils DevOps (intégration continue, etc.) et de développement Agile
Maîtriser des outils libres en géomatique (PostGreSQL/ PostGIS, QGIS)
Savoir expertiser et assurer la qualité scientifique de résultats
Pratiquer un anglais technique et/ou scientifique
Savoir rédiger des articles scientifiques

Formation et compétences requises :
Compétences organisationnelles :

Savoir transmettre un savoir, une technique, une compétence
Savoir concevoir et mettre en œuvre des solutions nouvelles et efficaces
Savoir publier et diffuser de l’information dans un système informatisé
Savoir mener une veille sur son domaine d’activité
Avoir le sens de la responsabilité, de l’autonomie, de l’initiative

Compétences relationnelles :

Savoir collaborer et travailler en équipe
Savoir encourager la synergie et partager ses connaissances et ses expériences

Adresse d’emploi :
IGn, 73 avenue de Paris, 94160 Saint-Mandé

Document attaché : 202301111300_Offre_d_emploi_LASTIG_JNN.pdf

Cross-modal reciprocal learning: location as supervision

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LASTIG
Durée : 36 mois
Contact : clement.mallet@ign.fr
Date limite de publication : 2023-03-31

Contexte :
Earth Observations (EO) nowadays refer to sensors with different modalities capturing rich and complementary information. EO are typically large-scale, multimodal, and multi-resolution. They often display a complex structure in which the spatial, temporal,
and spectral dimensions are entangled. This structure is influenced by
phenomenons operating at widely different scales, complex domain shifts (the distribution and appearance of certain classes vary significantly across regions and throughout the year), atmospheric conditions, and cumulative weather, resulting in inherently
non-stationary processes. While these characteristics complexify the analysis of EO, their absolute
spatial and temporal referencing of remote sensing allows us to align different acquisitions easily.

The deep learning paradigm is gradually being adopted as an indispensable tool for the automatic analysis of EO. However, the state-of-the-art solutions suffer from
multiple limitations: (1) existing deep-based models are not well-suited to the structure of EO, (2) large-scale annotation is unrealistic, (3) the limited spatio-temporal extent and task-specificity of existing
datasets and models result in poor generalization, (4) most annotated datasets remain focused on specific areas and environments, biasing the community towards particular architectures.

We propose to address the previous limitations by developing a Foundation Model of Earth Observations, trained on extensive unannotated data. Such a model should be rich, expressive, compact and efficient for most domain shifts and geographical bias. We will explore the idea of reciprocal cross-modal training to leverage the multimodality and georeferential alignment of EO data.

Sujet :
Foundation models refer to large neural networks trained on a vast amount of data and widely used for further applications or research. Such models can be built upon without having to be trained from scratch. This strategy both saves computation time and provides expressive
features/state-of-the-art encoders, and decreases the annotation and hardware requirements usually associated with large modern networks.
We propose a new learning paradigm dubbed “Cross-modal reciprocal learning” to train such foundation models from unannotated multi-modal EO.

Text-Image contrastive pretraining has shown impressive results in computer vision, leading to expressive and influential
foundation models. Contrastive learning has been recently explored for EO by exploiting spatial alignment across time series or for cross-modal localization. We propose generalizing text-image contrastive learning to the multi-modal setting with spatially aligned
observations. We require the features extracted from acquisitions of an area through different modalities to be more similar than any descriptors of another area. By forcing spatial alignment across sensors, the features must describe the only shared
latent variable: the actual semantics of the acquired area (e.g., road, building, plant species).

Generalizing contrastive learning to the multi-domain setting raises several theoretical and technical
challenges. First, the classic two-modalities formulation leads to an exponential complexity w.r.t the number of sensors, quickly becoming impractical and requiring us to develop an adapted loss and sampling procedure. Second, cross-modal learning implies the simultaneous training of several
large networks and the manipulation of costly multi-modal batches. This raises technical issues such as inefficiency in memory use and prolonged training times. Lastly, if we only reward the encoders
for spatial alignment across modalities, they may be discouraged from retaining sensor-specific information. This would result in weaker individual representations discarding the strength of each
sensor at the benefit of the lowest common denominator. This critical concern may be mitigated with multi-task learning and self-supervision.\

Depending on the application cases, we will focus on several modalities among the six following ones: Sentinel-2 Optical Time Series, Sentinel-1 Radar Time Series, High Resolution orthoimages, hyperspectral images, aerial LiDAR, and spaceborne LiDAR.

The PhD project also includes application cases related to the exploitation of the designed model. We will focus on standard downstream tasks such as multi-domain land-cover classification or crop mapping, and biogeophysical variable estimation (e.g., biomass estimation).

Profil du candidat :
– Familiarité avec la vision par ordinateur, l’apprentissage machine et l’apprentissage profond;
– Maîtrise de Python et familiarité avec PyTorch;
– Curiosité, rigueur, motivation;
– (Optionnel) Familiarité avec l’apprentissage auto/faiblement supervisé et contrastif;
– (Optionnel) Expérience avec l’imagerie aérienne ou satellite et la classification pour l’occupation des sols.

Formation et compétences requises :
Master 2 en informatique, computer sciences, mathématiques appliquées ou télédétection

Adresse d’emploi :
IGN, 73 avenue de Paris, 94160 Saint-Mandé

Document attaché : 202301111252_These2023_LASTIG_EO_reciprocal_learning.pdf

Thèse en Détection de Changements en Observation de la Terre

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LASTIG
Durée : 36 mois
Contact : clement.mallet@ign.fr
Date limite de publication : 2023-03-31

Contexte :
Face à l’érosion de la biodiversité et au réchauffement climatique, des mesures s’imposent pour préserver l’état de la planète. Ces mesures de préservation nécessitent de connaître l’état de la planète mais aussi d’être capable d’en suivre l’évolution avec la meilleure actualité possible.

Les données d’observation de la Terre (OT) sont désormais abondantes grâce à des efforts internationaux tels que le déploiement de la constellation européenne Sentinel-2, qui acquiert des images en couleur de toutes les zones du globe tous les cinq jours avec une résolution de 10 mètres. Des images de plus haute résolution peuvent être obtenues en France grâce à des programmes nationaux tels que SPOT-6/7 (Airbus/CNES, 1,5$:$m/pixel), Pléiades-Pléiades Néo (Airbus, 0,3m/px) ou la BDORTHO (IGN, 0,2m/px). Cependant ces images aériennes et satellites ne sont acquis qu’avec une fréquence allant d’un à trois ans.

Ainsi, l’observation de la Terre et le traitement des images sont une des sources d’information pour la mise en place de nombreuses politiques de protection des espaces naturels terrestres et marins. Cependant, l’annotation des images satellites ou aériennes est une tâche longue, coûteuse et fastidieuse qui doit être continuellement renouvelée.
Maintenant, qu’on était constitué de larges bases d’informations décrivant le territoire de différentes manières (tel que la BD Topo ou la BD Forêt de l’IGN), se pose la question de leur mise à jour.
Ainsi la tâche principale est d’être capable de détecter une différence entre une information présente dans une base de connaissances cartographique d’une région donnée et une nouvelle acquisition.
D’une part, les changements sont des phénomènes visuellement très variés mais aussi très rares. Par exemple, au sein de l’IGN, il a été montré que sur le département du Gers, seulement 5% du territoire avait été notablement modifié en 3 ans. Cependant, le parcours exhaustif de la totalité des acquisition est nécessaire pour de ne pas manquer un changement important.
L’investigation complète d’un département requièrent environ 300 heures de travail.
C’est pourquoi il est crucial de fournir de nouvelles méthodes pour assister et accélérer la mise à jour de la donnée géographique.

Le domaine de l’analyse d’image a connu cette dernière décennie une progression fulgurante, grâce au renouveau d’outils relativement anciens de l’intelligence artificielle, notamment les réseaux de neurones. Les réseaux convolutionnels ont permis d’obtenir des performances inédites en terme de reconnaissance d’objets, au prix d’apprentissages supervisés massifs. Cependant, l’apprentissage automatique pour l’observation de la Terre est presque toujours confronté à un manque d’ensembles de données annotées. Une grande partie des données disponibles est non annotée, c’est à dire sans information sémantique associée. Cette immense ensemble de données pourrait être utilisé comme une source d’information complémentaire pour l’apprentissage de modèles pour des applications telles que la surveillance de l’artificialisation des sols, de la déforestation ou du suivi des cultures.

Un point positif est que l’OT n’est pas le seul domaine où les annotations sont rares. L’annotation d’événements événements rares est un problème majeur dans la plupart, sinon la totalité, des applications d’apprentissage automatique. Une combinaison de deux solutions est adoptée pour pallier ce problème : l’augmentation de données (pour générer de nouvelles données annotées) et le pré-entraînement non supervisé ou auto-supervisé (pour exploiter des données non étiquetées).

Sujet :
Le travail de thèse consistera à développer des outils de détection de changements pour l’observation de la Terre reposant sur les progrès récents de l’apprentissage automatique. Contrairement à la plupart des travaux de détection de changements, le sujet:

– reposera sur des problématiques réelles opérationnelles issues de la surveillance du territoire, en particulier en lien avec la mise à jour des bases de données géographiques de l’IGN,
– identifiera les défis méthodologiques à relever pour bénéficier des progrès récents dans le domaine de l’apprentissage automatique, en particulier en ce qui concerne des problématiques d’augmentation de données et de pré-apprentissage mais dans le cadre de la télédétection.

Notons que la détection de changements regroupent plusieurs cas d’application.
Trois cas d’usage différents seront considérés :
– La comparaison de deux images d’une même zone obtenus par le même capteur;
– La comparaison de deux images d’une même zone obtenus par deux capteurs différents (aérienne et satellite par exemple);
– La comparaison entre une image et l’état de la connaissance passée de la zone (par exemple représentation sémantique de la zone).

Méthodologiquement, ce dernier cas est le plus complexe et le plus intéressant car il permet de mettre à jour la base de connaissances que l’on a du territoire et qui a pu déjà être mise à jour partiellement par d’autres voies. Cette base de connaissances peut aussi contenir des erreurs de saisies passées qui seront alors corrigées.

Profil du candidat :
– Familiarité avec la vision par ordinateur, l’apprentissage machine et l’apprentissage profond;
– Maîtrise de Python et familiarité avec PyTorch;
– Curiosité, rigueur, motivation;
– (Optionnel) Familiarité avec l’apprentissage auto/faiblement supervisé et contrastif;
– (Optionnel) Expérience avec l’imagerie aérienne ou satellite et la classification pour l’occupation des sols.

Formation et compétences requises :
Master 2 en informatique, computer sciences, mathématiques appliquées ou télédétection

Adresse d’emploi :
IGN, 73 avenue de Paris, 94160 Saint-Mandé

Document attaché : 202301111249_These2023_LASTIG_change_detection.pdf