Extraction et structuration des informations d’évolution des rues dans des corpus textuels à l’aide de grands modèles de langue

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : LaSTIG (Université Gustave Eiffel – IGN/ENSG)
Durée : 5 mois
Contact : charly.bernard@ign.fr
Date limite de publication : 2025-04-30

Contexte :

Sujet :
Ce stage s’inscrit dans un ensemble de travaux visant à proposer une méthodologie générique et reproductible pour la construction d’un graphe de connaissances géohistorique des voies et des adresses à partir des documents historiques et de données publiées sur le Web.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Équipe LaSTIG/Strudel – École Nationale des Sciences Géographiques
6-8 avenue Blaise Pascal
77420 Champs-sur-Marne
(RER A, station Noisy-Champs)

Document attaché : 202412131314_2025-Sujet_Stage_M2_LLM_Rues_Paris.pdf

DADY : un modèle fondation de réseau de neurones pour l’observation aérienne time-lapse de systèmes agroécologiques au Sud

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-04-30

Contexte :
Le projet DeepAeroDynamics (DADY) vise à combiner l’imagerie drone multispectrale time-lapse et le deep learning pour faire face aux défis du changement climatique et de la sécurité alimentaire dans les pays du Sud. L’objectif est de développer un modèle fondation capable d’intégrer les données multispectrales, spatiales et temporelles observées par drone aérien dans des environnements complexes et hétérogènes du Sud dans le but d’anticiper et prédire le comportement de plantes cultivées en agroécologie (Sahel, Madagascar, Guadeloupe).

Sujet :
Le stagiaire sera au coeur du développement d’une architecture deep learning permettant :
* D’analyser des séries temporelles multispectrales d’imagerie drone, et extraire automatiquement des représentations informatives de l’état des systèmes observés.
* D’analyser les dynamiques temporelles en utilisant des modèles de type Transformers pour capturer les évolutions des cultures décrites dans un espace latent.
* De maximiser l’utilisation des données par des techniques d’apprentissage semi-supervisées et des consignes prétextes pour maximiser la capacité d’apprentissage de l’architecture fondation.

Le développement des modèles s’appuiera sur des architectures CNN et Transformers. L’approche sera validée sur des jeux de données déjà acquis et stockés à proximité d’un supercalculateur. Les tests de niveau 1 s’effectueront sur une ferme GPU locale, et les modèles de niveau 2 seront testés sur les supercalculateurs Jean Zay et Adastra (20e mondial au TOP500). Les modèles seront documentés et diffusés en open-source, accompagnés de scripts pour le fine-tuning.

Profil du candidat :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en deep learning.

Formation et compétences requises :
Travail avec Python, Pytorch/Tensorflow, Github, Intégration Continue. Expérience en traitement d’images. Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€ mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av. Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202412131037_Offre de stage M2 – 2025 – DADY.pdf

Postdoctoral or Engineer Position: Integrating Differential Privacy in PostgreSQL

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : INSA Centre Val de Loire
Durée : 24
Contact : cedric.eichler@insa-cvl.fr
Date limite de publication : 2025-04-30

Contexte :
INSA Centre Val de Loire is offering an opportunity for either a Postdoctoral Researcher or Engineer to join the Petscraft project-team joint with Inria Saclay. We welcome applications from candidates with
diverse profiles and backgrounds, as we believe that both types of expertise can bring valuable contributions to our project. The specific responsibilities, objectives, and scope of the position will be tailored to
the selected candidate’s qualifications, skills, and experience. We are looking for the successful candidate
to start as soon as possible, but we are flexible with the start date to accommodate the right individual’s
availability.

This position is part of the project ”Making PostgreSQL Deferentially Private for Transparent AI” funded by the french national research agency ANR. The project involves several French research teams working on data protection, from Inria, universities and engineering schools, as well as Dalibo, company expert in PostgreSQL and developing PostgreSQL Anonymizer. The general objective
of the project is to propose, implement within PostgreSQL and evaluate a privacy preserving approach for interpreting SQL queries in the sense of differential privacy (DP). These queries will range from the
Select-Project-Join-Aggregation (SPJA) form to the export of releases (DUMP) of a part of the database in order to be able to work on it as if it contained no sensitive data. Specifically, the main objective is
to extend the anonymization models already integrated in PostgreSQL Anonymizer (pseudonymization, k-anonymization and addition of noise) to other models verifying DP, as well as DP existing and novel relaxations.

Sujet :
During the first year, the successful candidate will tightly collaborate with Dalibo to extend PostgreSQL Anonymizer with the most promising (in terms of utility) approaches to answering SPJA
queries that guarantee DP (or similar models, such as local differential privacy). The main lock of this task is to design this DP mechanism as an extension of the SQL grammar in order to qualify a specific
query or function with DP metadata.
Possibles objectives for the second year are varied and can be tailored to the selected candidate, with a wide range between implementation and theory. They may include more theoretical contributions, e.g.
regarding novel DP relaxations or the impact of semantics and schema on DP. In terms of implementation, they could include, for example, the development of demonstrators, validation and evaluation platforms
for the novel models proposed in the project.

Profil du candidat :
Candidates must hold either a PhD or a master (or equivalent) in
Computer Science

Formation et compétences requises :
The following skills are appreciated:
• Knowledge in privacy & anonimization.
• Knowledge & experience in databases and database management systems, particularly SQL and
PostgreSQL.
• Proficiency in programming.

Adresse d’emploi :
Either Inria Saclay centre, Turing building in Palaiseau or INSA CVL campus Bourges.

Document attaché : 202412131026_Postdoc_or_eng_position_DIFPRIPOS.pdf