Indice de qualité des eaux : modèle d’agrégation des sous-indices

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : MIS/UPJV
Durée : 6 mois
Contact : harold.trannois@u-picardie.fr
Date limite de publication : 2022-03-13

Contexte :
Ce stage s’inscrit dans le cadre du projet Janus. Ce projet, porté par le laboratoire MIS et la société Lilaea, a pour ambition de contribuer à l’enjeu sociétal majeur que représente la surveillance de la qualité des milieux aquatiques. Les travaux proposés sont préliminaires à une étude qui sera menée dans le cadre d’une thèse sur la prédiction de la qualité des masses d’eaux douces, étangs, rivières, lacs…

Sujet :
Le(la) stagiaire contribuera à la définition d’un Water Quality Index (WQI) en adéquation avec les dernières normes et avancées techniques. Cet index unique doit permettre à toute personne intéressée de près ou de loin par la qualité de l’eau, d’en connaître son état actuel et sa variabilité, à l’image des indices des prix à la consommation. L’étudiant(e) aura en charge l’exploration de la littérature sur les dernières techniques d’agrégation utilisées dans la construction du WQI à partir de ces sous-indices. Ces techniques d’agrégation sont nombreuses et il n’est pas rare qu’elles s’appuient sur des algorithmes génétiques ou des réseaux de neurones. Pour finir, l’étudiant(e) devra proposer un ou plusieurs modèles d’agrégation et en réaliser une implémentation.

Profil du candidat :
Etudiant(e) en M2 informatique ou dernière année d’école d’ingénieurs, avec une spécialisation dans l’apprentissage artificiel.

Formation et compétences requises :
Le(la) candidat(e) devra avoir des connaissances académiques en apprentissage artificiel et en développement informatique.

Adresse d’emploi :
Université de Picardie Jules verne
Laboratoire MIS
33 rue Saint Leu – 80039 Amiens Cedex 1 – France

Postdoc on Safe RL for Networking

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : Huawei Technologies
Durée : 18 mois
Contact : phamt.quang@huawei.com
Date limite de publication : 2022-04-01

Contexte :
When applied to communication networks, traditional approaches for control and decision-making require a comprehensive knowledge of system and user behaviors, which is unrealistic in practice when there is an increase in scale and complexity. Data-driven AI approaches do not have this drawback, but offer no safety bounds and are difficult to interpret. The ANR SAFE project aims to design an innovative approach by combining the best of both worlds. In this new approach, intelligence is distributed in the network between a global AI (at the central level) and local AIs (at the edge level) collaborating with each other by integrating traditional models with graph neural networks and reinforcement learning. The approach, developed for partially or completely observable/controllable environments, will natively integrate safety bounds, interpretability and provide self-adaptive systems for routing, traffic engineering and scheduling.

Sujet :
In the context of the ANR SAFE project, the postdoc researcher will focus on designing (i) a hierarchical architecture which enables an efficient collaboration between global AI and local AI and (ii) safety RL algorithms for network control. The postdoc will collaborate with partners of the project such as researchers of IRISA, Lab Hubert Curien, XLim, and QoS design.

The work will mainly include:
• Design hierarchical architecture of AI collaboration
• Design and implementation of novel safety RL algorithms for load balancing or smart queueing (e.g., Python, Tensorflow)
• Implementation the network testbed using network simulator or emulator (e.g., ns3, mininet)
• Test case generation and performance tests (scripts)
• Participation to scientific publications

Profil du candidat :
Ph.D. Degree in Networking, Computer Science, Electrical Engineering

Formation et compétences requises :
The following skills and experiences are highly desirable:
• Extensive experience with RL and network simulators / emulators
• Experience with development tools: Visual Studio, SVN / GIT, Python, C++
• Background in Networking and RL
• English: Operational

Adresse d’emploi :
18 quai du point du jour, 92100 Boulogne-Billancourt

Chargé-e de recherche en Intelligence artificielle pour la télédétection à INRAE

Offre en lien avec l’Action/le Réseau : MACLEAN/– — –

Laboratoire/Entreprise : UMR TETIS / INRAE
Durée : CDI
Contact : dino.ienco@inrae.fr
Date limite de publication : 2022-03-08

Contexte :
Part of the research conducted within the TETIS JRC (Joint Research Unit) concerns the design, development and use of AI techniques especially tailored for the analysis of remote sensing data with the aim to meet the agro-environmental challenges raised up by the different institutions to which it belongs to (CIRAD, INRAE, AgroParisTech and CNRS). To strengthen these research activities and maintain an original scientific position at both national and international level, it is important to consolidate the role of the TETIS JRC in this strategic and innovative area.
You will be associated with the ATTOS team (Acquisition, Remote Sensing, Processing and Spatial Observations). The aim of the team is to shed light on the understanding of systems and territorial decision-making in a context of agro-ecological transition, demographics, and sustainable development through the exploitation of remote sensing and Earth observation data. You will reinforce the team’s axis associated with the design, development and use of AI techniques for the analysis of remote sensing data, to support different applications/themes at the core of the team and the unit (i.e. land use, natural resource mapping, biodiversity characterization, extraction of biophysical variables, monitoring of forest environments, study of artificialization, etc.) in tight collaboration with fellow researchers and engineers coming from a multidisciplinary context.

Your work will contribute to the positioning of the unit in the emerging research field at the crossroads between AI and remote sensing. This fast growing research field shows a high potential of scientific production, with the possibility of major societal advances concerning both the agriculture and the environment application domains at the core of the INRAE institute.

Sujet :
Your scientific activity will be oriented towards emerging paradigms in the machine learning and computer vision fields such as: (i) Spatial and/or temporal transfer learning, domain adaptation of AI models to cope with environmental diversity in acquisition conditions (ecosystems, climate, etc.) and temporal variability; (ii) Multi-source and multi-modal remote sensing data fusion (multi-modal and cross-modal learning) taking into account the variability in terms of availability of the input sources (sources unavailable for inference, syntheses, etc.) (iii) Limited availability/quality/reliability of reference data (weakly-supervised learning) and (iv) The need for interpretability of the developed machine learning models (explainable AI) and their combination with underlying physical models (physical-based machine learning) for the analysis of earth observation data.

https://jobs.inrae.fr/en/open-competitions/open-competions-research-scientists-job-profiles-crcn/cr-2022-mathnum-3

Profil du candidat :
You have a PhD, ideally in computer science or artificial intelligence.
You have competences in the foundations of machine learning methodologies (supervised, semi-supervised, unsupervised learning), knowledge and/or experience in modern deep learning paradigms (domain adaptation, transfer learning, weakly supervised learning and knowledge distillation), and
the development and exploitation of the latter in the context of signal processing and image analysis (computer vision).

Already proven experiences in the analysis of satellite and earth observation data with applications in the field of agriculture or environment would be appreciated.
Fluency in English is desirable, as well as long-term international experience: laureates who have not yet had such experience will be strongly encouraged to spend a period of time abroad, co-constructed with the host team, within 3 years after the internship year.

Formation et compétences requises :
You have a PhD, ideally in computer science or artificial intelligence.
You have competences in the foundations of machine learning methodologies (supervised, semi-supervised, unsupervised learning), knowledge and/or experience in modern deep learning paradigms (domain adaptation, transfer learning, weakly supervised learning and knowledge distillation), and
the development and exploitation of the latter in the context of signal processing and image analysis (computer vision).

Already proven experiences in the analysis of satellite and earth observation data with applications in the field of agriculture or environment would be appreciated.
Fluency in English is desirable, as well as long-term international experience: laureates who have not yet had such experience will be strongly encouraged to spend a period of time abroad, co-constructed with the host team, within 3 years after the internship year.

Adresse d’emploi :
500, rue Jean François Breton
34090 Montpellier, France

[Urgent] Intelligence artificielle pour la prévision de la demande dans la supply chain

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : L@bISEN Yncréa Ouest, Equipe Vision-AD
Durée : 3 ans
Contact : ayoub.karine@yncrea.fr
Date limite de publication : 2022-06-30

Contexte :
Suite à un désistement de la dernière minute. Nous cherchons un candidat pour la thèse CIFRE suivante.

Ces dernières années, la complexité de plus en plus croissante du monde économique ne cesse d’attirer l’attention des chercheurs et des industriels qui se lancent dans la digitalisation de leur entreprise. Plus particulièrement, les chaines d’approvisionnement et les milieux industriels comme les entrepôts et les réseaux de transport ne sont plus gérés comme des réalités singulières mais comme la résultante d’un ensemble d’interactions entre entités générant et partageant des données et des intérêts communs. Pour améliorer l’efficacité de la chaîne d’approvisionnement, il est primordial de pouvoir améliorer la prévision de la demande. Ceci a un impact sur la production, la planification des stocks, l’équilibrage de la demande et de l’offre, l’optimisation des processus de livraison et la réduction de ses délais, la prédiction des heures de pointe dans les centres logistiques et la planification des ressources humaines. D’un autre côté, comme ces entités sont imbriqués, les performances du système global sont directement liées aux performances des entités élémentaires. Les études récentes dans le domaine du management de la supply chain ont mis l’accent sur l’intérêt de la gestion décentralisée de ces entités.

Sujet :
– Objectif de la thèse :
L’objectif de la thèse consiste à répondre à la question suivante : comment réaliser une prévision à court terme pour les chaînes d’approvisionnement variées et décentralisées ? Les méthodes traditionnelles de prévision, y compris les techniques de séries chronologiques et de régression, ont été largement utilisées dans la prévision de la demande. Naïve, moyenne mobile, tendance, régression linéaire multiple, Holt-Winters, lissage exponentiel, ARIMA et ses variantes, font partie de ces techniques traditionnelles. Les approches basées sur l’apprentissage automatique, par renforcement, la SVM (Support vector machine), LSTM (Long Short-Term Memory) et les réseaux de neurones en général, font office de challengers dans le domaine de la prévision de la demande. Elles ont montré leur supériorité lorsque le nombre de variables prédictives est très grand, et quand les sources de données sont multiples. C’est le cas en environnement très variable, par exemple pour les produits sensibles aux intempéries ou les produits saisonniers, ou lorsque des dizaines de facteurs motivant les comportements d’achat ou de nombreux types de données sont impliqués, rendant la planification de la demande trop complexe pour être effectuée avec succès avec des outils classiques.
– Approches méthodologiques et techniques envisagées :
• Etat de l’art sur la modélisation et le traitement des données des milieux logistique afin d’améliorer l’existant
• Conception d’un outil de prévision et d’aide à la décision répondant à la problématique énoncée
• Vérification et test de la performance du système proposé en la comparant avec d’autres approches pratiques et théoriques
• Perspectives : proposer une approche qui prend en compte les acteurs et milieux logistiques

Profil du candidat :
Pour cette thèse, nous recherchons un(e) jeune doctorant(e) fortement motivé(e) et ayant un goût prononcé pour l’innovation. Il/elle devra participer au développement de prototypes qui s’intégreront dans les solutions utilisées par Generix Group et L@bISEN Yncréa Ouest.

Formation et compétences requises :
Concernant les aspects liés à la recherche, le/la candidat(e) devra être titulaire d’un Master avec des compétences en Machine Learning, intelligence artificielle et/ou gestion des données massives. Il/elle est aussi nécessaire qu’il/elle ait une expérience réussie dans le développement informatique des techniques cités précédemment, avec le langage Python par exemple.

Un bon niveau en mathématiques appliquées semble naturellement nécessaire, en particulier dans le domaine des probabilités, des statistiques et des processus stochastiques. Des notions d’optimisation, recherche opérationnelle, programmation linéaire et méthodes de décomposition serait un plus pour ce poste.
Une ouverture d’esprit suffisante pour s’intégrer dans une nouvelle équipe est demandée.

Adresse d’emploi :
laboratoire de recherche L@bISEN Yncréa Ouest – Nantes / Generix Group

Document attaché : 202202081021_Offre Thèse CIFRE 2022.pdf

Poste de Professeure / Professeur des Universités en Intelligence artificielle : théorie et application

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Sorbonne Université
Durée : Non défini
Contact : guillaume.morel@sorbonne-universite.fr
Date limite de publication : 2022-03-04

Contexte :
Un poste de Professeure / Professeur des Universités en Intelligence artificielle : théorie et applications, est à pourvoir à Sorbonne Université avec une affection recherche dans un des laboratoires : ISIR, LIB, LIMICS ou LIP6.

Professeure / Professeur des Universités
Section 27 – Informatique
Profil : Intelligence artificielle : théorie et applications
Date limite des candidatures au poste : le 04 mars 2022 à 16h

Lien vers la fiche de poste : https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/FIDIS/0755890V/FOPC_0755890V_391.pdf

Lien vers le site de recrutement : https://recrutement.sorbonne-universite.fr/fr/personnels-enseignants-chercheurs-enseignants-chercheurs/enseignants-chercheurs/recrutement-2022-des-enseignantes-chercheuses-et-enseignants-chercheurs.html

Sujet :
Filières de formation concernées : Licence – Master d’informatique.

Objectifs pédagogiques et besoin d’encadrement :
La personne recrutée interviendra de façon équilibrée sur les différents niveaux de formation, du L1 au M2.
La personne recrutée contribuera significativement aux enseignements de Licence d’informatique dont les besoins couvrent l’ensemble de la discipline (algorithmique, programmation (notamment objet, concurrente, fonctionnelle, web), mathématiques discrètes, structures de données, système, architecture, réseaux, compilation, bases de données…)
Pour ce qui concerne les enseignements en Master d’informatique, différents besoins seront à couvrir en fonction du profil de la personne recrutée.

Profil du candidat :
Le poste est ouvert à tous les domaines de l’IA et de ses applications. La personne retenue intégrera l’un des laboratoires : ISIR, LIB, LIMICS ou LIP6 selon ses thématiques de recherche, et/ou de projets impliquant plusieurs laboratoires d’accueil au sein de SCAI (Sorbonne Center for Artificial Intelligence.

Formation et compétences requises :
La ou le professeur devra être capable de coordonner des programmes collaboratifs nationaux et internationaux. La participation de la personne recrutée, dans le passé, à des projets multidisciplinaires sera appréciée.

Adresse d’emploi :
UNIVERSITE SORBONNE UNIVERSITE
Campus Pierre et Marie Curie
75005

Apprentissage profond pour l’estimation de variables biophysiques du couvert forestier tropical

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : raffaele.gaetano@cirad.fr
Date limite de publication : 2022-02-28

Contexte :
Le suivi de l’état des forêts tropicales est d’importance mondiale (Herold et al. 2019). Il appelle le suivi dans la durée et sur de grandes surfaces de variables « biophysiques » de structures forestières (couvert, hauteur de canopée, biomasse épigée, …) et d’indicateurs de diversité spécifique et fonctionnelle. Le suivi du couvert arboré, notion polysémique, a fait l’objet de travaux importants, principalement basés sur les séries d’images satellitaires longues à moyenne résolution ou haute résolution spatiale (MODIS, Landsat, respectivement), Ceci a débouché sur des produits cartographiques ambitieux à des échelles pantropicales et mondiales (e.g. Avitabile et al. 2012; Hansen et al. 2013 ; Kubayashi et al. 2016). Cependant, ces produits recèlent des faiblesses de plusieurs ordres. Si celles-ci n’opèrent pas leur intérêt, tant que l’ampleur des surfaces peut permettre la compensation des imprécisions locales, elles rendent leurs utilisations hasardeuses pour des applications demandant de se focaliser sur des surfaces plus restreintes (downscaling), ou requérant un niveau de précision supérieur à celui effectif (qui n’est pas toujours explicite, d’ailleurs).

Le projet Sé2coul, a pour objectif de traduire les opportunités, offertes par les données Sentinel-1 et Sentinel-2, pour le suivi et la caractérisation des forêts, en tirant partie :
i) de la densification temporelle des séries temporelles d’images satellitaires et de leur accroissement en résolution spatiale. Ceci doit permettre d’aller bien au-delà de ce qui peut déjà être fait actuellement avec les séries HR de type « Landsat » (par exemple via le Google Earth Engine) pour corriger les effets instrumentaux dans l’optique de détection de changements francs de couvert (déforestation, feu, plantation, …), ou de détections de perturbations localisées (exploitation, chute d’arbres, …).
ii) de la facilitation de l’usage conjoint des données radar et optiques (Sentinel-1 et -2). En complément de l’optique, l’information radar en bande C (bien que probablement saturante à des niveaux assez bas de couvert et de biomasse) est sensible à la structure tridimensionnelle, et peut aider à lever des ambiguïtés dans les végétations complexes, ouvertes (par exemple pour le suivi de la dynamique des trouées, naturelles ou non), ou marquées par des variations saisonnières d’humidité (y compris du substrat).
iii) du développement de techniques d’intelligence artificielle (deep-learning) pour tirer parti des atouts des données Sentinel dans la perspective spécifique de la caractérisation biophysique des composantes ligneuses de la végétation dans des contextes tropicaux variés.

Le projet aura pour objectif de traduire ces opportunités en avancées significatives concernant l’estimation de caractéristiques fondamentales de la végétation ligneuse : (i) structure : Hauteur de canopée, LAI, etc. (ii) diversité, (iii) signature fonctionnelle saisonnière.

Sujet :
En s’appuyant sur les résultats actuels du projet, qui ont permis d’évaluer le potentiel des images Sentinel pour l’extraction de variables biophysiques sur la structure et la diversité des couverts forestiers, l’objectif de ce stage est de tester des solutions basées sur l’apprentissage profond pour : (i) s’affranchir du problème de la forte nébulosité des images disponibles en optique (Sentinel-2) en s’appuyant sur l’utilisation conjointe d’images optiques et radar; (ii) mettre en place des solutions permettant la mise en opération de la production cartographique de ces variables; (iii) poser les bases pour l’extraction d’information à valeur ajoutée (cartographie de la typologie des couverts forestiers, extraction de traits fonctionnels par analyse de séries temporelles). Le terrain d’étude en Guyane Française sera ciblé en priorité pour tester ces méthodes.
Pour cela, nous allons mobiliser en grande partie des méthodes déjà développées au sein de notre unité, concernant à la fois l’extraction de variables biophysiques et la génération de séries temporelles d’images Sentinel-2 dénuagées, avec l’objectif de les combiner opportunément et de tester la production de cartes sous différentes contraintes en termes de disponibilité d’images (e.g. nébulosité). Selon les acquis de cette phase, un deuxième objectif serait de travailler sur des séries temporelles d’images optiques dénuagées pour évaluer des premières méthodes d’extraction d’information à valeur ajoutée.

Les principales étapes envisagées pour la réalisation du stage sont :
Analyse bibliographique sur les méthodes d’apprentissage profond pour la synthèse d’images sans nuages par couplage radar/optique, et sur l’état de l’art concernant l’extraction de variables biophysiques du couvert forestier.
Mise en place du jeu de données :
Prise en main des données existantes
Téléchargement et prétraitements de série temporelle d’images Sentinel-1 et Sentinel-2
Préparation du jeu de données pour l’évaluation
Prise en main des méthodes d’apprentissage profond qui sont à mobiliser.
Mise en place de telle méthode dans le contexte de la cartographie de la typologie du couvert forestier sur la zone d’étude.
Évaluation de la méthode déployée à travers une analyse quantitative/qualitative.
Rédaction du rapport et préparation de la soutenance.

Profil du candidat :
Master II ou 3ème année d’école ingénieur en Traitement du Signal, Informatique ou Télédétection
Compétences : programmation informatique et géomatique
Bonne connaissance des méthodes de machine et deep learning (TensorFlow/PyTorch, Keras, …)
Goût pour la recherche scientifique et l’interdisciplinarité
Maîtrise de l’anglais et bonne capacité rédactionnelle

Formation et compétences requises :
Master II ou 3ème année d’école ingénieur en Traitement du Signal, Informatique ou Télédétection
Compétences : programmation informatique et géomatique
Bonne connaissance des méthodes de machine et deep learning (TensorFlow/PyTorch, Keras, …)
Goût pour la recherche scientifique et l’interdisciplinarité
Maîtrise de l’anglais et bonne capacité rédactionnelle

Adresse d’emploi :
Maison de la Télédétection, 500, rue Jean François Breton – Montpellier (34)

Document attaché : 202202071401_Fiche_Stage_M2_SE2COUL_TETIS.pdf

première demi-journée de deux séminaires sur les techniques d’anonymisation de données

Date : 2022-03-01
Lieu : virtuel,
organisé par le LS2N (Laboratoire des Sciences du Numérique de Nantes)

Le Thème transverse Sciences du Vivant du LS2N organise une mini-série de deux demi-journées de séminaires sur “l’anonymisation de données”.

Les inscriptions aux deux demi-journées sont indépendantes.

La première demi-journée de séminaires se déroulera le mardi 1er mars 2022, de 14H00 à 18H15, en mode distanciel. Le programme comporte 4 présentations :

Générer des données synthétiques centrées sur le patient : plus de raison de faire courir un risque de réidentification dans l’analyse des données biomédicales
Pierre-Antoine GOURRAUD, PU-PH, CHU de Nantes, Université de Nantes

Désidentification de textes : une tâche de détection d’entités ; désidentification de textes médicaux : état de l’art
Évaluation du risque de réidentification de textes
Une autre voie : la création de données artificielles
Pierre ZWEIGENBAULM (*), DR CNRS, responsable du groupe ILES (Langue Ecrite et Signée)
Aurélie Névéol(*), CR CNRS
Cyril GROUIN(*) IR CNRS.
(*) Laboratoire Interdisciplinaire des Sciences du Numérique), Université Paris-Saclay, Orsay

inscription gratuite mais obligatoire, lien pour l’inscription :
https://docs.google.com/forms/d/e/1FAIpQLSeeMkarTuw5seNnxd04xauILglY6pgIg1Soqfe-twXPPXEdTw/viewform?usp=pp_url
programme détaillé ci-dessous

PROGRAMME :
14H00-15H15
Générer des données synthétiques centrées sur le patient : plus de raison de faire courir un risque de réidentification dans l’analyse des données biomédicales
par le Pr Pierre-Antoine GOURRAUD, PU-PH, CHU de Nantes, Université de Nantes

Résumé : Les analyses de données massives s’alimentent presque toujours de données personnelles pseudonymisées. Les interprétations et prédictions auxquelles elles aboutissent sont utiles à la société, mais un risque de réidentification individuelle demeure. Nous présentons une nouvelle méthode permettant de générer des données synthétiques, des avatars, de granularité individuelle, tout en préservant la vie privée des patients, à l’exemple d’un essai clinique et d’un jeu de données en cancérologie utilisé en prédiction avec un algorithme apprenant.

15H15-16H15 ; 16H45-17H30 ; 17H30-18H15
Intervenants du LISN (Laboratoire Interdisciplinaire des Sciences du Numérique), Université Paris-Saclay, Orsay

Pierre ZWEIGENBAULM, DR CNRS, responsable du groupe ILES (Langue Ecrite et Signée)
Aurélie Névéol, CR CNRS
Cyril GROUIN IR CNRS

15H15-16H15
Désidentification de textes : une tâche de détection d’entités ; désidentification de textes médicaux : état de l’art.

Résumé : La désidentification de textes est habituellement modélisée en traitement automatique des langues comme une tâche de détection d’« entités nommées ». Nous donnerons ici une brève introduction à cette tâche : notion d’entité, mesures d’évaluation, les indices qui permettent de détecter des entités dans les textes. Nous résumerons les méthodes employées au fil du temps pour aborder cette tâche, des patrons à la classification supervisée, statistique puis neuronale. Nous poursuivrons avec la désidentification de textes médicaux. Nous présenterons d’abord la question du choix de l’ensemble des types d’entités à repérer lorsque l’on instancie la tâche de détection d’entités sur des textes médicaux : noms de personnes, dates, etc. Nous présenterons ensuite les méthodes qui ont été proposées pour réaliser cette tâche, avec des exemples concernant le traitement de l’anglais et du français : méthodes à base de patrons (de-id, MEDINA v1), à base d’apprentissage supervisé statistique (MEDINA v2, divers outils aux États-Unis) puis neuronal (NeuroNER, MAPA…) et les performances associées.

16H15-16H45 PAUSE

16H45-17H30
Évaluation du risque de réidentification de textes.

Résumé : La question du risque de réidentification est difficile à évaluer sur des textes en langue naturelle. Nous rappellerons le mode d’évaluation traditionnel de la détection d’entités en TAL, qui opère au niveau des entités individuelles. Nous examinerons également des manières simples de l’étendre à des unités textuelles plus pertinentes comme le document ou le dossier. Nous présenterons enfin une expérience d’évaluation du risque de réidentification sur des données réelles.

17H30-18H15
Une autre voie : la création de données artificielles.

Résumé : La désidentification de textes vise à réduire le risque de réidentification de documents textuels, notamment pour rendre acceptable le travail des chercheurs ou des ingénieurs lors de la mise au point d’algorithmes s’appliquant à ces données. Une autre façon de contourner les difficultés d’accès à des textes confidentiels pour le traitement automatique des langues consiste à créer des textes artificiels ayant des propriétés suffisamment similaires aux textes réels, mais ne concernant pas de patients réels. Nous présenterons des directions de travail en ce sens, fondés notamment sur la traduction automatique et sur la génération de textes.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

deuxième demi-journée de deux séminaires dédiés aux techniques de l’anonymisation de données – 8 mars 2022

Date : 2022-03-08
Lieu : virtuel,
organisé par le LS2N (Laboratoire des Sciences du Numérique de Nantes)

Le Thème transverse Sciences du Vivant du LS2N organise une mini-série de deux demi-journées de séminaires sur “l’anonymisation de données”.

Les inscriptions aux deux demi-journées sont indépendantes.

La deuxième demi-journée de séminaire / tutoriel se déroulera le mardi 8 mars 2022, de 9H30 à 12H30, en mode distanciel. Elle sera consacrée aux techniques d’anonymisation de données, avec le conférencier et le programme suivants :

Pr Benjamin NGUYEN,
Laboratoire d’Informatique Fondamentale d’Orléans, Equipe Sécurité des Données et des Systèmes
INSA Centre Val de Loire & Université d’Orléans
GdR Sécurité Informatique / GT Protection de la Vie Privée

Programme :
– Qu’est-ce que l’anonymat ?
– La pseudonymisation
– Architecture d’anonymisation
– Technique historique d’anonymisation
– Evaluation du risque de réidentification
– Techniques classiques d’anonymisation
– Méthodes statistiques classiques
– Confidentialité différentielle (Differential Privacy)

Le séminaire intègrera plusieurs parties démonstration en mode “tutoriel”. A cette occasion, les participants seront invités à réaliser eux-mêmes les opérations, en utilisant les logiciels ARX (pour l’anonymisation) et WEKA (pour l’analyse de données).

Le principe sera de fournir aux participants tous les fichiers dont ils ont besoin pour suivre, afin qu’ils réalisent les opérations en parallèle avec le conférencier.
L’objectif est de permettre une première prise en main de l’outil ARX, pour des utilisations futures dans d’autres contextes.

Pour un déroulement efficace, le nombre d’inscrits est limité à 30.

La participation à la première demi-journée (1 mars 2022) NE constitue PAS un prérequis pour participer à la deuxième demi-journée.
inscription gratuite mais obligatoire, nombre de places limité à 30,
lien pour l’inscription :
https://docs.google.com/forms/d/e/1FAIpQLScPEBXOSZQDepMDqGaFzNt6e4FmbDP7VzMRBU0H9kCbEyn9lA/viewform?usp=pp_url

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Post-Doc Position: Development of a customizable configuration approach for the digital work environ

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CNAM/IRSN
Durée : 12 mois
Contact : sebastien.ruelle@irsn.fr
Date limite de publication : 2022-04-29

Contexte :
Conservatoire National des Arts et Métiers (CNAM, a public high education and research institution) and Institut de Radioprotection et de Sûreté Nucléaire (IRSN, i.e. the public expert in research and expertise relating to radiological risks, the protection of man and environment) have joined forces in a joint «Cartographie Immersive Etendue/ Extended Immersive Mapping (CIE)» project to innovate the digital environment for researchers. In this context, we are recruiting a post doctorate whose mission is to propose a design and a concrete implementation (Proof Of Concept) of the CIE project, the whole constituting the first part of this project.

Sujet :
– Job: Post doctorate
– Salary: 2600-2700 € monthly gross income
– Starting Date: April-May 2022
– Duration: 12 months

Description :
IRSN operates experimental facilities, scientific and technical equipment, metrology resources and specialized mobile intervention resources. These resources are grouped together by «Plateformes Scientifiques et Techniques / Scientific and Technical Platforms (PST)». The objective of the joint «Cartographie Immersive Etendue/ Extended Immersive Mapping (CIE)» project is to set up a digital environment for the optimization and promotion of the scientific and technical means of PSTs for the benefit of laboratory teams and other potential users. The CIE must make it possible to provide customizable access to PSTs and associated services (3D visits, planning, economic monitoring, community networks, etc.) according to several parameters such as the user’s profile (internal, external, their profession, its hierarchical position, etc.) and its information / data needs (type, level of detail, mode of restitution).
To achieve these objectives, a situational engineering approach will be used with an identification of reusable components defined in relation to user needs and the context of their use. Each user will have a digital space specific to their needs built on an evolving library of components.
The design, implementation and evolution of the CIE must follow the principles of modularity, reuse and adaptation to the context, as well as to the intentions and needs of the users. In order to provide a suitable and evolving workspace for each user, the UX (User eXperience) [1] [2] and EX (Employee eXperience) [3] [4] approaches applied in the digital environment of IRSN were favored and should make it possible to build and then enrich the mapping of the scientific resources of the PSTs as well as all the associated services.

IRSN’s digital environment currently includes:

– Digital workplace (https://www.jalios.com/): this environment provides the IRSN intranet (including management of internal communities of practice);
– Microsoft tools (Sharepoint online, Power BI, Teams, Office…);
– 3D virtual tour (https://vrtice.com/): this solution developed by a startup facilitates access to content in a 3D environment; SPOT uses this tool for the promotion of facilities but also for training and management;
– CRAFT web database (https://www.bdi.fr/fr/plateforme-craft/): the pilot produced by IRSN currently makes it possible to gather all the data from these laboratories and their facilities, then to share them internally, with its partners but also with the general public;
– Internal database search engine (https://www.sinequa.com/): this engine is used to address most IRSN databases (scientific, administrative, technical, etc.);
– External database search engine AMI (https://www.chapsvision.fr/data/);
– Other tools (LEGISWAY for contract management, SAP ERP, etc.).

Post-doctoral research project:

– Prepare a state of the art of existing work in the field of UX and EX systems applicable to the context of the CIE,
– Consolidate the previously conducted analysis of user needs in order to identify the list of functional and technical requirements,
– Propose a taxonomy of description of PST installations and equipment at different levels by highlighting their possible uses,
– Formalize the notion of the UX / EX component and identify a set of components for a given perimeter,
– Propose an approach for configuring the digital work environment according to user needs and profiles,
– Participate in the definition of the target architecture of the digital environment, considering the information system in place and Enterprise Architecture rules,
– Implementation of the proposed approach for a given scope (production of a POC).

An apprentice will assist the post doctorate in the digital web development of CIE components (creation of application pilots, interfaces in the digital environment of IRSN).

Profil du candidat :
PhD degree in Computer Science / UX design

Formation et compétences requises :
Information Systems Development Methodologies, UX Design

Adresse d’emploi :
Location: CNAM, Paris (75) and IRSN, Fontenay aux Roses (92)

Apprentissage de représentations invariantes au domaine pour l’analyse de séries temporelles d’image

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube – Université de Strasbourg
Durée : 36 mois
Contact : gancarski@unistra.fr
Date limite de publication : 2022-04-29

Contexte :
L’objectif de cette thèse est d’étudier et développer des modèles pour l’apprentissage de représentations invariantes par domaine (Deep Learning) pour l’analyse de séries temporelles d’images satellitaires.

Cette thèse cofinancée par le CNES et par la Chaire Industrielle en Sciences des Données et Intelligence Artificielle sera dirigée par Thomas Lampert et Pierre Gançarski.

La date limite de dépôt des dossier auprès du CNES étant fixée en mars 2022, les candidats doivent impérativement prendre contact avec nous le plus rapidement possible afin de nous laisser le temps d’étudier leur candidature et d’organiser une audition si nécessaire.

Sujet :
L’objectif du projet est de développer des modèles d’apprentissage de représentations invariantes par domaine en utilisant l’apprentissage profond pour l’analyse de séries temporelles d’images satellites.

Il est difficile et coûteux d’annoter l’énorme quantité de données générées par les satellites, mais cela est nécessaire pour le succès des algorithmes d’apprentissage profond. Pour surmonter ce problème, des techniques d’apprentissage par transfert et d’adaptation au domaine seront développées pour exploiter les données non étiquetées. Ces techniques permettent d’améliorer les performances d’un algorithme avec un minimum (ou potentiellement aucune) annotation supplémentaire, ce qui réduit le coût du déploiement.

Detailed Description: https://drive.google.com/file/d/1_eil1utHBjfTwhmXQjR6VUM07jbJkYgk/view?usp=sharing

Profil du candidat :
Master en Informatique avec de fortes connaissances en Sciences des Données. Une connaissance de la télédétection est un plus indéniable.

Pour postuler, envoyez un mail à lampert@unistra.fr et pierre.gancarski@unistra.fr en joignant impérativement :
– une lettre de motivation expliquant vos qualifications, expériences et motivations ;
– un curriculum vitae
– toutes les informations sur votre cursus universitaire : parcours, diplômes obtenus, relevés de notes ainsi que votre classement pour chacune des années de Master ou équivalent pour les écoles d’ingénieurs;
et si possible, les coordonnées des personnes (enseignants ou autres personnes) pouvant fournir des informations sur vos compétences, votre motivation et votre travail.

Formation et compétences requises :
Des compétences pratique en apprentissage profond sont indispensables

La possibilité d’effectuer un stage gratifié de M2 au sein de l’équipe SDC pour acquérir ces compétences est aussi possible, voire encouragé. N’hésitez pas à vous renseigner.

Adresse d’emploi :
ICube Strasbourg (Site d’Illkirch – Pôle API)

Document attaché : 202202070930_CNES_PhD_advert.pdf