Offre de thèse : Graph Neural Networks for morpho-functional analysis a

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT Tours France
Durée : 3 ans
Contact : jyramel@univ-tours.fr
Date limite de publication : 2022-07-15

Contexte :
PhD Title: Graph Neural Networks for morphofunctional analysis and comparison of brain structures

Supervisors
● Jean-Yves Ramel (PR HDR) – LIFAT Université de Tours
● Elodie Chaillou (CR HC HDR) – INRAE PRC
● En collaboration avec l’équipe iBrain, INSERM (C. Destrieux, F. Anderson)

Description
Nowadays, the development of brain imaging methods generates a considerable amount of morphological and
functional data. However, their exploration and comparison over time for an individual (development and aging),
between individuals (variability within the species), and even more so between different species have been done only
partially. We propose to model these data in the form of graphs, then to use recent approaches of artificial intelligence
to better analyze them.
This approach has already been initiated by a multidisciplinary consortium of researchers in neuroanatomy, biology
and computer science as well as neurosurgeons during the Regional projects NeuroGéo and Neuro2Co (LIFAT, INRAE,
INSERM). It led to the creation of SILA3D, a software platform (in free access) allowing the representation of anatomo-
functional data in the form of graphs thanks to an interactive semantic segmentation of images [1, 2].

Sujet :
In this context, the proposed thesis aims to create new algorithms for anatomical and functional analysis and
comparison of brain structures using recent deep neural networks techniques dedicated to graphs (GNN, geometric
deep learning …).
The general objectives of this thesis are:
– To specify different strategies for modeling the brain data as graphs. For this, morphological and functional data from
different imaging modalities, including structural MRI and tractography, will be combined using different approaches
to be defined. The PhD student will use two datasets already acquired: a) ex vivo high field MRI of the human brainstem
(iBrain and NeuroSpin) [5, 10]; b) in vivo MRI of growing lambs (PRC and PIXANIM) [8].
– To Investigate differences between individuals (human brainstem variability) and over time (monitoring lamb brain
development from birth to adulthood [7,8,9]). The PhD student will propose several graph comparison methods
exploiting recent advances in Deep Learning on Graphs (GNN) [3, 4, 11].
The scientific challenges associated with these objectives are (1) to develop new graph-based deep learning methods
for the detection and classification of particular substructures in an encephalon (semi-supervised classification of
nodes) [3, 11]; (2) to develop new graph-based deep learning methods for the comparison, discrimination, and
classification of encephalon (supervised or unsupervised classification of graphs) [4,11].

More information: https://lifat.univ-tours.fr/medias/fichier/offre-phd-gnnbrain2022_1648463721506-pdf

Profil du candidat :
Candidates must have an MSc or engineering degree in a field related to computer science or applied mathematics,
with strong programming skills (in particular with deep learning frameworks). Experience with medical image analysis
or brain analysis will be a plus. Candidates are expected to have abilities to write scientific reports and communicate
research results at conferences in English

Formation et compétences requises :
Applications should include the following documents in electronic format: i) A short motivation letter stating why you
are interested in this project, ii) A detailed CV describing your past education and research background related to the
position. iii) The transcripts for master degrees. iv) The contact information for references (do not include the
reference letters with your applications as we will only ask for the reference letters for short-listed candidates).
Please send your application package to jean-yves.ramel@univ-tours.fr and elodie.chaillou@inrae.fr
A first selection will occur and then interviews will be proposed between April and the end of May.

Adresse d’emploi :
The position will start in October 2022 with a salary of 1975 euros gross/month (legal amount for doctoral contracts
in France) and will be located in Tours, France (LIFAT Lab). Ideally located in the heart of France (Loire Valley), one hour from Paris
and 2.5 hours away from the Atlantic Ocean, Tours is a lively and dynamic city.

Self-supervised learning for the detection of brain anomalies in MRI imaging

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Collaboration GIN/CREATIS/INRIA
Durée : 36 mois
Contact : carole.lartizien@creatis.insa-lyon.fr
Date limite de publication : 2022-07-15

Contexte :
Key words: Machine learning, Deep Learning; Multidimensional data, Segmentation, Neuroimaging, Self-supervised learning, Anomaly detection, Unsupervised representation learning

The vast majority of deep learning architectures for medical image analysis are based on supervised models requiring the collection of large datasets of annotated examples. Building such annotated datasets, which requires skilled medical experts, is time consuming and hardly achievable, especially for some specific tasks, including the detection of small and subtle lesions that are sometimes impossible to visually detect and thus manually outline. This critical aspect significantly impairs performances of supervised models and hampers their deployment in clinical neuroimaging applications, especially for brain pathologies that require the detection of small size lesions (e.g. multiple sclerosis, microbleeds) or subtle structural or morphological changes (e.g. Parkinson disease).

Sujet :
To solve this challenging issue, the objective of this thesis is to develop and evaluate deep self-supervised detection and segmentation approaches whose training does not require any fine semantic annotations of the anomalies localization.
During the PhD thesis, new methodological research axes will be considered based on the prolific literature in this field. We will explore different categories of self-supervised methods, including : novel unsupervised auto-encoder based anomaly detection models leveraging on the recent developments in visual transformers blocks (ViT) or vector quantized variational autoencoders (VQ-VAE), scalability of Gaussian mixture models as well as weakly supervised models based on scarce annotations.
In a first step, we will focus on Parkinson disease and micro hemorrhage imaging data and fuse different MR modalities.

Environment : We offer a stimulating research environment gathering experts in Image processing, Neurosciences & Neuroimaging, Advanced Statistical and Machine Learning methods. The PhD position is granted by the “Défi IA” program sponsored by la Région Auvergne Rhône-Alpes.

How to apply: Send an email directly to the supervisors with your CV and persons to contact. Interviews of the selected applicants will be done on an ongoing basis. Applications will be accepted up to the 30st of June.
(see attached file for details)

Profil du candidat :
We are looking for an enthusiastic and autonomous student with strong motivation and interest in multidisciplinary research (image processing and machine learning in a medical context).

Formation et compétences requises :
Candidate should have strong background either in machine learning and/or deep learning or image processing and some experience in both fields as well as good programming skills.

Adresse d’emploi :
Location: Grenoble Neurosciences Institute: https://neurosciences.univ-grenoble-alpes.fr & CREATIS – Villeurbanne: https://www.creatis.insa-lyon.fr/. Time sharing in the two laboratories will be discussed with the selected candidates.

Document attaché : 202203281242_PhD_proposal_Self_Supervised_Learning_Neuroimaging_CREATIS_GIN_INRIA.pdf

ATER informatique Université d’Orléans

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFO (Laboratoire d’Informatique Fondamentale d’
Durée : 12 mois
Contact : mirian@univ-orleans.fr
Date limite de publication : 2022-05-13

Contexte :
Plusieurs postes d’ATER à temps plein du 01/09/22 au 31/08/23 (12 mois) sont ouverts à l’Université d’Orléans :
– 5 postes avec enseignement à l’UFR Sciences et Techniques (Licence / Master d’informatique et Miage)
– 1 poste avec enseignement au département informatique de l’IUT d’Orléans
– 1 poste avec enseignement à Polytech’Orléans (formation IoT)

CONTACT POUR POSTE ATER: Mathieu.Liedloff@univ-orleans.fr

Sujet :
L’intégration en recherche s’effectuera dans l’une des équipes du laboratoire LIFO (https://www.univ-orleans.fr/lifo/), prioritairement dans l’équipe CA, GAMoC, LMV ou Pamda, et moins prioritairement dans l’équipe SDS localisée à Bourges :
– CA : Contraintes et Apprentissage (IA),
– GAMoC : Graphes, Algorithmes, et Modèles de Calcul,
– LMV : Langages, Modélisation et Vérification, et
– Pamda : Parallélisme et gestion de données (Big Data)
– SDS : Sécurité des Données et des Systèmes

Profil du candidat :
Doctorant ou jeune docteur

Formation et compétences requises :
Les fiches de poste sont disponibles ici :
– [UFR ST] https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ATERListesOffresPubliees/0450855K/FOPC_45124.pdf
– [IUT] https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ATERListesOffresPubliees/0450855K/FOPC_45021.pdf
– [Polytech] https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ATERListesOffresPubliees/0450855K/FOPC_45020.pdf

Adresse d’emploi :
Université d’Orléans
https://www.univ-orleans.fr/fr/univ/universite/travailler-luniversite/personnels-enseignants-et-chercheurs/attaches-temporaires

Interprétation des réseaux de neurones pour l’imagerie médicale

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CREATIS / LIRIS
Durée : 3 ans
Contact : michael.sdika@creatis.insa-lyon.fr
Date limite de publication : 2022-05-13

Contexte :
L’apprentissage profond a fait faire un bond en avant fulgurant à l’analyse d’image médicale. Cependant, les réseaux
de neurones restent des “boîtes noires”: on ne sait ni comment sont prises les décisions ni quelles sont les
caractéristiques de l’image d’entrée utilisé pour la décision. Or le domaine médical est un domaine critique dans
lequel on shouhaite la décision soit transparente ou au moins vérifiable par clinicien. Par ailleurs, les bases
d’apprentissage/validation/test étant souvent issues de la partition d’une même base globale, un biais dans celle ci
affectera la généralisation du réseau qui montrerait pourtant de bons résultats.
Les cartes d’attributions [IG,EG], identifiant les pixels d’importance dans le décision d’un réseau, permettent parfois
de voir, a posteriori, les zones utilisées par un réseau pour prendre sa décision.Avec ces outils, nous avons montré à
CREATIS, que pour un classifieur sujets sains vs pathologiques, on pouvait améliorer l’interprétabilité
[Wargnier2021] ou utiliser ces cartes à l’apprentissage pour baser la décision sur les lésions (voir figure ci dessous)
[Wargnier 2022].

Sujet :
Différents axes pourront être abordés durant la thèse.
Nous avons constaté qu’avec notre terme de régularisation [Wargnier2022], l’apprentissage était plus long et plus
difficile. Le premier axe de la thése sera un travail sur la stabilisation de l’apprentissage: comprendre pourquoi
l’apprentissage est plus compliqué et proposer des méthodes pour réduire les temps d’apprentissage.
Notre terme de régularisation n’étant adapté qu’à des problèmes de classification, dans un second axe nous
pourrons étendre notre régularisation à des tâches de régression. Nous pourrons comme cas d’application des
problèmes de recalage affine ou de prédiction du handicap en sclérose en plaque.Dans un troisième axe, nous étendrons notre approche à la segmentation. Pour cette tâche ce type de
régularisation pourrait réduire le nombre de sujets annotées nécessaire. Il faudra prendre en compte deux
nouveaux aspects: le changement d’architectures qui sont de type encodeur/decodeur et le fait que la sortie n’est
pas qu’une unique valeurs mais une image de même taille que l’image d’entrée.

Profil du candidat :
Formation : machine/deep learning, mathématiques appliquées, analyse d’images, vision par ordinateur.
Un excellent niveau en développement logiciel, anglais (écrit/oral) et des facilités de rédaction sont aussi
attendues.
Merci de fournir les documents suivant avec votre candidature :
– Curriculum Vitae
– Diplômes et notes pour l’ensemble du cursus universitaire
– Lettre(s) de recommandation de l’encadrant de stage
– Lettre de motivation

Formation et compétences requises :
Formation : machine/deep learning, mathématiques appliquées, analyse d’images, vision par ordinateur.
Un excellent niveau en développement logiciel, anglais (écrit/oral) et des facilités de rédaction sont aussi
attendues.
Merci de fournir les documents suivant avec votre candidature :
– Curriculum Vitae
– Diplômes et notes pour l’ensemble du cursus universitaire
– Lettre(s) de recommandation de l’encadrant de stage
– Lettre de motivation

Adresse d’emploi :
Lieu : CREATIS La Doua Campus, Villeurbanne, France
Démarrage: Octobre 2022

Document attaché : 202203251552_phd-2022.pdf

Learning to quantify uncertainties in scientific machine learning methods with application in hemodynamics

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISN, CNRS, Univ. Paris Saclay
Durée : 36 mois
Contact : lionel.mathelin@lisn.upsaclay.fr
Date limite de publication : 2022-05-31

Contexte :
Les processus de décision à fort enjeu et les applications scientifiques nécessitent à la fois des méthodes robustes et la capacité de quantifier l’incertitude des approches d’apprentissage automatique prédictif pour minimiser les risques et fournir la rigueur scientifique requise. Néanmoins, les méthodes traditionnelles d’apprentissage automatique
telles que l’apprentissage profond rencontrent des difficultés à expliquer leurs résultats, à faire respecter les contraintes physiques et à traiter de petites bases de données souvent bruitées. La mécanique des fluides, par exemple, peut normalement offrir des quantités de données très limitées ou de faible qualité, la vérité terrain est régulièrement inconnue, les bases de données de référence sont conventionnellement rares, et enfin, leurs problèmes ont généralement des termes et des paramètres inconnus. Récemment, le développement des réseaux des neurones guidés par la physique a ouvert de nouvelles perspectives pour la solution de différentes équations différentielles universelles et de solveurs pour les équations aux dérivées partielles dans les problèmes de haute dimension. Malgré les progrès de l’intégration des techniques de quantification de l’incertitude dans ces techniques, celles-ci sont encore sous-utilisées pour diverses raisons. Tout d’abord, il s’agit encore d’un domaine en développement avec de nombreux concepts encore flous pour la communauté de l’apprentissage automatique. De même, les applications de la mécanique des fluides ont un coût de calcul plus élevé que leurs homologues traditionnels de l’apprentissage profond, ce qui renforce l’hésitation de la communauté de l’apprentissage automatique par les techniques traditionnelles de quantification de l’incertitude. De même, les communautés d’apprentissage automatique se sont appuyées sur des ensembles de données simples pour valider les méthodes de quantification de l’incertitude, et elles ne peuvent traiter que des problèmes à faible dimension.

Sujet :
Cette thèse a pour objectif de développer de nouvelles stratégies de
quantification d’incertitudes dédiées à la fiabilisation de méthodes pour l’apprentissage automatique scientifique dans le domaine de la mécanique des fluides numériques.
Un focus sera fait sur des applications de systèmes de mécanique des fluides multi-échelles permettant de tester la sensibilité de la quantification à des incertitudes de différentes natures et à différentes échelles. Elle envisage également l’utilisation de méthodes d’analyse après-coup séparées du modèle prédictif. Dans ce cas, un modèle externe observe les méthodes d’apprentissage et tente de comprendre leurs incertitudes prédictives en observant les différents patterns d’erreurs qui conduisent aux incertitudes prédictives des modèles. Enfin, cette thèse explorera l’utilisation de méthodes de d’incertitude classiques (par ex., polynômes de chaos, indices de Sobol) avec ceux utilisés par les méthodes d’apprentissage profond.

Mots-clefs : Apprentissage profond, quantification des incertitudes, systèmes physiques complexes, approche Bayésienne, mécanique des fluides, hémodynamique.

Profil du candidat :
Master en Mathématiques appliquées, statistiques, science des données, quantification des incertitudes.

Formation et compétences requises :
Connaissance des méthodes d’apprentissage automatique et formation en mathématiques appliquées et statistiques.

Utilisation des outils actuels de science des données : langage Python et
framework de deep learning (comme PyTorch, TensorFlow ou Keras).

Adresse d’emploi :
Laboratoire Interdisciplinaire des Sciences du Numérique (LISN)
Université Paris-Saclay, CNRS

Document attaché : 202203251540_UDOPIA_Thesis_Proposal_UQSML.pdf

ÉCOLE THÉMATIQUE DU CNRS : BDA MDD

Date : 2022-06-19 => 2022-06-19
Lieu : Bastia, Corse, France, Centre IGESA, La Marana

ÉCOLE THÉMATIQUE DU CNRS : BDA MDD
19 – 24 juin 2022, Bastia, Corse, France
https://cedric.cnam.fr/lab/confs/mdd2022/

LES INSCRIPTIONS SONT OUVERTES

Date limite d’inscription: 15 mai 2022
Le nombre de participants est limité (la priorité sera donnée aux doctorants).

Venez surfer sur les vagues de données avec nous !

L’ère des données est ici et maintenant. Dans une société et un environnement axés sur les données, les solutions d’intégration, d’analyse et de modélisation des données doivent fonctionner au-dessus de différentes architectures cibles. Les solutions, protocoles et technologies de base de données évoluent à un rythme élevé, ce qui ouvre des défis passionnants à relever par des approches de recherche et de développement.

L’école thématique CNRS MDD « Masses de données distribuées » est une école thématique récurrente ayant lieu tous les deux ans depuis 2010. Cette école est une émanation de la communauté des bases de données en France, structurée autour de la conférence BDA : Gestion de données – principes et applications, qui a fêté ses 30 ans d’existence en 2016. Si notre conférence est le lieu de rencontre de notre communauté, l’école thématique MDD permet d’exposer en détails des thèmes fondamentaux pour la compréhension de l’évolution de notre domaine de recherche, et de préparer les doctorant(e)s à suivre – et provoquer – ses évolutions.

L’école MDD s’est attachée lors des cinq premières sessions à aborder des thèmes liés à ces défis. La première session (2010), a ainsi traité des systèmes distribués de gestion de données et du Web sémantique ; la seconde session (2012) s’est consacrée aux opérateurs de traitement de requêtes à l’échelle du Pétaoctet, aux nouvelles sources d’information (réseaux sociaux), à l’intégration de données issues d’environnement indépendants ; la session de 2014 a été dédiée à la visualisation analytique de données, à la qualité des données et au crowdsourcing ; la session de 2016 a porté sur les processus intégrés d’analyse de données massives respectueux de la vie privée. En 2018, la session a traité du « Scalable Data Analytics » avec les moyens d’analyser les données à large échelle. La session de 2020 a malheureusement été suspendue durant la pandémie et reportée à 2022.

L’école MDD offrira un programme intensif et passionnant et un environnement de travail avec des expert.e.s qui donneront des cours et mettront en pratique les problèmes qui font avancer le domaine. Les activités scientifiques seront combinées à des discussions et activités informelles qui favoriseront l’émergence d’idées, de projets et d’expérimentations qui aideront les doctorants et les chercheurs à compléter leurs recherches actuelles.

— PROGRAMME —

19/6 : Dimanche après-midi : arrivée

6/20 : Lundi : Intégration de données hétérogènes : Sémantique et polystores, Ioana Manolescu, François Goasdoué, Maxime Buron

21/06 : Mardi : Matin : Systèmes de traitement des grands graphes
Angela Bonifati, Chao Zhang

Après-midi : Comment mener des expériences ?
Nicolas Travers

6/22 : Mercredi Matin : Déployer des applications de Deep Learning à l’échelle : le défi des bases de données,
Genoveva Vargas-Solar et Javier Espinosa

Après-midi : Evénement social

6/23 : Jeudi : Sécurité des données et confidentialité des données externalisées dans le Cloud
Amr el Abbadi, Tristan Allard

Tutorial le matin et session pratique l’après-midi.

6/24 : Vendredi : Départ le matin

Le public cible de cette école est principalement constitué de jeunes chercheurs dans le domaine des bases de données ainsi que dans des domaines connexes ou multidisciplinaires (gestion de grandes quantités de données pour des applications scientifiques par exemple). Par jeunes chercheurs, nous entendons les doctorants et post-doctorants. L’école est également ouverte aux enseignants-chercheurs et chercheurs plus expérimentés dans un but d’ouverture thématique, de création d’un réseau d’échange ou de reconversion. L’école s’adresse évidemment aux ingénieurs de recherche du secteur privé (R&D, startup, etc.).

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Research Fellow (postdoctoral) position in the Computational Digital Pathology Lab of Bioinformatic

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Computational Digital Pathology Lab (CDPL) of Bioi
Durée : 1 an et +
Contact : yu_weimiao@bii.a-star.edu.sg
Date limite de publication : 2022-05-01

Contexte :
For a research overview of our unit, please refer to https://www.a-star.edu.sg/bii/research/ciid/cdpl

Sujet :
Novel imaging analysis methods and the advancement of Artificial Intelligence are making it feasible to extract quantitative information from Digital Pathology images. New knowledge, skills, and approaches are urgently required to develop novel, efficient and reliable computational tools for emerging challenges in biological and biomedical studies. Our CDPL is dedicated to the development of new solutions in this field. Currently, we are expanding our team and seeking enthusiastic scientists to join us!
Please email a detailed CV containing a list of publications to Dr. Weimiao YU, yu_weimiao@bii.a-star.edu.sg
Only shortlisted applicants will be notified.

Profil du candidat :
• Self-motivated scientist/Ph. D graduate to pursue a scientific career. Independent and passionate about biological image processing projects;
• Good team player. Able to undertake independent research projects under the direction of the PI together with other team members;
• Hold a Ph.D. in a relevant field of computer vision, image processing or machine vision, or other relevant fields;
• Good general knowledge and concept of science and engineering;
• Excellent scientific/technical writing skills and communication capability;
• Prior experience in working with image analysis projects (Industrial or academic).

Formation et compétences requises :
• Excellent experience, knowledge, and skills in one or two following programming languages, i.e., Matlab, C/C++, Java or Python;
• Excellent knowledge and skills in digital image processing;
• Deep understand of AI learning, machine learning and data science with hand-on skill and experience.
• Skills for numerical computational algorithms; Strong in mathematics theories.
• Rigid and logical thinking of scientific problems;
• General understanding of machine learning, pattern recognition, and artificial intelligence is a plus, but not compulsory;
• Basic knowledge of cell biology or pathology is a value-add;
• Present research achievements at internal/external seminars and conferences

Adresse d’emploi :
30 Biopolis Street, #07-01 Matrix, Singapore 138671

L’institut ACSS de l’Université PSL recrute des ingénieurs en science des données pour les sciences

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Institut ACSS, l’Université PSL
Durée : 1 an renouvelable
Contact : bruno.chavesferreira@dauphine.psl.eu
Date limite de publication : 2022-03-22

Contexte :
Dans le cadre du développement de l’Institut ACSS, l’Université PSL recrute deux ingénieurs d’études (IE) et un ingénieur de recherche (IR) en science des données. Ils seront chargés de mettre en œuvre des méthodes et outils de collecte et traitement de données issues de sources variées (Web, bases de données institutionnelles, archives, etc.). Ils auront également la responsabilité de veiller au respect des bonnes pratiques en matière de développement et de gestion du code et des données. Enfin, ils contribueront au développement de modèles statistiques ou d’apprentissage automatique (notamment dans le domaine du traitement automatisé de la langue naturelle).

Créé au sein de l’Université Paris Sciences et Lettres (PSL) et hébergé à Paris Dauphine, l’Institut « Applied Computational Social Sciences » a pour vocation de renforcer la recherche sur les grandes problématiques sociétales (cohésion politique et sociale, transition écologique, transformation numérique, efficacité et compétitivité économique) en articulant sciences des données et sciences sociales.

Sujet :
L’Institut collecte et traite à larges échelle des données hétérogènes tant pour permettre des avancées scientifiques que pour contribuer à éclairer le débat public et la décision. Il réunit sur une équipe pluridisciplinaire de chercheurs et s’appuie sur une équipe d’ingénieurs qui apportent leurs expertises pour constituer des bases de données originales et opérer des traitements complexes. Ces projets sont initiés et portés par des laboratoires du CNRS, de Dauphine, de l’ENS, de l’INSP, et des MinesParis-Tech. Les résultats des travaux ont vocation à être largement diffusés auprès de partenaires institutionnels et du monde économique.

Profil du candidat :
INGÉNIEUR D’ÉTUDES EN SCIENCE DES DONNÉES (2 POSTES)

Compétences nécessaires :
Connaissance approfondie de l’écosystème Python (et/ou R) en traitement, analyse et visualisation de données.
Maîtrise des bases de données relationnelles et NoSQL.
Méthodologies de développement : tests unitaires, gestion de versions (GIT).
Compréhension des méthodes scientifiques des sciences humaines et sociales.
Compétences additionnelles souhaitées :
Connaissance des paradigmes principaux d’apprentissage automatique (régression, classification supervisée, clustering, visualisation, etc.).
Pratique des services web modernes (architecture REST, formats JSON, XML, etc.) et des expressions régulières.
Une expérience en traitement de la langue naturelle (NLP) sera vivement appréciée.

INGÉNIEUR DE RECHERCHES EN SCIENCE DES DONNÉES (1 POSTE)
Compétences nécessaires :
Expérience dans le développement de réseaux de neurones profonds et autres modèles statiques avancés appliqués au traitement automatisé du langage sur de larges corpus.
Maîtrise des écosystèmes Python et R dédiés à la science des données.
Plus spécifiquement en Python, maîtrise de numpy, pandas, spacy, ntlk et connaissance pratique de tensorflow, keras et pytoch.
En R, maîtrise du tidyverse, de tidymodels et des bibliothèques associées, ainsi que de torch
Maîtrise des bases de données relationnelles et NoSQL.
Compréhension des méthodes scientifiques des sciences humaines et sociales.
Compétences additionnelles souhaitées :
Pratique des services web modernes (architecture REST, formats JSON, XML, etc.) et des expressions régulières.
Méthodologies de développement : tests unitaires, contrôle de versions (GIT).

Formation et compétences requises :
INGÉNIEUR D’ÉTUDES EN SCIENCE DES DONNÉES (2 POSTES)

Titulaire d’un master informatique, maths-info ou d’un diplôme d’école d’ingénieur.

INGÉNIEUR DE RECHERCHES EN SCIENCE DES DONNÉES (1 POSTE)
Diplôme d’ingénieur en informatique (ou mathématiques/statistiques) avec au moins 3 ans d’expérience ou titulaire d’un doctorat avec une thèse dans le domaine.

Adresse d’emploi :
Université Paris Dauphine-PSL
Pl. du Maréchal de Lattre de Tassigny, 75016 Paris

Document attaché : 202203221728_IngenieursACCS_fr.pdf

Deep learning for multi-modal satellite remote sensing

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CESBIO
Durée : 9 – 24 months
Contact : jordi.inglada@cesbio.eu
Date limite de publication : 2022-06-30

Contexte :
About CESBIO
════════════

Research at CESBIO aims to develop knowledge on continental biosphere
dynamics and functioning at various temporal and spatial scales and as
such participates in the specification of space missions and the
processing of remotely sensed data. CESBIO is or has been PI for 2 ESA
satellite missions (SMOS, the Soil Moisture and Ocean Salinity
satellite, and BIOMASS, a P-band SAR system to be launched in 2022)
and for the French-Israeli Venus satellite (2-day revisit, 10 m
resolution, optical sensor for vegetation monitoring, launched in
2017). CESBIO has developed the [`iota2′] processing chain for the
operational production of land-cover maps at the national French
scale. It has therefore a strong experience in upscaling learning and
classification processes. CESBIO has been committed over the last 4
years in collecting feedback, tailoring `iota2′ outputs for various
end-users, and disseminating it for several research institutes in
France.

[`iota2′]

Context
═══════

The [MAESTRIA] project (Multi-modAl Earth obServaTion Image Analysis)
aims to solve the methodological challenges related to the fully
automatic analysis of the massive amount of images acquired by Earth
Observation platforms. MAESTRIA targets to generate land-cover and
land-use descriptions at country scale at many spatial resolutions and
sets of classes. The ultimate goal is to provide a continuum of
spatially and semantically consistent products, that are relevant for
many end-users and applications. Both public policies at local or
national levels and scientific models will benefit from such kinds of
products for climate modelling, urban planning, crop monitoring or
impact assessment of surface changes.

The output of the MAESTRIA project will be two-fold: (i) methods that
leverage current challenges in Earth Observation image analysis; (ii)
a large range of precise and up-to-date land-cover maps available over
very large scales from 2m to 100m. Both will be made freely available
so as to stimulate research and commercial services built upon such
maps.

The current position integrates in and is funded by the MAESTRIA
project.

[MAESTRIA]

Application procedure
═════════════════════

Candidates should send an e-mail to jordi.inglada@cesbio.eu
containing:
1. Full CV
2. Letter of interest
3. Contact information for 2 references

Remuneration and duration
═════════════════════════

The gross monthly salary will be between 1800 € and 2200 € depending
on the experience. The contract may be reconducted up to 24 months in
the frame of another project.

Sujet :
Assignment
══════════

The work is dedicated to the fusion of heterogeneous information
coming from different satellite sensors in order to improve the
accuracy and semantic richness of the produced land cover maps.

In MAESTRIA, a new /pivotal/ representation of the multi-modal data is
being be developed in order to minimize the loss of information with
respect to the original data: *a set of common variables to all
modalities sampled at 10m resolution and daily revisit*. Two main
approaches will are developed in parallel: one based on (1) *physical
approaches* (models of the landscapes and the measuring mechanisms)
and the other one based on purely (2) *statistical approaches*. We pay
special attention to the possibility of cross-pollination of the two
approaches.

The specific tasks of the job cover the implementation and the
evaluation of representation learning algorithms (deep learning
networks). The work will be done under the supervision of the MAESTRIA
researchers.

Profil du candidat :
• Master’s or PhD in Applied Mathematics, Computer Science or Machine
Learning

Formation et compétences requises :
• Good programming skills in Python, knowledge of Pytorch will be
highly appreciated

Adresse d’emploi :
CESBIO
CNES – DSO/SI/CB – BPI 2801
18, avenue Edouard Belin
31401 Toulouse Cedex 09 – France

Document attaché : 202203221532_mmdc-position-cesbio-2022.pdf

Détection d’anomalies en apprentissage machine

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Informatique et Société Numérique (LIS
Durée : 3 ans
Contact : alexandre.baussard@utt.fr
Date limite de publication : 2022-04-22

Contexte :
La détection d’anomalies est un sujet important de l’analyse de données. La définition d’une anomalie peut varier en fonction du domaine d’application ou de l’objectif visé, mais généralement on considère que c’est une observation qui dévie considérablement du reste des autres observations comme si elle était générée par un processus différent. Ainsi, dans certains cas la détection d’anomalies peut permettre d’améliorer la qualité des données par suppression ou remplacement des données anormales. Dans d’autres cas, les anomalies traduisent un événement et apportent de nouvelles connaissances utiles. Par exemple, la détection d’anomalies peut prévenir un dommage matériel et donc inciter à la maintenance préventive dans le domaine de l’industrie. Elles peuvent aussi être signe de la présence d’un nouveau phénomène qu’il faudra essayer de prendre en compte, comme la détection d’une nouvelle classe.

Sujet :
L’apprentissage machine et plus particulièrement l’apprentissage profond (deep learning) permettent d’obtenir des performances très élevées lorsqu’on cherche par exemple à détecter et reconnaitre des objets ou encore à classifier des zones d’intérêt dans des images ou des vidéos. Cependant, en utilisation réelle, il faut décider si une nouvelle observation appartient à la même distribution que les observations existantes (utilisées lors de l’apprentissage), ou si elle doit être considérée comme différentes. Ce type de distinctions peut intervenir à deux niveaux selon les contextes. Dans un premier cas les données d’apprentissage contiennent des observations aberrantes qui sont définies comme des observations éloignées des autres. Les estimateurs de détection des aberrations tentent donc d’ajuster les régions où les données d’apprentissage sont les plus concentrées, en ignorant les observations déviantes. Dans le second cas, les données d’apprentissage ne sont pas polluées par des valeurs aberrantes, mais ces dernières peuvent survenir lors de la phase de te. Dans ce cas, nous sommes intéressés à adjoindre aux méthodes de reconnaissance une aptitude à écarter les nouvelles observations aberrantes. Nous sommes donc intéressés à détecter si une nouvelle observation est une valeur aberrante. Il s’agit notamment d’éviter que le système prenne une décision, à tort, avec une grande confiance. Dans ce contexte, la détection d’une observation aberrante peut avoir différents intérêts car elle pourrait par exemple être liée à une information pertinente jamais rencontrée ou non apprise jusqu’ici. Il apparaît donc important de pouvoir détecter dans un premier temps ces anomalies et, dans un deuxième temps, d’essayer de les exploiter pour mettre en évidence d’éventuelles nouvelles données utiles.

Dans le cadre de ce projet, nous allons nous focaliser sur le deuxième cas, à savoir la détection d’anomalies en condition d’utilisation réelle. Notre objectif en développant ces méthodes de détection est double. Il s’agit d’éviter les erreurs et de progresser vers une meilleure compréhension du processus de prise de décision par ces systèmes souvent considérés comme des « boîtes noires », dont le fonctionnement interne n’est pas explicable. Cela devrait aussi contribuer à caractériser les éléments conduisant à la prise de décision, via par exemple un niveau de confiance dans la décision.

Profil du candidat :
Etudiant de niveau master 2 avec une formation universitaire ou école d’ingénieur.

Formation et compétences requises :
Le candidat devra avoir des compétences en mathématiques appliquées, informatique, statistique, sciences des données et traitement du signal et des images.

Une première expérience dans le domaine de l’apprentissage profond et dans l’utilisation des bibliothèques TensorFlow ou PyTorch seront des plus.

Adresse d’emploi :
Université de Technologie de Troyes