Poste MCF Informatique Université de Haute-Alsace, ENSISA / Laboratoire IRIMAS, équipe MSD

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Université Haute-Alsace
Durée : indéterminée
Contact : maxime.devanne@uha.fr
Date limite de publication : 2024-03-06

Contexte :
Nous recrutons un(e) MCF en Informatique (CNU 27) dans notre équipe (dynamique et sympa) à l’Université de Haute-Alsace pour une prise de poste le 1er septembre 2024. Le profil recherche du poste est en analyse de séries temporelles avec des enseignements en réseau.

Conditions d’accueil particulières à l’UHA :
– Décharge d’enseignement pendant deux ans (96 h ETD la première année, 32 h ETD la deuxième année).
– Éligibilté à des projets spécifiques nouveaux recrutés (10 000 €) expertisés par la Commission de la Recherche.

Sujet :
La personne recrutée intégrera l’équipe MSD d’IRIMAS pour ses activités de recherche et la spécialité Informatique et Réseaux de l’ENSISA pour ses activités d’enseignement.

Les profils précis attendus par chaque laboratoire sont précisés ci-dessous. N’hésitez pas à contacter l’équipe pour plus d’informations sur le poste :
– Recherche : Germain Forestier (germain.forestier@uha.fr)
– Enseignement : Jonathan Weber (jonathan.weber@uha.fr)

Profil du candidat :
Profil recherche:
La/Le candidat(e) intégrera l’équipe MSD (Modélisation et Science des données) du département Informatique (https://msd-irimas.github.io) de l’IRIMAS. Il/Elle justifiera d’une expérience significative dans l’analyse et la fouille de séries temporelles et viendra renforcer l’axe de recherche « Science des données » de l’équipe. Au sein de cet axe, la/le candidat(e) s’attachera à développer les travaux actuels du département informatique sur la classification de séries temporelles de diverses origines (capteurs embarqués, satellites, dispositif chirurgicaux, etc.) par des approches de deep learning. Une expérience de projets de recherche nationaux et internationaux ; l’existence de collaborations avérées (publications, séjours scientifiques, projets) entre le candidat et des équipes internationales renommées sera appréciée. De plus, la/le candidat(e) s’appliquera de par ses capacités et activités à favoriser les interactions avec les équipes des départements « informatique », « Automatique, signal et Image » et « Mathématiques » de l’IRIMAS. Enfin, il/elle s’investira dans la vie de l’équipe.

Profil enseignement:
La/Le candidat(e) effectuera son enseignement principalement dans les trois années de la spécialité Informatique et Réseaux de l’ENSISA (https://www.ensisa.uha.fr/formations/ecole-ingenieur-informatique-et-reseaux/), éventuellement dans les autres spécialités d’ingénieurs de l’Ecole. La/Le candidat(e) devra posséder de solides compétences en informatique et des connaissances permettant d’aborder les aspects réseaux qui constitueront la majorité de son service. Une implication dans les enseignements d’apprentissage automatique (Intelligence Artificielle, Deep Learning) ainsi que ceux de cybersécurité, deux thèmes en développement dans la spécialité, sera également possible. Il/Elle s’impliquera dans les enseignements DDRS (Développement Durable et Responsabilité sociétale) de la spécialité. De plus, la/le candidat(e) s’investira également dans les enseignements du cycle post-bac de l’ENSISA (l’ENSISA étant partenaire INSA). L’enseignant(e)-chercheur(e) s’impliquera dans la vie de l’école (encadrement de projets, suivi de stages et d’apprentis, …) et envisagera à moyen terme la prise de responsabilités administratives collectives.

Formation et compétences requises :
Titulaire d’un Doctorat en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
Université Haute-Alsace, ENSISA
12 rue des Frères Lumière
68093 Mulhouse, France

Réalisation d’un benchmark des méthodes de détection d’armées de robots dans les réseaux sociaux

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’Informatique de Bourgogne (LIB)
Durée : 5-6 mois
Contact : eric.leclercq@u-bourgogne.fr
Date limite de publication : 2024-03-06

Contexte :
Dans les réseaux sociaux, la manipulation de l’information est une problématique pouvant avoir des conséquences néfastes importantes. Les stratégies de diffusion d’informations manipulées sont complexes, et peuvent avoir recours à la mise en oeuvre d’armées de robots ayant différents rôles dans le réseau. Par exemple, un groupe de robots peut avoir pour tâche de spammer certains messages ou mots clés afin de manipuler les tendances et de gagner une visibilité importante en peu de temps, d’autres robots peuvent avoir un profil évolué ainsi qu’une activité quotidienne, leur permettant de passer pour des utilisateurs légitimes et de donner plus de poids aux messages qu’ils pourraient diffuser dans certaines communautés. Toutefois, la détection de ces armées de robots est complexe, et l’évolution rapide de leur comportement et de leur organisation restreint les types d’algorithmes utilisables.

Le projet ANR Beelzebot est un projet interdisciplinaire regroupant des chercheur en informatique, en sciences de la communication et du langage. Il a pour objectif de définir des mécanismes pour détecter les armées de robots sur Twitter en se basant sur des méthodes non-supervisées, ainsi qu’à caractériser les activités de ces armées.

Sujet :
L’objectif du stage, dans le cadre du projet ANR Beelzebot, est de réaliser un textit{benchmark} des techniques de détection de robots existantes, afin d’en révéler les limites et de voir leur capacité à prendre en compte à différents jeux de données.

En plus des jeux de données publics, plusieurs jeux de données collectés sur Twitter sont à disposition, comme par exemple les discussions autour des élections présidentielles françaises de 2022 ou le COVID, contenant de plusieurs millions à plusieurs milliards de tweets. L’environnement matériel des serveurs de stockage et de traitement est opérationnel au Data Center Régional de l’UBFC.

Plus précisément, le stage consiste à réaliser un état de l’art pour identifier les méthodes de détection de robots exploitables (par exemple lorsque le code est déjà disponible), puis à établir un protocole expérimental permettant de comparer ces méthodes entre elles et enfin à réaliser les expériences correspondantes et mesurer les critères définis dans le protocole. Une attention particulière sera portée sur la reproductibilité de l’implémentation du protocole qui devra permettre de prendre en compte rapidement de nouvelles méthodes de détection ou de nouveaux jeux de données.

Ce travail constitue un travail préparatoire, qui pourra être poursuivi au cours d’une thèse financée par la projet ANR.

Profil du candidat :
étudiant en Master 2 avec spécialité informatique

Formation et compétences requises :
Formation Scientifique avec une solide base en informatique
Curiosité et rigueur scientifique
Compétences en gestion de données et programmation

Adresse d’emploi :
Université de Bourgogne
Laboratoire d’Informatique de Bourgogne
UFR Sciences et Techniques
9, Avenue Alain Savary
21078 Dijon

Document attaché : 202401300744_SujetStageBeelzebot.pdf

POST-DOCTORAL position – Detection of neurovisual disorders on a driving simulator

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LISV laboratory / University of Versailles Saint-Q
Durée : 10 month
Contact : olivier.rabreau@uvsq.fr
Date limite de publication : 2024-03-06

Contexte :
A 10-month post-doctoral position is available at the University of Versailles Saint-Quentin (UVSQ) in the LISV laboratory (www.lisv.uvsq.fr) headed by Professor Eric Monacelli. The post is part of the APTICONDUITE research project, which is part of the ‘Interactive Robotics’ research team.

Sujet :
The APTICONDUITE project aims to develop a new methodology integrated into a driving simulator for assessing neurovisual disorders of drivers in handicap situation.
This project combines a new multimodal experimental approach with advanced statistical modelling to provide a new theoretical and practical angle for studying neurovisual diseases in the field of adaptive driving.
In this context, the post-doctoral student will initially contribute to analyzing data from a network of physiological sensors on board a driving simulator. He/she will have to retrieve relevant information to characterize the driving performance of a specific population (stroke, cognitive disorders, etc.).
The second stage will involve developing a new methodology for the early detection of neurovisual disorders using artificial intelligence algorithms, in order to improve current clinical assessments.
The data set will include images, electrical signals and indicators such as heart rate, breathing rate, etc…

Profil du candidat :
Major responsibilities

– To use artificial intelligence techniques for the advanced exploration and analysis of data collected from biometric sensors (eye tracker, ECG, EMG, breathing, etc.) on a driving simulator, and to develop predictive models to assess the impact of visual disorders on road safety.
– Designing, developing and implementing specific assessment protocols for evaluating visual disorders in drivers on driving simulators, incorporating artificial intelligence methods.
– Collaborate with clinicians, ophthalmologists and vision experts to integrate objective measurements of visual disorders into the driving context, using machine learning algorithms.
– Contribute to the writing of scientific articles and the presentation of results at national and international conferences.
– Actively participate in research team discussions and meetings, working closely with other researchers and students.

We are looking for a PhD with experience in cognitive science and data processing:
– PhD: the candidate could hold a PhD in psychology, neuroscience, biomedical engineering or a related data scientist field.

Formation et compétences requises :
– Advanced skills in data analysis and the use of statistical software.
– Practical experience with artificial intelligence methods, including the use of machine learning algorithms to analyze complex data.
– Knowledge of visual disorders and their implications for driving would be appreciated.

Adresse d’emploi :
10-12 avenue de l’Europe 78140 Vélizy (France)

Document attaché : 202401291202_Post-doc1_APTICONDUITE_MIXED.pdf

Exploitation de l’imagerie aérospatiale pour la cartographie sémantique en prévention des risques naturels

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PRISME (UO) et BRGM Orléans
Durée : 6 mois
Contact : yves.lucas@univ-orleans.fr
Date limite de publication : 2024-03-31

Contexte :
Contexte et Objectifs du stage :

En télédétection, la production intensive de données satellitaires et aériennes multicapteurs et de résolution spatiale croissante (visible, IR, hyperspectral, lidar, radar,topographie, librairies spectrales de matériaux …) donne accès à une observation très fine de la terre qui pourrait notamment être exploitée dans le cadre de la gestion et la
prévention des catastrophes naturelles. En particulier, ces données sont particulièrement intéressantes pour la cartographie sémantique des éléments exposés, qui correspondent aux éléments d’un territoire qui peuvent être affectés par une catastrophe naturelle. Connaître leurs caractéristiques, comme leur géométrie, leur localisation, leur âge etc. est un prérequis indispensable à toute étude d’analyse de risques. Dans un contexte de changement climatique, où les catastrophes naturelles se multiplient, ces données représentent donc un enjeu majeur pour l’actualisation des scénarios de risques utilisés pour protéger un territoire.
Pour autant, l’exploitation des données satellitaires et aériennes représente un véritable challenge à cause de leur volumétrie et de leur forte hétérogénéité. Les techniques de machine learning, qui ont déjà révolutionné le domaine de la Computer Vision, semblent prometteuses pour lever ces contraintes, mais doivent encore être adaptées à la problématique spécifique de l’estimation de la vulnérabilité d’un territoire. Dans ce contexte, l’objectif de ce stage est de préparer l’extraction automatique des caractéristiques des éléments exposés à partir des images aérospatiales. Il s’agira plus précisément de répertorier les sources de données exploitables, de mettre en place un pipeline de collecte et de traitement de ces données gérant de façon automatique le flot entrant de nouvelles données, puis d’expérimenter l’extraction de
quelques caractéristiques pertinentes à partir de modèles d’apprentissage profond issus de l’état de l’art en segmentation sémantique.
Ces travaux, proposés par le laboratoire PRISME de l’Université d’Orléans et le BRGM, s’inscrivent dans le cadre du projet Région Centre Val de Loire CERES – Cartographie et caractérisation des éléments exposés de la région CVL à partir d’images satellites – qui vise à développer la connaissance des éléments exposés de la Région Centre Val de Loire pour la mettre à disposition de l’ensemble des acteurs socioéconomiques régionaux impliqués dans la gestion des risques induits par les catastrophes naturelles.

Sujet :
Programme de travail :

– Sources de données : répertorier les sources de données et d’images disponibles pour la cartographie et leurs modalités d’accès et mettre en place les fonctionnalités nécessaires à l’intégration automatique de nouvelles données dès leur parution.

– Caractérisation des éléments exposés : identifier les caractéristiques spatiales, géométriques, spectrales, documentaires … d’intérêt, exploitables dans les différentes sources de données et pertinentes pour la prévention des risques naturels.

– Traitement des données : évaluer les performances de différentes solutions de calcul en ligne ou locales et expérimenter quelques modèles deep learning avancés de l’état de l’art pour l’extraction de caractéristiques des éléments exposés aux aléas climatiques.

– Rédaction du mémoire de Master 2

Profil du candidat :
étudiant(e) en Master 2 Recherche à dominante informatique

Formation et compétences requises :
Compétences indispensables :

– traitement des images (librairie OpenCV) et analyse de données

– ingénierie informatique pour le déploiement applicatif des modèles deep learning (librairies Python Pytorch, Keras, TensorFlow…)

– intérêt pour le domaine de l’imagerie satellitaire apprécié

– bonne pratique de l’anglais scientifique indispensable

– autonomie, rigueur scientifique et forte motivation pour le sujet

Adresse d’emploi :
Modalités pratiques

Durée du stage : 6 mois max (avril-sept 2024)
Gratification de stage M2
Lieu du stage : BRGM – 3 avenue Claude Guillemin, 45100 Orléans – Bureau et poste de travail informatique.

NB : plusieurs résidences universitaires du campus de la Source à proximité du BRGM. Accès au restaurant BRGM.

Contacts

Yves LUCAS – Axe Images Vision – Laboratoire PRISME Université d’Orléans
yves.lucas@univ-orleans.fr

Cécile GRACIANNE – Département Risques Naturels et Prévention – BRGM Orléans
c.gracianne@brgm.fr

Document attaché : 202401251302_Sujet_Master2_CERES_2024.pdf

Structures multi-échelles dans les données musicales

Annonce en lien avec l’Action/le Réseau : Musiscale

Thème :

Ecoute et perception de la structure

Présentation :

Concepts multi-échelles pour l’analyse et la représentation de cheminements logiques à l’écoute de données musicales.

La question des représentations et de l’analyse de données fortement structurées, comme les données musicales, permet de poser des questions très sensibles sur l’appréhension cognitive, dont les aspects multi-échelle sont encore largement à explorer.

L’idée d’une constitution multi-échelle du flux musical se heurte avec les concepts linéaires traditionnellement mis en avant dans la description analytique ou même tout simplement empirique. L’unité de la mélodie, le fil de la narration, le développement thématique, la progression harmonique, etc. semblent être des notions qui échappent à l’image stratifiée que semble sous-entendre la notion de multi-échelle.
Quelle est la nature de ce « fil logique » que semble se donner l’écoute ? …

Du : 2024-02-14

Au : 2024-02-14

Lieu : Bordeaux (LaBRI, Campus de Talence)

Site Web : https://www.madics.fr/actions/musiscale/

Apprentissage profond et décomposition tensorielle pour l’analyse de patterns en signal et en imagerie multimodale. Application aux neuropathies

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISSI/IBISC
Durée : 6 mois
Contact : aurelien.hazan@u-pec.fr
Date limite de publication : 2024-02-28

Contexte :
Le développement exponentiel de l’IA et des réseaux de neurones renouvelle l’étude des séries temporelles d’un point de vue aussi bien fondamental qu’appliqué. En particulier pour les signaux multivariés, le tenseur peut être une représentation plus adéquate que la matrice, car il évite la perte de la structure des données, et donc la perte d’information.
L’apprentissage automatique sur données tensorielles est classiquement réalisé par décomposition tensorielle linéaire, par exemple CPD/PARAFAC ou Tucker [Sid17]. Récemment des représentations tensorielles ont été intégrées aux réseaux de neurones et ont permis des développements significatifs de l’apprentissage profond notamment dans le domaine de l’image en réduisant le nombre de paramètres à estimer.
Pour accroître l’identifiabilité et l’interprétabilité des modèles neuronaux profonds, des contraintes sont ajoutées, par exemple la non négativité, classique dans une cadre d’apprentissage matriciel et
tensoriel [Kol08]. En apprentissage profond, les auto-encodeurs variationnels ont été interprétés dans un cadre de factorisation matricielle non-négative, mais aussi comme une factorisation
tensorielle CPD, et même Tucker non-négative [Mar22]. Les autoencodeurs appartiennent à la famille des modèles génératifs. Ils permettent de découvrir des espaces latents en apprenant un
automorphisme x=f(x). Leur espace latent peut est structuré sous forme tensorielle, ce qui amène de très bonnes performances [Pan21]. Il a été montré que ceci permet un compromis en termes de
performances et d’interprétabilité, entre un auto-encodeur simple sans contrainte et un modèle de Tucker non-négatif, pour différentes taches (segmentation, détection de pattern). Toutefois ces travaux préliminaires laissent une marge importante de progrès, et les propriétés de ce type de modèle hybride sont encore mal connues.

Sujet :
Tout d’abord on établira un benchmark des différentes approches. Ensuite on modifiera les contraintes qui structurent la décomposition tensorielle dans un modèle de type auto-encodeur/décomposition de Tucker. On évaluera et on comparera les caractéristiques de
plusieurs architectures pour l’auto-encodeur. Les algorithmes proposés seront testés sur des données de plusieurs champs applicatifs actuellement examinés dans nos laboratoires respectifs : puissances
transmises sur un réseau de transport d’électricité ; calibration de capteurs de polluants ; prédiction de performances sportives, segmentation de tumeurs cérébrales. Ce travail pourra se poursuivre en
thèse (1) en comparant les performances de la représentation dans les domaines temporel, temps-fréquence, temps-échelle (2) en appliquant ces décompositions tensorielles sur les machines de
Boltzmann (DB networks et modèle de diffusion) (3) en étudiant l’influence de la structure en réseau du phénomène sous-jacent sur la représentation du signal. Des collaborations industrielles
sont envisageables.

Références
[Kol08] Kolda, Bader, « Tensor decompositions and applications », in: SIAM review 51.3 (2009), pp. 455–500.
[Sid17] Sidiropoulos et al. « Tensor Decomposition for Signal Processing and Machine Learning » IEEE Transactions on Signal Processing, 2017.
[Pan21] Panagakis et al. « Tensor Methods in Computer Vision and Deep Learning » Proceedings of the IEEE, https://doi.org/10.1109/JPROC.2021.3074329
[Mar22] Marmoret, « Unsupervised Machine Learning Paradigms for the Representation of Music Similarity and Structure », thèse IMT Atlantique, 2022.

Profil du candidat :
Connaissance du machine learning.

Formation et compétences requises :
M2 informatique, data science, statistiques

Adresse d’emploi :
Ce stage sera encadré par deux enseignants chercheurs rattachés aux laboratoires:

LISSI, http://lissi.fr, Equipe Synapse: 36-37 rue Georges Charpak, 77 567 Lieusaint.

IBISC, https://ibisc.univ-evry.fr/, Equipe SIAM: 36, Rue du Pelvoux, CE1455 Courcouronnes 91020 Evry Cédex

Poste de professeur section 27, Université Sorbonne Paris nord (LIMICS)

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIMICS
Durée : indéterminé
Contact : chan.leduc@univ-paris13.fr
Date limite de publication : 2024-09-01

Contexte :
LIMICS – UMRS 1142 : Le Laboratoire d’Informatique Médicale et d’Ingénierie des Connaissances en e-Santé (www.limics.fr) est une unité́ de recherche interdisciplinaire, qui développe des activités de recherche en informatique de santé et relevant des sections CNU 27 (Informatique) et CNU 46.04 (biostatistiques, informatique médicale et technologies de communication). Il regroupe une communauté de chercheurs (38 permanents et 15 doctorants) qui conduisent des recherches en informatique médicale et dans le domaine de l’ingénierie des connaissances pour des applications liées à la santé.

Sujet :
Les thématiques de recherche du LIMICS en traitement automatique des langues, intelligence artificielle symbolique, sciences et analyse des données et apprentissage sur des flux de données hétérogènes (textes, données omiques) sont aujourd’hui fortement sollicitées pour le développement d’applications en santé. Le nombre de projets innovants et le développement potentiel de collaborations avec d’autres laboratoires de recherche de l’USPN (LIPN, LEPS, EREN) sont croissants. Le recrutement d’un professeur en Informatique au LIMICS permettra de contribuer aux avancées de ces recherches pour les années à venir et contribuera également au renforcement des axes développés au sein du LIMICS, en particulier sur les thématiques de l’Ingénierie des connaissances, traitement automatique des langues, raisonnement sur les préférences, raisonnement en logiques de description, raisonnement à partir de cas, raisonnement sur les bases de connaissances massives en santé, aide à la décision et visualisation du web sémantique avec les graphes de connaissances.

Profil du candidat :
Enseignement
============
Le professeur recruté sera rattaché à l’UFR SMBH. Il ou elle effectuera son service d’enseignement à différents niveaux des Licence
(L1,L2 et L3) en Sciences de la Vie et en licence Sciences pour la Santé ainsi que dans le Master de Santé Publique, Parcours “Informatique Biomédicale”. Il ou elle participera notamment aux enseignements d’informatique permetant aux étudiants de Licence de se former à
l’algorithmique, aux langages de programmation (R, python), à la création de page web (HTML, CSS) et aux bases de données.
L’offre de formation pluridisciplinaire du Master d’informatique biomédicale veut répondre aux besoins nationaux et internationaux
de formation à l’informatique dans le domaine santé, la e-santé, le big data en santé (https://smbh.univ-paris13.fr/images/
Formations/masters-sante-publique/master-SMBH-informatique-biomedicale.pdf).
Le professeur recruté aura aussi comme mission d’animer l’équipe d’enseignants-chercheurs de l’UFR SMBH dans le domaine de
l’informatique au sens large.

Recherche
=========
La personne recrutée sera affectée sur le site de Bobigny et collaborera avec les autres sites de l’unité.
Elle devra s’inscrire dans les axes de recherche de l’unité dans son projet fondateur, et contribuer à animer la vie scientifique de l’équipe, à
encadrer des stagiaires de recherche et des doctorants, à organiser des colloques et monter des projets de recherche.
Les thèmes qui seront considérés en priorité sont les suivants :

+ Ingénierie des connaissances
+ Traitement automatique des langues
+ Raisonnement sur les préférences, raisonnement en logiques de description, raisonnement à partir de cas, raisonnement sur les bases de connaissances massives en santé
+ Aide à la décision
+ Visualisation

avec des approches pouvant relever de l’apprentissage statistique, du web sémantique ou de l’intelligence artificielle symbolique.

Formation et compétences requises :
Titulaire d’une Habilitation à Diriger des Recherches (HDR) en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
9 Rue de Chablis, 93000 Bobigny

Sustainability and explainability through learning on large knowledge graphs

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Mines Saint-Étienne / LIMOS
Durée : 3 ans
Contact : victor.charpenay@emse.fr
Date limite de publication : 2024-05-05

Contexte :
Large Language Models (LLMs), characterized by a large number of parameters and/or a large number of symbols in their training corpus, have become a reference in the development of AI systems. Yet, their use implies a significant energy consumption , both during training and inference, and a lack of transparency about decisions made by the system. The goal of the thesis will be to show that Knowledge Graphs (KGs), such as DBpedia, BabelNet or ConceptNet can be a solution to both problems.

Sujet :
The thesis will consist in characterizing the relationship between performances of a KG embedding model and its computational cost—empirical laws do exist for LLMs—and in analyzing the correspondance between its geometric properties and the semantic properties of the KG.

Profil du candidat :
Applicants should have prior experience with Semantic Web technologies and/or logic programming. General knowledge about machine learning techniques is also recommended.

Formation et compétences requises :
Master’s degree in computer science, data science or any related topic.

Adresse d’emploi :
Saint-Étienne

Document attaché : 202401231512_lkm-en.pdf

Explicabilité des réseaux sur Graphes pour l’action thérapeutique de molécules

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : GREYC ou LITIS
Durée : 6 mois
Contact : luc.brun@ensicaen.fr
Date limite de publication : 2024-05-05

Contexte :
L’apprentissage profond a révolutionné de nombreux domaines tels que l’analyse d’images ou le traitement automatique des langues. Pourtant, l’incapacité de ces systèmes à justifier leurs décisions est très vite apparue comme une limite forte.
Ce problème est d’autant plus saillant dans la prédiction de l’action thérapeutique d’une molécule où il n’est pas viable d’engager des moyens et du temps pour la synthèse / le test de molécules sur la simple base d’une prédiction par un réseau. Plus précisément, la capacité d’un réseau (en l’occurence sur graphe) à expliquer sa décision permet:

* de valider les prédictions avant d’engager des efforts et des moyens sur les synthèses d’une série moléculaire
* d’obtenir une intuition sur les propriétés physico-chimiques clés que doit posséder une molécule pour avoir une action biologique ciblée.

Le second point est également très intéressant car il ouvre des perspectives vers la conception de nouvelles molécules thérapeutiques.

Sujet :
Notre étude commencera par une étude des réseaux sur graphes (GNN) permettant de prédire les propriétés de nos jeu de données. L’étude sera ciblée sur la prédiction des interactions protéines/ligands à partir de plusieurs représentations de graphes moléculaires.

Si cette étape est validée, nous aborderons une comparaison des méthodes de la littérature permettant d’expliquer les résultats de ces GNNs. Les résultats produits (en termes d’explication) seront évalués en utilisant plusieurs critères tels que l’accuracy, l’aire sous la courbe, la fidélité, la parcimonie,…. Nous espérons identifier à partir de cette étude des sous structures pertinentes pour les propriétés à prédire.

Nous essaierons, dans un troisième temps, d’appliquer ces méthodes sur les graphes moléculaires squelettiques. Il s’agira de comparer sous l’angle de l’explicabilité les descriptions moléculaires “brutes” et celles produites en intégrant une expertise du domaine via le graphe pharmacophorique.

Ce sujet peut être considéré comme un formation pour une thèse de doctorat qui pourrait commencer à l’issue du stage.

Profil du candidat :
Nous recherchons des candidats de niveau Bac+5 avec de bonnes bases en apprentissage machine. Une capacité à travailler en équipe combinée à une curriosité pour les problèmes scientifiques et une certaine autonomies seraient des plus.

Formation et compétences requises :
Le candidat doit être inscrit en dernière année d’un Master ou d’un diplôme d’ingénieur dans un domaine lié à l’informatique ou aux mathématiques appliquées, et posséder de solides compétences en programmation.

Une expérience en informatique pour la Science des Données, apprentissage profond, notamment sur graphes ainsi que pytorch sera un plus.

Adresse d’emploi :
Le stage pourra se dérouler à Caen (au laboratoire GREYC) ou à Rouen (laboratoire LITIS).

Document attaché : 202401231248_theseCODAG.pdf

Postdoctoral or Research Engineer Position in image analysis applied to Spatial Transcriptomics

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : IGFL
Durée : 2 ans
Contact : jonathan.enriquez@ens-lyon.fr
Date limite de publication : 2024-05-05

Contexte :
The École Normale Supérieure (ENS) of Lyon is currently seeking a highly talented postdoctoral researcher or research engineer specializing in image data analysis. The successful candidate will join the Spatial-Cell-ID initiative (http://spatial-cell-id.ens-lyon.fr/), contributing to the development of innovative pipelines for the analysis of MERFISH data. The primary focus of this position will encompass image realignment, RNA spot detection, 3D MERFISH decoding, and cell segmentation, with the overarching goal of unravelling the biology of single cells within their native tissue environments.
Spatial-Cell-ID is a new national spatial transcriptomics facility funded by the French “EquipEx+” excellence initiative and led by the École Normale Supérieure of Lyon (ENSL). Spatial-Cell-ID gathers teams with the goal of studying cellular identity and its spatial heterogeneity within tissues, organs, or biological systems in normal and pathological contexts, leveraging the latest advancements in spatial transcriptomics. Spatial transcriptomics technologies were designated “Method of the Year 2020” by the Nature Methods journal and are currently revolutionizing our ability to study complex biological systems. Spatial-Cell-ID offers equipment for spatial transcriptomics that integrates imaging, sequencing, and data analysis technologies, which in synergy will provide access to the transcriptome of any single cell within its native spatio-temporal environment. It hosts a comprehensive selection of technologies, including single-cell transcriptomics, untargeted spatial transcriptomics (e.g., Slide-seq), and targeted spatial transcriptomics (e.g., MERFISH), associating state-of-the-art technological platforms of the University of Lyon.

The employer : The École Normale Supérieure de Lyon is an elite French public higher education institution that trains professors, researchers, senior civil servants as well as business and political leaders. It is a symbol of French Republican meritocracy and it remains committed to disseminating knowledge to the widest audience and to promoting equal opportunity. The ENSL brings together several laboratories at the cutting edge of science and working on different fields of Biology, Mathematics, Physics and Humanities.

Instructions for applicants : Applications should include a CV, a cover letter, and contact details for 3 referees to be sent to: Jonathan Enriquez (jonathan.enriquez@ens-lyon.fr) & Nicolas Ducros (Nicolas.Ducros@insa-lyon.fr). Please use the email subject “Spatial-Cell-ID”. For further information please contact the same addresses. Applications will be considered upon submission.

Sujet :
Role: The appointed candidate will develop innovative pipelines for the analysis of MERFISH data. The recruited post-doc or research engineer will be working at the IGFL (ENS of Lyon) in the Enriquez team and will closely collaborate with the Spatial-Cell-ID community composed of biologists, microscopists, biophysicists, and computer scientists who will assist him/her in the different aspects of this highly interdisciplinary project. The candidate will be involved in one or both of the main projects related to the development of 3D MERFISH: 1. Discover the gene networks controlling neuronal and muscle identity in Drosophila, 2. Generate a single cell smFISH atlas of the Drosophila Embryo in 3D at the cellular level. The candidate will also be involved in the development of 3D MERFISH for other model organisms relevant to the Spatial-Cell-ID community.

Profil du candidat :
Profile:
• Ph.D. or equivalent experience in Biology, Physics or Mathematics is required.

Formation et compétences requises :
• Proficiency in programming languages, particularly Python, applied to image data analysis.
• Experience in deep learning for image analysis/computer vision is a plus.
• Experience in confocal and super-resolution imaging is a plus.
• Excellent communication and collaboration skills. English is the working language.

Adresse d’emploi :
Institut de Génomique Fonctionnelle de Lyon
32-34 avenue Tony Garnier
69007 Lyon

Document attaché : 202401221304_image data analysis spatial Cell ID.pdf