Self-supervised learning for the detection of brain anomalies in MRI imaging

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : laboratoire CREATIS
Durée : 5-6 months
Contact : carole.lartizien@creatis.insa-lyon.fr
Date limite de publication : 2022-01-10

Contexte :
The vast majority of deep architectures for medical image analysis are based on supervised methods requiring the collection of large datasets of annotated examples. Building such annotated datasets is hardly achievable, especially for some specific tasks, including the detection of small and subtle lesions, which are sometimes impossible to visually detect and thus manually outline. This is the case for various brain pathologies including Parkinson’s disease.

An alternative methodological framework is that of anomaly detection in an unsupervised context (also called self-supervised). It consists in learning a model of representation of normality from the healthy data only, and then to consider as anomalies the test samples that deviate too much from normality. This last step is usually performed by calculating the error between the original and the reconstructed data from their projection in the latent representation space.

We have developed an expertise in the field of anomaly detection methods for the analysis of multi-modality brain images.

Sujet :
We have developed an expertise in the field of anomaly detection methods for the analysis of multi-modality brain images, and recently applied it to the detection of early forms of Parkinson’s disease in Parkinson’s disease in multiparametric MRI, in collaboration with the Centre de Neurosciences (GIN) and INRIA Grenoble.

The purpose of this project is to improve the performance achieved with the current model architecture by exploring methodological research axes in the domains of deep latent representation learning and visualisation (see attached pdf file for details).

The successful candidate will have access to the PPMI database (https://www.ppmi-info.org/accessdata-specimens/download-data) containing multiple images of controls and parkinsonian patients in different modalities and as well as to computing resources (CREATIS and/or CNRS supercomputer).

Profil du candidat :
Candidate should have background either in machine learning and/or deep learning or image processing and some experience in both fields as well as good programming skills.

We are looking for an enthusiastic and autonomous student with strong motivation and interest in multidisciplinary research (image processing and machine learning in a medical context). The candidate will also have the opportunity to interact with a PhD student working on this project.

See a complete description on https://www.creatis.insa-lyon.fr/site7/fr/node/47143

Formation et compétences requises :
Candidate should have a background either in machine learning and/or deep learning or image processing as well as good programming skills. Experience with deep learning libraries such (TensorFlow, Pytorch, scikit-learn) would be apreciated.

Adresse d’emploi :
Laboratoire CREATIS
INSA Lyon
21 rue Jean Capelle
69621 Villeurbanne cedex

Document attaché : 202112031401_Master_Neuro_SelfSupervised_Park_2021_22_eng.pdf

Interactive Explainability of Machine learning applied to language tasks

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT, Toulouse University & NUS, Singapore
Durée : 3 ans
Contact : philippe.muller@irit.fr
Date limite de publication : 2022-01-10

Contexte :
The thesis takes place within the Descartes project (https://www.cnrsatcreate.cnrs.fr/descartes/),
a large France-Singapore collaboration project on applying AI to urban systems.
The project will generate a lot of data about artifical systems deployed in the wild, part of which will be expressed as textual data (expert reports, user reactions,
news coverage, social media conversations). Natural language processing (NLP) models can help access that voluminous information, but there is an important need
from operators, policy makers and public institutions to understand the reasons behind models’ behaviours and the information they extract, to be able to evaluate
their potential issues (accuracy, fairness, biases).
This thesis will investigate methods design to explain machine learning systems typically used in NLP while integrating an interactive process with the system users.

Sujet :
Modern machine-learning based AI systems, while achieving good results on a lot of tasks, still appear as “black-box” models, where it is difficult to
trace the path from the input (a text, an image, a set of sensor measures) to the decision (classification of a document, an image, a situation).
The issue of explainability poses two different problems: (1) what is a good explanation, and specifically what is a good explanation in the context of textual models?
and (2) how to scale existing explanation methods to the kind of models used in NLP tasks?
About (1), existing methods for image classification or tabular data tend to rely on the extraction of a set of pixels or features that are sufficient for generating predictions, or increase the probabilities of the prediction. It is less straightforward for textual input, which consists of words, but whose meanings are inter-related in a given context (for instance “good” in a review could be an indication that the review is positive … unless it is preceded by “not”). So the first problem of this thesis will be to provide humanly acceptable explanations of simple text classifiers such as those foreseen for the detection tasks in
the dedicated sub-project of Descartes.
About (2), modern NLP models are based on very large and complex architectures, such as the transformer family. Logically sufficient or causally satisfying explanations are difficult to get for such cases, as both such methods suffer from scalability problems. So we will explore heuristics based on our solution to the first problem guiding an interactive procedure between explainee (the person requesting the explanation) and the ML system whose predictions should be explained. We will evaluate the procedure on those users targeted for the use cases of the project. Brian Lim from NUS Singapore will help design the validating experiments.

References:
– Descartes project: https://www.cnrsatcreate.cnrs.fr/descartes/
– A Survey of the State of Explainable AI for Natural Language Processing
Marina Danilevsky, Kun Qian, Ranit Aharonov, Yannis Katsis, Ban Kawas, Prithviraj Sen, ACL 2020. https://aclanthology.org/2020.aacl-main.46/
– Explanation in artificial intelligence: Insights from the social sciences
Tim Miller, Artificial Intelligence 267:1-38 (2019)
– Interpretable Machine Learning, Christoph Molnar. https://christophm.github.io/interpretable-ml-book/
– Alexey Ignatiev, Nina Narodytska, and Joao Marques-Silva. 2019. On Relating Explanations and Adversarial Examples. In NeurIPS. 15857–15867.
– Shrikumar, A.; Greenside, P.; and Kundaje, A. 2017. Learning important features through propagating activation differences. In Proceedings of the 34th International Conference on Machine Learning-Volume 70, 3145–3153. JMLR. org.
-Ribeiro, M. T.; Singh, S.; and Guestrin, C. 2016. Why should I trust you?: Explaining the predictions of any classifier. In ACM SIGKDD.

Profil du candidat :
A background in Computer Science and/or Machine learning.
Familiarity or a willingness to acquire a familiarity with both model based and model agnostic explanation paradigms that use either logical or statistical methods.
A familiarity with NLP / dialogue would be a plus.
Given the nature of the project, the student should be open to work in a cross-disciplinary environment, and have good English communication skills

Formation et compétences requises :
A background in Computer Science and/or Machine learning.
Familiarity or a willingness to acquire a familiarity with both model based and model agnostic explanation paradigms that use either logical or statistical methods.
A familiarity with NLP / dialogue would be a plus.
Given the nature of the project, the student should be open to work in a cross-disciplinary environment, and have good English communication skills

Adresse d’emploi :
The thesis will happen within the France-Singapore collaboration, with advisors from both sides. The student will be registered at the University of Toulouse, and part of the IRIT lab, but is expected to spend a good part of the thesis in Singapore at the partner lab, with funding provided by the Descartes project.

The thesis will be supervised on the French side by Nicholas Asher and Philippe Muller, both NLP experts on text and conversation analysis, and co-advised
by Nancy Chen from the A* lab, expert in NLP and dialogue, and Brian Lim at the National University of Singapore, an expert on Human-Computer interaction. The French advisors will also spend time at NUS during the thesis.

Contact: nicholas.asher@irit.fr, philippe.muller@irit.fr, nfychen@i2r.a-star.edu.sg

Méthodes multi-blocs et trois-voies dans le cadre de la prévention de l’allergie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : unité Statistique, Sensométrie et Chimiométrie / O
Durée : 6 mois
Contact : veronique.cariou@oniris-nantes.fr
Date limite de publication : 2022-02-25

Contexte :
Les allergies touchent 30-40% de la population mondiale. Parmi elles, la dermatite atopique est la plus fréquente et précoce. Ces allergies sont associées à un déséquilibre de la flore intestinale et à un dysfonctionnement du système immunitaire chez les nouveaux-nés. En induisant une flore optimale, les prébiotiques donnés tôt dans la vie pourraient prévenir des allergies. Le projet ANR CIMMAP (Characterising the effect of maternal prebiotic supplementation on perinatal Immune system maturation, Gut Microbiota and breast Milk compositions for Allergy Prevention in high-risk children) est un projet de recherche ANR collaboratif (voir https://www6.angers-nantes.inrae.fr/bia/Equipes-de-recherche/Allergie-ALL/Actualites/ANR-CIMMAP).

En particulier, CIMMAP explore la période périnatale chez l’enfant à risque d’allergie en se focalisant sur la mise en place du système immunitaire et du microbiote et les effets des prébiotiques sur le système immunitaire et sur le microbiote. Les données considérées dans CIMMAP sont issues dans un premier temps d’un modèle murin et dans un second temps d’un modèle humain, sur la base d’une cohorte sélectionnée à partir de l’étude PREGRALL (https://www.chu-nantes.fr/pregrall-participez-a-notre-etude-et-aidez-nous-a-prevenir-les-allergies-de-l-enfant).

Sujet :
Des travaux antérieurs sur le modèle murin ont permis de mesurer les effets d’une supplémentation en prébiotiques d’une part sur la composition du microbiote et d’autre part sur les caractéristiques du système immunitaire. L’objectif de ce stage est d’investiguer une approche holistique visant à mettre en relation ces deux blocs de données, en prenant également en compte une dimension longitudinale (plusieurs points de prélèvement effectués au cours de l’étude). Cette approche holistique repose sur un traitement de données multi-blocs (plusieurs tableaux de données, appariés sur les lignes c’est-à-dire les individus, sont analysés simultanément pour révéler la force des liens entre ces tableaux) voire un traitement de données trois voies (les tableaux de données étant cette fois appariés à la fois sur les individus et sur les variables).

En particulier deux verrous statistiques seront appréhendés.
Dimensionalité des tableaux et sparsité : dans le cadre des données de microbiote, le tableau de données présente un grand nombre de variables, avec existence d’une forte multicolinéarité. Un premier enjeu est donc de pouvoir gérer la dimensionnalité de ce tableau au regard des données d’immunologie, en particulier de manière à mesurer le lien entre ces deux tableaux et identifier un petit nombre de marqueurs du microbiote fortement liés aux caractéristiques du système immunitaire. Pour répondre à ce premier enjeu, le stage visera à étudier et mettre en œuvre des méthodes multi-blocs sparse dans un contexte non supervisé (ComDim, MB-PCA, RGCCA) et supervisé (P-ComDim, MB-PLS, MB-WCov).

Introduction de la dimension longitudinale : dans un second temps, une approche longitudinale sera investiguée pour prendre en compte simultanément les tableaux de données du microbiote prélevés à différents temps. Il s’agira en particulier d’identifier des trajectoires communes pour des groupes de marqueurs par des méthodes de décomposition tensorielle.

Profil du candidat :
Niveau Bac +5, Master II ou ingénieur, avec une formation en statistique ou biostatistique.

Formation et compétences requises :
Intérêt pour le traitement statistique de données biologiques et de santé.
Maîtrise des méthodes d’analyse multivariée dans le cadre supervisé et non supervisé.
Maîtrise du langage R.

Adresse d’emploi :
ONIRIS, Rue de la Géraudière, CS 82225, 44322 Nantes

Document attaché : 202112021708_stage_StatSC_CIMMAP_2022.pdf

Stage M2/Ingénieur : Explicabilité des réseaux profonds au moyen d’approches symboliques

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ICube / Université de Strasbourg
Durée : 5 à 6 mois
Contact : stella@unistra.fr
Date limite de publication : 2022-02-01

Contexte :
Les systèmes autonomes intelligents dits à “boîte noire”, qui reposent sur des algorithmes d’apprentissage comme les réseaux de neurones profonds, deviennent omniprésents dans notre paysage quotidien. L’exigence d’un meilleur encadrement de ces algorithmes devient un enjeu sociétal, et requiert le développement de techniques permettant de comprendre leur fonctionnement ou d’expliquer leurs décisions. Ce stage s’inscrit dans le cadre du projet DEEPISH (Deep lEarning ExPlainabilIty through Symbolic approacHes), qui a pour objectif de proposer un modèle reposant sur des techniques de raisonnement symbolique (graphes de connaissances et règles), permettant d’expliquer les décisions de systèmes basés sur un apprentissage profond. Le domaine d’application considéré est le diagnostic médical.
Différentes approches ont été proposées pour développer l’explicabilité des modèles profonds. Parmi les plus populaires, on trouve les techniques de visualisation permettant d’identifier, dans le cadre de la reconnaissance d’objets dans des images, les portions de celles-ci ayant permis au modèle de faire sa prédiction (Wang et al., 2020). Bien qu’intéressants, ces modèles sont limités lorsque les objets recherchés sur l’image sont trop complexes pour être appréciés à l’œil nu par des experts humains, par exemple dans le cas de détection de lésions subtiles dans des mammographies (Oren et al., 2020).
Nous envisageons une approche multi-modale qui permettrait d’identifier les facteurs de confusion dans les données. En effet, dans le domaine médical, de nombreuses sources de données peuvent apporter des éléments permettant d’appuyer ou de rejeter un diagnostic : rapports textuels, bilans sanguins, données génétiques, etc. On peut alors concevoir un système, qui, lorsqu’une lésion non détectable par un expert humain est caractérisée, pourrait fournir d’autres éléments factuels appuyant sa prédiction : si le patient est une femme et que la patiente possède le marqueur génétique xxx alors il est probable à n% qu’un traitement soit nécessaire.

Sujet :
Il sera d’abord nécessaire, pour alimenter le système de raisonnement, de commencer par construire des graphes de connaissances à partir de données textuelles issues des données multi-modales (coupes histologiques et rapports histologiques) disponibles, afin d’en extraire des concepts qui seront utilisés par le système de raisonnement. L’extraction d’informations à partir de textes nécessite d’extraire des triplets comprenant un sujet, une relation et un objet (Hohenecker et al., 2020, Solawetz & Larson, 2021). Ces graphes de connaissances seront ensuite enrichis par des connaissances extraites automatiquement à partir d’articles scientifiques disponibles dans le domaine public.
On pourra ensuite considérer que le modèle profond utilisé n’aura pas d’autre utilité que d’extraire des faits à partir de données complexes (ce qu’aucun système à base de règle n’est capable de faire), qui viendront compléter la connaissance organisée extraite des données textuelles. Ainsi, dans un deuxième temps, il faudra étudier différents types d’approches permettant de générer des règles logiques de façon autonome, comme les approches neuro- symboliques (Garcez et al., 2019 ; Ciravegna et al., 2021), ou les systèmes de classeurs (Learning Classifier Systems) (Orhand et al., 2021).

Références

Ciravegna, G., Barbiero, P., Giannini, F., Gori, M., Lió, P., Maggini, M., & Melacci, S. (2021). Logic Explained Networks. arXiv preprint arXiv:2108.05149.

Garcez, A. D. A., Gori, M., Lamb, L. C., Serafini, L., Spranger, M., & Tran, S. N. (2019). Neural- symbolic computing: An effective methodology for principled integration of machine learning and reasoning. arXiv preprint arXiv:1905.06088.

Hohenecker, P., Mtumbuka, F., Kocijan, V., & Lukasiewicz, T. (2020). Systematic Comparison of Neural Architectures and Training Approaches for Open Information Extraction. Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 8554‐8565.

Oren, O, Gersh, B. J. and Bhatt, D. L., “Artificial intelligence in medical imaging: switching from radiographic pathological data to clinically meaningful endpoints,” The Lancet Digital Health, vol. 2, no. 9, pp. e486–e488, Sep. 2020, doi: 10.1016/S2589-7500(20)30160-6.

Orhand, R., Jeannin-Girardon, A., Parrend, P. and, Collet, P., “Explainability and Performance of Anticipatory Learning Classifier Systems in Non-Deterministic Environments”, Genetic and Evolutionary Computation Conference (GECCO), Lille, France, juillet 2021

Solawetz, J., & Larson, S. (2021). LSOIE  : A Large-Scale Dataset for Supervised Open Information Extraction. Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, 2595‐2600.

Wang et al., “Score-CAM: Score-Weighted Visual Explanations for Convolutional Neural Networks,” 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 2020

Profil du candidat :
Le stage requiert un réel intérêt pour les méthodes d’intelligence artificielle :
– IA symbolique : modélisation de connaissances et raisonnement logique (graphes de connaissances et règles),
– apprentissage machine et réseaux de neurones profonds.

Formation et compétences requises :
L’étudiant·e en M2 informatique ou de niveau équivalent, devra avoir une spécialisation en intelligence artificielle (“deep learning”, modélisation de connaissances, raisonnement symbolique).
Il ou elle devra maîtriser le langage Python, être capable de manipuler des bibliothèques de TAL (spaCy, stanza, flair), et des réseaux de neurones profonds, afin d’être autonome pour l’implémentation.

Adresse d’emploi :
Laboratoire ICube / Université de Strasbourg
Lieu : Pole API (illkirch)

Document attaché : 202112021138_sujet stage M2 2022.pdf

Stage M2/Ingénieur : Deep Learning pour la détection de tumeurs dans des radiographies

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire I3S
Durée : 6 mois
Contact : lionel.fillatre@i3s.unice.fr
Date limite de publication : 2022-03-01

Contexte :
L’équipe MediaCoding du laboratoire I3S collabore sur ce sujet avec le Centre Hospitalier Universitaire (CHU) de Nice. Le stagiaire pourra donc bénéficier de l’expertise d’un professeur gastro-entérologue et hépatologue.

Sujet :
Objectifs :

Le Deep Learning (ou apprentissage profond) est une technique d’analyse de données qui permet d’obtenir des résultats de classification ou d’estimation très performants quel que soit le domaine applicatif. Ce sujet de stage s’intéresse à l’utilisation du Deep Learning pour l’analyse d’images médicales. Il s’agit plus particulièrement de détecter et localiser des lésions dans le foie. Nous disposons d’un jeu de données réelles d’images tomographiques étiquetées [1]. Les étiquettes décrivent la position et la forme des lésions dans les images. Le but du stage est d’utiliser un réseau de neurones pour estimer l’état du foie du patient.

De nombreux réseaux de neurones existent pour segmenter le contenu d’images [2]. Dans ce stage, il s’agira donc d’identifier les réseaux les plus prometteurs et de les appliquer aux images tomographiques du foie. Le stagiaire devra vérifier avec soin la qualité des informations qui peuvent être extraites de la segmentation, notamment l’estimation de la taille des lésions. Les lésions n’ont bien évidemment pas toutes les mêmes dimensions. Le réseau de neurones aura tendance à mieux détecter les lésions importantes. Le stagiaire pourra s’appuyer sur des travaux récents de notre équipe de recherche [3] afin de développer un réseau de neurones dont les performances en détection et en localisation des tumeurs seront robustes par rapport à la taille et à l’emplacement des lésions.

Encadrant du stage : M. Lionel Fillatre (professeur des universités)

Durée : de 4 à 6 mois (démarrage en mars/avril 2022 selon les contraintes du stagiaire).

Rémunération : environ 550 euros par mois.

Procédure pour déposer sa candidature : envoyer son CV, sa lettre de motivation et ses résultats académiques niveau L1, L2, L3, M1 et M2 à lionel.fillatre@i3s.unice.fr

Bibliographie :

[1] https://arxiv.org/pdf/1901.04056.pdf
[2] http://www.deeplearningbook.org/
[3] Cyprien Gilet, Susana Barbosa, and Lionel Fillatre. Discrete box-constrained minimax classifier for uncertain and imbalanced class proportions.IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020

Profil du candidat :
Ces travaux requièrent les compétences suivantes :
– Programmation informatique : les développements informatiques seront réalisés en Python et Pytorch (connaître préalablement Python n’est pas nécessaire mais souhaitable)
– Notions de bases en machine learning (en particulier sur les réseaux de neurones).

Formation et compétences requises :
Formation niveau M2/Ingénieur en mathématiques appliquées et/ou en informatique.

Adresse d’emploi :
Campus SophiaTech, Sophia Antipolis, département 06 (Alpes-Maritimes).

Télédétection pour le suivi des végétations pastorales d’alpage : Traitements et analyse

Offre en lien avec l’Action/le Réseau : MACLEAN/– — –

Laboratoire/Entreprise : PACTE
Durée : 6
Contact : pauline.dusseux@univ-grenoble-alpes.fr
Date limite de publication : 2021-12-03

Contexte :
Dans le cadre des travaux menés au sein du programme Alpages sentinelles, plusieurs actions sont conduites pour mieux caractériser, quantifier et qualifier les végétations pastorales d’alpage, et raisonner ainsi les modalités de leur mobilisation par les systèmes pastoraux dans un contexte d’aléas climatiques croissants :
– Définition d’une typologie et élaboration d’un référentiel des végétations pastorales d’alpage, intégrant leur fonctionnalité pastorale et leur sensibilité aux contraintes climatiques.
– Définition d’une méthodologie d’analyse de la vulnérabilité d’un alpage au changement climatique, intégrant sa sensibilité au regard des végétations qui le composent.
– Étude des variations interannuelles de productivité des différents types de pelouses d’alpage.
Ces travaux s’appuient sur l’acquisition de données de terrain selon des protocoles nécessitant actuellement des moyens humains et financiers importants.
Dans ce cadre, les partenaires du programme Alpages Sentinelles s’interrogent sur les apports possibles d’une approche de la végétation d’alpage par télédétection :
La télédétection peut-elle permettre d’identifier et de cartographier des types de milieux pastoraux, au regard d’une typologie fonctionnelle préétablie au sein du programme « Alpages sentinelles » ?
La télédétection peut-elle permettre de suivre les dynamiques temporelles de ces milieux pastoraux : variations interannuelles de productivité, évolution de long terme ?

Sujet :
Le sujet de stage proposé s’intéresse à la contribution possible de la télédétection à la caractérisation et au suivi de la productivité des milieux pastoraux avec un objectif méthodologique fort portant sur les outils de classification et de régression à mobiliser pour traiter des séries temporelles de données de télédétection ainsi que les indices qui en sont dérivés. Les techniques qui seront adoptées pour cela seront issus du domaine de l’apprentissage automatique ainsi que de l’apprentissage profond (deep learning).
Ces informations contribueront à développer les applications opérationnelles attendues à terme pour le programme Alpages sentinelles, notamment pour faire évoluer les méthodes actuelles d’acquisition de certaines données et monter en puissance en termes de dispositif, notamment pour les suivis annuels de biomasse (mesures de hauteurs de végétation sur le terrain pour le moment).

Profil du candidat :
Master : Télédétection / Géomatique / Informatique

Les compétences attendues sont les suivantes :
– Connaissances fortes en programmation (Python)
– Connaissances en télédétection optique et en traitement d’image (GDAL, OTB)
– Connaissances en statistiques
– Maîtrise de l’anglais scientifique
– Des connaissances sur les milieux pastoraux seraient un plus
– Des connaissances sur des librairies Python comme Keras, Tensorflow ou Pytorch
seraient un plus

Formation et compétences requises :
Master : Télédétection / Géomatique / Informatique
Les compétences attendues sont les suivantes :
– Connaissances fortes en programmation (Python)
– Connaissances en télédétection optique et en traitement d’image (GDAL, OTB)
– Connaissances en statistiques
– Maîtrise de l’anglais scientifique
– Des connaissances sur les milieux pastoraux seraient un plus
– Des connaissances sur des librairies Python comme Keras, Tensorflow ou Pytorch
seraient un plus

Adresse d’emploi :
Sciences Po Grenoble
Pacte/IEP – BP 48 – 38040 Grenoble cedex 9

Document attaché : 202112011726_2022_Sujet stage M2 Télédétection Alpages Sentinelles.pdf

Post doctoral position on time series analysis of data living on the SPD manifold. Application to th

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC UMR 6072
Durée : One year
Contact : luc.brun@ensicaen.fr
Date limite de publication : 2022-05-01

Contexte :
We are seeking an outstanding postdoctoral research fellow with experience in deep learning / machine learning to work with us at Caen University, France during one year on a project investigating the analysis of time series of data corresponding to SPD matrices. The challenge here will be to define machine learning methods and more specifically deep learning methods (either convolutional or recursive) to analyze these data by using all the interesting properties of this specific manifold.

The postdoctoral position is funded for one year under the research project PredictAlert supported by the Region Normandy (France). The PredictAlert project gathers engineering schools and universities around the design of a better understanding of the brain states during different states of wakefulness.

Sujet :
Objectives and challenges
The project is based on data from a cohort being currently acquired. It includes EEG and MRI acquisitions performed while subjects are falling asleep for a nap. In both cases, an acquisition in a given time window, is characterized by a SPD matrix. Each entry of this matrix correspond either to a correlation between two sensors in the case of an EEG acquisition or a correlation between two brain’s zones in the case of an IRM acquisition.
In a first step the candidate will have to work on EEG acquisitions in order to design a deep learning algorithm predicting quantified levels of wakefulness along long EEG sequences. Convolutional [1, 3] or recurrent [2, 4] networks on the SPD manifold will be both studded and evaluated before a focus on the more promising approach.

While functional IRM sequences may also be characterized as time series of SPD matrices, these sequences are based on data with a much better spatial resolution than EEGs. This come at the price of a much lower temporal resolution compared EEG acquisitions. The candidate will have to adapt the work already done on EEG data to functional IRM datum and to compare both results.

Profil du candidat :
Candidate profile

•  Interpersonal skills and the ability to work well individually or as a member of a project team are recommended.
• Good written and verbal communication skills are required, the candidate has to be fluent in spoken French or English and written English. Working language can be English or French.

Formation et compétences requises :
• The candidate must have a recent Ph.D. (within 5 years) in Computer science (or Applied Mathematics) in the field of Machine Learning.
• Knowledge and experience within Deep Learning frameworks is highly recommended.
• The candidate will perform research and algorithmic developments and solid programming skills are required.

Adresse d’emploi :
Caen, France in the GREYC UMR CNRS laboratory. Situated in the Normandy region of France close to the sea and about 240km west of Paris the city still has many old quarters, a population of around 120,000 the city area has roughly 250,000 inhabitants.

Document attaché : 202112011007_postdoc_en2.pdf

Clustering flou de séries temporelles pour la détection de la douleur

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Limos
Durée : 20 mois
Contact : issam.falih@uca.fr
Date limite de publication : 2022-05-01

Contexte :
Le LIMOS travaille en collaboration avec l’institut Analgésia, une fondation de recherche française dans le domaine de l’innovation et la douleur. Analgésia développe une application mobile e-santé permettant d’améliorer l’évaluation de la douleurs et d’accompagner le patient douloureux chronique au quotidien. Les données comprennent notamment des questionnaires hebdomadaires sous forme de niveau de score.

Sujet :
L’objectif principal est de développer de nouveaux modèles et de nouvelles méthodes basés sur l’apprentissage de représentation pour le clustering flou des séries temporelles avec une application aux données biomédicales.

Une première étape consistera à expérimenter l’état de l’art concernant les méthodes d’extraction d’attributs pour la classification non supervisée [MCLC21, MZLC19, YDW+20].
La deuxième étape serait d’utiliser un nouveau modèle de représentation basé sur une architecture neuronale afin d’améliorer la classification non supervisée des séries temporelles [MGL+18, YDZ+19]. Le but final est l’implémentation d’outils de fouille de données non supervisée afin de découvrir des groupes d’individus ayant des comportements identiques à la douleur, quelque soit leur pathologie de départ.

Profil du candidat :
– Doctorat en informatique, avec des compétences en fouille de données/Machine Learning/optimisation.
– Bonne liste de publication.
– Compétences en programmation en python..

Formation et compétences requises :
Pour les candidatures, merci d’envoyer par mail avant letextbf{ 6 décembre 2021}, un seul fichier pdf contenant une lettre de motivation décrivant leur parcours de recherche et leur motivation, un CV détaillé (avec la liste des publications) et les coordonnées de deux personnes de référence au maximum, à violaine.antoine@uca.fr et issam.falih@uca.fr

Adresse d’emploi :
LIMOS, Campus universitaire des Cézeaux, Université Clermont Auvergne

Document attaché : 202112010924_2021_PostDoc_Proposal-Fr.pdf

Optimisation d’un moteur d’inférences embarqué

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS, Université Claude Bernard Lyon 1, Campus de
Durée : 6 mois
Contact : lionel.medini@liris.cnrs.fr
Date limite de publication : 2022-05-01

Contexte :
Le Web des Objets (WoT) est le résultat de l’intégration dans le Web, d’objets communicants de l’Internet des Objets pouvant présenter des capacités limitées. Les applications du WoT concernent l’agriculture numérique, le bâtiment intelligent, les villes intelligentes, la santé, etc [Raw14]. Le Web sémantique forme un socle théorique privilégié pour les graphes de connaissances émergeant de l’échange, du stockage, du traitement et du raisonnement sur des données dans le WoT.

Nous focalisons à donner aux objets connectés une capacité de raisonnement sur les graphes de connaissances en embarquant les traitements au plus près de ces objets. Il s’agit pour cela de définir une architecture logicielle compatible à la fois avec la nature contrainte de ces objets et avec les standards du WoT – et notamment la notion de servient [WoT20] – et d’y intégrer un moteur d’inférence incrémental à base de règles. Une première version de moteur d’inférences a été développée en C et fonctionne notamment sur architecture Arduino Due. L’objectif de ce stage est de proposer une évolution de ce moteur en y intégrant des optimisations non prévues dans CoSWoT pour le parsing et l’échange de données compressées.

Sujet :
Dans ce stage, nous nous focalisons sur le moteur d’inférence intégré au servient. Nous partons du principe que les données échangées entre les différents modules logiciels sont déjà compressées en CBOR-LD ou bien en HDT.
L’objectif principal de ce stage est de modifier le moteur d’inférence du projet CoSWoT pour tirer parti de cette compression en ré-indexant plus efficacement les triplets et leurs termes. Autrement dit, il s’agit de substituer la bibliothèque de stockage de faits actuelle pour la remplacer par des structures de données plus légères, afin de réduire l’empreinte mémoire du moteur d’inférence et d’optimiser sa vitesse de traitement. Différentes solutions pourront être envisagées pour cela, qui devront être compatibles avec le fonctionnement de l’algorithme, les capacités du dispositif sur lequel il est déployé et l’arrivée des données sous forme de flux.

Dans un second temps, ces améliorations devront être évaluées en termes d’espace mémoire et de temps de traitement sur différents jeux de données, différents scénarios et différents appareils. L’objectif est de déterminer les limites de cette approche par rapport aux autres moteurs du marché, et également de caractériser les capacités de raisonnement des différents dispositifs utilisés.

En fonction du temps restant, l’automatisation du déploiement sur différents appareils pourra également être réalisée.

Le code réalisé sera déposé en open source.

Références :

[Ben21] Bento, A., Médini, L., Singh, K., & Laforest, F. (2021, June). Raisonnement embarqué et distribué pour le Web des Objets: un état de l’art. In Journées Francophones d’Ingénierie des Connaissances (IC) Plate-Forme Intelligence Artificielle (PFIA’21) (pp. pp-48).
[Bon19] Bonte, P., Tommasini, R., De Turck, F., Ongenae, F., & Valle, E. D. (2019, June). C-sprite: efficient hierarchical reasoning for rapid RDF stream processing. In Proceedings of the 13th ACM International Conference on Distributed and Event-based Systems (pp. 103-114).
[CBOR-LD] Sporny, M. & Longley, D.. CBOR-LD 1.0 – A CBOR-based Serialization for Linked Data. W3C Member Submission, 2021. URL : https://digitalbazaar.github.io/cbor-ld-spec/
[Cha18] Charpenay, Victor, Sebastian Käbisch, and Harald Kosch. “Towards a binary object notation for RDF.” European Semantic Web Conference. Springer, Cham, 2018.
[Fer10] Fernandez, J.D., Martinez-Prieto, M.A. & Gutierrez, C.. Compact Representation of Large RDF Data Sets for Publishing and Exchange. In: The Semantic Web ISWC 2010, vol. 6496, pp. 193–208. Springer Berlin Heidelberg, Berlin, Heidelberg, 2010.
[Med16] Médini, L. An Avatar-based Workflow for the Semantic Web of Things. In WWW 2016 W3C Track.
[Mot12] Motik, B., Horrocks, I., Kim, S.M. Delta-reasoner: a semantic web reasoner for an intelligent mobile platform. In WWW 2012 companion volume.
[Mri15] Mrissa, M., Médini, L., Jamont, J.-P., Le Sommer, N., Laplace, J. An Avatar Architecture for the Web of Things. Internet Computing 19(2). IEEE, 2015.
[Raw14] Rawat, P., Singh, K. D., Chaouchi, H., & Bonnin, J. M. (2014). Wireless sensor networks: a survey on recent developments and potential synergies. The Journal of supercomputing, 68(1), 1-48.
[Roj16] Rojas, R., Médini, L., Cordier, A. Toward Constrained Semantic WoT. In WoT 2016.
[Sub16] Subercaze, J., Gravier, C., Chevalier, J., Laforest, F. Inferray: fast in-memory RDF inference. PVLDB 9(6). VLDB Endowment, 2016.
[Ter16] Terdjimi, M., Médini, L., Mrissa, M. HyLAR+: Improving Hybrid Location-Agnostic Reasoning with Incremental Rule-based Update. In WWW 2016, companion volume.
[Tom21] Tommasini, R., Bonte, P., Ongenae, F., & Della Valle, E. (2021). RSP4J: An api for rdf stream processing. In European Semantic Web Conference (pp. 565-581). Springer, Cham.
[WoT20] Kovatsch & al. (2020), Web of Things (WoT) Architecture, W3C Recommendation, https://www.w3.org/TR/2020/REC-wot-architecture-20200409/

Profil du candidat :
5A ingénierie ou master 2

Formation et compétences requises :
Programmation en C (éventuellement embarquée)
Représentation et raisonnement sur des graphes de connaissances
Programmation Web en JavaScript (facultatif)

Adresse d’emploi :
Université Claude Bernard Lyon 1, Campus de la Doua, Villeurbanne.

Le stagiaire sera rattaché au Laboratoire d’InfoRmatique en Image et Systèmes d’information (LIRIS). Le LIRIS est une unité mixte de recherche (UMR 5205) du CNRS, de l’INSA de Lyon, de l’Université Claude Bernard Lyon 1, de l’Université Lumière Lyon 2 et de l’Ecole Centrale de Lyon. Il compte 330 membres. Les recherches du LIRIS concernent un large spectre de la science informatique au sein de ses douze équipes de recherche structurées en six pôles de compétences.

Encadrants :
Lionel Médini, Pierre-Antoine Champin, Frédérique Laforest

Modalités de candidature :

Les candidats doivent envoyer les documents suivants :
-un CV
-une lettre de motivation
-le dernier relevé de notes

Ces documents doivent être envoyés à lionel.medini à liris.cnrs.fr

Exploiter les formats compacts pour concevoir un moteur d’inférence pour Internet des objets

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Hubert Curien, St-Etienne
Durée : 6 mois
Contact : singh.d.kamal@gmail.com
Date limite de publication : 2022-05-01

Contexte :
Le Web des Objets (WoT) est le résultat de l’intégration dans le Web, d’objets communicants de l’Internet des Objets pouvant présenter des capacités limitées. Les applications du WoT concernent l’agriculture numérique, le bâtiment intelligent, les villes intelligentes, la santé, etc [Raw14]. Le Web sémantique forme un socle théorique privilégié pour les graphes de connaissances émergeant de l’échange, du stockage, du traitement et du raisonnement sur des données dans le WoT.

Nous focalisons à donner aux objets connectés une capacité de raisonnement sur les graphes de connaissances en embarquant les traitements au plus près de ces objets. Il s’agit pour cela de définir une architecture logicielle compatible à la fois avec la nature contrainte de ces objets et avec les standards du WoT – et notamment la notion de servient [WoT20] – et d’y intégrer un moteur d’inférences incrémental à base de règles. L’objectif de ce stage est de proposer une évolution de ce moteur en y intégrant des optimisations non prévues dans notre projet CoSWoT pour le parsing et l’échange de données compressées.

Les enjeux majeurs de l’utilisation des technologies du Web sémantique dans un environnement embarqué sont la verbosité des syntaxes concrètes de graphes de connaissances (e.g. Turtle ou JSON-LD) [Cha18] et la complexité du traitement sémantique de ces graphes [Ben21]. L’autre problématique est liée à la complexité du raisonnement différentiel sur données arrivant en flux : au fil du temps, les données peuvent évoluer, modifiant le graphe de connaissances sur lequel s’effectue le raisonnement.

Sujet :
Nous souhaitons exploiter les formats compacts de connaissances formelles pour concevoir un moteur d’inférence différentiel capable de raisonner de manière efficace en termes de mémoire, de calcul (bien adapté au type de processeur ou microcontrôleur), d’utilisation de la bande passante et de l’énergie.

Les tâches à réaliser sont les suivants :

i) L’étude des formats compacts de la littérature (notamment CBOR-LD et HDT) [CBOR-LD] [https://www.rdfhdt.org/]

ii) Concevoir et réaliser un parseur/serialiseur différentiel qui transforme efficacement les faits RDF dans une représentation compacte, qui sera fournie en entrée du raisonneur.

iii) Nous allons aussi adapter l’algorithme de RSP4J [Tom21] aux environnements embarqués pour parser les données à la volée.
L’implémentation du prototype sera réalisée en C pour avoir un code au plus proche des contraintes matérielles sur Arduino, ESP32, etc.

iv) Nous évaluerons l’efficacité de ces propositions via des expérimentations sur divers matériels et dans divers scénarios correspondant à des cas d’usage du raisonnement dans le WoT.

Références :

[Ben21] Bento, A., Médini, L., Singh, K., & Laforest, F. (2021, June). Raisonnement embarqué et distribué pour le Web des Objets: un état de l’art. In Journées Francophones d’Ingénierie des Connaissances (IC) Plate-Forme Intelligence Artificielle (PFIA’21) (pp. pp-48).
[Bon19] Bonte, P., Tommasini, R., De Turck, F., Ongenae, F., & Valle, E. D. (2019, June). C-sprite: efficient hierarchical reasoning for rapid RDF stream processing. In Proceedings of the 13th ACM International Conference on Distributed and Event-based Systems (pp. 103-114).
[CBOR-LD] Sporny, M. & Longley, D.. CBOR-LD 1.0 – A CBOR-based Serialization for Linked Data. W3C Member Submission, 2021. URL : https://digitalbazaar.github.io/cbor-ld-spec/
[Cha18] Charpenay, Victor, Sebastian Käbisch, and Harald Kosch. “Towards a binary object notation for RDF.” European Semantic Web Conference. Springer, Cham, 2018.
[Raw14] Rawat, P., Singh, K. D., Chaouchi, H., & Bonnin, J. M. (2014). Wireless sensor networks: a survey on recent developments and potential synergies. The Journal of supercomputing, 68(1), 1-48.
[Roj16] Rojas, R., Médini, L., Cordier, A. Toward Constrained Semantic WoT. In WoT 2016.
[Tom21] Tommasini, R., Bonte, P., Ongenae, F., & Della Valle, E. (2021). RSP4J: An api for rdf stream processing. In European Semantic Web Conference (pp. 565-581). Springer, Cham.
[WoT20] Kovatsch & al. (2020), Web of Things (WoT) Architecture, W3C Recommendation, https://www.w3.org/TR/2020/REC-wot-architecture-20200409/

Profil du candidat :
Niveau 5A ou M2 (en cours)

Modalités de candidature :
Les candidats doivent envoyer les documents suivants :
une lettre de motivation
un CV
le dernier relevé de notes
Ces documents doivent être envoyées à : singh.d.kamal@gmail.com

Formation et compétences requises :
Des compétences en représentation des connaissances du Web sémantique.
Des compétences en programmation en C.

Adresse d’emploi :
Le stagiaire serait un/une membre du laboratoire LabHC, St-Etienne, France. Le Laboratoire Hubert Curien (https://laboratoirehubertcurien.univ-st-etienne.fr/en/index.html) est une unité mixte de recherche CNRS (UMR 5516) de l’Université Jean Monnet à Saint-Etienne, et de l’Institut d’Optique Graduate Ecole, travaillant sur des thématiques liées à l’optique, la photonique et les hyperfréquences, l’informatique, les télécoms et l’image. Les membres du LaHC impliqués dans le projet CoSWoT sont des chercheurs d’équipe nommée Data Intelligence. Ils sont spécialisés dans l’IA et le traitement des données.

Encadrants : Kamal Singh (LaHC), Riccardo Tommasini (LIRIS), Victor Charpenay (LIMOS)