Stage M2/Ingénieur : Explicabilité des réseaux profonds au moyen d’approches symboliques

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ICube / Université de Strasbourg
Durée : 5 à 6 mois
Contact : stella@unistra.fr
Date limite de publication : 2022-02-01

Contexte :
Les systèmes autonomes intelligents dits à “boîte noire”, qui reposent sur des algorithmes d’apprentissage comme les réseaux de neurones profonds, deviennent omniprésents dans notre paysage quotidien. L’exigence d’un meilleur encadrement de ces algorithmes devient un enjeu sociétal, et requiert le développement de techniques permettant de comprendre leur fonctionnement ou d’expliquer leurs décisions. Ce stage s’inscrit dans le cadre du projet DEEPISH (Deep lEarning ExPlainabilIty through Symbolic approacHes), qui a pour objectif de proposer un modèle reposant sur des techniques de raisonnement symbolique (graphes de connaissances et règles), permettant d’expliquer les décisions de systèmes basés sur un apprentissage profond. Le domaine d’application considéré est le diagnostic médical.
Différentes approches ont été proposées pour développer l’explicabilité des modèles profonds. Parmi les plus populaires, on trouve les techniques de visualisation permettant d’identifier, dans le cadre de la reconnaissance d’objets dans des images, les portions de celles-ci ayant permis au modèle de faire sa prédiction (Wang et al., 2020). Bien qu’intéressants, ces modèles sont limités lorsque les objets recherchés sur l’image sont trop complexes pour être appréciés à l’œil nu par des experts humains, par exemple dans le cas de détection de lésions subtiles dans des mammographies (Oren et al., 2020).
Nous envisageons une approche multi-modale qui permettrait d’identifier les facteurs de confusion dans les données. En effet, dans le domaine médical, de nombreuses sources de données peuvent apporter des éléments permettant d’appuyer ou de rejeter un diagnostic : rapports textuels, bilans sanguins, données génétiques, etc. On peut alors concevoir un système, qui, lorsqu’une lésion non détectable par un expert humain est caractérisée, pourrait fournir d’autres éléments factuels appuyant sa prédiction : si le patient est une femme et que la patiente possède le marqueur génétique xxx alors il est probable à n% qu’un traitement soit nécessaire.

Sujet :
Il sera d’abord nécessaire, pour alimenter le système de raisonnement, de commencer par construire des graphes de connaissances à partir de données textuelles issues des données multi-modales (coupes histologiques et rapports histologiques) disponibles, afin d’en extraire des concepts qui seront utilisés par le système de raisonnement. L’extraction d’informations à partir de textes nécessite d’extraire des triplets comprenant un sujet, une relation et un objet (Hohenecker et al., 2020, Solawetz & Larson, 2021). Ces graphes de connaissances seront ensuite enrichis par des connaissances extraites automatiquement à partir d’articles scientifiques disponibles dans le domaine public.
On pourra ensuite considérer que le modèle profond utilisé n’aura pas d’autre utilité que d’extraire des faits à partir de données complexes (ce qu’aucun système à base de règle n’est capable de faire), qui viendront compléter la connaissance organisée extraite des données textuelles. Ainsi, dans un deuxième temps, il faudra étudier différents types d’approches permettant de générer des règles logiques de façon autonome, comme les approches neuro- symboliques (Garcez et al., 2019 ; Ciravegna et al., 2021), ou les systèmes de classeurs (Learning Classifier Systems) (Orhand et al., 2021).

Références

Ciravegna, G., Barbiero, P., Giannini, F., Gori, M., Lió, P., Maggini, M., & Melacci, S. (2021). Logic Explained Networks. arXiv preprint arXiv:2108.05149.

Garcez, A. D. A., Gori, M., Lamb, L. C., Serafini, L., Spranger, M., & Tran, S. N. (2019). Neural- symbolic computing: An effective methodology for principled integration of machine learning and reasoning. arXiv preprint arXiv:1905.06088.

Hohenecker, P., Mtumbuka, F., Kocijan, V., & Lukasiewicz, T. (2020). Systematic Comparison of Neural Architectures and Training Approaches for Open Information Extraction. Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 8554‐8565.

Oren, O, Gersh, B. J. and Bhatt, D. L., “Artificial intelligence in medical imaging: switching from radiographic pathological data to clinically meaningful endpoints,” The Lancet Digital Health, vol. 2, no. 9, pp. e486–e488, Sep. 2020, doi: 10.1016/S2589-7500(20)30160-6.

Orhand, R., Jeannin-Girardon, A., Parrend, P. and, Collet, P., “Explainability and Performance of Anticipatory Learning Classifier Systems in Non-Deterministic Environments”, Genetic and Evolutionary Computation Conference (GECCO), Lille, France, juillet 2021

Solawetz, J., & Larson, S. (2021). LSOIE  : A Large-Scale Dataset for Supervised Open Information Extraction. Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, 2595‐2600.

Wang et al., “Score-CAM: Score-Weighted Visual Explanations for Convolutional Neural Networks,” 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 2020

Profil du candidat :
Le stage requiert un réel intérêt pour les méthodes d’intelligence artificielle :
– IA symbolique : modélisation de connaissances et raisonnement logique (graphes de connaissances et règles),
– apprentissage machine et réseaux de neurones profonds.

Formation et compétences requises :
L’étudiant·e en M2 informatique ou de niveau équivalent, devra avoir une spécialisation en intelligence artificielle (“deep learning”, modélisation de connaissances, raisonnement symbolique).
Il ou elle devra maîtriser le langage Python, être capable de manipuler des bibliothèques de TAL (spaCy, stanza, flair), et des réseaux de neurones profonds, afin d’être autonome pour l’implémentation.

Adresse d’emploi :
Laboratoire ICube / Université de Strasbourg
Lieu : Pole API (illkirch)

Document attaché : 202112021138_sujet stage M2 2022.pdf

Stage M2/Ingénieur : Deep Learning pour la détection de tumeurs dans des radiographies

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire I3S
Durée : 6 mois
Contact : lionel.fillatre@i3s.unice.fr
Date limite de publication : 2022-03-01

Contexte :
L’équipe MediaCoding du laboratoire I3S collabore sur ce sujet avec le Centre Hospitalier Universitaire (CHU) de Nice. Le stagiaire pourra donc bénéficier de l’expertise d’un professeur gastro-entérologue et hépatologue.

Sujet :
Objectifs :

Le Deep Learning (ou apprentissage profond) est une technique d’analyse de données qui permet d’obtenir des résultats de classification ou d’estimation très performants quel que soit le domaine applicatif. Ce sujet de stage s’intéresse à l’utilisation du Deep Learning pour l’analyse d’images médicales. Il s’agit plus particulièrement de détecter et localiser des lésions dans le foie. Nous disposons d’un jeu de données réelles d’images tomographiques étiquetées [1]. Les étiquettes décrivent la position et la forme des lésions dans les images. Le but du stage est d’utiliser un réseau de neurones pour estimer l’état du foie du patient.

De nombreux réseaux de neurones existent pour segmenter le contenu d’images [2]. Dans ce stage, il s’agira donc d’identifier les réseaux les plus prometteurs et de les appliquer aux images tomographiques du foie. Le stagiaire devra vérifier avec soin la qualité des informations qui peuvent être extraites de la segmentation, notamment l’estimation de la taille des lésions. Les lésions n’ont bien évidemment pas toutes les mêmes dimensions. Le réseau de neurones aura tendance à mieux détecter les lésions importantes. Le stagiaire pourra s’appuyer sur des travaux récents de notre équipe de recherche [3] afin de développer un réseau de neurones dont les performances en détection et en localisation des tumeurs seront robustes par rapport à la taille et à l’emplacement des lésions.

Encadrant du stage : M. Lionel Fillatre (professeur des universités)

Durée : de 4 à 6 mois (démarrage en mars/avril 2022 selon les contraintes du stagiaire).

Rémunération : environ 550 euros par mois.

Procédure pour déposer sa candidature : envoyer son CV, sa lettre de motivation et ses résultats académiques niveau L1, L2, L3, M1 et M2 à lionel.fillatre@i3s.unice.fr

Bibliographie :

[1] https://arxiv.org/pdf/1901.04056.pdf
[2] http://www.deeplearningbook.org/
[3] Cyprien Gilet, Susana Barbosa, and Lionel Fillatre. Discrete box-constrained minimax classifier for uncertain and imbalanced class proportions.IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020

Profil du candidat :
Ces travaux requièrent les compétences suivantes :
– Programmation informatique : les développements informatiques seront réalisés en Python et Pytorch (connaître préalablement Python n’est pas nécessaire mais souhaitable)
– Notions de bases en machine learning (en particulier sur les réseaux de neurones).

Formation et compétences requises :
Formation niveau M2/Ingénieur en mathématiques appliquées et/ou en informatique.

Adresse d’emploi :
Campus SophiaTech, Sophia Antipolis, département 06 (Alpes-Maritimes).

Télédétection pour le suivi des végétations pastorales d’alpage : Traitements et analyse

Offre en lien avec l’Action/le Réseau : MACLEAN/– — –

Laboratoire/Entreprise : PACTE
Durée : 6
Contact : pauline.dusseux@univ-grenoble-alpes.fr
Date limite de publication : 2021-12-03

Contexte :
Dans le cadre des travaux menés au sein du programme Alpages sentinelles, plusieurs actions sont conduites pour mieux caractériser, quantifier et qualifier les végétations pastorales d’alpage, et raisonner ainsi les modalités de leur mobilisation par les systèmes pastoraux dans un contexte d’aléas climatiques croissants :
– Définition d’une typologie et élaboration d’un référentiel des végétations pastorales d’alpage, intégrant leur fonctionnalité pastorale et leur sensibilité aux contraintes climatiques.
– Définition d’une méthodologie d’analyse de la vulnérabilité d’un alpage au changement climatique, intégrant sa sensibilité au regard des végétations qui le composent.
– Étude des variations interannuelles de productivité des différents types de pelouses d’alpage.
Ces travaux s’appuient sur l’acquisition de données de terrain selon des protocoles nécessitant actuellement des moyens humains et financiers importants.
Dans ce cadre, les partenaires du programme Alpages Sentinelles s’interrogent sur les apports possibles d’une approche de la végétation d’alpage par télédétection :
La télédétection peut-elle permettre d’identifier et de cartographier des types de milieux pastoraux, au regard d’une typologie fonctionnelle préétablie au sein du programme « Alpages sentinelles » ?
La télédétection peut-elle permettre de suivre les dynamiques temporelles de ces milieux pastoraux : variations interannuelles de productivité, évolution de long terme ?

Sujet :
Le sujet de stage proposé s’intéresse à la contribution possible de la télédétection à la caractérisation et au suivi de la productivité des milieux pastoraux avec un objectif méthodologique fort portant sur les outils de classification et de régression à mobiliser pour traiter des séries temporelles de données de télédétection ainsi que les indices qui en sont dérivés. Les techniques qui seront adoptées pour cela seront issus du domaine de l’apprentissage automatique ainsi que de l’apprentissage profond (deep learning).
Ces informations contribueront à développer les applications opérationnelles attendues à terme pour le programme Alpages sentinelles, notamment pour faire évoluer les méthodes actuelles d’acquisition de certaines données et monter en puissance en termes de dispositif, notamment pour les suivis annuels de biomasse (mesures de hauteurs de végétation sur le terrain pour le moment).

Profil du candidat :
Master : Télédétection / Géomatique / Informatique

Les compétences attendues sont les suivantes :
– Connaissances fortes en programmation (Python)
– Connaissances en télédétection optique et en traitement d’image (GDAL, OTB)
– Connaissances en statistiques
– Maîtrise de l’anglais scientifique
– Des connaissances sur les milieux pastoraux seraient un plus
– Des connaissances sur des librairies Python comme Keras, Tensorflow ou Pytorch
seraient un plus

Formation et compétences requises :
Master : Télédétection / Géomatique / Informatique
Les compétences attendues sont les suivantes :
– Connaissances fortes en programmation (Python)
– Connaissances en télédétection optique et en traitement d’image (GDAL, OTB)
– Connaissances en statistiques
– Maîtrise de l’anglais scientifique
– Des connaissances sur les milieux pastoraux seraient un plus
– Des connaissances sur des librairies Python comme Keras, Tensorflow ou Pytorch
seraient un plus

Adresse d’emploi :
Sciences Po Grenoble
Pacte/IEP – BP 48 – 38040 Grenoble cedex 9

Document attaché : 202112011726_2022_Sujet stage M2 Télédétection Alpages Sentinelles.pdf

Post doctoral position on time series analysis of data living on the SPD manifold. Application to th

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC UMR 6072
Durée : One year
Contact : luc.brun@ensicaen.fr
Date limite de publication : 2022-05-01

Contexte :
We are seeking an outstanding postdoctoral research fellow with experience in deep learning / machine learning to work with us at Caen University, France during one year on a project investigating the analysis of time series of data corresponding to SPD matrices. The challenge here will be to define machine learning methods and more specifically deep learning methods (either convolutional or recursive) to analyze these data by using all the interesting properties of this specific manifold.

The postdoctoral position is funded for one year under the research project PredictAlert supported by the Region Normandy (France). The PredictAlert project gathers engineering schools and universities around the design of a better understanding of the brain states during different states of wakefulness.

Sujet :
Objectives and challenges
The project is based on data from a cohort being currently acquired. It includes EEG and MRI acquisitions performed while subjects are falling asleep for a nap. In both cases, an acquisition in a given time window, is characterized by a SPD matrix. Each entry of this matrix correspond either to a correlation between two sensors in the case of an EEG acquisition or a correlation between two brain’s zones in the case of an IRM acquisition.
In a first step the candidate will have to work on EEG acquisitions in order to design a deep learning algorithm predicting quantified levels of wakefulness along long EEG sequences. Convolutional [1, 3] or recurrent [2, 4] networks on the SPD manifold will be both studded and evaluated before a focus on the more promising approach.

While functional IRM sequences may also be characterized as time series of SPD matrices, these sequences are based on data with a much better spatial resolution than EEGs. This come at the price of a much lower temporal resolution compared EEG acquisitions. The candidate will have to adapt the work already done on EEG data to functional IRM datum and to compare both results.

Profil du candidat :
Candidate profile

•  Interpersonal skills and the ability to work well individually or as a member of a project team are recommended.
• Good written and verbal communication skills are required, the candidate has to be fluent in spoken French or English and written English. Working language can be English or French.

Formation et compétences requises :
• The candidate must have a recent Ph.D. (within 5 years) in Computer science (or Applied Mathematics) in the field of Machine Learning.
• Knowledge and experience within Deep Learning frameworks is highly recommended.
• The candidate will perform research and algorithmic developments and solid programming skills are required.

Adresse d’emploi :
Caen, France in the GREYC UMR CNRS laboratory. Situated in the Normandy region of France close to the sea and about 240km west of Paris the city still has many old quarters, a population of around 120,000 the city area has roughly 250,000 inhabitants.

Document attaché : 202112011007_postdoc_en2.pdf

Clustering flou de séries temporelles pour la détection de la douleur

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Limos
Durée : 20 mois
Contact : issam.falih@uca.fr
Date limite de publication : 2022-05-01

Contexte :
Le LIMOS travaille en collaboration avec l’institut Analgésia, une fondation de recherche française dans le domaine de l’innovation et la douleur. Analgésia développe une application mobile e-santé permettant d’améliorer l’évaluation de la douleurs et d’accompagner le patient douloureux chronique au quotidien. Les données comprennent notamment des questionnaires hebdomadaires sous forme de niveau de score.

Sujet :
L’objectif principal est de développer de nouveaux modèles et de nouvelles méthodes basés sur l’apprentissage de représentation pour le clustering flou des séries temporelles avec une application aux données biomédicales.

Une première étape consistera à expérimenter l’état de l’art concernant les méthodes d’extraction d’attributs pour la classification non supervisée [MCLC21, MZLC19, YDW+20].
La deuxième étape serait d’utiliser un nouveau modèle de représentation basé sur une architecture neuronale afin d’améliorer la classification non supervisée des séries temporelles [MGL+18, YDZ+19]. Le but final est l’implémentation d’outils de fouille de données non supervisée afin de découvrir des groupes d’individus ayant des comportements identiques à la douleur, quelque soit leur pathologie de départ.

Profil du candidat :
– Doctorat en informatique, avec des compétences en fouille de données/Machine Learning/optimisation.
– Bonne liste de publication.
– Compétences en programmation en python..

Formation et compétences requises :
Pour les candidatures, merci d’envoyer par mail avant letextbf{ 6 décembre 2021}, un seul fichier pdf contenant une lettre de motivation décrivant leur parcours de recherche et leur motivation, un CV détaillé (avec la liste des publications) et les coordonnées de deux personnes de référence au maximum, à violaine.antoine@uca.fr et issam.falih@uca.fr

Adresse d’emploi :
LIMOS, Campus universitaire des Cézeaux, Université Clermont Auvergne

Document attaché : 202112010924_2021_PostDoc_Proposal-Fr.pdf

Optimisation d’un moteur d’inférences embarqué

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS, Université Claude Bernard Lyon 1, Campus de
Durée : 6 mois
Contact : lionel.medini@liris.cnrs.fr
Date limite de publication : 2022-05-01

Contexte :
Le Web des Objets (WoT) est le résultat de l’intégration dans le Web, d’objets communicants de l’Internet des Objets pouvant présenter des capacités limitées. Les applications du WoT concernent l’agriculture numérique, le bâtiment intelligent, les villes intelligentes, la santé, etc [Raw14]. Le Web sémantique forme un socle théorique privilégié pour les graphes de connaissances émergeant de l’échange, du stockage, du traitement et du raisonnement sur des données dans le WoT.

Nous focalisons à donner aux objets connectés une capacité de raisonnement sur les graphes de connaissances en embarquant les traitements au plus près de ces objets. Il s’agit pour cela de définir une architecture logicielle compatible à la fois avec la nature contrainte de ces objets et avec les standards du WoT – et notamment la notion de servient [WoT20] – et d’y intégrer un moteur d’inférence incrémental à base de règles. Une première version de moteur d’inférences a été développée en C et fonctionne notamment sur architecture Arduino Due. L’objectif de ce stage est de proposer une évolution de ce moteur en y intégrant des optimisations non prévues dans CoSWoT pour le parsing et l’échange de données compressées.

Sujet :
Dans ce stage, nous nous focalisons sur le moteur d’inférence intégré au servient. Nous partons du principe que les données échangées entre les différents modules logiciels sont déjà compressées en CBOR-LD ou bien en HDT.
L’objectif principal de ce stage est de modifier le moteur d’inférence du projet CoSWoT pour tirer parti de cette compression en ré-indexant plus efficacement les triplets et leurs termes. Autrement dit, il s’agit de substituer la bibliothèque de stockage de faits actuelle pour la remplacer par des structures de données plus légères, afin de réduire l’empreinte mémoire du moteur d’inférence et d’optimiser sa vitesse de traitement. Différentes solutions pourront être envisagées pour cela, qui devront être compatibles avec le fonctionnement de l’algorithme, les capacités du dispositif sur lequel il est déployé et l’arrivée des données sous forme de flux.

Dans un second temps, ces améliorations devront être évaluées en termes d’espace mémoire et de temps de traitement sur différents jeux de données, différents scénarios et différents appareils. L’objectif est de déterminer les limites de cette approche par rapport aux autres moteurs du marché, et également de caractériser les capacités de raisonnement des différents dispositifs utilisés.

En fonction du temps restant, l’automatisation du déploiement sur différents appareils pourra également être réalisée.

Le code réalisé sera déposé en open source.

Références :

[Ben21] Bento, A., Médini, L., Singh, K., & Laforest, F. (2021, June). Raisonnement embarqué et distribué pour le Web des Objets: un état de l’art. In Journées Francophones d’Ingénierie des Connaissances (IC) Plate-Forme Intelligence Artificielle (PFIA’21) (pp. pp-48).
[Bon19] Bonte, P., Tommasini, R., De Turck, F., Ongenae, F., & Valle, E. D. (2019, June). C-sprite: efficient hierarchical reasoning for rapid RDF stream processing. In Proceedings of the 13th ACM International Conference on Distributed and Event-based Systems (pp. 103-114).
[CBOR-LD] Sporny, M. & Longley, D.. CBOR-LD 1.0 – A CBOR-based Serialization for Linked Data. W3C Member Submission, 2021. URL : https://digitalbazaar.github.io/cbor-ld-spec/
[Cha18] Charpenay, Victor, Sebastian Käbisch, and Harald Kosch. “Towards a binary object notation for RDF.” European Semantic Web Conference. Springer, Cham, 2018.
[Fer10] Fernandez, J.D., Martinez-Prieto, M.A. & Gutierrez, C.. Compact Representation of Large RDF Data Sets for Publishing and Exchange. In: The Semantic Web ISWC 2010, vol. 6496, pp. 193–208. Springer Berlin Heidelberg, Berlin, Heidelberg, 2010.
[Med16] Médini, L. An Avatar-based Workflow for the Semantic Web of Things. In WWW 2016 W3C Track.
[Mot12] Motik, B., Horrocks, I., Kim, S.M. Delta-reasoner: a semantic web reasoner for an intelligent mobile platform. In WWW 2012 companion volume.
[Mri15] Mrissa, M., Médini, L., Jamont, J.-P., Le Sommer, N., Laplace, J. An Avatar Architecture for the Web of Things. Internet Computing 19(2). IEEE, 2015.
[Raw14] Rawat, P., Singh, K. D., Chaouchi, H., & Bonnin, J. M. (2014). Wireless sensor networks: a survey on recent developments and potential synergies. The Journal of supercomputing, 68(1), 1-48.
[Roj16] Rojas, R., Médini, L., Cordier, A. Toward Constrained Semantic WoT. In WoT 2016.
[Sub16] Subercaze, J., Gravier, C., Chevalier, J., Laforest, F. Inferray: fast in-memory RDF inference. PVLDB 9(6). VLDB Endowment, 2016.
[Ter16] Terdjimi, M., Médini, L., Mrissa, M. HyLAR+: Improving Hybrid Location-Agnostic Reasoning with Incremental Rule-based Update. In WWW 2016, companion volume.
[Tom21] Tommasini, R., Bonte, P., Ongenae, F., & Della Valle, E. (2021). RSP4J: An api for rdf stream processing. In European Semantic Web Conference (pp. 565-581). Springer, Cham.
[WoT20] Kovatsch & al. (2020), Web of Things (WoT) Architecture, W3C Recommendation, https://www.w3.org/TR/2020/REC-wot-architecture-20200409/

Profil du candidat :
5A ingénierie ou master 2

Formation et compétences requises :
Programmation en C (éventuellement embarquée)
Représentation et raisonnement sur des graphes de connaissances
Programmation Web en JavaScript (facultatif)

Adresse d’emploi :
Université Claude Bernard Lyon 1, Campus de la Doua, Villeurbanne.

Le stagiaire sera rattaché au Laboratoire d’InfoRmatique en Image et Systèmes d’information (LIRIS). Le LIRIS est une unité mixte de recherche (UMR 5205) du CNRS, de l’INSA de Lyon, de l’Université Claude Bernard Lyon 1, de l’Université Lumière Lyon 2 et de l’Ecole Centrale de Lyon. Il compte 330 membres. Les recherches du LIRIS concernent un large spectre de la science informatique au sein de ses douze équipes de recherche structurées en six pôles de compétences.

Encadrants :
Lionel Médini, Pierre-Antoine Champin, Frédérique Laforest

Modalités de candidature :

Les candidats doivent envoyer les documents suivants :
-un CV
-une lettre de motivation
-le dernier relevé de notes

Ces documents doivent être envoyés à lionel.medini à liris.cnrs.fr

Exploiter les formats compacts pour concevoir un moteur d’inférence pour Internet des objets

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Hubert Curien, St-Etienne
Durée : 6 mois
Contact : singh.d.kamal@gmail.com
Date limite de publication : 2022-05-01

Contexte :
Le Web des Objets (WoT) est le résultat de l’intégration dans le Web, d’objets communicants de l’Internet des Objets pouvant présenter des capacités limitées. Les applications du WoT concernent l’agriculture numérique, le bâtiment intelligent, les villes intelligentes, la santé, etc [Raw14]. Le Web sémantique forme un socle théorique privilégié pour les graphes de connaissances émergeant de l’échange, du stockage, du traitement et du raisonnement sur des données dans le WoT.

Nous focalisons à donner aux objets connectés une capacité de raisonnement sur les graphes de connaissances en embarquant les traitements au plus près de ces objets. Il s’agit pour cela de définir une architecture logicielle compatible à la fois avec la nature contrainte de ces objets et avec les standards du WoT – et notamment la notion de servient [WoT20] – et d’y intégrer un moteur d’inférences incrémental à base de règles. L’objectif de ce stage est de proposer une évolution de ce moteur en y intégrant des optimisations non prévues dans notre projet CoSWoT pour le parsing et l’échange de données compressées.

Les enjeux majeurs de l’utilisation des technologies du Web sémantique dans un environnement embarqué sont la verbosité des syntaxes concrètes de graphes de connaissances (e.g. Turtle ou JSON-LD) [Cha18] et la complexité du traitement sémantique de ces graphes [Ben21]. L’autre problématique est liée à la complexité du raisonnement différentiel sur données arrivant en flux : au fil du temps, les données peuvent évoluer, modifiant le graphe de connaissances sur lequel s’effectue le raisonnement.

Sujet :
Nous souhaitons exploiter les formats compacts de connaissances formelles pour concevoir un moteur d’inférence différentiel capable de raisonner de manière efficace en termes de mémoire, de calcul (bien adapté au type de processeur ou microcontrôleur), d’utilisation de la bande passante et de l’énergie.

Les tâches à réaliser sont les suivants :

i) L’étude des formats compacts de la littérature (notamment CBOR-LD et HDT) [CBOR-LD] [https://www.rdfhdt.org/]

ii) Concevoir et réaliser un parseur/serialiseur différentiel qui transforme efficacement les faits RDF dans une représentation compacte, qui sera fournie en entrée du raisonneur.

iii) Nous allons aussi adapter l’algorithme de RSP4J [Tom21] aux environnements embarqués pour parser les données à la volée.
L’implémentation du prototype sera réalisée en C pour avoir un code au plus proche des contraintes matérielles sur Arduino, ESP32, etc.

iv) Nous évaluerons l’efficacité de ces propositions via des expérimentations sur divers matériels et dans divers scénarios correspondant à des cas d’usage du raisonnement dans le WoT.

Références :

[Ben21] Bento, A., Médini, L., Singh, K., & Laforest, F. (2021, June). Raisonnement embarqué et distribué pour le Web des Objets: un état de l’art. In Journées Francophones d’Ingénierie des Connaissances (IC) Plate-Forme Intelligence Artificielle (PFIA’21) (pp. pp-48).
[Bon19] Bonte, P., Tommasini, R., De Turck, F., Ongenae, F., & Valle, E. D. (2019, June). C-sprite: efficient hierarchical reasoning for rapid RDF stream processing. In Proceedings of the 13th ACM International Conference on Distributed and Event-based Systems (pp. 103-114).
[CBOR-LD] Sporny, M. & Longley, D.. CBOR-LD 1.0 – A CBOR-based Serialization for Linked Data. W3C Member Submission, 2021. URL : https://digitalbazaar.github.io/cbor-ld-spec/
[Cha18] Charpenay, Victor, Sebastian Käbisch, and Harald Kosch. “Towards a binary object notation for RDF.” European Semantic Web Conference. Springer, Cham, 2018.
[Raw14] Rawat, P., Singh, K. D., Chaouchi, H., & Bonnin, J. M. (2014). Wireless sensor networks: a survey on recent developments and potential synergies. The Journal of supercomputing, 68(1), 1-48.
[Roj16] Rojas, R., Médini, L., Cordier, A. Toward Constrained Semantic WoT. In WoT 2016.
[Tom21] Tommasini, R., Bonte, P., Ongenae, F., & Della Valle, E. (2021). RSP4J: An api for rdf stream processing. In European Semantic Web Conference (pp. 565-581). Springer, Cham.
[WoT20] Kovatsch & al. (2020), Web of Things (WoT) Architecture, W3C Recommendation, https://www.w3.org/TR/2020/REC-wot-architecture-20200409/

Profil du candidat :
Niveau 5A ou M2 (en cours)

Modalités de candidature :
Les candidats doivent envoyer les documents suivants :
une lettre de motivation
un CV
le dernier relevé de notes
Ces documents doivent être envoyées à : singh.d.kamal@gmail.com

Formation et compétences requises :
Des compétences en représentation des connaissances du Web sémantique.
Des compétences en programmation en C.

Adresse d’emploi :
Le stagiaire serait un/une membre du laboratoire LabHC, St-Etienne, France. Le Laboratoire Hubert Curien (https://laboratoirehubertcurien.univ-st-etienne.fr/en/index.html) est une unité mixte de recherche CNRS (UMR 5516) de l’Université Jean Monnet à Saint-Etienne, et de l’Institut d’Optique Graduate Ecole, travaillant sur des thématiques liées à l’optique, la photonique et les hyperfréquences, l’informatique, les télécoms et l’image. Les membres du LaHC impliqués dans le projet CoSWoT sont des chercheurs d’équipe nommée Data Intelligence. Ils sont spécialisés dans l’IA et le traitement des données.

Encadrants : Kamal Singh (LaHC), Riccardo Tommasini (LIRIS), Victor Charpenay (LIMOS)

Des besoins d’utilisateurs à la construction de requêtes ’sciences de données’ pour une base de donn

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : LIFO
Durée : 4-6 mois
Contact : mirian@univ-orleans.fr
Date limite de publication : 2021-12-16

Contexte :
Dans le contexte de l’action DOING.

Sujet :
Ce stage a comme objectif la proposition d’une méthode semi-automatique pour traiter les questions des experts du domaine de la santé pour dériver des templates de requêtes science des données qui fournissent des réponses à ces questions.

Profil du candidat :
Niveau master

Formation et compétences requises :
Bonne notions de bases de données , théorie de langange, Intelligence artificielle

Adresse d’emploi :
LIFO

Document attaché : 202111301154_DSqueries-GetInfo.pdf

Vers des requêtes science de données

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : LIFO (Laboratoire d’Informatique Fondamentale d’
Durée : 4-6 mois
Contact : mirian@univ-orleans.fr
Date limite de publication : 2021-12-16

Contexte :
Stage proposé dans le cadre de l’action DOING.

Sujet :
Le stage a comme objectif l’étude de la conception d’un système d’interrogation capable d’offrir à ses utilisateurs des requêtes d’analyse prescriptive (Prescriptive Analytics en anglais)

Profil du candidat :
Niveau master

Formation et compétences requises :
De bonnes notions en bases de données et intelligence artificielle

Adresse d’emploi :
LIFO

Document attaché : 202111301150_DSqueries.pdf

Réseaux de neurones profonds pour l’analyse de conversations

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire ERIC / CABOT Financial
Durée : 5 à 6 mois
Contact : adrien.guille@univ-lyon2.fr
Date limite de publication : 2021-11-30

Contexte :
Le stage se situe dans le contexte d’une collaboration entre le laboratoire ERIC et Cabot Financial France. Cabot Financial France est la filiale française du groupe Encore Capital, leader mondial du rachat de créances. Le métier de Cabot est de racheter des créances impayées aux banques pour tenter ensuite de les recouvrer. En rachetant aux banques leurs créances douteuses, Cabot sécurise les bilans de celles-ci et contribue ainsi au bon fonctionnement de l’économie. L’objectif des opérations de recouvrement est de joindre les débiteurs pour mettre en place un plan soutenable d’apurement de leurs dettes. Les plateaux d’appels de Cabot passent ainsi chaque semaine plusieurs milliers d’appels téléphoniques qui peuvent déboucher sur des engagements des débiteurs.

Sujet :
L’objectif du stage est de proposer une solution pour prédire si un engagement pris au cours d’une conversation téléphonique sera tenu ou non. Plus exactement, il s’agit d’une tâche de classification définie sur des données textuelles, les conversations étant restranscrites. La difficulté à résoudre cette tâche réside dans la nature conversationnelle de ces textes et la nécessité de modéliser explicitement les interlocuteurs et leurs prises de parole. On se propose d’étudier les avancées récentes en matière de réseaux de neurones profonds pour l’apprentissage à partir du texte, et d’explorer de nouvelles architectures plus expressive, e.g. hiérarchiques, adaptées à la nature des textes considérés.

Profil du candidat :
Master 2 / Dernier année d’école d’ingénieur

Formation et compétences requises :
Apprentissage automatique
Traitement automatique de la langue

Adresse d’emploi :
Lyon ou Paris

Document attaché : 202111291412_Offre de stage – Cabot.pdf