CR

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Unité BioSP – INRAE
Durée : CDI
Contact : edith.gabriel@inrae.fr
Date limite de publication : 2024-03-06

Contexte :
L’unité Biostatistique et processus SPatiaux (BioSP) à INRAE (Avignon) développe des travaux en statistique, en systèmes dynamiques, en écologie-épidémiologie avec un intérêt particulier pour les questions spatiales et spatio-temporelles. Les domaines d’application de ces travaux sont avant tout l’écologie, l’épidémiologie, l’agriculture, l’environnement et les risques climatiques. L’activité de recherche en statistiques spatiales et spatio-temporelles (champs gaussiens, extrêmaux et processus ponctuels) constitue le cœur historique et l’un des axes disciplinaires qui structurent l’unité. L’évaluation des risques épidémiologiques, environnementaux ou climatiques est désormais confrontée à la croissance exponentielle du nombre et du volume des bases de données, évolution qui impacte à la fois les méthodes d’analyse spatiale (dimensionnalité) et les méthodes d’apprentissage (présence de structures de dépendances spatiales ou spatio-temporelles). L’hybridation entre ces deux approches représente un enjeu scientifique majeur. A terme, l’ambition est de renouveler les recherches en statistiques spatiales menées à BioSP et de positionner l’unité en tant qu’acteur apportant des contributions théoriques et méthodologiques dans ce champ de recherche.

Pour postuler, rendez-vous sur le site INRAE jobs du 30 janvier au 05 mars 2024 : https://jobs.inrae.fr/

Sujet :
A BioSP, vous développerez des recherches en apprentissage pour les données présentant des dépendances spatiales et/ou spatio-temporelles dans les domaines d’applications de l’unité. Le champ de recherche étant vaste et les pistes nombreuses, vous aurez l’autonomie pour définir vos priorités de recherche à l’intérieur de ce périmètre. Par vos apports compétences théoriques dans l’un des domaines de l’apprentissage, vous viendrez renforcer l’unité dans l’utilisation de ces techniques et dans l’évolution des approches de statistiques spatiales. Vous collaborerez avec les membres de l’unité développant des recherches dans les domaines des statistiques spatiales, des événements extrêmes et de l’épidémiologie, et vous pourrez vous appuyer sur les jeux de données étudiés dans ce cadre. Vous serez associé/e aux travaux de la chaire Geolearning portée par l’unité en lien avec l’équipe Géostatistique de l’Ecole de Mines de Paris, https://chaire-geolearning.org/

Profil du candidat :
Vous êtes titulaire d’un doctorat, avec des compétences et une expérience dans l’un des domaines de l’apprentissage (Machine Learning, Deep Learning, domain adaptation, transfer learning, weakly supervised learning et knowledge distillation, Generative Adversial Networks, Deep Generative Models). Vous avez montré votre capacité à apporter des développements dans l’un de ces domaines, de préférence dans le traitement de données montrant des dépendances spatiales ou spatio-temporelles, si possible en apportant des résultats mathématiques nouveaux, par exemple sur des garanties théoriques liées à ces méthodologies. Vous savez diffuser vos avancées par des codes informatiques ouverts. Des expériences déjà avérées dans l’analyse de données spatialisées dans le domaine du climat, de l’environnement et/ou de l’écologie seraient très appréciées.

Formation et compétences requises :
Vous êtes titulaire d’un doctorat, avec des compétences et une expérience dans l’un des domaines de l’apprentissage (Machine Learning, Deep Learning, domain adaptation, transfer learning, weakly supervised learning et knowledge distillation, Generative Adversial Networks, Deep Generative Models). Vous avez montré votre capacité à apporter des développements dans l’un de ces domaines, de préférence dans le traitement de données montrant des dépendances spatiales ou spatio-temporelles, si possible en apportant des résultats mathématiques nouveaux, par exemple sur des garanties théoriques liées à ces méthodologies. Vous savez diffuser vos avancées par des codes informatiques ouverts. Des expériences déjà avérées dans l’analyse de données spatialisées dans le domaine du climat, de l’environnement et/ou de l’écologie seraient très appréciées.

Adresse d’emploi :
INRAE – BioSP
228 route de l’aérodrome
Domaine Saint Paul
84914 Avignon

Document attaché : 202401311038_ML_2024_BioSP.pdf

STAGE M2 : Gestion de données de l’électromobilité

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UHA – IRIMAS
Durée : 6 mois
Contact : laurent.moalic@uha.fr
Date limite de publication : 2024-03-06

Contexte :
Le développement de la mobilité électrique est plus que jamais au cœur des orientations stratégiques à travers le monde. Cette rupture avec les mobilités thermiques, pour être efficace et avoir un impact significatif sur l’environnement notamment, doit s’accompagner de la mise en place d’infrastructures de recharge à grande échelle. Il est donc primordial que l’implantation des bornes de recharge soit pertinente, en termes de positionnement des infrastructures et de dimensionnement.

Sujet :
L’objet de ce stage est de fournir une première étape vers un déploiement de bornes de recharge optimal.
Trois thèmes feront l’objet de ce stage :
• Il s’agira dans un premier temps d’identifier l’ensemble des données géographiques et socio-économiques susceptibles d’impacter le fonctionnement d’un réseau de bornes de recharge.
• Dans un deuxième temps, ce stage fera ressortir les corrélations existant entre les données caractérisant le territoire et le fonctionnement réel d’un réseau de recharge.
• Finalement, la mise en œuvre d’un algorithme d’apprentissage automatique visera à prédire le fonctionnement d’une borne de recharge d’après son implantation.

Profil du candidat :
• Le candidat doit être en master M2 ou cycle ingénieur en informatique ou en mathématiques appliquées.
• Des compétences en Systèmes d’Information Géographique (SIG) ou dans le domaine de la mobilité serait un plus.

Formation et compétences requises :
M2 ou cycle Ingénieur

Adresse d’emploi :
Mulhouse

Document attaché : 202401311007_SujetStageMaster1.pdf

Poste MCF Informatique Université de Haute-Alsace, ENSISA / Laboratoire IRIMAS, équipe MSD

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Université Haute-Alsace
Durée : indéterminée
Contact : maxime.devanne@uha.fr
Date limite de publication : 2024-03-06

Contexte :
Nous recrutons un(e) MCF en Informatique (CNU 27) dans notre équipe (dynamique et sympa) à l’Université de Haute-Alsace pour une prise de poste le 1er septembre 2024. Le profil recherche du poste est en analyse de séries temporelles avec des enseignements en réseau.

Conditions d’accueil particulières à l’UHA :
– Décharge d’enseignement pendant deux ans (96 h ETD la première année, 32 h ETD la deuxième année).
– Éligibilté à des projets spécifiques nouveaux recrutés (10 000 €) expertisés par la Commission de la Recherche.

Sujet :
La personne recrutée intégrera l’équipe MSD d’IRIMAS pour ses activités de recherche et la spécialité Informatique et Réseaux de l’ENSISA pour ses activités d’enseignement.

Les profils précis attendus par chaque laboratoire sont précisés ci-dessous. N’hésitez pas à contacter l’équipe pour plus d’informations sur le poste :
– Recherche : Germain Forestier (germain.forestier@uha.fr)
– Enseignement : Jonathan Weber (jonathan.weber@uha.fr)

Profil du candidat :
Profil recherche:
La/Le candidat(e) intégrera l’équipe MSD (Modélisation et Science des données) du département Informatique (https://msd-irimas.github.io) de l’IRIMAS. Il/Elle justifiera d’une expérience significative dans l’analyse et la fouille de séries temporelles et viendra renforcer l’axe de recherche « Science des données » de l’équipe. Au sein de cet axe, la/le candidat(e) s’attachera à développer les travaux actuels du département informatique sur la classification de séries temporelles de diverses origines (capteurs embarqués, satellites, dispositif chirurgicaux, etc.) par des approches de deep learning. Une expérience de projets de recherche nationaux et internationaux ; l’existence de collaborations avérées (publications, séjours scientifiques, projets) entre le candidat et des équipes internationales renommées sera appréciée. De plus, la/le candidat(e) s’appliquera de par ses capacités et activités à favoriser les interactions avec les équipes des départements « informatique », « Automatique, signal et Image » et « Mathématiques » de l’IRIMAS. Enfin, il/elle s’investira dans la vie de l’équipe.

Profil enseignement:
La/Le candidat(e) effectuera son enseignement principalement dans les trois années de la spécialité Informatique et Réseaux de l’ENSISA (https://www.ensisa.uha.fr/formations/ecole-ingenieur-informatique-et-reseaux/), éventuellement dans les autres spécialités d’ingénieurs de l’Ecole. La/Le candidat(e) devra posséder de solides compétences en informatique et des connaissances permettant d’aborder les aspects réseaux qui constitueront la majorité de son service. Une implication dans les enseignements d’apprentissage automatique (Intelligence Artificielle, Deep Learning) ainsi que ceux de cybersécurité, deux thèmes en développement dans la spécialité, sera également possible. Il/Elle s’impliquera dans les enseignements DDRS (Développement Durable et Responsabilité sociétale) de la spécialité. De plus, la/le candidat(e) s’investira également dans les enseignements du cycle post-bac de l’ENSISA (l’ENSISA étant partenaire INSA). L’enseignant(e)-chercheur(e) s’impliquera dans la vie de l’école (encadrement de projets, suivi de stages et d’apprentis, …) et envisagera à moyen terme la prise de responsabilités administratives collectives.

Formation et compétences requises :
Titulaire d’un Doctorat en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
Université Haute-Alsace, ENSISA
12 rue des Frères Lumière
68093 Mulhouse, France

Réalisation d’un benchmark des méthodes de détection d’armées de robots dans les réseaux sociaux

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’Informatique de Bourgogne (LIB)
Durée : 5-6 mois
Contact : eric.leclercq@u-bourgogne.fr
Date limite de publication : 2024-03-06

Contexte :
Dans les réseaux sociaux, la manipulation de l’information est une problématique pouvant avoir des conséquences néfastes importantes. Les stratégies de diffusion d’informations manipulées sont complexes, et peuvent avoir recours à la mise en oeuvre d’armées de robots ayant différents rôles dans le réseau. Par exemple, un groupe de robots peut avoir pour tâche de spammer certains messages ou mots clés afin de manipuler les tendances et de gagner une visibilité importante en peu de temps, d’autres robots peuvent avoir un profil évolué ainsi qu’une activité quotidienne, leur permettant de passer pour des utilisateurs légitimes et de donner plus de poids aux messages qu’ils pourraient diffuser dans certaines communautés. Toutefois, la détection de ces armées de robots est complexe, et l’évolution rapide de leur comportement et de leur organisation restreint les types d’algorithmes utilisables.

Le projet ANR Beelzebot est un projet interdisciplinaire regroupant des chercheur en informatique, en sciences de la communication et du langage. Il a pour objectif de définir des mécanismes pour détecter les armées de robots sur Twitter en se basant sur des méthodes non-supervisées, ainsi qu’à caractériser les activités de ces armées.

Sujet :
L’objectif du stage, dans le cadre du projet ANR Beelzebot, est de réaliser un textit{benchmark} des techniques de détection de robots existantes, afin d’en révéler les limites et de voir leur capacité à prendre en compte à différents jeux de données.

En plus des jeux de données publics, plusieurs jeux de données collectés sur Twitter sont à disposition, comme par exemple les discussions autour des élections présidentielles françaises de 2022 ou le COVID, contenant de plusieurs millions à plusieurs milliards de tweets. L’environnement matériel des serveurs de stockage et de traitement est opérationnel au Data Center Régional de l’UBFC.

Plus précisément, le stage consiste à réaliser un état de l’art pour identifier les méthodes de détection de robots exploitables (par exemple lorsque le code est déjà disponible), puis à établir un protocole expérimental permettant de comparer ces méthodes entre elles et enfin à réaliser les expériences correspondantes et mesurer les critères définis dans le protocole. Une attention particulière sera portée sur la reproductibilité de l’implémentation du protocole qui devra permettre de prendre en compte rapidement de nouvelles méthodes de détection ou de nouveaux jeux de données.

Ce travail constitue un travail préparatoire, qui pourra être poursuivi au cours d’une thèse financée par la projet ANR.

Profil du candidat :
étudiant en Master 2 avec spécialité informatique

Formation et compétences requises :
Formation Scientifique avec une solide base en informatique
Curiosité et rigueur scientifique
Compétences en gestion de données et programmation

Adresse d’emploi :
Université de Bourgogne
Laboratoire d’Informatique de Bourgogne
UFR Sciences et Techniques
9, Avenue Alain Savary
21078 Dijon

Document attaché : 202401300744_SujetStageBeelzebot.pdf

POST-DOCTORAL position – Detection of neurovisual disorders on a driving simulator

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LISV laboratory / University of Versailles Saint-Q
Durée : 10 month
Contact : olivier.rabreau@uvsq.fr
Date limite de publication : 2024-03-06

Contexte :
A 10-month post-doctoral position is available at the University of Versailles Saint-Quentin (UVSQ) in the LISV laboratory (www.lisv.uvsq.fr) headed by Professor Eric Monacelli. The post is part of the APTICONDUITE research project, which is part of the ‘Interactive Robotics’ research team.

Sujet :
The APTICONDUITE project aims to develop a new methodology integrated into a driving simulator for assessing neurovisual disorders of drivers in handicap situation.
This project combines a new multimodal experimental approach with advanced statistical modelling to provide a new theoretical and practical angle for studying neurovisual diseases in the field of adaptive driving.
In this context, the post-doctoral student will initially contribute to analyzing data from a network of physiological sensors on board a driving simulator. He/she will have to retrieve relevant information to characterize the driving performance of a specific population (stroke, cognitive disorders, etc.).
The second stage will involve developing a new methodology for the early detection of neurovisual disorders using artificial intelligence algorithms, in order to improve current clinical assessments.
The data set will include images, electrical signals and indicators such as heart rate, breathing rate, etc…

Profil du candidat :
Major responsibilities

– To use artificial intelligence techniques for the advanced exploration and analysis of data collected from biometric sensors (eye tracker, ECG, EMG, breathing, etc.) on a driving simulator, and to develop predictive models to assess the impact of visual disorders on road safety.
– Designing, developing and implementing specific assessment protocols for evaluating visual disorders in drivers on driving simulators, incorporating artificial intelligence methods.
– Collaborate with clinicians, ophthalmologists and vision experts to integrate objective measurements of visual disorders into the driving context, using machine learning algorithms.
– Contribute to the writing of scientific articles and the presentation of results at national and international conferences.
– Actively participate in research team discussions and meetings, working closely with other researchers and students.

We are looking for a PhD with experience in cognitive science and data processing:
– PhD: the candidate could hold a PhD in psychology, neuroscience, biomedical engineering or a related data scientist field.

Formation et compétences requises :
– Advanced skills in data analysis and the use of statistical software.
– Practical experience with artificial intelligence methods, including the use of machine learning algorithms to analyze complex data.
– Knowledge of visual disorders and their implications for driving would be appreciated.

Adresse d’emploi :
10-12 avenue de l’Europe 78140 Vélizy (France)

Document attaché : 202401291202_Post-doc1_APTICONDUITE_MIXED.pdf

Exploitation de l’imagerie aérospatiale pour la cartographie sémantique en prévention des risques naturels

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : PRISME (UO) et BRGM Orléans
Durée : 6 mois
Contact : yves.lucas@univ-orleans.fr
Date limite de publication : 2024-03-31

Contexte :
Contexte et Objectifs du stage :

En télédétection, la production intensive de données satellitaires et aériennes multicapteurs et de résolution spatiale croissante (visible, IR, hyperspectral, lidar, radar,topographie, librairies spectrales de matériaux …) donne accès à une observation très fine de la terre qui pourrait notamment être exploitée dans le cadre de la gestion et la
prévention des catastrophes naturelles. En particulier, ces données sont particulièrement intéressantes pour la cartographie sémantique des éléments exposés, qui correspondent aux éléments d’un territoire qui peuvent être affectés par une catastrophe naturelle. Connaître leurs caractéristiques, comme leur géométrie, leur localisation, leur âge etc. est un prérequis indispensable à toute étude d’analyse de risques. Dans un contexte de changement climatique, où les catastrophes naturelles se multiplient, ces données représentent donc un enjeu majeur pour l’actualisation des scénarios de risques utilisés pour protéger un territoire.
Pour autant, l’exploitation des données satellitaires et aériennes représente un véritable challenge à cause de leur volumétrie et de leur forte hétérogénéité. Les techniques de machine learning, qui ont déjà révolutionné le domaine de la Computer Vision, semblent prometteuses pour lever ces contraintes, mais doivent encore être adaptées à la problématique spécifique de l’estimation de la vulnérabilité d’un territoire. Dans ce contexte, l’objectif de ce stage est de préparer l’extraction automatique des caractéristiques des éléments exposés à partir des images aérospatiales. Il s’agira plus précisément de répertorier les sources de données exploitables, de mettre en place un pipeline de collecte et de traitement de ces données gérant de façon automatique le flot entrant de nouvelles données, puis d’expérimenter l’extraction de
quelques caractéristiques pertinentes à partir de modèles d’apprentissage profond issus de l’état de l’art en segmentation sémantique.
Ces travaux, proposés par le laboratoire PRISME de l’Université d’Orléans et le BRGM, s’inscrivent dans le cadre du projet Région Centre Val de Loire CERES – Cartographie et caractérisation des éléments exposés de la région CVL à partir d’images satellites – qui vise à développer la connaissance des éléments exposés de la Région Centre Val de Loire pour la mettre à disposition de l’ensemble des acteurs socioéconomiques régionaux impliqués dans la gestion des risques induits par les catastrophes naturelles.

Sujet :
Programme de travail :

– Sources de données : répertorier les sources de données et d’images disponibles pour la cartographie et leurs modalités d’accès et mettre en place les fonctionnalités nécessaires à l’intégration automatique de nouvelles données dès leur parution.

– Caractérisation des éléments exposés : identifier les caractéristiques spatiales, géométriques, spectrales, documentaires … d’intérêt, exploitables dans les différentes sources de données et pertinentes pour la prévention des risques naturels.

– Traitement des données : évaluer les performances de différentes solutions de calcul en ligne ou locales et expérimenter quelques modèles deep learning avancés de l’état de l’art pour l’extraction de caractéristiques des éléments exposés aux aléas climatiques.

– Rédaction du mémoire de Master 2

Profil du candidat :
étudiant(e) en Master 2 Recherche à dominante informatique

Formation et compétences requises :
Compétences indispensables :

– traitement des images (librairie OpenCV) et analyse de données

– ingénierie informatique pour le déploiement applicatif des modèles deep learning (librairies Python Pytorch, Keras, TensorFlow…)

– intérêt pour le domaine de l’imagerie satellitaire apprécié

– bonne pratique de l’anglais scientifique indispensable

– autonomie, rigueur scientifique et forte motivation pour le sujet

Adresse d’emploi :
Modalités pratiques

Durée du stage : 6 mois max (avril-sept 2024)
Gratification de stage M2
Lieu du stage : BRGM – 3 avenue Claude Guillemin, 45100 Orléans – Bureau et poste de travail informatique.

NB : plusieurs résidences universitaires du campus de la Source à proximité du BRGM. Accès au restaurant BRGM.

Contacts

Yves LUCAS – Axe Images Vision – Laboratoire PRISME Université d’Orléans
yves.lucas@univ-orleans.fr

Cécile GRACIANNE – Département Risques Naturels et Prévention – BRGM Orléans
c.gracianne@brgm.fr

Document attaché : 202401251302_Sujet_Master2_CERES_2024.pdf

Structures multi-échelles dans les données musicales

Annonce en lien avec l’Action/le Réseau : Musiscale

Thème :

Ecoute et perception de la structure

Présentation :

Concepts multi-échelles pour l’analyse et la représentation de cheminements logiques à l’écoute de données musicales.

La question des représentations et de l’analyse de données fortement structurées, comme les données musicales, permet de poser des questions très sensibles sur l’appréhension cognitive, dont les aspects multi-échelle sont encore largement à explorer.

L’idée d’une constitution multi-échelle du flux musical se heurte avec les concepts linéaires traditionnellement mis en avant dans la description analytique ou même tout simplement empirique. L’unité de la mélodie, le fil de la narration, le développement thématique, la progression harmonique, etc. semblent être des notions qui échappent à l’image stratifiée que semble sous-entendre la notion de multi-échelle.
Quelle est la nature de ce « fil logique » que semble se donner l’écoute ? …

Du : 2024-02-14

Au : 2024-02-14

Lieu : Bordeaux (LaBRI, Campus de Talence)

Site Web : https://www.madics.fr/actions/musiscale/

Apprentissage profond et décomposition tensorielle pour l’analyse de patterns en signal et en imagerie multimodale. Application aux neuropathies

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISSI/IBISC
Durée : 6 mois
Contact : aurelien.hazan@u-pec.fr
Date limite de publication : 2024-02-28

Contexte :
Le développement exponentiel de l’IA et des réseaux de neurones renouvelle l’étude des séries temporelles d’un point de vue aussi bien fondamental qu’appliqué. En particulier pour les signaux multivariés, le tenseur peut être une représentation plus adéquate que la matrice, car il évite la perte de la structure des données, et donc la perte d’information.
L’apprentissage automatique sur données tensorielles est classiquement réalisé par décomposition tensorielle linéaire, par exemple CPD/PARAFAC ou Tucker [Sid17]. Récemment des représentations tensorielles ont été intégrées aux réseaux de neurones et ont permis des développements significatifs de l’apprentissage profond notamment dans le domaine de l’image en réduisant le nombre de paramètres à estimer.
Pour accroître l’identifiabilité et l’interprétabilité des modèles neuronaux profonds, des contraintes sont ajoutées, par exemple la non négativité, classique dans une cadre d’apprentissage matriciel et
tensoriel [Kol08]. En apprentissage profond, les auto-encodeurs variationnels ont été interprétés dans un cadre de factorisation matricielle non-négative, mais aussi comme une factorisation
tensorielle CPD, et même Tucker non-négative [Mar22]. Les autoencodeurs appartiennent à la famille des modèles génératifs. Ils permettent de découvrir des espaces latents en apprenant un
automorphisme x=f(x). Leur espace latent peut est structuré sous forme tensorielle, ce qui amène de très bonnes performances [Pan21]. Il a été montré que ceci permet un compromis en termes de
performances et d’interprétabilité, entre un auto-encodeur simple sans contrainte et un modèle de Tucker non-négatif, pour différentes taches (segmentation, détection de pattern). Toutefois ces travaux préliminaires laissent une marge importante de progrès, et les propriétés de ce type de modèle hybride sont encore mal connues.

Sujet :
Tout d’abord on établira un benchmark des différentes approches. Ensuite on modifiera les contraintes qui structurent la décomposition tensorielle dans un modèle de type auto-encodeur/décomposition de Tucker. On évaluera et on comparera les caractéristiques de
plusieurs architectures pour l’auto-encodeur. Les algorithmes proposés seront testés sur des données de plusieurs champs applicatifs actuellement examinés dans nos laboratoires respectifs : puissances
transmises sur un réseau de transport d’électricité ; calibration de capteurs de polluants ; prédiction de performances sportives, segmentation de tumeurs cérébrales. Ce travail pourra se poursuivre en
thèse (1) en comparant les performances de la représentation dans les domaines temporel, temps-fréquence, temps-échelle (2) en appliquant ces décompositions tensorielles sur les machines de
Boltzmann (DB networks et modèle de diffusion) (3) en étudiant l’influence de la structure en réseau du phénomène sous-jacent sur la représentation du signal. Des collaborations industrielles
sont envisageables.

Références
[Kol08] Kolda, Bader, « Tensor decompositions and applications », in: SIAM review 51.3 (2009), pp. 455–500.
[Sid17] Sidiropoulos et al. « Tensor Decomposition for Signal Processing and Machine Learning » IEEE Transactions on Signal Processing, 2017.
[Pan21] Panagakis et al. « Tensor Methods in Computer Vision and Deep Learning » Proceedings of the IEEE, https://doi.org/10.1109/JPROC.2021.3074329
[Mar22] Marmoret, « Unsupervised Machine Learning Paradigms for the Representation of Music Similarity and Structure », thèse IMT Atlantique, 2022.

Profil du candidat :
Connaissance du machine learning.

Formation et compétences requises :
M2 informatique, data science, statistiques

Adresse d’emploi :
Ce stage sera encadré par deux enseignants chercheurs rattachés aux laboratoires:

LISSI, http://lissi.fr, Equipe Synapse: 36-37 rue Georges Charpak, 77 567 Lieusaint.

IBISC, https://ibisc.univ-evry.fr/, Equipe SIAM: 36, Rue du Pelvoux, CE1455 Courcouronnes 91020 Evry Cédex

Poste de professeur section 27, Université Sorbonne Paris nord (LIMICS)

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIMICS
Durée : indéterminé
Contact : chan.leduc@univ-paris13.fr
Date limite de publication : 2024-09-01

Contexte :
LIMICS – UMRS 1142 : Le Laboratoire d’Informatique Médicale et d’Ingénierie des Connaissances en e-Santé (www.limics.fr) est une unité́ de recherche interdisciplinaire, qui développe des activités de recherche en informatique de santé et relevant des sections CNU 27 (Informatique) et CNU 46.04 (biostatistiques, informatique médicale et technologies de communication). Il regroupe une communauté de chercheurs (38 permanents et 15 doctorants) qui conduisent des recherches en informatique médicale et dans le domaine de l’ingénierie des connaissances pour des applications liées à la santé.

Sujet :
Les thématiques de recherche du LIMICS en traitement automatique des langues, intelligence artificielle symbolique, sciences et analyse des données et apprentissage sur des flux de données hétérogènes (textes, données omiques) sont aujourd’hui fortement sollicitées pour le développement d’applications en santé. Le nombre de projets innovants et le développement potentiel de collaborations avec d’autres laboratoires de recherche de l’USPN (LIPN, LEPS, EREN) sont croissants. Le recrutement d’un professeur en Informatique au LIMICS permettra de contribuer aux avancées de ces recherches pour les années à venir et contribuera également au renforcement des axes développés au sein du LIMICS, en particulier sur les thématiques de l’Ingénierie des connaissances, traitement automatique des langues, raisonnement sur les préférences, raisonnement en logiques de description, raisonnement à partir de cas, raisonnement sur les bases de connaissances massives en santé, aide à la décision et visualisation du web sémantique avec les graphes de connaissances.

Profil du candidat :
Enseignement
============
Le professeur recruté sera rattaché à l’UFR SMBH. Il ou elle effectuera son service d’enseignement à différents niveaux des Licence
(L1,L2 et L3) en Sciences de la Vie et en licence Sciences pour la Santé ainsi que dans le Master de Santé Publique, Parcours “Informatique Biomédicale”. Il ou elle participera notamment aux enseignements d’informatique permetant aux étudiants de Licence de se former à
l’algorithmique, aux langages de programmation (R, python), à la création de page web (HTML, CSS) et aux bases de données.
L’offre de formation pluridisciplinaire du Master d’informatique biomédicale veut répondre aux besoins nationaux et internationaux
de formation à l’informatique dans le domaine santé, la e-santé, le big data en santé (https://smbh.univ-paris13.fr/images/
Formations/masters-sante-publique/master-SMBH-informatique-biomedicale.pdf).
Le professeur recruté aura aussi comme mission d’animer l’équipe d’enseignants-chercheurs de l’UFR SMBH dans le domaine de
l’informatique au sens large.

Recherche
=========
La personne recrutée sera affectée sur le site de Bobigny et collaborera avec les autres sites de l’unité.
Elle devra s’inscrire dans les axes de recherche de l’unité dans son projet fondateur, et contribuer à animer la vie scientifique de l’équipe, à
encadrer des stagiaires de recherche et des doctorants, à organiser des colloques et monter des projets de recherche.
Les thèmes qui seront considérés en priorité sont les suivants :

+ Ingénierie des connaissances
+ Traitement automatique des langues
+ Raisonnement sur les préférences, raisonnement en logiques de description, raisonnement à partir de cas, raisonnement sur les bases de connaissances massives en santé
+ Aide à la décision
+ Visualisation

avec des approches pouvant relever de l’apprentissage statistique, du web sémantique ou de l’intelligence artificielle symbolique.

Formation et compétences requises :
Titulaire d’une Habilitation à Diriger des Recherches (HDR) en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
9 Rue de Chablis, 93000 Bobigny

Sustainability and explainability through learning on large knowledge graphs

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Mines Saint-Étienne / LIMOS
Durée : 3 ans
Contact : victor.charpenay@emse.fr
Date limite de publication : 2024-05-05

Contexte :
Large Language Models (LLMs), characterized by a large number of parameters and/or a large number of symbols in their training corpus, have become a reference in the development of AI systems. Yet, their use implies a significant energy consumption , both during training and inference, and a lack of transparency about decisions made by the system. The goal of the thesis will be to show that Knowledge Graphs (KGs), such as DBpedia, BabelNet or ConceptNet can be a solution to both problems.

Sujet :
The thesis will consist in characterizing the relationship between performances of a KG embedding model and its computational cost—empirical laws do exist for LLMs—and in analyzing the correspondance between its geometric properties and the semantic properties of the KG.

Profil du candidat :
Applicants should have prior experience with Semantic Web technologies and/or logic programming. General knowledge about machine learning techniques is also recommended.

Formation et compétences requises :
Master’s degree in computer science, data science or any related topic.

Adresse d’emploi :
Saint-Étienne

Document attaché : 202401231512_lkm-en.pdf