Appels à Projet MITI

Date : 2024-02-15

La Mission pour les Initiatives Transverses et Interdisciplinaires du CNRS (https://miti.cnrs.fr/) vient de publier plusieurs appels à projets qui sont pertinents pour la communauté MaDICS.
Les financements sont de l’ordre 15k€/an sur 2 ans, plus un stage, mais ces appels à projets sont souvent de bons tremplins pour des projets interdisciplinaires à plus large spectre (80 prime, futur COP, discussions de la programmation ANR). Ils permettent de démontrer le rôle important du GDR MaDICS dans l’interdisciplinarité.
Attention, les deadlines sont très courtes pour certains appels, en particulier sur la thématique “polluants et dépollution” qu’on a déjà mentionnés dans des précédents messages.

• Pollution et dépollution : solutions et trajectoires (deadline 13 décembre) https://miti.cnrs.fr/appel-a-projets/depollution/

• Conditions extrêmes (deadline 18 décembre) https://miti.cnrs.fr/appel-a-projets/conditions-extremes

• Ressource et sobriété (deadline 9 janvier) https://miti.cnrs.fr/appel-a-projets/ressources-et-sobriete/

• Jumeaux numériques (deadline 15 février, après le colloque qui aura lieu les 22 et 23 janvier à Paris) : https://miti.cnrs.fr/appel-a-projets/jumeaux-numeriques/

• Suivis à long-terme (deadline 14 février). https://miti.cnrs.fr/appel-a-projets/suivis-a-long-terme/

• Systèmes multi-agents (en cours de finalisation).

Par ailleurs, deux appels ont été ouvert pour favoriser la mobilité entre les laboratoires. L’occasion de faire venir des scientifiques d’autres disciplines dans nos laboratoires.

• Mobilité interdisciplinaire immersive (deadline 9 janvier). Soutien à des visites courtes entre laboratoires. https://miti.cnrs.fr/appel-a-projets/mobilite-immersion-ed-2024/

• Osez l’interdisciplinarité (deadline 23 janvier). Soutien à une mobilité effective entre laboratoire. https://miti.cnrs.fr/appel-a-projets/osez-linterdisciplinarite-ed-2024/


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Jumeau numérique de patient sous anesthésie. Exploration et évaluation d’approches par Deep Learning.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire des Sciences du Numérique de Nantes (L
Durée : 6 mois
Contact : christine.sinoquet@univ-nantes.fr
Date limite de publication : 2024-01-31

Contexte :
Ce stage s’inscrit dans le cadre d’une collaboration à l’interface entre numérique et santé, avec Le Laboratoire Expérimental de SImulation en Médecine Intensive (LE SiMU) de l’Université de Nantes. Le SiMU permet notamment de se perfectionner dans la gestion de situations critiques en anesthésie. Il intervient sur simulateurs de patients haute-fidélité (mannequins), avec immersion des acteurs en formation dans une équipe médicale humaine pleine-échelle interprofessionnelle.

Dans le but d’améliorer la sécurité et la qualité des soins peropératoires, les formateurs du SiMU souhaitent varier la diversité des scénarios à proposer aux internes en anesthésie et infirmiers anesthésistes, en formation initiale, ainsi qu’ aux praticiens plus expérimentés, en formation continue. Pour varier les scénarios, il est proposé à terme d’automatiser la génération de scénarios réalistes de simulation, en s’appuyant sur tout ou partie de la base de profils anesthésiques enregistrés par le CHU de Nantes depuis 2004 (500 000 profils anesthésiques). Dans cette modalité assistée par le numérique, la personne qui suit la formation (interne ou infirmier), fait partie de l’équipe médicale. Les autres membres de l’équipe médicale sont simulés très simplement (icônes réalisant des actions et émettant des informations, sur l’écran de l’ordinateur assigné à l’apprenant). De cette innovation est attendu un accès potentiel à une grande variété de scénarios réalistes de simulation de cas d’anesthésie. Servir cet objectif de formation répond également à terme au besoin d’anticipation par prédiction, inhérent au paradigme de la médecine personnalisée, en pleine émergence.

Pour atteindre cet objectif, deux axes de recherche ont été explorés au sein de l’équipe DUKe du LS2N. Ils portent respectivement sur une approche de data mining / raisonnement à base de cas, et une approche machine learning (modèle de Markov autorégressif à changements de régimes). Les travaux du stage exploreront une troisième catégorie d’approche, centrée sur les modèles neuronaux profonds.

Les CHU ont obligation légale d’enregistrer toutes les données relatives aux interventions chirurgicales. Parmi ces dernières, figurent les profils anesthésiques des patients. Un profil anesthésique est constitué d’une trace d’événements et d’une série temporelle multivariée. La trace d’événements est la séquence horodatée des actions réalisées par l’équipe médicale (e.g., administration d’un anesthésique) pendant la chirurgie. Les actions orchestrent l’évolution des paramètres physiologiques du patient. La série temporelle multivariée correspond à un ensemble de séries temporelles univariées qui décrivent chacune l’évolution d’un paramètre physiologique du patient (e.g., fréquence cardiaque).

Sujet :
Dans le cadre de ce stage, nous ramenons le problème à un problème de prédiction de série temporelle. L’apprentissage d’un réseau de neurones profond à partir des séries temporelles des profils anesthésiques permettra cette prédiction.
Il existe un nombre assez limité de revues de l’état de l’art récentes qui soient consacrées au Deep Learning, lorsqu’il est utilisé pour la prédiction de séries temporelles ([LZ2020] https://arxiv.org/pdf/2004.13408.pdf ; [SGM2020] https://arxiv.org/abs/1911.13288 ; [THS2020] http://doi.org/10.1089/big.2020.0159).

Dans le domaine de la prédiction pour les séries temporelles comme dans d’autres domaines, l’émergence de modèles de réseaux de neurones compétitifs a rapidement relégué les Perceptrons Multi-Couches (Multilayer Perceptrons, MLPs) au second plan.

Les Réseaux de Neurones Récurrents (Recurrent neural networks, RNNs) ont été conçus pour pouvoir traiter des données séquentielles. Un RNN réalise la même tâche à chaque pas de temps : la séquence (x1 , x2 , · · · , xt , xt+1 · · · ) correspondant à la série temporelle est fournie au RNN, élément par élément (pas de temps par pas de temps). La prédiction de séries temporelles via l’utilisation d’un RNN est un problème qui donne lieu à des recherches actives (voir par exemple [CC2016] dans le domaine des finances).

Les Réseaux de Neurones Récurrents à Mémoire Court et Long Terme (Long Short-Term Memory networks, LSTMs) représentent la sous-catégorie la plus utilisée des RNN. En effet, leur capacité à capturer les dépendances à long terme leur assure de meilleures performances en prédiction que celles des RNN. Les LSTM ont été utilisés pour la prédiction de séries temporelles dans de nombreux domaines, comme par exemple la prédiction du coût de l’électricité [PLL2018] ou la prédiction d’énergie renouvelable [GHS2016].

Les Réseaux de Neurones Convolutifs (Convolutional Neural Networks, CNNs) sont une classe particulière de réseaux de neurones artificiels, capable de préserver les dépendances spatiales existant au sein des données, en n’autorisant que très peu de connexions entre les couches successives du réseau. Le terme Réseaux de Neurones Convolutifs Temporels (Temporal Convolutional Networks, TCNs) a été introduit récemment [BKK2018]. De très nombreux travaux sur l’utilisation de CNN pour la prédiction de séries temporelles ont été publiés, comme dans le domaine de la prédiction de demande en énergie [AE2017]. Des modèles hybrides ont été proposés, qui combinent des couches CNN et LSTM, ou bien connectent les sorties d’un CNN aux entrées d’un CNN, ou encore proposent une intégration de modèles par combinaison des sorties obtenues d’un CNN et d’un LSTM exploités en parallèle. Par exemple, cette dernière approche a été appliquée pour la prédiction dans les domaines de l’énergie, de la météorologie et des finances [SZL2019].

Les modèles Seq2Seq (Encoder-Decoders, Transformers) sont conçus pour transformer une séquence fournie en entrée en une deuxième séquence obtenue en sortie. Une utilisation emblématique des Transformers est la traduction, en traitement du langage naturel. Les Transformers ont été récemment utilisés pour la prédiction de séries temporelles (voir par exemple [N2019]).

Les auto-encodeurs (AutoEncoders, AEs) constituent une sous-catégorie particulière des encodeurs-décodeurs. Ce type de modèle a notamment été combiné avec d’autres modèles, comme les LSTM, pour la prédiction de séries temporelles (voir par exemple [BYR2017]).

Références bibliographiques

[AE2017] Almalaq, A. and Edwards, G. (2017) A review of deep learning methods applied on load forecasting, 16th
International Conference on Machine Learning and Applications (ICMLA), 511-516.

[BKK2018] Bai, S. and Kolter, J. Z. and Koltun, V. (2018) An empirical evaluation of generic convolutional and recurrent networks for sequence modeling, arXiv:1803.01271.

[BYR2017] Bao, W. and Yue, J. and Rao, Y (2017) A deep learning framework for financial time series using stacked autoencoders and long-short term memory, PLOS ONE, 12(7):e0180944.

[CC2016] Chandra, R. and Chand, S. (2016) Evaluation of co-evolutionary neural network architectures for time series prediction with mobile application in finance, Applied Soft Computing, 49:462-473.

[GHS2016] Gensler, A. and Henze, J. and Sick, B. and Raabe, N. (2016) Deep learning for solar power forecasting – an approach using AutoEncoder and LSTM neural networks, International Conference on Systems, Man, and Cybernetics (SMC), 2858-2865.

[LZ2020] Lim, B. and Zohren, S. (2020) Time series forecasting with deep learning: a survey, https://arxiv.org/abs/2004.13408-review.

[N2019] Nino, S. (2019) Transformers and time series forecasting, Princeton University, USA, thèse.

[PLL2018] Peng, L. and Liu, S. and Liu, R. and Wang, L. (2018) Effective long short-term memory with differential evolution algorithm for electricity price prediction, Energy, 162:1301-1314.

[SZL2019] Shen, Z. and Zhang, Y. and Lu, J. and Xu, J. and Xiao, G. (2019) A novel time series forecasting model with deep learning, Neurocomputing, 396(5):302-313.

[THS2020] Torres, J. F. and Hadjout, D. and Sebaa, A. and Martínez-Álvarez, F. and Troncoso, Al. (2020) Deep learning for time series forecasting: a survey. Big Data, ahead of print, http://doi.org/10.1089/big.2020. 0159

Profil du candidat :
Profil Master 2 Bioinformatique ou Master 2 Informatique, avec un intérêt marqué pour les travaux en collaboration avec des médecins anesthésistes, infirmiers anesthésistes, infirmiers de bloc opératoire et des informaticiens/bioinformaticiens ; intérêt marqué pour l’intelligence artificielle et le Deep Learning. Un stage de Master 1 dans un domaine proche du sujet représente un plus.

Formation et compétences requises :
Profil Master 2 Bioinformatique ou Master 2 Informatique,
– Capacité à réaliser des recherches sur Internet pour identifier des codes éprouvés permettant de servir de base aux solutions proposées
– Goût prononcé pour la programmation, aisance en programmation, rigueur dans la programmation
– Capacité à documenter du code
– Capacité à rendre compte de l’avancement de ses travaux, capacité au reporting (hebdomadaire)

Adresse d’emploi :
Stage en présentiel
LS2N
Faculté des Sciences et des Techniques
2 rue de la Houssinière
44322 Nantes Cedex

Document attaché : 202311281534_stage_m2_bioinfo_deep_learning_pred_serie_temporelle_context_seq_events_2023_24_23_11_09_thur.pdf

Internship in data science, (Bio)Mathematics and Modelling applied to ‘sport and diabetes’ physiology

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : laboratoire URePSSS, Université de Lille
Durée : 6 mois
Contact : elsa.heyman@univ-lille.fr
Date limite de publication : 2024-01-31

Contexte :
In type 1 diabetes (T1D), physical activity is an essential component of the treatment plan because of its
recognised beneficial effects on numerous health parameters. Nevertheless, T1D individuals often have
a level of physical activity that falls short of international recommendations. The main obstacles to
physical activity are fear of hypoglycaemia and diabetes imbalance. Depending on the intensity, duration,
method and timing of the last insulin injection, physical activity can have a hypo- or hyperglycaemic
effect. Faced with this situation, it is difficult for T1D sports practitioners to anticipate appropriate
adaptations to their insulin and/or diet: at present, recommendations as to the adaptations to be made
according to the characteristics of the exercise remain very vague due to the lack of studies carried out
under real-life conditions (glucose monitoring sensors).
The overall aim of the project is to improve the accuracy of algorithms for predicting variations in blood
sugar levels as a function of physical activity, using data recorded by sensors worn in everyday life,
taking into account diet, insulin administered (e.g., from insulin pumps), etc.

Sujet :
The sensors (accelerometer, continuous glucose monitoring systems, insulin pumps, etc) worn by the
patients living with T1D generate a large amount of temporal data each day. This data needs to be
processed and analysed automatically to produce simple indicators that are useful to patients, and to
enable research teams to base their predictive models on it. Codes for calculating indices of glycaemic
excursions (e.g., time spent at different thresholds of hypoglycaemia or hyperglycaemia, glycaemic
variability, i.e., rapid variations towards high and low glycaemia levels, etc.) have already been developed
to process data from glucose sensors. These codes are also designed to create a formatted database for
each patient, enabling a number of simple indicators to be displayed and calculated. These codes were
then put into an intuitive web interface for researchers and doctors.
The main objective of the internship will be to explore machine learning methods in order to improve
the algorithms and statistical models for prediction of hypo and hyperglycaemic risk around physical
activity (considering their temporal dynamics).

Profil du candidat :
o In-depth knowledge of data science
o In-depth knowledge of the main supervised and unsupervised learning models
o Strong skills in R or, failing that, in Python for data science
o Fluent reading of English
o Autonomy, rigor, reliability
o Ability to listen and communicate with the scientific community
o Ability to present work orally and in writing

Formation et compétences requises :
master in data science.

Adresse d’emploi :
The internship will be located at the University of Lille, within the URePSSS laboratory
(Multidisciplinary Sport, Health and Society Research Unit, ULR 7369) under the supervision of Prof.
Elsa Heyman and Dr. Pierre Morel, in close collaboration with Prof. Philippe Preux of the CRISTAL
laboratory (UMR 9189, IT, Signal and Automation Research Centre). Regular videoconference meetings
will be organised with a collaborator from the University of Rennes (Joris Heyman) and Montreal (Rémi
Rabasa-Lhoret).

Document attaché : 202311281455_FicheStageURePSSS_Anglais_URePSSS_CRISTAL.pdf

Reinforcement learning for the smart multiaxial testing of materials

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaMcube, en collaboration avec CRIStAL
Durée : 6 mois
Contact : jean-baptiste.colliat@univ-lille.fr
Date limite de publication : 2024-01-31

Contexte :
Ce stage se place dans le contexte d’une nouvelle collaboration entre le LaMcube, laboratoire de mécanique de l’université de Lille., et CRIStAL, laboratoire d’informatique, autmatique et traiement de signal de l’Université de Lille.

L’objectif est d’explorer l’utilisation de l’apprentissage par renforcement pour le test de matériaux.

Sujet :
The goal of this internship is to design, implement and test a reinforcement learning agent able to control a material testing machine. This machine is used to perform research on materials at the LaMcube lab. The reinforcement learning part of the internship will be handle in collaboration with team Scool at CRIStAL/Inria.

Mechanics of materials aims to understand, model and optimize the mechanical response of industrially relevant materials. Here, the scale of observation as well as the size of the specimens are the keystones in order to build an accurate identification strategy. Major improvements have been made during the last four decades, mainly thanks to the renewal of measurement techniques. Still, several material properties and field values are difficult to measure directly. This is especially true for the interfaces. Moreover, the search for adaptive loading paths able to activate specific fine scale mechanisms is of the greatest interest, regardless of the material.
During this internship, we aim to develop a novel experimental-numerical technique in order to determine such quantities of interest by selecting the optimal macroscopic multiaxial loading paths. Reinforcement learning is coupled with material testing to attain this goal. The objective is to explore several RL algorithms in order to train an agent to control the material testing machine. A simulation environment based on the Finite Element Method will be used to train the RL agent.

(See the attached pdf for pictures.)

Profil du candidat :
Strong knowledge in reinforcement learning.
Knowledge in mechanics is a plus.
Ability to communicate and work on an interdisciplinary project.
Autonomous, able to propose original and realistic ideas.
Interested in practical applications of RL.

Formation et compétences requises :
Master d’informatique avec une spécialisation en apprentissage automatique.

Adresse d’emploi :
Cité scientifique, Villeneuve d’Ascq.

Document attaché : 202311281450_RL_intern_CRISTAL_LAMCUBE.pdf

Méthodes de fusion de données multispectrales à de multiples résolutions et à données manquantes. Application aux images Sentinel-2 et Sentinel-3

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC
Durée : 6 mois
Contact : matthieu.puigt@univ-littoral.fr
Date limite de publication : 2024-01-31

Contexte :
Ce stage s’inscrit dans le cadre des activités conjointes des laboratoires LISIC (UR 4491, Calais) — plus particulièrement les activités de l’équipe SPeciFI dans l’antenne de Saint-Omer du LISIC — et LOG (UMR 8187, Wimereux) — plus particulièrement les activités de l’équipe TELHYD du LOG — autour de l’imagerie satellitaire pour l’observation marine côtière, dans le cadre de la Structure Fédérative de Recherche og{}Campus de la Merfg~ et du projet TOSCA OSYNICO financé par le CNES. En particulier, dans le cadre de ces projets initiés en 2020, le LISIC développe des méthodes à la frontière entre traitement du signal et des images et intelligence artificielle appliquées aux données satellitaires (images multi- ou hyper-spectrales). Le LOG s’intéresse à l’analyse théorique et l’observation de processus physiques afin de comprendre et prévoir leurs impacts sur l’environnement marin, d’un point de vue de la biologie ou de la biogéochimie.

Sujet :
L’observation satellitaire de notre planète connaît depuis plusieurs décennies d’importantes avancées instrumentales, avec des développements conséquents que ce soit en terme de résolution spatiale (par exemple en télédétection de la couleur de l’eau à haute résolution spatiale 10-60 m) et en terme de résolution spectrale (imagerie hyper-spectrale). Une image Multi-Spectrale (MS) ou Hyper-Spectrale (HS) consiste en un cube de données dont deux axes décrivent les variations spatiales et un axe décrit les variations spectrales. La principale différence entre une image HS et une image MS réside dans le nombre très réduit de bandes spectrales observées dans cette dernière.

Cependant, à cause de contraintes physiques, l’augmentation du nombre de bandes spectrales dans une image HS entraîne une diminution de sa résolution spatiale. Ainsi, aujourd’hui, notre planète est observée à la fois par des imageurs MS ayant une très bonne résolution spatiale mais une faible résolution spectrale et par des imageurs HS ayant une très bonne résolution spectrale mais une faible résolution spatiale (et un ensemble d’imageurs aux propriétés intermédiaires).

Dans le cadre de ce stage, nous nous intéressons à l’observation marine côtière via les données des satellites Sentinel-2 et Sentinel-3. Les images obtenues par ces deux satellites permettent d’étudier la couleur de l’océan, c’est-à-dire la répartition spatiale et temporelle de la concentration en phytoplancton, en matière en suspension et en matière organique. Les données Sentinel-2 consistent en des cubes avec 13 bandes spectrales pour une résolution spatiale variant de 10 à 60 m en fonction des bandes, acquises tous les 5 jours environ. Les données Sentinel-3 sont des cubes avec 21 bandes spectrales pour une résolution spatiale de 300 m, acquises tous les jours. En observation marine, pour comprendre les phénomènes complexes qui se passent en milieu côtier, il est nécessaire que les données à disposition combinent :
– une bonne résolution spectrale pour mieux analyser le milieu biogéochimique (chlorophylle, particules en suspension, etc) ;
– une bonne résolution spatiale pour mieux appréhender les phénomènes de répartition de ce milieu qui sont beaucoup plus complexes en milieu côtier qu’en pleine mer ;
– une courte période d’acquisition de ces images pour repérer des phénomènes très concentrés dans le temps (blooms de phytoplanctons par exemple).

Aucune donnée satellitaire ne permet aujourd’hui de respecter ces trois contraintes.

Dans le cadre de ce stage, nous proposons de traiter conjointement des données Sentinel-2 et Sentinel-3 acquises approximativement le même jour (fusion spatio-spectrale), afin de générer des données combinant le nombre de bandes spectrales de Sentinel-3 et la résolution spatiale de Sentinel-2. En particulier :
1) Nous souhaitons traiter des données qui ont subi une correction atmosphérique, permettant une comparaison avec des mesures in situ. Cependant, ce traitement entraîne des problématiques comme la présence de données manquantes (au niveau des terres, des nuages et des navires) ou des valeurs négatives sans signification physique.
2) Nous souhaitons traiter conjointement les trois résolutions spatiales de Sentinel-2 avec l’unique résolution spatiale de Sentinel-3, espérant ainsi améliorer la qualité de fusion.
3) Nous souhaitons effectivement réaliser une comparaison avec les mesures in situ.

Les méthodes envisagées feront appel à un formalisme régularisé de factorisation matricielle / tensorielle et/ou à un formalise de type apprentissage profond.

Le stage pourra être poursuivi par la préparation d’une thèse dans le domaine de l’apprentissage comprimé pour la fusion spatio-spectro-temporelle d’images satellitaires.

Le stage aura lieu dans la nouvelle antenne de Longuenesse du LISIC, dédiée actuellement à l’imagerie hyperspectrale. Cette antenne, créée récemment, compte à ce jour 6 chercheurs permanents, 1 chercheur post-doctorant et 4 doctorants. Le ou la stagaire sera encadré(e) par Claire Guilloteau, Mattthieu Puigt et Gilles Roussel qui apporteront leur expertise respective en traitement des images MS/HS et en machine learning (deep learning, factorisation matricielle, optimisation) pour l’imagerie satellitaire.

De nombreux échanges auront lieu avec le LOG, situé à Wimereux (et plus particulièrement avec Cédric Jamet et Vincent Vantrepotte). Le LOG apportera ses compétences sur la couleur de l’océan, notamment sur l’analyse des images fusionnées et leur validation. Le LOG fournira les mesures in-situ de validation et des images dans des zones côtières d’intérêt (Manche orientale, Guyane, Cambodge, Vietnam).

Ces deux laboratoires sont situés au coe{}ur du Parc naturel régional des caps et marais d’Opale, à proximité directe de Lille, de l’Angleterre, de la Belgique et de l’Europe du Nord (Amsterdam à 4h de route de Longuenesse).

Profil du candidat :
Issu(e) d’une filière scientifique en sciences de données (traitement du signal et des images, informatique avec une dominante en intelligence artificielle/apprentissage/machine learning, mathématiques appliquées), vous êtes curieux(se) et très à l’aise en programmation (Matlab, Python). Vous lisez et parlez avec aisance l’anglais courant. Bien que non-obligatoire, une première expérience en factorisation de données (décomposition de matrices ou tenseurs, séparation de sources, apprentissage de dictionnaire, etc) ou en deep learning sera appréciée. Pour candidater, merci d’envoyer un courriel à {claire.guilloteau, matthieu.puigt, gilles.roussel} [at] univ-littoral.fr en y annexant les documents pouvant supporter votre candidature :
– votre CV,
– une lettre de motivation,
– vos relevés de notes de Licence 3, Master 1, Master 2 (si ces dernières sont disponibles) ou d’Ecole d’Ingénieurs (première à troisième année),
– deux lettres de recommandation ou les noms et moyens de contact de deux référents académiques.

Formation et compétences requises :
Ecole d’ingénieurs ou Master avec une dominante en traitement de données / machine learning / mathématiques appliquées

Adresse d’emploi :
LISIC, antenne de Longuenesse, EILCO, Campus de la Malassise, 62698 Longuenesse

Document attaché : 202311280725_Stage_SFR_2024_LISIC_LOG.pdf

Fairness in Machine Learning on Graphs

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab / INSA Rouen
Durée : 6 months
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2024-01-15

Contexte :
Fairness is a major ingredient for Safe and Trustworthy Artificial Intelligence (AI). It is central to have fair Machine Learning (ML) models in any AI system in major application areas, and it is even more crucial in medicine. Within this context, the ANR project FAMOUS aims to address fairness in Machine Learning with multimodality. This project brings forth experts in Machine Learning and Neuroscientists from 4 major research institutes in France and a company: Laboratoire d’Informatique et Systèmes (Marseille), Institut des Neurosciences de la Timone (Marseille), Laboratoire Hubert Curien (Saint Etienne), LITIS Lab (Rouen) and Euranova (R&D division in France). Within this environment, we are offering this Master’s internship in the LITIS Lab at the INSA Rouen Normandy, with the possibility to pursue a PhD thesis.

Sujet :
Unfairness starts from the existence of biases in the datasets used to learn ML models. The main advances in deep learning in ML are due to learning an embedding of data in a latent space that is appropriate for the given task at hand. Thus, the performance of the ML model highly depends on the investigated embedding, and so does its fairness.

Dealing with graph data is more complex than Euclidean data due to their structure. This internship considers the problem of learning from a set of graph data – multiple graphs – (as opposed to graph mining of a single large-scale graph, e.g. social network). Since an explicit embedding of graphs into a Euclidean space suffers from information loss and restricted precision, graph embedding will be considered with graph neural networks (GNNs) [1, 2].

The internship aims to study bias-free embedding with GNNs. Within the last few years, there has been an increased interest in fairness-promoting graph embedding methods, mainly for node embedding in network mining with applications on social networks [3, 4, 5], and more recently using GNNs as black boxes [6]. Within this internship, the intern will explore this research direction of bias-free GNNs. She/he will investigate relevant methods and devise the appropriate algorithms to address datasets of MRI of the brain. It is worth noting that graph representations have demonstrated their relevance for characterizing MRI of the human brain, such as for the analysis of the brain activity and of its cortical folding. This application will be conducted within a narrow collaboration with the Institut des Neurosciences de la Timone.

The objectives of the internship are as following:
1- Familiarize herself/himself with fairness in GNNs.
2- Explore the most relevant methods on well-known graph datasets.
3- Devise appropriate method for the MRI application at hand.
4- Gain hands-on with graphs constructed from brain MRI datasets.
These objectives will allow to lay the groundwork for advanced research in a subsequent PhD.

Research Environment

This intern will conduct her/his research within the Machine Learning group in the LITIS Lab, under the supervision of Dr. Benoît Gaüzère and Prof. Paul Honeine. This internship will be conducted within the research project FAMOUS, and within a strong collaboration with the Institut des Neurosciences de la Timone.

Duration and Location

– The internship will last 5 to 6 months, starting from February or March 2024.
– It will be located at INSA Rouen Normandie, within the ML team of LITIS lab, France.

[1] M. Balcilar, G. Renton, P. Héroux, B. Gaüzère, S. Adam, and P. Honeine. “Analyzing the Expressive Power of Graph Neural Networks in a Spectral Perspective”. In: ICLR. 2021.
[2] M. Balcilar, G. Renton, P. Héroux, B. Gaüzère, S. Adam, and P. Honeine. “When Spectral Domain Meets Spatial Domain in Graph Neural Networks”. In: ICML – Workshop on Graph Representation Learning and Beyond. 2020.
[3] A. Bose and W. Hamilton. “Compositional fairness constraints for graph embeddings”. In: ICML. 2019.
[4] J. Kang, J. He, R. Maciejewski, and H. Tong. “Inform: Individual fairness on graph mining”. In: ACM SIGKDD Int. Conf. Knowl. 2020.
[5] J. Palowitch and B. Perozzi. “Debiasing Graph Representations via Metadata-Orthogonal Training”. In: IEEE/ACM ASONAM. 2020.
[6] E. Dai and S. Wang. “Say No to the Discrimination: Learning Fair Graph Neural Networks with Limited Sensitive Attribute Information”. In: WSDM. 2021.

Profil du candidat :
– Student in final year of Master or Engineering School, in applied mathematics, data science, artificial intelligence, or related fields

Formation et compétences requises :
– Strong skills in data analysis and Machine Learning
– Good programming skills in Python and the scientific ecosystem numpy/pytorch
– Interest in neuroscience and/or ML fairness

Application

Interested candidates are invited to send by email a CV, a cover letter expressing their interest and background in the subject, and academic transcripts. Reference letters may also be beneficial.

Contacts

Benoit Gaüzère : benoit.gauzere@insa-rouen.fr
Paul Honeine : paul.honeine@univ-rouen.fr

Adresse d’emploi :
INSA Rouen

Document attaché : 202311262056_Internship – FAMOUS.pdf

Construction et validation statistique de modèles dédiés à la génération de traces d’événements associées à des séries temporelles multivariées. Application au cas d’une cohorte de patients ayant subi une chirurgie avec anesthésie générale.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N
Durée : 6 mois
Contact : hugo.boisaubert@univ-nantes.fr
Date limite de publication : 2024-01-31

Contexte :
Ce stage s’inscrit dans le cadre d’une collaboration à l’interface entre numérique et santé, avec Le Laboratoire Expérimental de SImulation en Médecine Intensive (LE SiMU) de Nantes Université. Le SiMU permet notamment de se perfectionner dans la gestion de situations critiques en anesthésie. Il intervient sur simulateurs de patients haute-fidélité( mannequins), avec immersion des acteurs en formation dans une équipe médicale humaine pleine-échelle interprofessionnelle. Dans le but d’améliorer la sécurité et la qualité des soins per-opératoires, les formateurs du SiMU souhaitent varier la diversité des scénarios à proposer aux internes en anesthésie et infirmiers anesthésistes, en formation initiale, ainsi qu’aux praticiens plus expérimentés, en formation continue.

Pour varier les scénarios, il est proposé à terme d’automatiser la génération de scénarios réalistes desimulation, en s’appuyant sur tout ou partie de la base de profils anesthésiques enregistrés par le CHU de Nantes depuis 2004 (500 000 profils anesthésiques). Dans cette modalité assistée par le numérique, la personne qui suit la formation (interne ou infirmier), fait partie de l’équipe médicale. Les autres membres de l’équipe médicale sont simulés très simplement (icônes réalisant des actions et émettant des
informations, sur l’écran de l’ordinateur assigné à l’apprenant). De cette innovation est attendu un accès potentiel à une grande variété de scénarios réalistes de simulation de cas d’anesthésie. Servir cet objectif
de formation répond également à terme au besoin d’anticipation par prédiction de risque, inhérent au paradigme de la médecine personnalisée, en pleine émergence.

Les CHU ont obligation légale d’enregistrer toutes les données relatives aux interventions chirurgicales.

Parmi ces dernières, figurent les profils anesthésiques des patients. Un profil anesthésique est constitué d’une trace d’événements et d’une série temporelle multivariée. La trace d’événements est la séquence
horodatée des actions de l’équipe médicale (e.g., administration d’un anesthésique). Les actions déterminent l’évolution des paramètres physiologiques du patient. La série temporelle multivariée
correspond à un ensemble de séries temporelles univariées qui décrivent chacune l’évolution d’un paramètre physiologique du patient (e.g., fréquence cardiaque).

Sujet :
L’accès aux données médicales est particulièrement contraint en raison du cadre réglementaire qui s’applique à ce type de données. Un générateur de données réaliste a donc été développé au sein de l’équipe DUKe du LS2N, grâce à l’expertise des partenaires du SiMU / CHU de Nantes.

Le premier objectif de ce stage est de tester sur ce type de données, les modèles et méthodes élaborés par la collaboration LS2N / LE SiMU / CHU de Nantes.

Une approche par expertise, utilisant l’expertise des soignants en anesthésie, sera utilisée pour construire un modèle du déroulement d’une chirurgie choisie. Ce modèle se présentera sous la forme d’une grammaire formelle. Cette grammaire servira ensuite de guide pour l’adaptation du générateur de données réalistes à la chirurgie choisie, ainsi que pour la construction de la représentation synthétique évoquée ci-dessous.

Pour générer un simulateur de scénarios réactifs, deux axes de recherche ont été explorés au sein de l’équipe DUKe du LS2N. Ils portent respectivement sur une approche de data mining / raisonnement à
base de cas, et une approche machine learning (modèle de Markov à changements de régimes et autorégressif). Les travaux du stage exploreront la première catégorie d’approche, centrée sur la
construction d’une représentation synthétique des scénarios observés sur une cohorte de patients.

Le but des travaux est d’utiliser les données de santé issues des profils anesthésiques observés dans une cohorte de patients, pour construire des scénarios réactifs. Il faut pouvoir intégrer dans une seule structure de données l’ensemble des éléments nécessaires pour jouer les scénarios.

Des travaux récents de l’équipe DUKe, dont la publication est à venir, ont amené à faire émerger une nouvelle représentation de connaissances pour des données complexes, comme le sont les profils anesthésiques. Cette représentation appelée représentation synthétique associe de manière novatrice · les différentes séquences d’actions médicales d’une cohorte de patients (ayant subi la même chirurgie), sous la forme d’un graphe orienté,
· des séries temporelles multivariées consensus, associées à chaque intervalle de temps séparant deux actions médicales successives.

La représentation synthétique des traces d’actions médicales d’une cohorte de patients peut être le support utilisé pour générer des scénarios réactifs. En effet, ce type de représentation contient tous les
éléments pour contrôler l’évolution d’un patient numérique soumis à des actions médicales

Dans le cadre de ce stage, le/la stagiaire aura à produire une représentation synthétique pour la chirurgie prise en compte. La grammaire formelle construite sera utilisée pour construire
la représentation synthétique. La ou les représentations synthétiques produites seront testées et évaluées statistiquement afin de
mesurer la similarité des scénarios générés aux scénarios observés.

Par ailleurs, grâce à leur caractère synthétique, ces représentations peuvent représenter des opportunités de réponse aux problématiques d’anonymisation de jeux de données complexes, multivariées et
interdépendantes, comme c’est le cas des profils anesthésiques.

Le stage pourra éventuellement explorer les opportunités que représentent les représentations synthétiques pour la production de jeux de donnés réalistes anonymisées.

Profil du candidat :
Profil Master Bioinformatique / Statistique avec compétences en programmation ou Master Informatique, avec un intérêt marqué pour les travaux en collaboration avec des professionnels de santé et des informaticiens/bioinformaticiens.

Formation et compétences requises :
Intérêt pour la gestion de données médicales et l’anonymisation
de données. Rigueur en programmation et capacité à générer de la documentation, avec usage des outils standard (Git, Doctest, Sphinx). Des compétences en bases de données (SQL, pour la curation de données,
éventuellement) sont attendues et une expérience en calcul intensif (ordonnanceur, parallélisation) sera appréciée. Capacités à rendre compte de son travail régulièrement.

Adresse d’emploi :
LS2N – Site Faculté des Sciences et des Techniques
Campus Lombarderie
2 chemin de la houssinière
44300 Nantes

Document attaché : 202311252322_sujet_2023_2024_bdlbs_m2_repres_synth_23_11_24_thur_14h12-1.pdf

Postdoc : Simulation jointe de la qualité des eaux et du débit de petits cours d’eau sous changement climatique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Unité BioSP – INRAE
Durée : 2 ans
Contact : edith.gabriel@inrae.fr
Date limite de publication : 2023-12-23

Contexte :
Ce post-doc est financé pour 2 ans par la chaire GeoLearning (https://chaire-geolearning.org/), et sera encadré par Edith Gabriel et Lionel Benoit (INRAE-BioSP) avec un suivi de l’ANDRA.

L’ANDRA souhaite tirer profit de la grande quantité de données collectées par l’OPE (Observatoire Pérenne de l’Environnement, https://ope.andra.fr) pour construire une prospective sur l’état des cours d’eau autour du Centre industriel de stockage géologique Cigéo sous l’influence jointe du changement climatique et de la mise en exploitation du site pour le stockage profond de déchets radioactifs.

L’objectif est de proposer une modélisation statistique spatio-temporelle et multivariée des débits et de la qualité des eaux dans la zone OPE. Le modèle envisagé permettra d’étudier l’impact de différents scenarii de changement climatique et/ou anthropique sur l’environnement de Cigéo, et d’émuler certains paramètres hydro-météorologiques utilisés en entrée de modèles d’impact (hydrogéologie, écologie des cours d’eau, etc.).

Sujet :
L’OPE est situé autour du village de Bure à la frontière de la Meuse et de la Haute-Marne dans une zone à faible densité de population. Les paysages sont caractérisés par une alternance de forêts, de grandes cultures et de prairies. D’un point de vue hydrologique la zone comprend trois bassins versants interconnectés par un épikarst qui sont suivis en une quinzaine de sites dans le cadre de l’OPE. Le but de cet observatoire est d’évaluer la qualité des eaux (de surfaces et souterraines) à l’aide de prélèvements ponctuels réguliers renseignant un grand nombre de paramètres (environ 300) qui caractérisent en particulier le débit, et les teneurs de l’eau en matières organique et minérales ainsi qu’en micro- et macropolluants. Six stations automatiques complètent ce dispositif en mesurant en temps continu un nombre réduit de paramètres (conductivité, température, oxygène dissous, HAP, pH, carbone
organique dissous, nitrates et hauteur d’eau) afin de mieux appréhender la variabilité temporelle de la qualité des eaux superficielles. Enfin, des échantillonneurs intégratifs permettent d’estimer la concentration à long terme de certains polluants, et d’évaluer leur impact sur les organismes
sensibles (p. ex. batraciens).
Pour cette étude, nous nous concentrerons sur un sous-ensemble des paramètres mesurés par l’OPE pour caractériser la qualité de l’eau. Nous retiendrons les paramètres physico-chimiques généraux de caractérisation de l’état des cours d’eau définis dans la Directive Cadre sur l’Eau.
Pour compléter ces mesures effectuées sur les cours d’eau, un réseau de forages instrumentés dispersés dans le paysage comprenant actuellement une cinquantaine d’ouvrages (capteurs de niveau, plus dans certains cas de conductivité et température) fournit des informations sur l’état des nappes phréatiques connectées aux cours d’eau d’intérêt. De plus, de nombreuses données environnementales auxiliaires sont disponibles pour décrire l’environnement de surface (p. ex. occupation du sol, parcellaires et pratiques agricoles) et atmosphérique (p. ex. météorologie, qualité de l’air) afin de contextualiser le suivi de la qualité de l’eau et les interactions nappes-rivières.

Questions de recherche

La personne retenue devra traiter les questions suivantes :
1. Identifier les proxys / créer les indicateurs permettant de prédire l’évolution de la qualité de l’eau et des débits,
2. Construire, en chaque station, puis pour l’ensemble des stations, un modèle d’apprentissage automatique liant les proxys environnementaux aux variables hydrologiques cibles,
3. Réaliser une étude de l’impact des changements climatique et anthropique sur les débits des cours d’eau et la qualité de leurs eaux,
4. Interpoler, en temps continu et sur l’ensemble du réseau des cours d’eau, les prédictions issues des modèles des étapes 2 et 3.

Profil du candidat :
Statisticien ou data-scientist avec un fort intérêt pour les applications environnementales.

Formation et compétences requises :
Les candidat(e)s doivent être titulaires d’un doctorat en statistique, en apprentissage automatique, en science des données, ou dans un domaine connexe. Elle/il doit montrer un fort intérêt pour les
applications hydro-climatiques et les problématiques liées aux ressources en eau.
Les candidat(e)s doivent avoir de solides compétences analytiques, ainsi que de bonnes compétences en programmation scientifique (de préférence en R ou Python) et en traitement de données. De
bonnes compétences interpersonnelles, la volonté d’interagir avec d’autres chercheurs et étudiants et la capacité de présenter les résultats de ses travaux lors de conférences internationales sont attendues. La maîtrise de l’anglais et de solides compétences en communication orale et écrite sont requises.

Adresse d’emploi :
Unité BioSP, INRAE
228 route de l’aérodrome
domaine Saint Paul
84914 Avignon

Document attaché : 202311231707_Postdoc_Hydrology_OPE_FR.pdf

Appel prix de thèse AFRIF 2023

Date : 2024-01-29

++++++++++++++++++++++++++++++++++++++++++++++++
+++ Prix de thèse AFRIF 2023
+++ http://www.afrif.asso.fr/
+++ Date limite de candidature : 29 janvier 2024
+++++++++++++++++++++++++++++++++++++++++++++++++

L’AFRIF (Association Française pour la Reconnaissance et l’Interprétation des Formes, http://www.afrif.asso.fr/) a créé un prix de thèse en reconnaissance et interprétation des images et des formes afin d’encourager et de promouvoir la recherche dans ce domaine et plus spécifiquement de récompenser les meilleurs travaux doctoraux sur ces sujets.

Le prix AFRIF 2023 sera doté d’une somme de 1000 euros.
Le lauréat sera invité à présenter ses travaux dans le cadre de la conférence RFIAP (conjointement avec la CaP) 2024 qui se tiendra à Lille du 1er au 3 juillet 2024.
Le jury sera composé des membres du Conseil d’Administration de l’AFRIF ainsi que d’experts du domaine, et sera présidé par François Rousseau (IMT Atlantique)

Peuvent être candidat(e)s tous les docteurs ayant soutenu une thèse relevant des domaines de la reconnaissance des images et des formes entre le 1er juillet 2022 et le 31 décembre 2023. La thèse doit être effectuée au sein d’une école doctorale française ou dans le cadre d’une cotutelle avec une école doctorale française. La thèse peut être rédigée en anglais. Une thèse déjà soumise à l’appel de l’an passé n’est plus éligible pour ce nouvel appel.

Parmi les critères d’évaluation interviendra la qualité du dossier de publications (revues et congrès) incluant les brevets.

Il est demandé de soumettre électroniquement avant le 29 janvier 2024 (minuit) un dossier de candidature (fichiers pdf uniquement) comportant :

• un CV détaillé avec la liste des publications et des brevets,
• un résumé de la thèse en 2 ou 3 pages (mettant en évidence l’originalité de la thèse, l’importance du sujet et des contributions principales, la qualité des résultats obtenus, les éventuels transferts technologiques réalisés ou en cours),
• un avis du directeur de thèse (un second avis extérieur peut être éventuellement ajouté),
• les rapports de thèse et le rapport de soutenance,
• les fichiers du manuscrit de thèse et des articles principaux issus de la thèse (jusqu’à 3).

Les candidatures se font par messagerie électronique, par un envoi à François Rousseau (francois.rousseau@imt-atlantique.fr) et à Camille Kurtz le secrétaire de l’AFRIF (Camille.Kurtz@u-paris.fr) du lien à partir duquel le dossier peut être téléchargé (ou en pièce jointe s’il n’est pas trop volumineux).

Laurent Wendling
Président de l’AFRIF

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

TOTh 2024 Call for Papers Posters Demos – Terminology & Ontology: Theories and applications

Date : 2023-11-23 => 2024-06-07
Lieu : Université Savoie Mont Blanc (Chambéry, France)
Campus Scientifique du Bourget du Lac

======================================================
TOTh 2024 CONFERENCE – ONSITE & ONLINE
Terminology & Ontology: Theories and applications
Calls for Papers, Posters & Demos

Home


6 & 7 June 2024
University Savoie Mont-Blanc (Chambéry, France)
—————————————————————————————–
Deadline for submission of extended abstracts: 15 January 2024
Notification to authors: 12 February 2024
Easychair submission page: https://easychair.org/conferences/?conf=toth2024
The format for submitting abstracts is free. The number of characters including spaces is between 12,000 and 15,000, excluding the bibliography
—————————————————————————————–
The proceeding will be published in the “Terminologica” Collection (http://toth.condillac.org/proceedings) distributed by “le Comptoir des presses d’universités” (http://www.lcdpu.fr/). The previous proceedings can be downloaded at: http://toth.condillac.org/proceedings
—————————————————————————————–
TOTh TRAINING 2024
“Terminology & Artificial Intelligence (1)”

Training 2024 AI


4 & 5 June 2024
University Savoie Mont-Blanc (Chambéry, France).
======================================================

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.