Interdisciplinary PhD in ML & Medicine in Marseille

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’Informatique et des Systèmes (LIS)
Durée : 3 ans
Contact : paul.chauchat@lis-lab.fr
Date limite de publication : 2024-05-24

Contexte :

Sujet :
The complete offer is available here:
https://www.lis-lab.fr/wp-content/uploads/2024/03/Sujet_these_homeostasie-2.pdf

Context and Positioning
Homeostasis is the process by which living organisms maintain a stable internal balance necessary for their survival and optimal functioning. This process typically involves feedback mechanisms that detect deviations from a target state and activate responses to correct these deviations and return the system to a stable level. The homeostasis capabilities of an individual are used to support medical decision making, such as patients’ peri-operative risk stratification in lung cancer surgery.
The homeostatic abilities of an individual can be assessed through exercise testing, which is the traditional clinical method for evaluating patients’ health status and overall systemic dynamics. A series of tests is designed to measure features representative of the individual’s homeostatic capabilities, with one significant metric being the maximal oxygen uptake (VO2max). These measurements are obtained through routine functional tests and maximal exercise sessions, aimed at challenging the entire organism to evaluate physiological adaptive responses. When exercise performance or maximal aerobic capacity is limited for a given patient, the medical doctor has to identify the failing physiological function and to provide a coherent system failure mechanics analyzing the monitored data. However, medical doctors still analyze the collected physiological data in a univariate approach as historically developed. Currently, in the research community, the human body is considered as a dynamic physiological complex system. Recently, the framework of network physiology was proposed, giving a central role to homeostasis.
To broaden theoretical knowledge and to fill the gap between current research and medical practice, the Exercise Test Laboratory of Hôpitaux Universitaires de Marseille built its own activity database composed of 2500 exercise tests.

Objectives
This thesis aims at exploiting this dataset in order to provide a global understanding and interpretation framework of the multivariate data generated during maximal exercise testing to improve patients’ homeostasis phenotyping through their homeostatic capabilities.
We aim to develop a medically and statistically consistent approach to identifying and quantifying determinants of overall performance as well as aerobic performance from monitored variables. This would provide physicians with improved analytical tools to achieve a more relevant and precise patient exercise phenotyping.
The thesis project aims to go further and provide physicians with a quantitative decision support indicator. It will be developed by focusing on the dynamic interactions between the recorded variables. Here, we consider in particular adapting the framework of physiological networks to the mesoscopic and macroscopic case of exercise tests. This would provide crucial information to the physician about patients’ homeostatic capacities.

Work environment
The recruited candidate will work at LIS-lab and C2VN, in Marseille. They will have access to the computing cluster of LIS.
In addition to the supervising team, the PhD candidate will work in close collaboration with a junior hospital doctor.

Profil du candidat :
We are looking for a candidate with both an appeal to work on precise and effective medical problems, and a strong theoretical background in one of the following:
• System and control theory
• Signal/Image/Graph processing
• Computer science
• Machine learning/Artificial intelligence
Good coding skills are also required, preferably in Python.
The candidate should be able to work autonomously, and interact efficiently with the team. Critical thinking, especially when interpreting results, is crucial.

Candidate selection is a two-stage process. First the supervision team will shortlist three candidates, who will then be auditioned by Laennec Institute scientific board.
The application must include a CV, a motivation letter, and the master’s degree grade transcript (first year, and at least the first semester of the second year if it is ongoing).

Formation et compétences requises :

Adresse d’emploi :
Laboratoire d’Informatique et des Systèmes
LIS UMR 7020 CNRS / AMU / UTLN
Aix Marseille Université – Campus de Saint Jérôme – Bat. Polytech
52 Av. Escadrille Normandie Niemen
13397 Marseille Cedex 20

Document attaché : 202403261024_Sujet_thèse_homéostasie.pdf

DÉTECTION DE SIGNATURE MOLÉCULAIRE POUR LA STRATIFICATION DES PATIENTS PAR L’INTÉGRATION MULTI-ÉCHELLES DE DONNÉES HÉTÉROGÈNES.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaBRI, Université de Bordeaux
Durée : 3 ans
Contact : thebault@labri.fr
Date limite de publication : 2024-06-03

Contexte :
Ce projet de thèse interdisciplinaire vise à proposer de nouvelles approches informatiques pour analyser et améliorer les connaissances actuelles sur les cancers digestifs, maladies souvent diagnostiquées tardivement et aux solutions thérapeutiques limitées. Une stratification efficace des patients nécessite la compréhension la plus exhaustive possible des mécanismes biologiques impliquant des données biologiques hétérogènes (génomique, transcriptomique, protéomique, communication intercellulaire, épigénomique …), étroitement interconnectées de façon hiérarchique, et des connaissances provenant de bases de données spécialisées. La modélisation et intégration de ces données hautement complémentaires et à forte combinatoire dans un système complexe est cruciale pour approcher la réalité biologique et améliorer la précision des connaissances sur les mécanismes mis en jeu.
Dans ce contexte, les objectifs de ce projets sont de (1) modéliser les données biologiques à partir d’un multiplex (graphe multi-couches) hétérogène mixte avec le double avantage de représenter par niveau chaque type de données biologiques avec leurs interactions tout en prenant en compte les relations entre chaque niveau en fonction des différentes classes de pathologies, (2) proposer de nouvelles méthodes d’identification des voies de signalisation dérégulées basées par exemple sur la combinaison d’algorithmes de propagation de l’information et de détection de communautés dans chaque couche et entre elles afin d’utiliser au mieux toutes les topologies spécifiques à chaque type de données tout en permettant de les relier et (3) définir et implémenter des approches de visualisation pour faciliter l’interprétation interactive des résultats en plaçant le/la biologiste ou bioinformaticien·ne au centre du processus d’analyse des données. Ces développements informatiques seront appliqués à des données hétérogènes (exome, protéomique, transcriptomique..) produites par le BRIC à partir d’une cohorte de patients atteints de cancers digestifs (pancréas, foie et rectum).

Sujet :

Un des grands défis dans le domaine de la santé numérique est d’accompagner l’exploitation de grands jeux de données et de connaissances hétérogènes pour le développement de la médecine de précision. Cette médecine, dite personnalisée, permet notamment d’identifier les sous-groupes de patients présentant des caractéristiques biologiques ou génétiques similaires en tenant compte des caractéristiques individuelles des patients, ce qui facilite le développement de traitements plus ciblés et efficaces. Elle repose sur l’acquisition de données multi-omiques (génomique, transcriptomique…) couplées aux informations cliniques et biologiques des patients, générant ainsi un important volume et une grande diversité de données.

Face à cette grande hétérogénéité de données biologiques portant des informations différentes et complémentaires, de nombreux outils d’intégration de données multi-omiques ont été proposés ces dernières années. Cinq grandes familles de méthodes sont proposées: l’intégration précoce, mixte, intermédiaire, tardive et hiérarchique [1]. Nous nous intéressons particulièrement aux méthodes d’intégration mixte (transformation indépendante de chaque jeu de données en une représentation simple) et hiérarchique (inclusion des connaissances préalables des relations régulatoires entre les différents types de données). En effet, chaque type de données peut être représenté naturellement sous forme de graphes ce qui permet de simplifier et débruiter ces données à grandes dimensions, ensuite l’utilisation de multiplex permet de connecter ces graphes tout en gardant l’aspect hiérarchique des relations entre les différentes molécules suivant le dogme central de la biologie moléculaire. La grande flexibilité et la variété des graphes nous permettent aussi de pouvoir modéliser et rendre accessible l’abondance de connaissances bio-médicales présentent dans les nombreuses bases de données. HetioNet [2], par exemple, propose un graphe de connaissance multiplex hétérogène (11 types de nœuds et 24 types d’arêtes) récapitulant 29 bases de données. Plus récemment, BioCypher [3] propose une architecture modulaire, réutilisable et extensible permettant la construction et l’exploration de méta-graphes en utilisant des graphes de connaissance pré-construits à partir de chaque base de données (57 bases de données et 11 ontologies) ainsi que l’ajout de nouveaux modules.
A notre connaissance, il n’existe pas de méthode permettant de combiner les informations provenant des expériences omiques, chacune d’elle avec leurs propres propriétés et les relations non aléatoires entre elle et la mine d’information provenant des graphes de connaissance qui permettrait d’interpréter les perturbations observées dans les échantillons. De plus, le parcours de ces multiplex hétérogènes afin d’identifier les informations biologiques importantes provenant de chaque couche (topologie spécifique aux type de données) et permettant une combinaison cohérente entre elles (hiérarchie et expertise biologique) est une question qui reste difficile. De nombreuses approches de type marche aléatoire [4] ou marche aléatoire dirigée [5] ont été proposées, nous pensons cependant que le parcours des données issues des expériences pondèrent précisément les liens entre les molécules et devraient être utilisées dans cette tâche.

L’intégration de données reste donc une problématique majeure et l’utilisation de multiplex hétérogènes pour cette tâche semble une alternative naturelle, adaptative et tendance aux méthodes classiques de machine learning et d’apprentissage profond.

Nous allons nous intéresser en particulier aux cancers digestifs comme cas d’étude. Les cancers digestifs demeurent des pathologies de mauvais pronostic dont le diagnostic est souvent réalisé à un stade avancé et pour lequel les moyens thérapeutiques sont restreints.
Dans le but de développer des thérapies efficaces, il est nécessaire de mieux comprendre la pathogenèse de ces cancers et d’identifier des sous-groupes de patients. En effet, la stratification des patients en catégories plus homogènes dans leurs étiologies, le profil moléculaire de leur cancer et leur devenir permettront ensuite des prises en charge spécifiques diminuant le risque de complications tels que la résistance au traitement et de mortalité précoce.

1. Picard M, Scott-Boyer M-P, Bodein A, Périn O, Droit A. Integration strategies of multi-omics data for machine learning analysis. Computational and Structural Biotechnology Journal. 2021;19:3735–46.
2. Himmelstein DS, Baranzini SE. Heterogeneous Network Edge Prediction: A Data Integration Approach to Prioritize Disease-Associated Genes. Tang H, editor. PLoS Comput Biol. 2015;11:e1004259.
3. Lobentanzer S, Aloy P, Baumbach J, Bohar B, Carey VJ, Charoentong P, et al. Democratizing knowledge representation with BioCypher. Nat Biotechnol. 2023;41:1056–9.
4. Pio-Lopez L, Valdeolivas A, Tichit L, Remy É, Baudot A. MultiVERSE: a multiplex and multiplex-heterogeneous network embedding approach. Sci Rep. 2021;11:8794.
5. Liu W, Li C, Xu Y, Yang H, Yao Q, Han J, et al. Topologically inferring risk-active pathways toward precise cancer classification by directed random walk. Bioinformatics. 2013;29:2169–77.
6. Feng S, Heath E, Jefferson B, Joslyn C, Kvinge H, Mitchell HD, et al. Hypergraph models of biological networks to identify genes critical to pathogenic viral response. BMC Bioinformatics. 2021;22:287.
7. Wilkinson MD, Dumontier M, Aalbersberg IjJ, Appleton G, Axton M, Baak A, et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 2016;3:160018.
8. Lin D, Crabtree J, Dillo I, Downs RR, Edmunds R, Giaretta D, et al. The TRUST Principles for digital repositories. Sci Data. 2020;7:144.

Profil du candidat :
Etudiant(e) titulaire d’un master 2 de bioinformatique ou assimilé (ou informatique mais avec une forte inclination pour la biologie), disposant des compétences suivantes :
Connaissances en bioinformatique, (bio)statistique et biologie Maîtrise de l’environnement linux/unix
Maîtrise du langage R et d’un langage de programmation (python, C, …) Motivation pour évoluer dans un environnement pluridisciplinaire Rigueur et esprit de synthèse, ainsi que capacité à travailler en équipe.

Formation et compétences requises :

Adresse d’emploi :
LaBRI – Laboratoire Bordelais de Recherche en Informatique
Université de Bordeaux
351, cours de la Libération F-33405 Talence cedex.

Sparsification de grands Graphes

Annonce en lien avec l’Action/le Réseau :

Thème :

Simplification de masses de données complexes

Présentation :

Nous organisons un workshop sur la sparsification (simplification) de grands graphes et réseaux en conjonction avec la conférence FRCCS 2024 qui se tiendra à Montpellier. Nous souhaitons organiser un défi lors de ce workshop pour le meilleur sparsifieur sur des datastes ciblées.
Pour rendre ce challenge attractif, nous souhaitons pouvoir offrir un prix au gagnant.
Nous demandons une aide de 500 euros pour ce prix.

Du : 2024-05-28

Au : 2024-05-31

Lieu : Montpellier, France

Site Web : https://iutdijon.u-bourgogne.fr/ccs-france/complex-network-sparsification/

Un modèle pour l’évaluation de l’acceptabilité, de l’acceptation et de la confiance des utilisateurs des navettes autonomes dans des zones péri-urbaines et rurales

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Laboratoire Informatique, Image et Interaction (L3
Durée : 36 mois
Contact : alain.bouju@univ-lr.fr
Date limite de publication : 2024-04-10

Contexte :
La réduction du rejet de carbone dans l’atmosphère est une préoccupation mondiale. En effet, l’émissions de gaz à
effet de serre dans l’atmosphère est à l’origine du réchauffement climatique ce qui présente une menace pour notre
terre. L’impact carbone du transport est l’un des plus important, par exemple en France, le transport est l’activité qui
contribue le plus aux émissions de gaz à effet de serre (durable, 2021).
Dans ce contexte, différentes mesures peuvent être appliqué dont dans le domaine des transports. Notamment la
conduite autonome et les services de transport à la demande de véhicules électriques. En effet, la conduite autonome
apporte de nombreux avantages aux individus et à la société, notamment une sécurité routière accrue, une réduction
des embouteillages et une empreinte écologique améliorée.
C’est dans ce cadre que le projet YéloDETA intervient. L’objectif du projet YéloDETA est de fournir un service de
transport à la demande automatisé dans les zones à faible densité (périurbaines et rurales) dans 8 communes de
l’agglomération rochelaise. Cependant, pour parvenir à une diffusion réussie de ces véhicules autonomes et exploiter
ainsi leur potentiel environnemental, il faut favoriser une large acceptation de ce concept de mobilité. L’acceptabilité
et l’acceptation sont donc un point bloquant important (Bel., 2019). Ici, l’acceptabilité concerne les intentions des
utilisateurs à utiliser ou non la technologie, et l’acceptation de son usage effectif.

Sujet :
La thèse s’inscrit dans les domaines de l’IHM et des véhicules autonomes, elle vise à fournir un modèle pour
l’évaluation de l’acceptabilité, de l’acceptation et de la confiance des utilisateurs finaux des navettes autonomes dans
un environnement péri-urbaines et rurales. Ces résultats permettront d’améliorer et d’accélérer le processus de
conception des IHM utilisateur-navette autonome à intégrer dans ce type de véhicule afin de garantir une bonne
expérience utilisateur et un déploiement rapide. L’objectif de la thèse est donc double : mesurer l’acceptabilité et
l’acceptation des usagers des navettes autonomes, et proposer les lignes directives pour la conception de l’IHM
usager-Navette qui garantit son acceptabilité.

Profil du candidat :

Formation et compétences requises :
Master en Informatique avec des bases en Modélisation

Adresse d’emploi :
Laboratoire L3i
Institut LUDI
Bâtiment Pascal
Avenue Michel Crépeau
17042 La Rochelle Cedex 1 – France

Document attaché : 202403221104_sujet-these-YeloDeta.pdf

Chaire de Professeur Junior (CPJ) au LITIS Lab / INSA Rouen Normandie : « IA pour une mobilité sûre et intelligente »

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab / INSA Rouen
Durée : 5 ans
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2024-04-10

Contexte :

Sujet :
Un poste de Chaire de Professeur Junior (CPJ) est à pourvoir pour la rentrée 2024 au Laboratoire LITIS à l’INSA Rouen Normandie, sur la thématique « Intelligence Artificielle pour une mobilité sûre et intelligente ».

La personne recrutée intégrera une des 3 équipes du LITIS, selon l’adéquation de son profil aux thèmes de recherche de ces équipes :
– équipe Apprentissage : Machine Learning (https://www.litislab.fr/equipe/app)
– équipe MIND : Multi-Agent, Interaction, Décision (https://www.litislab.fr/equipe/mind)
– équipe STI : Systèmes de Transport Intelligents (https://www.litislab.fr/equipe/sti)

Les activités d’enseignement se feront au département « informatique et technologie de l’information » (http://iti.insa-rouen.fr).

Le profil complet est disponible sur Galaxie : https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/FIDIS/0760165S/FOPC_0760165S_4117.pdf

La date butoir de candidature sur Galaxie est le 15 avril 2024.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
LITIS, INSA Rouen Normandie

Document attaché : 202403212124_CPJ-ITI-LITIS-2024.pdf

Postdoc Position in Machine/Deep Learning/Computer Vision – Development and applications of novel Machine and Deep Learning and computer vision algorithms for the analysis of multispectral images for the detection of vine diseases

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : CReSTIC, Université de Reims Champagne-Ardenne
Durée : 18 mois
Contact : valeriu.vrabie@univ-reims.fr
Date limite de publication : 2024-05-31

Contexte :
Postdoc Position in Machine/Deep Learning/Computer Vision

Title
Development and applications of novel Machine and Deep Learning and computer vision algorithms for the analysis of multispectral images for the detection of vine diseases

Context
The activities of the 140 people working at The Research Center in Information and Communication Science and Technologies (CReSTIC) revolve around the extraction and analysis of knowledge, signal and image processing and analysis, machine and deep learning, applied in particular to smart farming. Driving many academic projects, CReSTIC is also a major player in innovation as evidenced by its industrial transfer activities alongside national and international companies. Among them, as part of a collaboration with Comité de Champagne and Segula Technologies company, an ambitious project aims to develop detection strategies and algorithms for detecting the presence of vine diseases based on image processing, machine and deep learning, and information theory concepts. This project focus on the detection of grapevine yellows on Chardonnay, a very challenging task, especially of the Flavescence Dorée, a serious and epidemic disease. It is one of the two grapevines yellow diseases that might cause a rapid decay in Champagne and other wine regions, being considered as the new phylloxera of the vineyard. To date, the detection approach of the yellows is to collectively explore the vineyard on foot every year to identify affected vines and to perform biomolecular tests by approved laboratories. As the survey is not precise nor optimal enough for a large-scale monitoring, the development of integrable detection solutions based on imagery appears necessary.

Sujet :
We conducted several acquisition campaigns between 2020 and 2023. Spectra were collected on the leaves under controlled conditions as well as multispectral images (5 bands in visible-NearInfraRed and 8 bands in ShortWaveInfraRed). Multispectral images (5 bands in visible-NearInfraRed) were collected in situ at different distances (including by drone), lighting conditions, and periods during the harvest period. The processing of the spectra made it possible to identify discriminating spectral bands, a suitable multispectral camera being built for the 2024 acquisition campaign. The analysis of multispectral images is, however, much more complex, particularly for in situ acquisitions, because of the variability induced by endogenous and exogenous factors (brightness, phytosanitary treatments, vine vigor, other diseases) and especially because of the interannual variability. Existing CNN-models and new hierarchical models developed by our lab have proven effective in detecting grapevine yellows, but the generalization capabilities of these models are not sufficient to compensate for these variabilities.

The objective is to propose new detection strategies and algorithms that are robust to variability induced by endogenous and exogenous factors, and by year. Several tracks could be explored, independently or jointly:

– Extraction of supervised and/or unsupervised features, and identification of the most robust ones using, notably using information theory concepts which have already been developed for the identification of spectral bands from spectra.

– Fusion of multispectral information or identification of an optimal subset at different levels (images – including calculation of an NDVI type index, features, extraction algorithms).

– Integration of reinforcement, continuous learning and/or domain adaptation concepts and adaptation of these concepts to multispectral images.

It might also be interesting to design semi-supervised approaches to take advantage of the possibility of acquiring many unlabeled images during new acquisition campaigns.

Profil du candidat :
Self-motivated scientist seeking to pursue a scientific career, holding a Ph.D. or in the process of completing it, in a relevant field of machine/deep learning or other relevant fields.

Strong knowledge and skills in AI learning, machine learning and data science with hand-on skill and experience.

Strong foundations in python and pytorch coding. Knowledge and skills in Python environments such as Tensorflow, Pytorch, Keras, Pandas, Scikit-learn, etc.).

Understand of digital image processing; prior experience in working with image analysis projects (industrial or academic) will be a plus.

Independent and passionate about data science projects, however good team player, able to undertake research projects together with other team members.

Excellent communication (oral and written) and public speaking skills.

Formation et compétences requises :
PhD in Machine/Deep Learning/Computer Vision

Adresse d’emploi :
The PostDoc will be based at the CReSTIC lab of the University of Reims Champagne-Ardenne on the Moulin de la Housse campus in Reims.

Within the framework of the project, he/she may be required to intervene to the project partners, the Comité de Champagne in Epernay or Segula Technologies in Reims downtown.

Exchanges with BII, A*STAR, Singapore could be considered during this period or after.

Interested applicants please contact Valeriu Vrabie valeriu.vrabie@univ-reims.fr, Alban Goupil alban.goupil@univ-reims.fr et Eric Perrin eric.perrin@univ-reims.fr.

Document attaché : 202403200911_PostDoc.Crestic.Urca.En.pdf

Prix de Thèse Systèmes Complexes de CSS/France (Local Chapter of the Complex Systems Society)

Date : 2024-04-01
Lieu : IXXI, Lyon, France

Rappel: 2 semaines avant la cloture des candidatures

Prix de Thèse Systèmes Complexes de CSS/France (Local Chapter of the Complex Systems Society)

Informations clefs

  • Date limite de soumission: 1er Avril 2024
  • Pour qui: doctorants ayant soutenu une thèse en 2022 ou 2023 dans la thématique des systèmes complexes
  • Récompenses: 6 prix de 1000 €
  • Site web de dépôt: http://css-fr.org/283-2/

L’objectif de ce prix est de mettre à l’honneur la recherche dans le domaine des systèmes complexes et de distinguer les travaux de jeunes chercheurs et chercheuses particulièrement prometteurs.

Exceptionnellement, l’appel à candidatures pour le Prix de Thèse Systèmes Complexes 2024 concerne les doctorantes et doctorants de toutes disciplines travaillant sur les systèmes complexes ayant soutenu leur thèse en 2022 ou 2023.

À l’issue de l’appel à participation, les meilleures candidats et candidates seront sélectionnés pour présenter leur thèse devant un jury interdisciplinaire composé de personnalités reconnues dans le domaine, qui décerneront 6 prix de 1000 €. Cette journée d’audition aura lieu en Septembre 2024, à Lyon, organisé par l’IXXI.

Le format des présentations sera de 15min + 5min de discussion.

Éligibilité

  • Les thèses éligibles auront été soutenues entre janvier 2022 et décembre 2023, dans une école doctorale française. Les thèses rédigées en anglais et en français sont acceptées par le jury.
  • Pour pouvoir concourir à ce prix de thèse, il faut que les candidats et candidates fassent la preuve, notamment dans le résumé de thèse soumis au dossier, d’une adéquation de leur travail avec au moins certains des “objets” et “questions” définis dans la feuille de route systèmes complexes.
  • Outre la qualité scientifique des candidats, le jury sera particulièrement attentif à l’interdisciplinarité de la démarche. Les doctorant.e.s ayant soutenu une thèse strictement mono-disciplinaire sont invité.e.s à candidater à des prix dédiés à leur discipline.

Le prix de thèse de CSS/France

Le Prix de thèse français « Systèmes Complexes » a été lancé en 2017 par l’Institut des Systèmes Complexes de Paris IdF – ISC-PIF, rejoint les éditions suivantes par l’Institut des Systèmes Complexes en Normandie – ISCN, l’Institut Rhônalpin des Systèmes Complexes – IXXI et l’Académie des Systèmes Complexes de l’Université de Nice Côté d’Azur. À partir de 2024, il est organisé par CSS/France (Local Chapter of the Complex Systems Society) en collaboration avec ces centres régionaux.

Candidatures

Les candidats et candidates devront soumettre leur candidature en ligne avant le 1 Avril minuit heure française.

Documents demandés : CV, rapport du jury de thèse et pré-rapports des rapporteurs, résumé de la thèse (anglais ou français, maximum 2 pages) et lien vers le manuscrit de la thèse. Une attention particulière sera portée au résumé, qui doit être écrit spécifiquement pour cette soumission. Il pourra mettre en avant l’adéquation du travail avec le domaine des systèmes complexes, tout en restant fidèle au contenu de la thèse.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Clustering under constraints for multivariate and heterogeneous time series – Application to hydrological data

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube laboratory
Durée : 3 ans
Contact : lafabregue@unistra.fr
Date limite de publication : 2024-05-23

Contexte :
This thesis is part of the field of unsupervised or weakly supervised learning applied to temporal data. Clustering, which consists in partitioning the set of analyzed objects into groups or clusters, is one of the most widely used approaches and relies on a similarity measure between objects. In particular, sequence clustering raises problems related to measuring similarity between two individuals. For example, in river monitoring, certain phenomena occur at an annual frequency linked to the natural water cycle, but may be shifted in time due to geographical distance and local meteorology. Similarity measures must be able to take these potential shifts or slight distortions in time into account. Numerous methods have been proposed in the literature to take these specificities into account, such as Dynamic Time Warping, Longest Common SubSequence or, more recently, representations using shapelets or neural networks.

Sujet :
The main objective of this thesis is to develop new approaches for measuring similarity between two multivariate time series, taking into account missing values distributed heterogeneously in time and between variables. The aim is to define solutions for integrating temporal information (spacing between two time steps, temporal frequencies of measurements, etc.) into the calculation of similarity. We will also look at how to integrate the expert’s knowledge via annotations, also known as constraints (e.g. proximity/remoteness between two individuals based on external information), concerning both temporal and spatial links between different individuals, in order to improve the correspondence between the clustering obtained and the expert’s expectations. These approaches will be experimented on river monitoring data that raise various problems, due to their number, their diversity, and their spatial and temporal heterogeneity.
Work will focus on the following questions:
– clustering vector sequences, where vectors contain parameters that can be measured at different time steps
– taking into account temporal (seasons) and geographical (hydrographic regions) constraints
– coupling physico-chemical and biological or hydrological data (different measurement frequencies)
– exploring the limits of the proposed methods in terms of number and size of sequences

Profil du candidat :
– Master 2 in Computer Science
– Training in data science, data mining, machine learning

Formation et compétences requises :
– Excellent knowledge of machine learning and knowledge modeling
– Excellent programming skills in Python or R
– Excellent communication and writing skills in English (French not mandatory)
– An interest in the application’s subject

Adresse d’emploi :
The thesis will be carried out at the ICube laboratory in Illkirch (near Strasbourg).

Document attaché : 202403191713_sujet_these_hydro.pdf

Invitation to Submit Extended Abstracts to the 15th Traffic & Granular Flow (TGF) Conference 2024 in Lyon

Date : 2024-12-02 => 2024-12-05
Lieu : Lyon, France

Dear Colleagues,

We are thrilled to announce the opening of extended abstract submissions for the 15th edition of the Traffic & Granular Flow (TGF) Conference, a pivotal event that has been fostering interdisciplinary collaboration since 1995.
This year, we are pleased to host the conference in the beautiful city of Lyon, France, from December 2nd to December 5th, 2024, perfectly timed just before Lyon’s renowned Light Festival.

Conference Highlights:
Dates: December 2nd to December 5th, 2024
Location: Prestigious venues in Lyon – the Palais Hirsch and the Palais de la Bourse
Extended Abstract Submission Deadline: May 31st, 2024 (firm deadline)
Submission Portal: https://tgf2024.sciencesconf.org/

Invited Speakers:
We are honored to confirm the participation of the following esteemed speakers, who will be sharing their latest research and insights across our broad spectrum of topics:

Ernesto Altshuler, Univ of Havana, Cuba
Karol Bacik, MIT, Cambridge, USA
Denis Bartolo, ENS, Lyon, France
Xiaowen Chen, ENS, Paris, France
Marta Gonzalez, UC-Berkeley, USA
Eleni Vlahogianni, NTUA, Athens, Greece
Nathalie Vriend, CU-Boulder, USA
Iker Zuriguel, Univ of Navarra, Spain

Their contributions will spark exciting inter-disciplinary dialogue and knowledge-sharing at TGF 2024, offering invaluable perspectives from across the globe.

Expected Contributions:
TGF 2024 aims to provide a comprehensive overview of the latest developments across a broad spectrum of topics related to traffic and granular flow.
This includes but is not limited to:
– traffic modelling and analysis
– granular and active flows
– pedestrian dynamics
– collective dynamics of biological systems

Our goal is to facilitate an exchange of high-quality research findings and innovative ideas that can shape the future of these fields.

Commitment to Sustainability:
In line with our commitment to a sustainable future, we encourage participants to:
Use the Labos1point5 simulator to assess and minimize the carbon footprint of their travel.
Extend their stay beyond the conference duration for local academic collaborations. Interested participants should contact the Organising Committee for potential arrangements with Institut Lumière Matière or LICIT.
Proceedings Publication:
Selected high-quality papers will be published in Open Access in EPJ Web of Conferences, ensuring wide dissemination and accessibility of your research.

Local Organising Committee:
Nicolas BAIN, CNRS, Institut Lumière Matière
Angelo FURNO, ENTPE-Univ. Gustave Eiffel, LICIT-ECO7
Alexandre NICOLAS, CNRS, Institut Lumière Matière
Osvanny RAMOS, Univ. Lyon 1, Institut Lumière Matière
Adèle DOUIN, Univ. Lyon 1, Institut Lumière Matière
We invite academic experts, practitioners, and all interested in the fields of physics, computer science, engineering, and beyond to submit their extended abstracts and join us for what promises to be an enlightening and memorable conference.

For more details, including submission guidelines and conference logistics, please visit our website https://tgf2024.sciencesconf.org/ or contact us directly at tgf2024@sciencesconf.org.

We look forward to welcoming you to Lyon for an engaging and inspiring TGF 2024.

Warm regards,

The TGF 2024 Local Organising Committee

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Exploitation de données multidimensionnelles longitudinales pour le monitoring avancé de bioprocédé

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : StatSC Oniris VetAgroBio Nantes
Durée : 6 mois
Contact : veronique.cariou@oniris-nantes.fr
Date limite de publication : 2024-04-15

Contexte :
La digestion anaérobie, ou méthanisation, est un bioprocédé permettant de convertir la matière organique en biogaz, riche en
méthane. Ce bioprocédé est utilisé de plus en plus largement à l’échelle industrielle pour la valorisation des déchets organiques
en énergie renouvelable. Il repose sur l’activité d’une communauté microbienne complexe, dynamique, et sensible aux
variations des conditions opératoires. Cette sensibilité peut avoir pour conséquence une instabilité du procédé, et des
répercussions importantes pour les opérateurs. Afin d’optimiser la digestion anaérobie, une compréhension approfondie du
fonctionnement des communautés microbiennes, en particulier face à des stress, est essentielle. Les méthodologies haut-débit
omiques s’avèrent des outils particulièrement pertinents pour cela. La métagénomique, la métatranscriptomique, la
métabolomique et la métataxonomique permettent en effet de caractériser une communauté microbienne à différents
niveaux de son fonctionnement. Ces approches sont particulièrement intéressantes lorsqu’elles sont utilisées dans un contexte
longitudinal, c’est-à-dire en analysant une suite temporelle d’échantillons plutôt que des échantillons uniques. Ainsi, il est
possible de mieux saisir la dynamique de l’écosystème microbien suite à un changement de paramètre opératoire ou à un
stress, et de proposer des solutions pour limiter les répercussions sur le procédé.
Cependant la plupart des méthodes statistiques utilisées pour analyser les données omiques ne tiennent pas compte
explicitement de la temporalité, et traitent les différents points de temps comme des échantillons indépendants. Pour exploiter
pleinement le potentiel des données longitudinales et prendre en compte le lien temporel entre les échantillons, la création
de pipelines analytiques spécifiques est requise. Ces pipelines permettraient d’identifier les marqueurs biologiques associés à
l’évolution des conditions opératoires et à l’évolution des performances des procédés. On pourrait chercher des liens entre les
dynamiques temporelles des microorganismes et faire des hypothèses biologiques. On pourrait également envisager de
déconvoluer l’effet des différents facteurs sur les dynamiques microbiennes et par exemple distinguer la dynamique naturelle
de l’écosystème de l’effet spécifique d’un paramètre donné.

Sujet :
Dans ce contexte, l’objectif du stage sera de mettre en place un pipeline analytique spécifique pour la valorisation des données
omiques longitudinales issues de bioprocédés. Différents défis statistiques seront à résoudre (Kodikara et al. 2022). Des jeux
de données omiques (metataxonomique, métagénomique, métabolomique) issues d’échantillons prélevés dans des
bioréacteurs de laboratoire sont disponibles. Elles proviennent d’expériences réalisées dans l’unité PROSE pour évaluer les
conséquences de différents stress salins sur les performances de la digestion anaérobie. On pourra s’appuyer sur des travaux
préliminaires précédents (Bodein et al. 2019, Chapleur et al. 2021).
Bodein, A., Chapleur, O., Droit, A. and Lê Cao, K.-A. (2019) A Generic Multivariate Framework for the Integration of Microbiome Longitudinal Studies With
Other Data Types. Frontiers in Genetics 10(963).
Chapleur, O., Poirier, S., Guenne, A. and Lê Cao, K.-A. (2021) Time-course analysis of metabolomic and microbial responses in anaerobic digesters exposed to
ammonia. Chemosphere 283, 131309.
Kodikara, S., Ellul, S. and Lê Cao, K.-A. (2022) Statistical challenges in longitudinal microbiome data analysis. Briefings in Bioinformatics 23(4).

Profil du candidat :
– Connaissances solides en statistiques et en particulier en analyse de données,
– Aptitude à développer des scripts de traitement de données sous R,
– Capacités rédactionnelles et lecture d’articles scientifiques en anglais,
– Aptitudes au travail en équipe et à la communication.

Formation et compétences requises :
Master 2 en statistique / biostatistique

Adresse d’emploi :
Oniris VetAgroBio
Campus des Sciences de l’Ingénieur
44300 Nantes

Document attaché : 202403151506_DOMULO_Stage_M2_StatSC_PROSE_2024.pdf