Appel à communication pour l’atelier GAST (Gestion et Analyse des données Spatiales et Temporelles)

Date : 2025-01-27 => 2024-12-31
Lieu : EGC’25 – Strasbourg

Résumé :
Dans le cadre du dixième atelier GAST, nous sollicitons des soumissions d’articles autour des thématiques de la gestion et analyse des données spatiales et temporelles. Nous souhaitons que l’atelier soit un espace d’échange qui regroupe des chercheurs du domaine. En fonction des possibilités, nous pourrons également envisager la venue d’un invité qui, par ses travaux récents, peut enrichir les connaissances de la communauté.

Équipe organisatrice :
– Clément IPHAR, LETG / UBO (Brest)
– Aurélie LEBORGNE, ICube / UNISTRA (Strasbourg)
– Nida MEDDOURI, LRE / EPITA (Paris)
– Loïc SALMON, ISEA/ UNC (Nouméa)

Descriptif :
La nature des données spatiales et temporelles exploitées s’étend au sens très large dans cet atelier. Il peut s’agir d’analyser des données enrichies d’informations de localisation et d’horodatage ; aussi bien que de traiter des sources d’informations complexes dont nous cherchons à extraire des informations spatiales ou temporelles (documents vidéo, textes, cartes, etc.). Les problématiques associées peuvent concerner aussi bien les techniques de représentation de ces informations, leurs analyses (en temps réel ou pas) que leur stockage.

Ces thématiques ont connu un intérêt croissant ces dernières années, en particulier avec le développement de nombreuses méthodes d’analyse de séries temporelles ou de traces mobiles. Il nous apparaît donc important de permettre aux chercheurs de la communauté francophone (ou autres) de pouvoir se rencontrer pour échanger spécifiquement sur ces thématiques.

Objectifs :
Cet atelier s’inscrit dans la continuité des ateliers des années passées. Un des objectifs est de regrouper les chercheurs du domaine académique et de l’industrie. Ces derniers s’intéressent aux problématiques liées à la prise en compte de l’information temporelle ou spatiale (quantitative ou qualitative) dans leurs processus de gestion et d’analyse de données (méthodes et application de l’extraction, la gestion, la représentation, l’analyse et la visualisation d’informations, apprentissage et extraction de connaissances à partir des données spatio-temporelles). L’atelier permet de donner la possibilité à un grand nombre de chercheurs intéressés par ces thématiques de présenter leurs problématiques et approches.

Thèmes de l’atelier (liste non exhaustive) :
Les soumissions attendues porteront sur les besoins, outils, problèmes, techniques, méthodes et algorithmes dédiés à l’analyse :
– Des données temporelles : séries temporelles, données séquentielles, etc.
– Des données spatiales : images satellites, numériques, données géomatiques et maritimes, etc.
– Des données spatio-temporelles : données issues de réseaux de capteurs, données biologiques et médicales, traces spatio-temporelles (déplacements d’espèces vivantes, objets), vidéos, séries d’images satellites, données territoriales, etc.
– Des données textuelles évoquant des aspects spatiaux et temporels, etc.
– Des flux de données (en temps réel) incluant des informations spatiales, etc.
– Des données fédérées dans un environnement distribué géographiquement, etc.

Les questions suivantes pourront, par exemple, y être abordées :
– Recherche et intégration de connaissances spatiales et temporelles dans un processus d’analyse de données;
– Méthodes d’apprentissage profond pour les données spatio-temporelles;
– Extraction et visualisation de motifs ou de règles de classification/prédiction à partir des données spatio-temporelles;
– Modélisation de l’information spatiale et temporelle, prise en compte des aspects hétérogènes, multidimensionnel ou multi échelle des données temporelles et spatiales;
– Représentation, analyse et gestion des données spatio-temporelles incertaines;
– Prise en compte des contraintes d’anonymat dans les données spatiales et temporelles (apprentissage fédéré);
– Explicabilité/interprétabilité des modèles en présence de données temporelles et/ou spatiales;
– Données géo-spatiales et géo-temporelles du Web et de l’Open Data;
– Construction et acquisition de connaissances géo-spatiales/géo-temporelles à partir de textes et/ou d’images;
– Mesure de qualité sur les données spatiales et temporelles;

Les contributions peuvent aborder ces questions de manière conceptuelle ou appliquée sur divers domaines d’application (santé, transport, industrie, etc.). Les méthodes, modèles et outils qui transcendent les frontières entre plusieurs domaines applicatifs seront particulièrement appréciés.

Les dates importantes:
– Abstract : 22 novembre 2024
– Full paper : 26 novembre 2024
– Notification : 13 décembre 2024

Instructions aux auteurs : Les auteurs sont invités à soumettre des travaux de recherche originaux (non publiés ou en cours d’évaluation) autour des thématiques de l’atelier. Trois formats de papier sont acceptés : résumés étendus de 2 pages; papiers courts de 6 pages et papiers longs de 12 pages. Les actes n’étant pas imprimés, une certaine flexibilité est possible autorisée autour de ces chiffres.

Les soumissions devront être réalisées au format PDF et devront utiliser le format RNTI disponible en téléchargement à l’adresse : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip. La langue officielle de l’atelier est le français, mais il reste ouvert aux contributions en langue anglaise. La soumission des propositions d’articles se fera exclusivement sous format électronique via le site EasyChair Conference System : https://easychair.org/conferences/?conf=egc2025 en choisissant lors de la soumission la track GAST correspondant à l’atelier. Si vous rencontrez des difficultés, n’hésitez pas à nous contacter.

Chaque soumission sera évaluée par 3 évaluateurs. Les critères d’évaluation retenus sont :
– L’adéquation du contenu scientifique de la proposition aux thématiques de l’atelier.
– La mise en évidence d’un résultat scientifique, d’une idée innovante ou de retours d’expériences.
– La qualité scientifique de la soumission.
– La clarté de la présentation (pour un public pluridisciplinaire notamment).
– Le fait que la contribution soit susceptible de donner lieu à des échanges scientifiques intéressants.

Les inscriptions peuvent se réaliser à l’atelier seul ou à tout l’événement (atelier + conférence). Le tarif d’inscription et la procédure d’inscription sont disponibles sur le site de la conférence EGC : https://www.egc2025.cnrs.fr/.

Contact : gast_egc2025@easychair.org

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Post-doctoral researcher in spatial quantitative ecology based on heterogeneous data analysis

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Biostatistics and Spatial Processes, INRAE
Durée : 18 months
Contact : samuel.soubeyrand@inrae.fr
Date limite de publication : 2024-12-01

Contexte :
You will be based at the BioSP research unit (Biostatistics and Spatial Processes) in Avignon, and collaborate with researchers from INRAE and Cirad at Avignon, Montpellier and Rennes. You will specifically work with Samuel Soubeyrand (INRAE, Avignon) and Virginie Ravigné (Cirad, Montpellier), and be involved in the IRIS project dedicated to better understanding and monitoring biological regulation services. This topic is approached in the IRIS project both from a general and methodological perspective, and throughout the study of a specific context, namely the citrus production in Corsica.

The rational underlying the project is to envision and implement a proof of concept of a multidimensional, integrative surveillance of the biological diversity (instead of the traditional surveillance in silo of specific pests) contributing both to the sanitary risk and to their mitigation.

Sujet :
Your work in this project will consist in carrying out original research aiming at modeling and inferring the links between the characteristics of the landscapes and the local capacities of pest regulation. You will characterize landscapes with classical indicators related to land use, climate, geology, anthropization, etc., and more original indicators reflecting connectivity between the diverse landscape components. Then, you will infer landscape-regulation links with multidimensional models allowing you to take into account the interaction within the community (for instance, models considered in statistics, machine learning, species distribution modeling, or even hybrid models encompassing mechanistic components), with the additional challenge of incorporating in these analyzes connectivity data. This part of the research will be based on accurate spatial diversity data collected during the project in the citrus production areas in Corsica and processed with metabarcoding and high throughput sequencing techniques. The deliverables of your work will be high level scientific publications, a computer code for producing landscape characteristics and inferring landscape-regulation links, and a dynamic map of potential natural regulation (and its counterpart, namely pest risk).

Profil du candidat :

Formation et compétences requises :
Background in quantitative ecology, community ecology, statistics or other related domains that led you to work on interacting processes and to analyze complex data.

Adresse d’emploi :
https://jobs.inrae.fr/en/ot-22941

Assimilation de données de phénotypage numérique par deep learning pour la simulation d’un modèle Structure-Fonction 3D d’arbres fruitiers

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR AGAP Institut, CIRAD, Montpellier
Durée : 6 mois
Contact : frederic.boudon@cirad.fr
Date limite de publication : 2024-12-30

Contexte :
Pour analyser finement le fonctionnement et la croissance des plantes, les modèles structure-fonction de plantes (FSPM) prennent en compte la structure modulaire des plantes, leur distribution spatiale 3D, leur fonctionnement interne en interaction avec l’environnement (Prusinkiewicz, 2004 ; Fourcaud et al., 2008 ; Louarn et Song 2020). Leur développement est motivé par l’idée que la structure tridimensionnelle des plantes forme son interface avec l’environnement et module sa croissance et sa productivité (Costes et al., 2006). Ils ont notamment été utilisés pour la modélisation d’arbres fruitiers (Costes et al., 2008 ; Allen et al., 2005 ; Lescourret et al., 2011 ; Boudon et al., 2020) chez lesquels la compétition interne pour les ressources entre organes nécessite d’avoir des représentations dynamiques spatialisées. Un verrou majeur de cette approche est la paramétrisation du modèle qui rend difficile son adoption pour construire des outils d’aide à la décision pour la gestion des vergers (DeJong, 2019) et plus généralement qui freine son utilisation dans la communauté scientifique.

La télédétection, couplée au traitement de données par deep learning, ont un potentiel important pour aider à la caractérisation du fonctionnement et de la croissance des plantes et donc paramétrer de tels modèles. En particulier, la disponibilité récente de caméras (RGB, Lidar, thermique, etc.) et vecteurs (drone, phénomobile, etc) permet d’envisager des solutions innovantes pour le phénotypage haut débit et le suivi des cultures. Récemment de nombreuses initiatives visent à automatiser le phénotypage des plantes, mais se concentrent sur un ensemble limité de traits, souvent peu compatible avec la définition d’un FSPM (Streit et al., 2023). L’objectif de ce stage est de rapprocher méthodes de phénotypage haut débit des vergers et construction d’un modèle 3D détaillé d’arbres fruitiers, en prenant comme cas d’application les pommiers.

Sujet :
L’objectif premier de ce stage sera d’extraire des règles de développement et de ramification à partir de reconstructions 3D issues de scans LiDAR en hiver par des méthodes d’assimilation de données, basées sur du machine ou deep learning (i.e. CNNS, RNNs, LSTMs et Transformers). Le second objectif sera de réaliser une première étape de reformulation d’un modèle FSPM d’arbre fruitier, MAppleT (Costes et al., 2008) pour préparer son couplage avec les données numériques issues de différents protocoles d’acquisition (LiDAR, imagerie aéroportée).

• Le stage débutera par une analyse bibliographique des traits accessibles par phénotypage pour la modélisation structure-fonction. Un bilan sera fait des différents traits mesurés par phénotypage LiDAR et imagerie qui seront mis en regard des paramètres des modèles de simulation. En particulier, les aspects de topologie de l’architecture des arbres, notamment leur ramification seront analysés.
• A partir de reconstructions issues de scans LiDAR en hiver, des méthodes d’assimilation de données, basées sur des méthodes de machine ou deep learning, pour permettre de reproduire les séquences d’événements développementaux observées en fonction des génotypes, seront développées. Pour modéliser et simuler ces séquences, différents types d’architecture de réseaux seront testés, (i.e. CNNS, RNNs, LSTMs et Transformers). Les séquences déduites de la reconstruction 3D devront prendre en compte l’incertitude des mesures. Les modèles initiaux de séquences de ramification, construits à partir de modèles de semi chaînes de Markov cachées, seront utilisés pour pré-entraîner les modèles de réseaux. Ceux-ci seront évalués pour leur capacité à prendre en compte les effets génotypiques.
• Le FSPM MappleT sera ensuite modifié pour prendre en compte ce nouveau type de modélisation des paramètres de ramification, basé sur la donnée. Des validations en termes de quantité d’organes reconstruites, de volume de plantes, etc. seront mise en place.

Profil du candidat :

Formation et compétences requises :
– Dernière année de Formation Supérieure BAC + 5
– Connaissances : Master en maths-infos, programmation en langage Python, des connaissances en statistiques seront appréciées
– Compétences opérationnelles : Goût pour le travail en équipe et l’inter-disciplinarité
– Langues : français, anglais

Adresse d’emploi :
Avenue Agropolis TA A-108 / 01
34398 Montpellier Cedex 5, France

Document attaché : 202410090946_stageM2-assimilation-vf.pdf

Anchor-free small ship detection from Sentinel-2 images

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA, Université Bretagne Sud
Durée : 6 mois
Contact : minh-tan.pham@univ-ubs.fr
Date limite de publication : 2024-12-31

Contexte :
For information, please consult the offer on this link:
http://www-obelix.irisa.fr/files/2024/10/Master_topic_ship_detection_2024.pdf

Sujet :
Keywords: Deep learning, small object detection, anchor-free detection, ship detection, Sentinel-2

Profil du candidat :
Student Master 2, Ecole d’Ing´enieur or equivalent with excellent academic track;
Ability to communicate in English;

Formation et compétences requises :
Background in computer science and/or machine/statistical learning and/or applied mathematics for signal and image processing;
Excellent programming in Python (familiar with one of deep learning packages is a must,
preferable PyTorch).

Adresse d’emploi :
The expected intern will join the OBELIX research group (www.irisa.fr/obelix) from IRISA (UMR 6074) is located in the UBS (Universit´e Bretagne Sud) campus in Vannes 56000, France.

Document attaché : 202410090849_Master_topic_ship_detection_2024.pdf

Learning with heavy-tailed inputs: Out-of-domain Generalization on Extremes

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire MAP5, Université Paris-Cité,
Durée : 4-6 months + opportu
Contact : anne.sabourin@u-paris.fr
Date limite de publication : 2025-05-04

Contexte :
The internship is intended to lead to a PhD thesis if everything goes as planned. The PhD will be funded by the ANR project EXSTA led by A. Sabourin. The Phd Candidate will benefit from interactions with other researchers in the field e.g. through workshops organised within the project’s framework, in addition to usual participation in conferences.

Sujet :
Context: Extreme Value Theory (EVT) is a field of probability and statistics concerned with tails of distributions, that is, regions of the sample space located far away from the bulk, associated with rare and extreme events. Poviding probabilistic descriptions and statistical inference methods for the tails requires sound theoretical assumptions pertaining to the theory of regular variation and maximum domains of attraction, ensuring that a limit distribution of extremes exists. This setting encompasses a wide range of applications in various disciplines where extremes have tremendous impact, such as climate science, insurance, environmental risks and industrial monitoring systems [1].

In a supervised learning framework, the goal is to learn a good prediction function to predict new, unobserved labels. In many contexts (covariate-shifts, climate change), extrapolation (or out-of-sample) properties of the predictors thus constructed are crucial, and obtaining good generalization properties on unobserved regions of the covariate space is key. Recently, there has been significant interest in the ML literature regarding out-of-domain generalization (see e.g. [2]).

Recent works [3,4,5] focus on the problem of learning a tail predictor based on a small of the most, with non-asymptotic guarantees regarding the risk on extreme regions . For simplicity, the theoretical study in both works is limited to Empirical Risk Minimization (ERM) algorithms without a penalty term. In addition, the regression problem analysed in [5] covers least squares regression only. Also, with heavy-tailed targets, non-linear transformations of the target are required in order to satisfy boundedness assumptions.

Research Objectives: The general purpose of this internship and subsequent thesis is to extend the scope of applications of the supervised learning methods described above to a wider class of learning algorithms. One main limitation of least squares regression is that the optimal predictor (i.e. the conditional expectation given the covariate) is not invariant under non-linear transformations of the target. As a starting point, the least-squares framework will be extended to the quantile regression framework which, in contrast to least squares, is compatible with non-linear transformations. From a statistical learning perspective, we shall extend the ERM framework considered thus far to encompass penalized risk minimizations procedures amenable to high dimensional covariates or non-linear regression functions. SVM quantile regression [6] is a natural candidate for this purpose. The goal will be to obtain finite sample guarantees on the generalization error of quantile regression functions learnt with the a subsample made of the largest observations and hopefully recover learning rates of comparable order as the ones obtained in the classical framework, with the full sample size n replaced with the reduced sample size. The bottleneck is that these largest observations may not be considered as an independent sample because they are order statistics of a full sample. However it is anticipated that proof techniques from recent works [7,8,9] based on conditioning arguments and concentration inequalities incorporating (small) variance terms can be leveraged for this purpose.

References
[1] Beirlant, J., Goegebeur, Y., Segers, J., and Teugels, J. L. (2004). Statistics of Extremes: Theory and
Applications, volume 558. John Wiley & Sons.

[2] Zhou, K., Liu, Z., Qiao, Y., Xiang, T., and Loy, C. C. (2022). Domain generalization: A survey. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 45(4):4396–4415.

[3] Jalalzai, H., Clémençon, S., and Sabourin, A. (2018). On binary classification in extreme regions. In
NeurIPS Proceedings, volume 31.

[4] Clémençon, S., Jalalzai, H., Lhaut, S., Sabourin, A., and Segers, J. (2023). Concentration bounds for the
empirical angular measure with statistical learning applications. Bernoulli, 29(4):2797–2827.

[5] Huet, N., Clémençon, S., and Sabourin, A. (2023). On Regression in Extreme Regions. arXiv preprint
arXiv:2303.03084.

[6] Takeuchi, I., Le, Q. V., Sears, T. D., Smola, A. J., and Williams, C. (2006). Nonparametric quantile
estimation. Journal of machine learning research, 7(7).

Supervisory Team/contact: Anne Sabourin (MAP5, Université Paris-Cité), Clément Dombry (LMB, Université de Franche-Comté)

Profil du candidat :
Master’s student (2nd year) in Applied Mathematics/Statistics/Statistical Machine Learning with an excellent track record and a strong interest for mathematical statistics and learning theory. Some knowledge of R or Python.

Application to the PhD thesis from candidates having already graduated from a Master’s program will also be considered.

Formation et compétences requises :
Being enrolled in or having graduated from a Master’s program in Mathematics/Statistics/Statistical Machine Learning

Adresse d’emploi :
Laboratoire MAP5, Université Paris Cité, 45 rue des Saint Pères, Paris.

Document attaché : 202410081334_offreStage2024.pdf

Détection automatique d’interaction médicamenteuse en réanimation médicale

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube
Durée : 6 mois
Contact : nicolas.lachiche@unistra.fr
Date limite de publication : 2025-05-04

Contexte :
Collaboration avec le service de réanimation de l’hôpital de Hautepierre à Strasbourg

Sujet :
Description de l’offre

Les patients admis en réanimation médicale sont souvent atteints de maladies graves, voire potentiellement mortelles, nécessitant de multiples traitements. L’incidence des interactions médicamenteuses y est donc élevée, avec des conséquences parfois sévères, telles qu’une exacerbation des effets secondaires ou une augmentation de la toxicité des médicaments.
De plus, ces patients présentent fréquemment des insuffisances rénale et/ou hépatique, ce qui peut entraîner des surdosages médicamenteux en raison d’une élimination altérée. Cela complexifie davantage la tâche du prescripteur, qui doit quotidiennement évaluer le rapport bénéfice/risque des traitements administrés.
Aujourd’hui, un grand nombre de données sont automatiquement collectées chez les patients de réanimation. L’objectif de ce stage est d’utiliser ces informations pour apprendre à détecter les interactions médicamenteuses et ainsi assister le clinicien dans ses décisions thérapeutiques.
Dans le cadre de ce projet, nous nous concentrerons sur l’allongement de l’intervalle QT comme indicateur mesurable des interactions médicamenteuses touchant le cœur. Cet intervalle, mesuré sur l’électrocardiogramme, est influencé par de nombreux facteurs et médicaments (CredibleMeds). En cas d’allongement excessif, il peut induire des troubles du rythme cardiaque
potentiellement mortels.

Travail à réaliser

– Calculer l’intervalle QT à partir des électrocardiogrammes en utilisant les librairies de traitement
du signal existantes
– Vérifier l’influence de situations et médicaments connus sur le QT extrait des bases de données
– Identifier et extraire les médicaments et autres informations pertinentes des données
– Utiliser des algorithmes d’apprentissage machine pour prédire la variation du QT

Profil du candidat :
Bac +4-5 en informatique, science des données, intelligence artificielle, apprentissage automatique

Formation et compétences requises :
Python et les librairies classiques de l’apprentissage profond et des séries temporelles

Adresse d’emploi :
ICube
300 Boulevard Brant
67412 Illkirch

Document attaché : 202410071201_StageM2_Interactions2024.pdf

Postdoc – Temporal Graph Auto-Encoders for Anomaly Detection in Industrial Internet of Things

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC – Univ. Littoral Côte d’Opale
Durée : 24 months
Contact : esteban.bautista@univ-littoral.fr
Date limite de publication : 2024-11-15

Contexte :
The Industrial Internet of Things (IIoT) connects industrial devices, sensors, and machines to the internet, facilitating real-time data exchange. Detecting anomalies in IIoT systems is critical for ensuring security and operational efficiency. Anomalies can arise from two main data sources: communication logs, where devices are vulnerable to attacks or intrusions, and measurements, where equipment issues can disrupt production. While IIoT data can be very well modeled as an attributed temporal graph, most approaches tackle the above challenges using graph or time-series approaches, which often results in loss of important information. This postdoc project proposes to develop new algorithms that directly analyze temporal graphs, capturing both dynamic and structural information to improve anomaly detection in IIoT systems.

Sujet :
The recruited postdoc will collaborate with us on three research axes:
————————–
1. Temporal graph-based auto-encoder architecture.

We aim to build an anomaly detector based on an auto-encoder architecture that extends time-series and static graph ones to temporal graphs. We plan to address this challenge by building upon recent results that combine graph theory and signal processing into a unified formalism for temporal graphs.

————————–
2. Detection of network intrusions and attacks in communication logs.

We plan to evaluate the proposed architecture in real-world IIoT traffic datasets that capture various types of intrusions and
attacks. We would like in particular to exploit the properties of the latent space to localize the anomalous temporal graph region.

————————–
3. Detection of faults in IIoT measurements.

We aim to explore whether capturing the non-stationary dependencies of sensor measurements through temporal graphs can enhance the time-space localization of anomalies in applications such as machine health monitoring and transportation network monitoring.

Profil du candidat :
We look for highly motivated candidates with relevant experience in anomaly detection, graph machine learning, and/or deep learning. Experience in Python programming, cybersecurity and/or streaming algorithms is a plus. Ideal candidates will have a publication record in selective AI conferences.

Formation et compétences requises :
PhD in computer science or related fields.

Adresse d’emploi :
Saint-Omer, France

Document attaché : 202410062130_postdoc_ADIIOT_description_.pdf

PPR Océan & Climat : Appel à propositions de data challenges.

Date : 2024-10-04 => 2026-10-04

Chers collègues,

Nous avons le plaisir de vous annoncer le lancement d’une action IA dans le cadre du PPR Océan & Climat (https://www.ocean-climat.fr/). Cette action nationale vise à soutenir le développement de solutions nativement IA pour la modélisation, la prévision et l’observation des océans.

Suivant une démarche inspirée des avancées récentes pour la prévision météorologique court-terme, la première phase (octobre 2024-septembre 2025) visera via un appel à propositions à définir de manière collaborative des “data challenges” dont la mise en oeuvre (e.g., jeux de données, cadre d’évaluation) bénéficiera du soutien du PPR en termes d’ingénierie support. La deuxième phase (septembre 2025-décembre 2027) s’appuiera sur la sélection de 8 à 9 postdoctorats de deux ans pour laquelle un appel sera ouvert début 2025.

Nous organisons deux webinaires les 4/10 et 11/10 (12.00-13.00) pour présenter cette action et répondre à toute question (cf. lien zoom ci-dessous). Nous vous invitons également à rejoindre un espace slack dédié en complétant le formulaire d’inscription ci-dessous. Nous proposons que cet espace slack soit la plateforme principale pour les échanges autour de cette action.

Merci de faire suivre ce mail à toute personne potentiellement intéressée.
N’hésitez pas à me contacter pour tout complément d’information.

Bien cordialement,
Ronan Fablet pour le comité de suivi

Exemples de data challenges:

– WeatherBench 2.0 : https://sites.research.google/weatherbench/
– Ocean Data Challenge – Global SSH mapping: https://2023a-ssh-mapping-ose.readthedocs.io/en/latest/

Dates importantes :
– 4 et 11 Octobre 2024, 12.00-13.00: wébinaires (cf. lien zoom ci-dessous)
– 18 Octobre 2024 : date limite de proposition de “data challenges”
– 19 Octobre – 22 Novembre 2024 : mise en commun et révision des data challenges proposés
– 13 Décembre 2024 : publication des data challenges sélectionnés
– Janvier 2024 : ouverture de l’appel postdocs
– Septembre 2025 : démarrage des postdocs et workshop de lancement des data challenges

Formulaire d’inscription : https://forms.gle/R7QhGe4VwBrXXPWV7
Lien zoom du webinaire du 04/10/2024, 12.00-13.00:
https://cnrs.zoom.us/j/91635362763?pwd=bv146gsjDkT9SQ7lUcxHY1n4bi0jpU.1

Lien zoom du webinaire du 11/10/2024, 12.00-13.00:
https://univ-grenoble-alpes-fr.zoom.us/j/93226799086?pwd=agYwgn1IYRYhwD3x63VXyhCSfRZDns.1

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Stage M2 au CEA : Nouvelles approches par apprentissage statistique profond pour l’identification structurale de biomarqueurs en métabolomique par spectrométrie de masse

Offre en lien avec l’Action/le Réseau : DSChem/– — –

Laboratoire/Entreprise : CEA
Durée : 6 mois
Contact : etienne.thevenot@cea.fr
Date limite de publication : 2024-11-30

Contexte :
La spectrométrie de masse haute résolution couplée à la chromatographie liquide (LC-HRMS) est une technologie puissante en santé pour détecter et caractériser l’ensemble des petites molécules dans un échantillon biologique (métabolomique), afin de découvrir de nouveaux biomarqueurs et médicaments. L’identification des métabolites (i.e. la détermination de leur structure 2D) à partir de l’analyse du spectre de masse obtenu après fragmentation du composé (MS/MS) représente un défi majeur en raison de la taille limitée des bases de données de spectres de référence expérimentaux comparée à la diversité chimique du métabolome. C’est pourquoi les approches in silico, et en particulier les méthodes d’apprentissage statistique se sont développées ces dernières années [1] pour prédire à partir d’un spectre MS/MS (liste de pics correspondant à des couples « masse, intensité ») une représentation de la molécule et/ou de son processus de fragmentation en sous-structures sous forme de descripteurs chimiques ou de chaine de caractères (e.g. SMILES). Toutefois, les performances des modèles actuels restent limitées à 26% de prédiction correcte de la structure 2D. Pour enrichir l’information chimique dans les spectres MS/MS, notre laboratoire a développé de nouvelles approches expérimentales multiplexées qui permettent d’acquérir en parallèle une grande quantité de spectres sur le même composé dans des conditions de fragmentation distinctes.

Sujet :
L’objectif du stage est de développer de nouveaux modèles d’apprentissage profond pour l’identification structurale à partir des données MS/MS multiplexées. A partir d’une base de données originale de composés récemment caractérisés expérimentalement de manière approfondie au laboratoire, les performances prédictives des modèles de l’état de l’art seront d’abord évaluées (e.g. par prédiction de descripteurs chimiques ou de SMILES grâce à un transformer ou un auto-encoder [2]). Un nouveau type d’architecture sera ensuite développé pour intégrer l’ensemble des informations multiplexées et montrer leur impact sur la qualité de la prédiction. L’ensemble des algorithmes seront implémentés avec les librairies PyTorch et RDKit notamment, et appliqués à la recherche de biomarqueurs dans les données de plusieurs cohortes cliniques disponibles au laboratoire.
Mots clés : apprentissage statistique, théorie des graphes, chimie numérique, spectrométrie de masse, santé
Références :
[1] Liu et al. (2021) Current and future deep learning algorithms for tandem mass spectrometry (MS/MS)-based small molecule structure elucidation. Rapid Commun Mass Spectrom, DOI:10.1002/rcm.9120.
[2] Russo et al. (2024) Machine learning methods for compound annotation in non-targeted mass spectrometry—A brief overview of fingerprinting, in silico fragmentation and de novo methods. Rapid Commun Mass Spectrom. DOI: 10.1002/rcm.9876.

Profil du candidat :
Nous recherchons un.e candidat.e avec un bon dossier en mathématiques appliquées (apprentissage statistique, théorie des graphes) et motivé.e par les applications multidisciplinaires (chimie, physique, biologie).

Formation et compétences requises :

Adresse d’emploi :
Le stage s’effectuera au centre CEA de Saclay, dans l’équipe science des données métabolomiques du laboratoire Innovations en Spectrométrie de Masse pour la Santé.
Merci d’adresser votre candidature (CV détaillé, lettre de motivation, notes de licence et master et nom de deux référents) à :
Etienne Thévenot (etienne.thevenot@cea.fr)
Equipe sciences des données (https://odisce.github.io)
Laboratoire Innovations en Spectrométrie de Masse pour la Santé (LI-MS)
UMR Médicaments et Technologies pour la Santé (MTS)
CEA, Centre de Saclay, F-91191 Gif sur Yvette, France

Document attaché : 202410041921_240924_stage_M2_cea_ai-ms2_EThevenot.pdf

1st cfp: 14th IAPR-TC15 International Workshop on Graph-Based Representations in Pattern Recognition

Date : 2025-06-25 => 2025-06-27
Lieu : Caen, France.

Dear All,

We are pleased to announce the first call for papers for the upcoming IAPR Workshop on Graph-Based Representations in Pattern Recognition (GbRPR). The workshop will be held in Caen, France, from June 25 to June 27, 2025. The scope of GbR2025 includes, but is not limited to, the following topics :

  • Data mining on/with graphs
  • Deep learning on graphs: Graph Neural Networks, Graph pooling, Graph autoencoders, …
  • Graph Signal Processing
  • Graph matching and classification
  • Graph distance and similarity measures
  • Graph kernels and graph embeddings
  • Graphs in bioinformatics/chemoinformatics
  • Graphs in social network analysis
  • Graph-based methodologies for pattern recognition
  • Graph-based learning and clustering
  • Graph based image segmentation
  • Irregular (graph) pyramids
  • Graph representation of images and shapes
  • Other graph-based applications in pattern recognition

GbR has been a biannual event for nearly 30 years and has consistently served as a meeting place for algorithmic and machine learning approaches dealing with data defined either on a graph or by a graph.
Scientific applications of our methods is wide but concern primarily domains like the one addressed by DSchem, where structural information between objects is a key information.

The proceedings of the workshop will be published in the LNCS series, and we are currently in discussions with Pattern Recognition Letters to create a special virtual issue related to GbR topics following the workshop. The workshop will include two invited talks on Graph matching (provided by Christine Solnon) and ML on graphs. The planned registration fees are approximately 100 €.

Important dates

  • Paper submissions due: February 3, 2025
  • Notification of acceptances: March 3, 2025
  • Final camera-ready papers due: April 1, 2025
  • Registration: June 2, 2025

Please do not hesitate to submit papers and/or join us for three days of intense scientific activity in a warm atmosphere.

Regards,

Luc Brun, Benoit Gaüzère, Sébastien Bougleux, Vincenzo Carletti.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.