Quantum Chemistry meets Deep Learning

Offre en lien avec l’Action/le Réseau : DSChem/Doctorants

Laboratoire/Entreprise : Laboratoire d’Informatique et des Systèmes (LIS,
Durée : 6 mois
Contact : thierry.artieres@lis-lab.fr
Date limite de publication : 2024-02-16

Contexte :
This internship is part of a collaboration between the CT/ICR and QARMA teams at LIS that aims to promote artificial intelligence (AI) solutions in chemical research at Aix Marseille Université (AMU), a field that is still largely unexplored by the local chemical community. The simplified context of the study is as follows. The object of study for this project is the prediction of quantities of interest for a given molecule. The molecule corresponds to an assembly of atoms interacting via bonds, which possesses a certain energy E as a function of the geometry of the molecule (relative positions of the various atoms), and which is subjected to a force F. The aim is to predict not only the energy E but also the forces F as a function of G. Two features are important in devising a model for predicting the quantities E and F. Firstly, F is equal to the gradient of the energy E. Secondly, there are several energy surfaces of E as a function of G. These surfaces are continuous. During the evolution of a molecule, its geometry can evolve, and there can be a jump from one surface to another e,n a geometry G, all the more likely as the two curves are close for this geometry.

Sujet :
From a Machine Learning point of view, the problem may be viewed as a prediction task where one wants to predict an energy function from the geometric characteristics of a molecule, but also to predict the gradient of this energy finely, for which one also has supervision. Finally, it is a problem that can be modelled as multi-task learning, since it involves predicting several energy surfaces simultaneously.

The aim of the internship is, starting from recent approaches proposed in the field [Batalia et al., 2022, Batzner et al., 2022, Gilmer et al., 2017, Satoki et al., 2024, Thölke et al., 2022], to test and compare them experimentally and then to propose an innovative approach that will enable us to overcome their limitations. We will be able to draw on recent ideas such as multitask learning [Crawshaw, 2020] and gradient learning [Wu et al., 2010], approaches that have not received much attention in the literature.

On the one hand, multitask learning is a paradigm in which several tasks are learned simultaneously to improve the generalisation performance of a learning task using other related tasks. While the typical protocol is to train a model independently to predict energy, gradient it may be beneficial to exploit multitask extensions, which have not been employed to date in this type of domain.

On the other hand, gradient learning is a little-known but potentially valuable framework in which the objective is to learn the gradient of a classification or regression function, with or without supervision. In addition to conventional energy learning using gradient information, we will explore strategies based on explicit learning of the gradient function, starting with neural networks in a multi-output, multi-task framework and extending to other designs.

Références

[Batatia et al., 2022] Ilyes Batatia, Dávid Péter Kovács, Gregor N. C. Simm, Christoph Ortner, Gábor Csányi: MACE: Higher Order Equivariant Message Passing Neural Networks for Fast and Accurate Force Fields. NeurIPS 2022
[Batzner et al., 2022] Batzner, S., Musaelian, A., Sun, L. et al. E(3)-equivariant graph neural networks for data-efficient and accurate interatomic potentials. Nat Commun 13, 2453 (2022). https://doi.org/10.1038/s41467-022-29939-5
[Crawshaw, 2020] Crawshaw, M. arXiv 2020.Multi-Task Learning with Deep Neural Networks: A Survey, https://doi.org/10.48550/ARXIV.2009.09796
[Gilmer et al., 2017] Justin Gilmer, Samuel S. Schoenholz, Patrick F. Riley, Oriol Vinyals, George E. Dahl: Neural Message Passing for Quantum Chemistry. ICML 2017: 1263-1272
[Satoki et al., 2024] Satoki Ishiai, Ikki Yasuda, Katsuhiro Endo, and Kenji Yasuoka, Graph-Neural-Network-Based Unsupervised Learning of the Temporal Similarity of Structural Features Observed in Molecular Dynamics Simulations, Journal of Chemical Theory and Computation 2024 20 (2), 819-831
[Thölke et al., 2022] Philipp Thölke, Gianni De Fabritiis, Equivariant Transformers for Neural Network based Molecular Potentials. ICLR 2022
[Wu et al., 2010] Qiang Wu, Justin Guinney, Mauro Maggioni, Sayan Mukherjee: Learning Gradients: Predictive Models that Infer Geometry and Statistical Dependence. J. Mach. Learn. Res. 11: 2175-2198 (2010)

Profil du candidat :
Computer science or data science master 2
Last year engineering school

Formation et compétences requises :
Programning : python and deep Learning platform (pytorch or tensorflow)
Machine Learning and deep learning basics

Adresse d’emploi :
Pole scientifique de Chateau Gombert
Marseille

Poste MCF 27 (UFR Économie et gestion) – Informatique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’informatique et des systèmes (LIS)
Durée : Campagne synchronisé
Contact : secretariat@lis-lab.fr
Date limite de publication : 2024-02-16

Contexte :
Profil recherche :

Le pôle Science des Données ou SD (environ 50 enseignants-chercheurs répartis en 6 équipes de recherche) est l’un des quatre pôles autour desquels le Laboratoire d’informatique et des systèmes (LIS, UMR87020) est structuré. Il a pour ambition de réunir des chercheurs autour des problématiques centrées sur les données, d’un point de vue informatique, qu’il s’agisse de leur représentation, de leur manipulation ou de leur traitement.

Profil enseignement :

Les enseignements se dérouleront à la Faculté d’Économie et de Gestion (FEG) sur les sites d’Aix-en-Provence et de Marseille-Centre.

Sujet :
Profil recherche :

Le pôle SD souhaite par ce poste renforcer ses travaux sur les thèmes de la recherche d’information et du traitement automatique des langues, croisant des problématiques issues de l’apprentissage machine, de la fouille de textes, de l’interaction humain-machine et des sciences cognitives. Les applications mises en avant sont celles liées aux humanités numériques, à l’éducation et à la santé, en connexion avec les intérêts stratégiques de l’établissement. Les thèmes suivants sont privilégiés :
• Le développement de méthodes centrées sur les utilisateurs pour l’accès à l’information avec les nouveaux modèles de traitement du langage naturel, comme les grands modèles de langue. L’impact de ces modèles sur la question de la factualité et de la désinformation. Leur interaction avec la diversité des modalités du monde réel et leur évaluation dans le cadre d’agents incarnés comme les robots humanoïdes.
• La redéfinition de la notion de pertinence sous le prisme de la subjectivité, à travers par exemple l’analyse de sentiment multimodale. L’accès à l’information multimodale (texte, image, vidéo) et la prise en compte de l’état de l’utilisateur de manière multimodale (suivi du regard, ECG, EEG).
• La définition de modèles et de ressources informatisées pour étudier l’acquisition du langage, les processus cognitifs de lecture et de production langagière guidés par des biais inductifs liés aux sciences cognitives.

L’objectif de ce recrutement est donc de renforcer l’une des équipes du pôle SD sur la thématique Langage, Interactions et Recherche d’Information. Le critère majeur de sélection sera l’excellence scientifique.

Profil enseignement :

Au niveau licence, les besoins en enseignement correspondent aux cours d’informatique dispensés classiquement dans les premières années des filières « économie et gestion » : introduction à l’informatique, environnements techniques et applicatifs Internet, tableurs, bases de données, programmation Python.

Étant donnée l’offre de formation de la FEG, les besoins de licence sont à compléter avec ceux qui apparaissent au niveau Master dans le domaine du numérique : systèmes d’information, base de données structurées et semi-structurées (SQL/NoSQL), ingénierie des données, visualisation, interface humain-machine, ergonomie, programmation web et mobile.

Une caractéristique importante liée à ce poste se situe dans le suivi de la professionnalisation des étudiants de la faculté et plus particulièrement de certains Master : suivi d’alternants, relations avec les entreprises d’accueil, conseil de perfectionnement, formation continue et apprentissage… Plusieurs expériences dans tout ou partie de ces domaines sont souhaitables.

Enfin, il est attendu des candidats.es une bonne capacité à utiliser des formes vairées de pédagogies : pédagogie inversée, hybride, sur plateforme… Toutes les expériences dans ces domaines valoriseront la candidature.

Profil du candidat :
L’objectif de ce recrutement est de renforcer l’une des équipes du pôle SD sur la thématique Langage, Interactions et Recherche d’Information. Le critère majeur de sélection sera l’excellence scientifique.

Formation et compétences requises :
Titulaire d’un Doctorat en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
LIS UMR 7020 CNRS / AMU / UTLN
Aix Marseille Université – Campus de Saint Jérôme – Bat. Polytech
52 Av. Escadrille Normandie Niemen
13397 Marseille Cedex 20

Ecole thématique Masses de données

Date : 2024-06-23 => 2024-06-27
Lieu : Ceillac-en-Queyras

The thematic school ‘Masses de Données’ (MDD) originates from the research community in databases. Its aim is to strengthen the educational component (tutorials) within an independent event, leading to the creation of the MDD summer-school.
Our thematic school aims to shed light on various societal issues by inviting experts from various computer science and legal disciplines. The general theme, “Responsible data management,” will be divided into the following 5 axe.

Please join us with the provided link.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Un poste de Professeure Assistante ou Professeur Assistant en Apprentissage Statistique ou Science des données

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : École polytechnique
Durée : CDI
Contact : Erwan.Le-Pennec@polytechnique.edu
Date limite de publication : 2024-03-20

Contexte :
Le département de mathématiques appliquées de l’École Polytechnique est susceptible de recruter une professeure assistante ou un professeur assistant en apprentissage statistique ou sciences des données à compter du 1ᵉʳ septembre 2024. Il s’agit d’un poste permanent à temps plein en tant qu’enseignant-chercheur de l’École polytechnique.

L’ouverture de ce poste repose sur une activité croissante dans ces domaines, aussi bien pour la recherche au CMAP, le laboratoire de Mathématiques Appliquées de l’École polytechnique, que pour l’enseignement dans le département de Mathématiques Appliquées.
Le CMAP à travers l’équipe SIMPAS (Statistique, Image, Probabilité numérique, Apprentissage et Simulations) est un centre de premier plan dans ce domaine.

L’École polytechnique offre une rémunération attractive (dépendant de l’expérience) ainsi qu’un environnement exceptionnel aussi bien pour l’enseignement, avec une charge réduite et le contact avec de brillants élèves/étudiants, que pour la recherche avec le soutien (scientifique, administratif et budgétaire) du CMAP. Elle donne ainsi à ses professeures assistantes et professeurs assistants d’excellentes conditions pour la préparation d’une habilitation à diriger des recherches.

Sujet :
Le laboratoire cherche à renforcer son équipe autour de la théorie de l’apprentissage statistique au sens large, qui constitue la thématique de recherche mise en avant pour ce recrutement. Le département est néanmoins ouvert à des profils d’excellent niveau sur des thématiques connexes, par exemple autour de la science des données.

Profil du candidat :
Un doctorat en mathématiques appliquées / statistiques / apprentissage automatique ou dans des domaines connexes est requis. Une grande importance sera accordée à la capacité de la candidate ou du candidat à travailler en équipe.
Il/Elle mènera ses recherches au CMAP dans l’équipe SIMPAS. Le candidat ou la candidate devra présenter un projet scientifique détaillé démontrant comment son activité de recherche renforcera celle déjà existante en apprentissage statistique ou science des données (elle/il est fortement encouragée/encouragé à contacter les membres du CMAP pour discuter du projet de recherche).
Elle/Il devra être capable de contribuer à l’enseignement des mathématiques appliquées, des statistiques et de l’apprentissage automatique à tous les niveaux de formation (licence, cycle ingénieur polytechnique, master, voire MOOC et Executive Education). Il/Elle devra s’intégrer dans les équipes pédagogiques des cours fondamentaux de mathématiques appliquées et des cours plus spécialisés. Sa capacité à contribuer à la pédagogie par projet et à renforcer les liens entre enseignement, recherche et applications sera un élément important de la candidature.

Formation et compétences requises :
Un doctorat en mathématiques appliquées / statistiques / apprentissage automatique ou dans des domaines connexes est requis.

Adresse d’emploi :
Ecole polytechnique
Route de Saclay
91128 PALAISEAU

Document attaché : 202402141556_Profil ML 2024 – Ecole polytechnique.pdf

GRASEC 2024 Call for papers

Date : 2024-07-30 => 2024-08-02
Lieu : Vienne Autriche

The 5th International Workshop on Graph-based Approaches for CyberSecurity to be held in conjunction with the 19th International Conference on Availability, Reliability and Security
Vienna, Austria
July 30 – August 02, 2024

Topics of interest include, but are not limited to

Knowledge graphs and ontologies of cyberspaces and digital twins
Attack graphs modeling and application, graph-based threat assessment
Graph-based models for network modeling and cyber situational awareness
Graph-based approaches to network traffic analysis and forensics
Intrusion, anomaly, and botnet activity detection using graph data
Graph-based anomaly detection for network security and management
Graph application in access controls, security policies
Graph-based malware detection
Autoencoders and representation learning for graphs and knowledge graphs
Graph embedding techniques for network security and management problems
Graph databases and graph-based tools for security data analysis
Visualization and analysis of dynamic large-scale graphs and graph streams
Novel applications of static/dynamic and large graphs in network security and management

IMPORTANT DATES
Submission Deadline: April 29, 2024
Author Notification: May 29, 2024
Proceedings Version: June 18, 2024
Workshop days: July 30 – August 02, 2024

The submission guidelines valid for the workshop are the same as for the ARES conference. They can be found at https://www.ares-conference.eu/conference/submission/.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Sixième édition du Symposium MaDICS

Présentation

La sixième édition du Symposium MaDICS aura lieu en présentiel à Blois sur le site Jean Jaurès de l’IUT de Blois les 29 et 30 mai 2024. Il a pour objectif de réunir la communauté MaDICS à l’occasion de conférences scientifiques invitées, de sessions dédiées aux Actions et Ateliers du GDR, mais également d’une demi-journée plus spécialement à destination des doctorants et jeunes chercheurs (cf Appel à posters)… et bien sûr de nombreux moments de convivialité !

Pour vous inscrire au Symposium vous devez vous inscrire à au moins une session (Action, Atelier ou Posters). Pour des raisons d’organisation, veuillez vous inscrire à toutes les actions et ateliers auxquelles vous souhaitez participer.

En espérant que vous serez nombreux pour partager ce moment ensemble.

Du : 2024-05-29
Au : 2024-05-30
Lieu : IUT de Blois, site Jean Jaurès (Comment venir)

Programme

Mercredi 29 mai 2024
9h00  Accueil et café
Atrium
9h30  Session d’ouverture
Introduction, présentation du GDR et questions
Amphi 1
10h00  Keynote Vincent Guigue (AgroParisTech)
Modèles de langue: impact sur les systèmes d’information et évolution des directions de recherche (résumé)

Amphi 1

11h00  Projet MaDICS 2025-2029 – Présentation et discussions
Comité de Direction de MaDICS, Anne Siegel (Directrice adjointe scientifique Interdisciplinarité et interfaces, CNRS Sciences Informatique)
Amphi 1
12h00  Pause repas
13h45  Mise en lumière de travaux de Jeunes Chercheuses et Chercheurs
Lucas Simonne (Ekimetrics) : Découverte de règles graduelles causales dans les graphes de connaissances (résumé)

Edwige Cyffers (INRIA) : Confidentialité différentielle pour l’apprentissage décentralisé (résumé)

Amphi 1

14h30  Session Actions et Ateliers 1
Atelier TIDS
Salle JJ010
Programme
Appel à soumission
Atelier SaD-HN
Salle JJ006
Programme
Action DSChem
Salle JJ008
Programme
16h30  Pause
16h45  Gong Show – Flash talk de doctorants
Amphi 1
17h30  Session posters
Liste des posters
Atrium
18h00  Cocktail et Posters
Atrium
19h00  Fin de la journée
 
Jeudi 30 mai 2024
9h00  Session Ateliers et Actions 2
Action BigData4Astro
Salle JJ010
Programme
Action DOING
Amphi 1
Programme
Atelier DFAe
Salle JJ008
Programme
11h00  Pause
11h15  Keynote Christelle Loiselet (BRGM)
Structuration des données en géosciences (résumé)

Amphi 1

12h15  Pause repas
14h00  Session Actions et Ateliers 3
Action SimpleText
Salle JJ010
Programme
Action Musiscale
Salle JJ006
Programme
Action HELP
Amphi 1
Programme
16h00  Fin du Symposium

Programme de l’Atelier TIDS

Appel à soumission

Mercredi 29 mai 14h30
14h30 Rappel des objectifs de l’Atelier et introduction
14h35 Présentation de Thomas Guyet (INRIA/AIstroSight)
Présentation du SNDS (SYSTÈME NATIONAL DES DONNÉES DE SANTÉ), contexte et contenu des bases de données
14h55 Présentations orales
Retours d’expérience d’utilisateurs du SNDS ou autres sources de données de santé dans le cadre d’activité de recherches en intelligence artificielle (au sens large)
16h00 Présentation de Tom Marty (Health Data Hub)
Le Health Data Hub : accélérer et faciliter l’accès aux données de santé en France
16h30 Fin

Programme de l’Atelier SaD-HN

Mercredi 29 mai 14h30
14h30 Retour sur la journée AFIA-MADICS-MAGIS “IA et Humanités Numériques”
14h45 Présentation de Cyrille Suire (L3i)
Humanités numériques au L3i : exploration et convergence interdisciplinaire
15h15 Présentation de Maxime Morge (CRIStAL)
Modélisation informatique et analyse empirique de processus sociaux au sein des communautés numériques.
Le cas de R et Pandas sur la plateforme Stack Overflow
15h45 Présentation de Yannis Addi (Archives Henri Poincaré, Nancy)
Intégrer et modéliser des connaissances : python comme outil du web sémantique
16h15 Conclusions
16h30 Fin

Programme de l’Action DSChem

Mercredi 29 mai 14h30
14h30 Introduction et rappel des objectifs de DSChem
14h40 Bertrand Cuissart
Unveiling the part played by small data in chemical sciences
15h00 Dragos Horbvath
Challenges for AI in chemistry
15h20 Gilles Marcou
Panorama des analyses pratiquées et des outils informatiques disponibles
15h20 Table ronde autour des thèmes de l’Action
16h30 Fin

Programme de l’Action BigData4Astro

Jeudi 30 mai 9h00
9h00 Introduction et présentation de l’Action
9h15 Paolo Bianchini (Observatoire Astronomique de Strasbourg)
Globular clusters: small stellar systems, big modelling challenges
9h45 Damien Gratadour (Observatoire de Paris)
L’IA temps réel
10h15 Table ronde Astro et IA
Formation, moyens humains, logiciels et matériels, aspects écologiques, …
10h45 Prochaines étapes et conclusion
11h00 Fin

Programme de l’Action DOING

Jeudi 30 mai 9h00
9h00 Mirian Halfeld Ferrari Alves (LIFO), Anne-Lyse Minard Frost (LLL), Genoveva Vargas-Solar (LIRIS)
L’Action DOING: retour d’expériences
9h30 Présentation de Francesca Bugiotti (Centrale Supélec) Bio
Named Entity Recognition using Deep Neural Networks and Large Language Models (résumé)

10h00 Présentation de Stefania Dumbrava (ENSIIE) Bio
Property Graph Schema: Specification & Discovery (résumé)

10h45 Clôture et wrap-up
Discussions sur les tendances et perspectives
11h00 Fin

Programme de l’Atelier DFAe

Jeudi 30 mai 9h00
9h00 Introduction – Objectifs de l’atelier
9h15 Keynote de Pavlo Mozharovskyi (LTCI)
Anomaly detection using data depth: multivariate case
10h00 Présentations de Benjamin Lysaniuk (PRODIG)
Analyser un risque sanitaire dans un contexte de parcimonie de données : retour sur un programme de recherche en SHS sur les expositions environnementales à l’amiante à Sibaté (Colombie)
10h30 Présentation de Hamza Chergui (Skaizen Group)
Détecter des anomalies grâce à l’apprentissage automatique et les ontologies
10h50 Discussions
11h00 Fin

Programme de l’Action SimpleText

Jeudi 30 mai 14h00
14h00 Introduction et présentation de la campagne SimpleText@CLEF
14h15 Présentation de Christophe Servan (LISN)
Passage à l’échelle des modèles de deep learning pour le texte dans le contexte industriel
15h00 Présentation de Richard Dufour (LS2N)
MALADES – Grands Modèles de Langue Adaptables et Souverains pour le Domaine Médical Français
15h45 Clôture
16h00 Fin

Programme de l’Action Musiscale

Jeudi 30 mai 14h00
14h00 Introduction
14h15 Présentation de Emmanuel Amiot (chercheur en mathématiques de la musique)
La déraisonnable efficacité de la Transformée de Fourier Discrète en théorie musicale (résumé)

15h00 Présentation de Vincent Lostanlen (CNRS)
De la diffusion en ondelettes aux réseaux de neurones multirésolution pour le traitement du signal musical (résumé)

15h45 Discussions
16h00 Fin

Programme de l’Action HELP

Jeudi 30 mai 14h00
14h00 Introduction et bilan de l’Action HELP
14h15 Tiphaine Viard (Telecom ParisTech)
Explicabilité en tant qu’objet technique et social
15h00 Elodie Escriva
Exploration d’explications
15h20 Etienne Vareille (ETIS)
Explications causales pour les données temporelles
15h40 Nicolas Ringuet (LIFAT)
Exploration d’hypothèses explicables dans le cadre de l’IA évaluative
16h00 Table ronde sur l’explicabilité
Quels challenges ? QUelles actions à mener ? Quelle forme pour les ateliers ?
16h30 Fin

Liste des Posters

Exposant Laboratoire Titre
Ahaggach Hamid Laboratoire d’informatique de Bourgogne, Université de Bourgogne, France Analyse de données basée sur l’apprentissage et les ontologies dans le domaine automobile
Aknouche Anis LIP6 Smart Zeenea : Services Intelligents pour la Maintenance et l’Enrichissement de Catalogues de Données
Bachiri Inas Je suis stagiaire au laboratoire LAMIH UMR CNRS 8201, mais ce travail est indépendent de mes activités au laboratoire. AI Explainability in Medical Imaging: A Case Study on Breast Cancer Detection
Bazouzi Aymen IRISA Precedability Prediction Between Educational Resources
Beauchamp Aymeric Laboratoire d’Informatique fondamentale d’Orléans Incremental Constrained Clustering by Minimal Weighted Modification
Bernard Charly Lastig Ontologie et méthologie de peuplement d’un référentiel géo-historique d’adresses
Boissier Fabrice LRE – Laboratoire de Recherche de l’EPITA Analyse et réutilisation de documents avec CREA : cas d’étude dans l’enseignement supérieur
Boiteau Antoine GREYC Dégradations contrôlées d’annotations portant sur des structures relationnelles
Bossut Noémie LAMSADE Gestion de la Provenance : Analyse de la Reproductibilité des Workflows Scientifiques en Bioinformatique
Combeau Alexandre EXERSYS: EXplainable RecommendER SYStem for the Nutrition Domain
Coeuret Margaux Laboratoire LIST3N équipe Technologies et Pratiques Exploration des graphes de mémos en analyse qualitative par théorisation ancrée (GTM )
Dang Trung Anh Le Laboratoire d’Informatique Fondamentale d’Orléans (LIFO) Continual Self-Supervised Learning with Efficient Buffer
Daouadi Idris LIMOS Query Answering in Incomplete Databases under Causal Specifications of Missingness Mechanisms
Diop Lamine Laboratoire de Recherche de l’EPITA Scalable Sampling for High Utility Patterns in Large Databases
Gendarme Steve GREYC UMR CNRS 6072 Exploitation des motifs fermés dans FPRS pour surmonter le problème du « cold start » dans les systèmes de recommandation
Guembour Sami LASTIG (LAboratoire en Sciences et Technologies de l’Information Géographique pour la ville intelligente et les territoires durables) Analyse sémantique computationnelle du corpus des Cahiers citoyens – Caractérisation de «corpus de petite taille» à l’aide de profils sémantiques
Guilbert Mathieu LIFO Towards Explainable Clustering: A Constrained Declarative based Approach
Kader Bochra Lamsade , Université Paris dauphine psl On Managing Dynamic Knowledge Graphs
Kamga Nguifo Durande Berluskoni Limos et Ceri-SN Motifs graduels au service de l’explicabilité des classifieurs profonds de séries temporelles
Kanouté Mamadou LIST3N – Laboratoire informatique et société numérique de l’Université de Technologie de Troyes Etude comparative des approches de résolution du covariate shift pour les problèmes de régression
Kastner Lise GREYC UMR 6072 Combining a sensitivity analysis with Bayesian optimization for setting chemical reaction parameters
Le Boudec Nathan GREYC – Orange Labs Modélisation et évaluation de l’uplift dans le cadre du multitraitement pour les systèmes de recommendation d’offres
Le Boursicaud Johan IRISA In-Database Graph Neural Networks through Views
Madad Sarra LIST3N Approche NLP de l’évaluation des performances des employés
Mbiaya Kwuite Franck Anael LIFO Knowledge Graph-Based Image Classification
Michaux Paul LIST3N Auto-encodeur pour compression de matrices de doses issues de radiothérapie du sein
Moranges Maëlle Laboratoire d’Informatique de Grenoble Decoding student learning in medical education through UNESS platform interactions
Mortelier Alexis GEYYC CONCEPTION D’UN OBSERVATOIRE DE LA TACTIQUE AU HANDBALL À BASE DE SOUS- GRAPHES DYNAMIQUES
Nespoulous Guilhem LIST3N Business process quantum digital twin
Oubelmouh Youssef LIFAT Identification des motifs séquentiels affectant l’attrition des employés
Ovide Manon LIFAT Comment rendre les graphes de connaissance plus FAIR ?
Sassi Dorra Institute for Research in Computer Science and Random Systems IRISA Modeling Human Learning through Imperfect Responses and Elicitation
Travers Nicolas DVRC SuPreME: Sequential Pattern Mining for Understanding Multiscale Seasonal Tourist Behavior
Tual Solenn LASTIG Reconstruction automatique de la généalogie des parcelles et des bâtiments à partir du cadastre ancien
Vareille Etienne ETIS (Equipes Traitement de l’Information et Systèmes) ChronoEpilogi: Scalable Time Series Selection with Multiple Solutions
Vendeville Benjamin Lab-STICC Le problème des hallucinations dans l’accès à l’information scientifique fiable par les LLMs: verrous et opportunités
Vu Thi Hai Yen LIFO – Laboratoire d’Informatique Fondamentale d’Orléans Knowledge-based graph modeling in Mineral Prospectivity Mapping
Zahouani Zineddine Laboratoire d’Informatique, de Modélisation et d’Optimisation des Systèmes (LIMOS) Hybrid reasoning and dynamic recommendations to optimize group dynamics

Appel à Posters

Nous organisons une session poster spécialement consacrée aux jeunes chercheuses et jeunes chercheurs souhaitant présenter leurs travaux en science des données et gestion de données massives. Ils auront ainsi l’occasion de rencontrer des collègues académiques et acteurs industriels intéressés par ces thématiques et présents lors de cette journée.

Soumission de poster

Pour soumettre un poster, il suffit :

Il est possible de réutiliser un poster en indiquant l’événement auquel il a déjà été présenté.

Bourses de mobilité

Le GDR MaDICS offre un certain nombre de bourses aux jeunes chercheuses et jeunes chercheurs présentant un poster, permettant de couvrir leurs frais de mission pour la participation à l’ensemble du symposium, selon les règles habituelles de la fonction publique. La demande d’une bourse doit être formulée via le formulaire de soumission de poster et avant le 30 mars 2024 10 avril 2024.

La sélection pour les posters et les bourses sera faite selon l’adéquation des travaux aux thèmes du GDR et, pour les bourses, selon le nombre de demandes par laboratoire.

Les résultats seront diffusés le 17 avril 2024.

AI4AGRI Summer School 2024

Date : 2024-05-08 => 2024-05-14
Lieu : Brasov, Roumanie

Ecole intelligence artificielle pour l’agriculture.

L’école est gratuite, les étudiants logés. En revanche, les frais de déplacements ne sont pas pris en compte par l’école.

Les financements sont Européens

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Ouverture d’un concours de chargé-e de recherche de classe normale (CRCN) en optimisation appliquée aux réseaux de capteurs

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : TSCF
Durée : Poste de permanent
Contact : francois.pinet@irstea.fr
Date limite de publication : 2024-03-10

Contexte :
Le laboratoire TSCF d’INRAE Clermont-Auvergne-Rhône-Alpes propose au concours, un poste de permanent : une ou un chargé-e de recherche de classe normale (CRCN) en optimisation appliquée aux réseaux de capteurs.

www.inrae.fr/tscf

Le profil complet est accessible ici : https://jobs.inrae.fr/concours/concours-charges-recherche-classe-normale-profil-h-f/cr-2024-mathnum-5

Attention aux modalités et à la date limite pour déposer votre dossier (c’est-à-dire la date de clôture des inscriptions) : https://jobs.inrae.fr/concours/concours-charges-recherche-classe-normale-profil-h-f

Sujet :
Voici un résumé du poste :

L’unité de recherche Technologies et systèmes d’information pour les agro-systèmes (TSCF) du centre INRAE de Clermont-Ferrand (www.inrae.fr/tscf/), composée de 60 personnes, conçoit de nouvelles technologies et des agroéquipements permettant de mettre en œuvre la transition écologique de l’agriculture. L’unité est membre de l’I-SITE CAP 20-25 (https://cap2025.fr/).TSCF développe des recherches sur les réseaux sans fil d’objets connectés dédiés à la gestion agri-environnementale. Dans ce domaine, une quinzaine de chercheurs et ingénieurs de TSCF sont spécialisés en informatique avec une solide expérience en termes de projets interdisciplinaires. Les méthodes conçues visent les nouveaux besoins du domaine agricole en matière d’acquisition de données en milieu naturel. Les données collectées au sein des cultures permettent notamment une détection précoce d’évènements tels que des attaques de bioagresseurs ou des stresses hydriques. Plusieurs solutions sont actuellement développées au sein de TSCF pour gérer les contraintes énergétiques des réseaux d’acquisition, leur qualité de service, la mise en place d’un comportement intelligent au sein des nœuds de communication, ainsi que la gestion des données collectées. Au sein de plusieurs projets collaboratifs, ces nouvelles techniques permettent de déployer et gérer des réseaux d’objets connectés. Ces résultats ont mis en avant la nécessité de proposer de nouvelles méthodes d’optimisation de ces systèmes d’acquisition de données, visant à améliorer leur performance globale. Dans ce contexte, vous conduirez des recherches dans le domaine de l’optimisation des réseaux d’objets connectés, avec comme objectif d’accroître leurs performances et de répondre aux nouveaux besoins soulevés par la transition agroécologique. Les réseaux à optimiser pourront être constitués de nœuds fixes (objets connectés) ou mobiles (engins/robots agricoles). Les optimisations pourront porter sur différents aspects. Il pourra s’agir d’améliorer les stratégies de communications entre les nœuds, par exemple le routage des messages, l’organisation de réseaux ad hoc, ou encore l’optimisation des envois de messages. L’optimisation énergétique sera aussi un facteur important pour maximiser la durée de vie du réseau et réduire son impact environnemental. Un autre point portera sur la configuration du réseau, en gérant par exemple les incertitudes, l’optimisation des positions des nœuds, de la couverture du réseau ou des cibles mobiles, la définition de clusters de nœuds. Enfin, une optimisation multi-objectifs devrait permettre de prendre en compte plusieurs critères à la fois.
Ainsi, vous apporterez vos compétences pour formaliser et résoudre différents aspects de ces problèmes. En collaboration avec les chercheurs et ingénieurs de TSCF, vous développerez des méthodes d’optimisation pour les communications sans fil, la gestion de l’énergie ou la configuration des réseaux. Vous vous intégrerez aux projets existants de TSCF et vos méthodes seront expérimentées sur différentes applications agricoles. Vous vous intégrez dans un environnement de recherche dynamique. Vous bénéficierez de collaborations avec le Laboratoire d’Informatique, de Modélisation et d’Optimisation des Systèmes (LIMOS), ainsi qu’avec d’autres unités de l’I-SITE CAP 20-25. Il vous sera possible de créer des liens entre TSCF et d’autres laboratoires du département MathNum d’INRAE. Vous vous inscrirez pleinement dans le projet de l’unité TSCF, qui vise notamment à développer des approches intégrées pour l’autonomie et la performance des technologies numériques au service de l’agroécologie.

Contacts :

FRANÇOIS PINET
francois.pinet@inrae.fr

ROLAND LENAIN
roland.lenain@inrae.fr

Profil du candidat :
Des compétences et une expérience en optimisation des réseaux seraient un plus. Vous devrez avoir démontré vos capacités à développer et appliquer des approches d’optimisation pour résoudre des problèmes pratiques liés aux réseaux sans fil.
Vous serez amené à travailler en collaboration avec un collectif interdisciplinaire. Un goût pour le travail en équipe est nécessaire. Un dynamisme certain est attendu pour s’adapter rapidement et proposer des solutions dans un contexte agricole en évolution. Une capacité à communiquer efficacement est aussi attendue, que ce soit par des publications scientifiques, des présentations, ou des rapports. La maîtrise de l’anglais est souhaitée ainsi qu’une expérience internationale de longue durée : les lauréats qui n’en auraient pas encore réalisé seront fortement incités à effectuer un séjour à l’étranger co-construit avec l’équipe d’accueil à l’issue de l’année de stage.

Formation et compétences requises :
Vous êtes titulaire d’un doctorat ou équivalent. Une thèse dans le domaine de l’informatique ou des mathématiques est vivement recommandée.

Adresse d’emploi :
TSCF, INRAE, campus des Cézeaux, 63170 Aubière

Chaire de Professeur Junior au CNRS en Physique Statistique et IA : Montpellier – Lyon – Saclay

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CNRS Physique
Durée : tenure position
Contact : Pierre.Borgnat@ens-lyon.fr
Date limite de publication : 2024-03-10

Contexte :
StatPhys and IA

Sujet :
Artificial intelligence has experienced enormous developments in the recent past around the world, with applications in many areas of science and industry. In recent years, machine learning and neural network methods have developed increasingly important links with statistical physics.

Profil du candidat :
The CNRS tenure-track position aims to support this interface, by recruiting a researcher developing sophisticated artificial intelligence techniques to solve statistical physics problems, or using tools from statistical physics to better understand and improve machine learning algorithms.

Formation et compétences requises :
PhD. Profile to be DR in 3 to 6 years.

Adresse d’emploi :
Candidates must propose a research project which can be developed in one or more of the three host laboratories: Institut de Physique Theorique de Saclay (contact Pierfrancesco Urbani ), Laboratoire Charles Coulomb Montpellier (contact Ludovic Berthier ), Laboratoire de Physique de l’Ecole Normale Superieure de Lyon (contact Pierre Borgnat ).

Deep continual learning for satellite image time series

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Université Bretagne Sud / IRISA
Durée : 3 ans
Contact : charlotte.pelletier@univ-ubs.fr
Date limite de publication : 2024-03-10

Contexte :
During the last decades, the number and characteristics of the imaging sensors on board the satellites have constantly increased and evolved allowing access (often free of charge) to a large amount of Earth observation data. Recent constellations frequently revisit the same regions at a high spatial resolution. For example, the two Sentinel-2 satellites capture all land surfaces every five days at the equator at a 10-meter spatial resolution at best. The data cubes acquired by these
sensors, commonly referred to as satellite image time series (SITS) [8], combine high spectral, spatial, and temporal resolutions, facilitating precise monitoring of landscape dynamics. [1].

The automatic transformation of these data cubes into meaningful information (e.g., deforestation maps or land cover land use maps) usually relies on supervised learning techniques. Recent advances in this field have been marked by a shift towards deep learning methods, owing to their state-of-the-art results across various domains, including computer vision and natural language processing. The ability of temporal neural networks to handle sequential data (e.g., text or audio) and to detect time-invariant characteristics results in various achievements for time series classification in several domains [2], including remote sensing [6].

However, models are often trained statically. In other words, either a model is fine-tuned, leading to forgetting the knowledge gained previously, or a new model is trained for each new dataset
neglecting the opportunity to leverage insights from prior training instances. For example, the French scientific panel on land cover mapping (CES OSO) produces annual land cover maps by
retraining a model every year, overlooking the potential utility of previously trained models. This approach is not only computationally intensive and time-consuming but also suboptimal given the
rapid availability of satellite imagery for model updates. A compelling alternative lies in dynamic learning paradigms, wherein models are updated from a data stream, enabling the accumulation of knowledge over time while mitigating the risk of catastrophic forgetting. In the deep learning era, this strategy is known as continual learning [4]. Traditional scenarios view each observation sequentially and process them independently [10], which is an issue for SITS whose temporal structure (e.g., crop growth rate) is crucial to model landscape dynamics.

Sujet :
While the formal definition of continual learning is much debated in machine learning and computer vision communities, it is non-existent for SITS. The PhD aims at developing for the first time continual learning techniques adapted to the specificities of SITS data by leveraging both continual learning and SITS analysis research. It will consist of two main objectives: (1) devising and evaluating new robust continual learning paradigms for SITS, and (2) refining the continual learning strategy to discover new classes over time. We aim to demonstrate the potential of continual learning applied to SITS for forest monitoring, especially to help monitor Amazon deforestation and degradation on a large scale.

1. Developing new continual learning algorithm for sequences of satellite images. In this regard, we aim to evaluate existing state-of-the-art techniques and their ability to recall dynamics in SITS (e.g., vegetation growth). Among several ideas, we first plan to study continual learning strategies on temporal neural networks (e.g., Transformers with regularized attention weights) when subtime-series are inputted. This scenario requires studying how catastrophic forgetting will impact temporal neural architectures and potentially how its effect can be
mitigated. It also requires to determine the optimal number of past observations to find a trade-off between the precision of the method and memory used to store the data.
2. Discovering new classes over time without forgetting previous class [3]. The inability of continual learning approaches to discover new classes limits considerably their application in real-world remote sensing settings where land cover changes over time and labels cannot be easily collected. A possible idea is to represent each existing class through prototypes, that can be extracted for SITS [9], and maintain them over time. New classes could be identified when embedding of newly acquired observations are dissimilar from existing prototypes.

Profil du candidat :
We are looking for a candidate
• with a computer science, (geo)data science, or statistics master degree (or equivalent),
• with strong data analysis, machine learning, and computer vision knowledge,
• who is familiar with deep learning techniques,
• with excellent programming skills in at least one language (C/C++, Python, etc.),
• with good communication skills (at least in English) are required,
• with interest in Earth observation applications.
• Knowledge of time series analysis and remote sensing techniques will be appreciated

Formation et compétences requises :
Computer science, (geo)data science, or statistics master degree (or equivalent).

Adresse d’emploi :
Université Bretagne Sud
Laboratoire IRISA
Campus de Tohannic
56000 Vannes

Document attaché : 202402091126_PhD_DECOL__CL4SITS.pdf