Prédiction des Concentrations de Polluants Atmosphériques en zone Aéroportuaire par Apprentissage Automatique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC/LMEE, Université Paris-Saclay, Univ. Evry
Durée : 4 à 6 mois
Contact : Khalifa.Djemal@ibisc.univ-evry.fr
Date limite de publication : 2022-05-31

Contexte :
Dans le cadre des études d’impact et de maîtrise des risques environnementaux en zone aéroportuaire, des modèles numériques sont utilisés pour simuler, expliquer et prédire les transferts de polluants. Le choix d’une action de protection des populations est réalisé en tenant compte de l’importance des émissions potentielles de façon à minimiser les concentrations reçues par chaque individu sur la totalité de la zone.

Sujet :
Dans le cadre des études d’impact et de maîtrise des risques environnementaux en zone aéroportuaire, des modèles numériques sont utilisés pour simuler, expliquer et prédire les transferts de polluants. Le choix d’une action de protection des populations est réalisé en tenant compte de l’importance des émissions potentielles de façon à minimiser les concentrations reçues par chaque individu sur la totalité de la zone.
Les données atmosphériques (météorologiques, topographiques, etc.) sont devenues de plus en plus croissantes et gourmandes en temps de traitement (Big data), l’exploitation de ces données par des approches d’intelligence artificielle semble une évidence en particulier dans le cadre de l’estimation et la prédiction des transferts de polluants.
L’objectif du stage est de développer un modèle de prédiction des concentrations de polluants issues d’un réseau de capteurs fixes ou mobiles dans une zone aéroportuaire. Le modèle à développer se basera sur les techniques d’apprentissage automatique, en particulier l’apprentissage profond (deep learning). Le stagiaire aura pour principales tâches de :
– faire une étude bibliographique exhaustive sur les approches de prédiction,
– prendre en main et d’exploiter des données atmosphériques à partir de l’existant dont une grande partie est disponible aux laboratoires IBISC/LMEE,
– développer un modèle de prédiction adapté aux différents types de données.

Mots-clés (en français) : Intelligence artificielle, Apprentissage automatique, Optimisation, Prediction et Identification, Dispersion atmosphérique, Réseau de capteurs, Zone aéroportuaire

Keywords (in english):
Artificial intelligence, Machine learning, Optimization, Prediction and identification, Atmospheric dispersion, Sensors network, Airport area

Références bibliographiques :
[1] Abdelli A., Saouli R., Djemal K., Youkana I., Multiple instance learning for classifying histopathological images of the breast cancer using residual neural network, Inernational Journal of Imaging Systems and Technology, 2022.
[2] Boulemnadjel A., Hachouf F., Hebboul A., Djemal K., Active learning for improving a soft subspace clustering algorithm. Journal of Engineering Applications of Artificial Intelligence, 46, Part A, 196-208, 2015.
[3] Hacini M., Hachouf F., Djemal K., A new speckle filtering method for ultrasound images based on a weighted multiplicative total variation, Signal Processing, 103, 214-229, 2014.
[4] Horch A., Djemal K., Gafour A., Taleb N., Supervised fusion approach of local features extracted from SAR images for detecting deforestation changes. IET Image Processing, doi:10.1049/iet-ipr.2019.0122, 2019.
[5] Kouichi, H., Sensors networks optimization for the characterization of atmospheric releases source, Theses, Université Paris Saclay, France, https://hal.archives-ouvertes.fr/tel-01593834, 2017.
[6] Kouichi, H., Ngae, P., Kumar, P., Feiz, A.-A., Bekka, N., Optimization of an Urban Monitoring Network for Retrieving an Unknown Point Source Emission, Geosci. Model Dev. Discuss., doi.org/10.5194/gmd-2018-6, 2018.
[7] Kumar, P., Singh S. K., Feiz A. A., Ngae P., An urban scale inverse modelling for retrieving unknown elevated emissions with building-resolving simulations, Atmospheric environment 140, 135-146, 2016
[8] Larroque S., Sedgh gooya E., Gripon V., Pastor D., Using Tags to Improve Diversity of Sparse Associative Memories. Proceedings of Cognitive, 1-7, 2015.
[9] Ngae, P., Kouichi, H., Kumar, P., Feiz, A.-A., Chpoun, A., Optimization of an urban monitoring network for emergency response applications: An approach for characterizing the source of hazardous releases, Quarterly Journal of the Royal Meteorological Society, doi.org/10.1002/qj.3471, 2019.
[10] Sedgh Gooya E., Al Falou A., Kaddah W., Robust and discriminating face recognition system based on a neural network and correlation techniques, 2020 Tenth International Conference on Image Processing Theory, Tools and Applications (IPTA), Paris, 2020, pp. 1-5, doi: 10.1109/IPTA50016.2020.9286617.

Profil du candidat :
De niveau Master 2 ou équivalent, de préférence dans les spécialités suivantes :
– Intelligence artificielle
– Traitement de données
– Informatique
– Mathématiques appliquées (modélisation et calculs scientifiques)

Formation et compétences requises :
– Programmation Python, outils de traitement de données.
– Méthodes d’apprentissage automatique.
– Des connaissances de base en sciences de l’environnement atmosphérique seront également très appréciées.

Adresse d’emploi :
Laboratoires IBISC-LMEE
UFR-ST, Université d’Evry Val d’Essonne
40 rue du Pelvoux
91020 Evry.

Document attaché : 202204131204_Sujet_Stage_PSIA2.pdf

Fouille de données sur des transformations électrochimiques : associer des conditions au rendement d

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Groupe de recherche en informatique, image, automa
Durée : 3 ans
Contact : bertrand.cuissart@unicaen.fr
Date limite de publication : 2022-06-30

Contexte :
Comme elle utilise un simple électron pour former ou rompre des liaisons au cours de processus complexes, l’électrosynthèse possède un très grand potentiel en termes de découverte de nouveaux processus et d’industrialisation à bas coût. Cependant, la maîtrise et l’optimisation de réactions électrocatalysées restent difficiles et l’apport des sciences du numérique à la résolution de problèmes chimiques représente une opportunité unique. Le projet AMPERE porté par les laboratoires LIMA (UMR 7042, INC), LBM (UMR 7203, INC), LHFA (UMR 5069, INC) et GREYC (UMR 6072, INS2I) s’inscrit dans cette dynamique et rassemble une communauté de chimistes et d’informaticiens souhaitant développer des processus d’aide à la décision facilitant la découverte et l’optimisation de transformations électrochimiques. AMPERE est financé dans le cadre du programme CNRS 80/PRIME, programme initié à l’occasion des 80 ans du CNRS, destiné à financer des projets interdisciplinaires originaux et en rupture (https://www.cnrs.fr/fr/cnrsinfo/80-nouveaux-projets-pour-le-programme-80prime). Au-delà de ce projet, ce dialogue interdisciplinaire entre intelligence artificielle et chimie enrichit chaque communauté en termes d’avancées fondamentales et appliquées.

Sujet :
Le travail de thèse proposé ici s’intègre entièrement au projet AMPERE, il s’agit donc d’un travail de recherche directement motivé par une application chimique. En s’appuyant sur un outil de criblage qui génère expérimentalement des données sur des réactions électrochimiques, il s’agit de concevoir et d’implémenter des méthodes informatiques de fouille de données. A partir des techniques actuelles utilisées dans les bases de données de réactions chimiques, nous commencerons par construire une base de données appropriée aux réactions électrochimiques. Cet outil jouant un rôle pivot dans le projet, il devra satisfaire les besoins de consultation des chimistes, et constituer une source pour les analyses informatiques. En conséquence, sa réalisation sera le fruit d’une discussion entre les experts des deux disciplines. En s’appuyant sur la base de données de réactions électrochimiques, la thèse comportera deux travaux de recherche informatique.

Premièrement, il s’agira de concevoir une méthode d’analyse adaptée aux données réactionnelles étudiées. En effet, le caractère dynamique et complexe des réactions nécessite de les représenter sous la forme de données structurées à partir desquelles seront extraits les descripteurs pertinents. L’analyse informatique associée à cette partie du travail calculera les associations statistiques remarquables entre conditions expérimentales et valeurs de rendements réactionnels. Pour une réaction donnée, le système pourra proposer des nouveaux paramètres afin d’augmenter le rendement, ainsi qu’une explication de ses choix, explication compréhensible par un chimiste.

Ensuite, un travail de recherche en fouille de données séquentielles est envisagé. Une réaction sera modélisée sous la forme d’une suite d’états, chaque état décrivant un point de la réaction. Les techniques de fouille de séquences adaptées à ce cas permettront d’extraire les enchaînements de parties d’états réactionnels “remarquables”. Par remarquable, on peut entendre “fréquent”, “unique” ou très associé à un caractère externe comme un niveau de rendement. Pour modéliser d’éventuelles incertitudes, il peut être possible de remplacer les séquences par des arbres orientés. Pour réaliser l’analyse subséquente, il faudra concevoir un processus de fouille original ; ce travail comporte un fort caractère innovant.

Profil du candidat :
Il s’agit d’un travail informatique en Sciences des Données, une discipline très actuelle de l’intelligence artificielle. Le doctorant aura l’opportunité de construire une expertise dans le cadre spécifique de la recherche des associations au sein des données structurées, les données étant ici représentées sous la forme de graphes ou de séquences. Le travail s’intégrant à un projet interdisciplinaire, le doctorant expérimentera concrètement le dialogue orientant les travaux de ce type de projets. De plus, il acquerra une compétence complémentaire dans le domaine de l’informatique appliquée à la chimie. L’innovation en analyse de données chimiques s’associant à des défis technologiques ou scientifiques, cette compétence offre l’opportunité de participer à des projets ambitieux, de nature variée et aux retombées importantes.

Formation et compétences requises :
Le candidat doit être inscrit en dernière année d’un Master ou d’un diplôme d’ingénieur dans un domaine lié à l’informatique ou aux mathématiques appliquées, et posséder de solides compétences en programmation ; le candidat peut aussi être titulaire d’un tel diplôme. Une expérience en informatique pour la Science des Données sera un plus (fouille de données, apprentissage automatique, … Le candidat doit avoir des capacités à rédiger des rapports scientifiques et à communiquer des résultats de recherche lors de conférences en anglais.

Adresse d’emploi :
La thèse débutera à l’automne 2022 — début septembre ou début octobre. Le travail se déroulera principalement au GREYC, laboratoire académique normand situé à Caen. Le projet impliquant plusieurs laboratoires français, la thèse inclut plusieurs semaines annuelles de travail dans les laboratoires partenaires.

Salaire brut mensuel : 2 135 €

Candidature Les candidatures doivent inclure les documents suivants au format électronique : une lettre de motivation, un CV détaillé décrivant vos études et votre expérience en recherche, les relevés de notes des diplômes obtenus, les coordonnées de personnes références préférentiellement issues du monde la recherche.
Veuillez envoyer votre dossier de candidature à bertrand.cuissart@unicaen.fr et jean-luc.lamotte@unicaen.fr.

Document attaché : 202204130729_ampere1.pdf

Poste permanent Inria : Ingénieur(e) développement logiciel spécialiste en calcul scientifique pour

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Centre Inria de Lyon – Equipe-Projet DANTE
Durée : Poste permanent
Contact : remi.gribonval@inria.fr
Date limite de publication : 2022-07-15

Contexte :
L’équipe-projet Inria DANTE (https://team.inria.fr/dante) du LIP à l’ENS de Lyon bénéficie cette année d’un poste permanent d’ingénieur(e) Inria.

La première affectation au sein de notre équipe porte sur une durée de 4 ans renouvelable. La personne recrutée s’intègrera par ailleurs au collectif des ingénieurs permanents de l’institut, représenté au niveau d’un centre par le Service d’Expérimentation et de Développement (SED).

Poste ouvert dans un premier temps en mobilité fonction publique (date limite de candidature 6 mai 2022), puis le cas échéant sur concours de recrutement.

Sujet :
L’équipe concernée, DANTE, a pour principal objectif de développer des techniques d’apprentissage et des algorithmes de traitement du signal munis de solides fondements théoriques, physiquement interprétables, et économes en ressources. Parmi ces techniques d’IA, le développement de la librairie logicielle Faµst de calcul matriciel à grande échelle est un projet central pour l’équipe. La maîtrise durable de ce développement technologique ciblant les codes entre traitement du signal, apprentissage et calcul scientifique avec utilisation de matrices creuses est un enjeu structurant important pour l’équipe.

Pour mener ses travaux, DANTE s’appuie sur une culture à l’interface entre traitement du signal et apprentissage, et sur une expertise théorique et algorithmique autour de la notion de parcimonie, des graphes, et de l’optimisation à grande échelle. Via des partenariats choisis, les méthodes développées ont des applications potentielles allant de l’IA frugale sur des dispositifs embarqués (par exemple des véhicules autonomes) à l’imagerie médicale (IRM haute-résolution), l’astrophysique, ou les sciences sociales computationnelles (modélisation et analyse de phénomènes de contagion).

Profil du candidat :
Profil recherché en développement logiciel spécialiste en calcul scientifique pour l’apprentissage et le traitement du signal.

Formation et compétences requises :
Niveau de diplôme exigé : Thèse ou équivalent
Autre diplôme apprécié : Bac+5 ou équivalent

Pour plus de détails sur le poste, les contacts, et comment postuler :

https://jobs.inria.fr/public/classic/fr/offres/2022-04758

Adresse d’emploi :
Lyon

Turbulent convection: numerical modelling and physics-guided machine learning

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISN – Lab. Interdisciplinaire des Sciences du Num
Durée : 3 ans
Contact : anne.sergent@lisn.fr
Date limite de publication : 2022-05-15

Contexte :
*Summary* At very high Rayleigh numbers, a very intense heat transfer regime appears for which the triggering mechanisms are still poorly understood. Using HPC numerical simulations and physics-guided machine learning techniques, we seek to extract from data physical information bringing to light the multi-scale interactions between different turbulent flow structures.

The Rayleigh-Benard convection is established in a cavity under the effect of a temperature difference imposed on the horizontal walls, the bottom wall being heated. The resulting flow in the turbulent regime is a multi-structured and multi-scale phenomenon characterized by the superposition of small-scale plumes (heat vectors), a large-scale mean flow filling the cavity, boundary layers and turbulent fluctuations.

For many years, we have been simulating this physical phenomenon by direct numerical simulation (DNS). The transition to massively parallel simulations now allows us to consider calculations at parameter levels close to experiments. However, these calculations are very heavy and even if the spatio-temporal description of the flow can be very fine, it is difficult to approach statistically all the scales of the flow, to store all the computed fields, or to easily replay the sequences.

Despite progress made by careful comparison of experimental and numerical simulations studies, key differences remain in the amount and nature of the information provided by each community, making conjoint understanding difficult. For instance, experimental data is incomplete (probes time series, 2D fields sequences or images), but well converged and can reach high forcings. Numerical simulations are fully resolved in space, but reach lower turbulence level and for shorter durations. The tremendous potential capabilities of recent physics-informed deep learning (DL) techniques will help in seamlessly integrating the benefits of each approach into a new modeling and comprehension of turbulent physics.

In this project, we will take advantage of both perceptrons or (graph) convolutional neural networks frameworks enhanced with physical constraints, in order to mitigate the risks and to speed up and robustify the training phase of the models. More specifically, objectives are to infer missing data from experiments, and alleviate the cost of expensive numerical simulations by reducing the storage cost.

Sujet :
The project seeks to take advantage of the capabilities of machine learning techniques to reduce the complexity of the data. These techniques will be deployed at the interface between numerical models and solvers, and experimentally acquired data, not only to facilitate comparison, but also to access unmeasured/unquantifiable information in terms of variables or resolution finesse, and to guide physical exploration.

Two types of architecture will be considered based on deep or graph convolution neural networks, in which physical constraints enrich the output data for an accelerated convergence, with two distinct objectives. First,
it is about processing multi-source experimental data acquisition to reconstruct hidden quantities fields, and test ideas about the super-resolution reconstruction to improve the spatial resolution of measures. Second, it is to extract physical informations from experimental images. DNS data are used for preliminary tests, but also provide additional information, leading to mixing of experimental and numerical databases.

Several encouraging internships have already been carried out on the topic [Lucor et al. JCP 2022]. A large DNS database already exists [Belkadi et al. JFM 2021], but it will be expanded as needed using the resources of GENCI’s national supercomputers. The project will focus on hidden scalar or field variables reconstruction and/or super-resolution using DNS or / and experimental data, useful to better understand physical couplings between simultaneous flow quantities.

Profil du candidat :
• Good programming skills, especially in Python programming
• Good writing skills

Formation et compétences requises :
• Master of Science or equivalent in applied mathematics, physics, or mechanical engineering, with competences in fluid dynamics, statistics, or scientific computing

Adresse d’emploi :
Laboratoire Interdisciplinaire des Sciences du Numérique, UMR-CNRS 9015,
Département de Mécanique www.lisn.upsaclay.fr
Univ. Paris-Saclay, bât. 507, Rue du Belvédère, 91405 Orsay

Document attaché : 202204121258_PhD_LISN_convection_2022_madics_v2.pdf

11th International Conference on Complex Networks & Their Applications

Date : 2022-11-08 => 2022-11-10
Lieu : Palermo Italy

You are cordially invited to submit your contribution until June 07, 2022.

SPEAKERS
• Luís A. Nunes Amaral Northwestern University USA
• Manuel Cebrian Max Planck Institute for Human Development Germany
• Shlomo Havlin Bar-Ilan University in Israel
• Giulia Iori City, University of London UK
• Melanie Mitchell Santa Fe Institute USA
• Ricard Solé Universitat Pompeu Fabra Spain

TUTORIALS (November 07, 2022)
• Michele Coscia IT University of Copenhagen Denmark
• Adriana Iamnitchi Maastricht University, Netherlands

PUBLICATION
Full papers (not previously published up to 12 pages) and Extended Abstracts (about published or unpublished research up to 4 pages) are welcome.
• Papers will be included in the conference proceedings edited by Springer
• Extended abstracts will be published in the Book of Abstracts (with ISBN)

Extended versions will be invited for publication in special issues of international journals:
o Applied Network Science edited by Springer
o Advances in Complex Systems edited by World Scientific
o Complex Systems
o Entropy edited by MDPI
o PLOS one
o Social Network Analysis and Mining edited by Springer

TOPICS
Topics include, but are not limited to:
o Models of Complex Networks
o Structural Network Properties and Analysis
o Complex Networks and Epidemics
o Community Structure in Networks
o Community Discovery in Complex Networks
o Motif Discovery in Complex Networks
o Network Mining
o Network embedding methods
o Machine learning with graphs
o Dynamics and Evolution Patterns of Complex Networks
o Link Prediction
o Multilayer Networks
o Network Controllability
o Synchronization in Networks
o Visual Representation of Complex Networks
o Large-scale Graph Analytics
o Social Reputation, Influence, and Trust
o Information Spreading in Social Media
o Rumour and Viral Marketing in Social Networks
o Recommendation Systems and Complex Networks
o Financial and Economic Networks
o Complex Networks and Mobility
o Biological and Technological Networks
o Mobile call Networks
o Bioinformatics and Earth Sciences Applications
o Resilience and Robustness of Complex Networks
o Complex Networks for Physical Infrastructures
o Complex Networks, Smart Cities and Smart Grids
o Political networks
o Supply chain networks
o Complex networks and information systems
o Complex networks and CPS/IoT
o Graph signal processing
o Cognitive Network Science
o Network Medicine
o Network Neuroscience
o Quantifying success through network analysis
o Temporal and spatial networks
o Historical Networks

GENERAL CHAIRS
Hocine Cherifi (University of Burgundy, France)
Rosario N. Mantegna (university of Palermo, Italy)
Luis M. Rocha (Binghamton University, USA)

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Chaire de Professeur Junior – IA hybride – Montpellier

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRMM-Faculté des sciences
Durée : 3 à 6 ans
Contact : marianne.huchard@lirmm.fr
Date limite de publication : 2022-05-18

Contexte :
Un poste de professeur junior (tenure-track) intitulé « Intelligence Artificielle Hybride » est à pourvoir à l’Université de Montpellier, avec une affectation recherche au LIRMM (UMR CNRS 5506) et une affectation enseignement à la Faculté des Sciences (FdS).

Sujet :
Nous recherchons des candidats en Informatique dont la recherche s’inscrit à l’intersection de l’IA symbolique et de l’IA non-symbolique pour définir des stratégies d’hybridation et de fertilisation croisée des différentes techniques, depuis la représentation des connaissances, les systèmes d’argumentation, à base de règles et les preuves automatiques, jusqu’à l’apprentissage automatique en passant par l’optimisation, la programmation par contraintes et l’accès aux données médiatisé par les connaissances, par exemple en utilisant l’apprentissage pour construire des ontologies, ou en utilisant l’argumentation pour améliorer l’explication des techniques non-symboliques ou d’optimisation complexe.

En enseignement, le projet s’articule autour de la construction et de la diffusion d’enseignements sur l’IA, incluant la mise en perspective des différents courants de l’IA, la problématique des données et des connaissances et développant la théorie et la pratique des différentes techniques modernes. Dans les enseignements proposés, le professeur junior veillera en particulier à faire écho à ses activités de recherche autour des stratégies d’hybridation et de fertilisation croisée entre IA symbolique et IA non-symbolique et s’appuiera sur les environnements de développement et de déploiement de toute dernière génération.

Le poste pourra être pourvu au 15 octobre 2022 sous forme d’un CDD de 3 ans (renouvelable une fois), puis d’une titularisation comme Professeur des Universités à l’Université de Montpellier.

Un package financier est associé à la chaire, avec notamment le financement d’un doctorat et d’un postdoc. Une charge d’enseignement de 64h par an pendant la période de CDD (de 3 à 6 ans) devra aussi être assurée par le titulaire de la chaire.

La fiche de poste est disponible sur le portail d’applications Galaxie du Ministère :

https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/FIDIS/0342490X/FOPC_0342490X_38.pdf

et dans la rubrique Chaires de Professeur Junior de l’université :

Personnels enseignants titulaires

Personnes à contacter :
En recherche : Philippe Poignet (Directeur du LIRMM) : Philippe.Poignet@lirmm.fr
En enseignement : Alain Hoffmann (administrateur provisoire de la FdS) : Alain.Hoffmann@umontpellier.fr

Les candidats sont invités à prendre contact le plus rapidement possible.

Profil du candidat :
Informatique, Intelligence Artificielle

Formation et compétences requises :
Thèse de doctorat

Adresse d’emploi :
Université de Montpellier

Université de Montpellier

Offre de thèse au LAMSADE

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LAMSADE et IRISSO
Durée : 3 ans
Contact : alexis.tsoukias@dauphine.fr
Date limite de publication : 2022-06-30

Contexte :
financement CNRS prime80

Sujet :
Fairness by explanation in algorithmic decision making

Profil du candidat :
H/F

Formation et compétences requises :
Master in Computer Science with opening/minor in the Social Sciences.

Adresse d’emploi :
LAMSADE, Université Paris Dauphine

Document attaché : 202204101414_call4phd01.pdf

Approches déclaratives efficaces pour l’extraction des motifs d’intervalles fermés

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC CNRS UMR 6072
Durée : 3 ans
Contact : bruno.cremilleux@unicaen.fr
Date limite de publication : 2022-05-31

Contexte :
En fouille de données, l’extraction de motifs [7] vise à identifier des régularités dans des ensembles de données (datasets). Ces motifs permettent de faire émerger des relations implicites dans une grande masse de données. Il appartient ensuite aux data scientists et aux experts sur les données de déterminer si un motif est le résultat d’une simple corrélation, ou s’il est le fruit d’une relation directe entre ses composants, par exemple un lien de causalité entre deux composants. De nombreuses applications en fouille de données sont amenées à traiter des données numériques. Dans ce contexte, il est souvent nécessaire de passer par une étape de binarisation pour profiter des méthodes symboliques. Cette binarisation s’effectue soit en créant des attributs pour constituer des intervalles sur les valeurs des données [4], soit en partitionnant les valeurs dans le dataset en catégories selon différents paramètres : taille, composition de blocs au regard de leur classe, tests statistiques, entropie, etc. [2]. La binarisation entraîne une perte d’information par rapport aux données d’origine. Une technique comme l’ “interordinal scaling” permet de préserver l’information d’origine mais conduit à des données de grande taille. Afin d’avoir une méthode capable de traiter directement les données numériques, Kaytoue et al. [4] ont proposé la méthode MintIntChange capable d’extraire des motifs d’intervalles fermés réduisant ainsi la chaîne de traitement de données. Cependant, étendre MintIntChange pour être capable de traiter d’autres tâches de fouille avec de nouvelles contraintes s’avère une tâche non triviale.

Sujet :
La synergie entre la fouille de données et les paradigmes déclaratifs tels que SAT, la Programmation Par Contraintes (PPC) et la Programmation Linéaire en Nombre Entier (PLNE) a connu un grand essor au cours de la dernière décennie à travers différents travaux [5, 1, 8, 6]. L’avantage principal de ces approches réside dans leur côté déclaratif qui offre une large flexibilité pour s’adapter à des tâches variées en fouille de données. Ces approches incluent la possibilité d’intégrer de nouvelles contraintes spécifiées par l’utilisateur sans besoin de développer de nouveaux algorithmes spécifiques de résolution. L’objectif de ce travail de thèse est de définir des méthodes et de concevoir des outils permettant l’extraction de motifs d’intervalles dans un cadre déclaratif. En effet, travailler directement sur les données numériques est un enjeu majeur pour réduire les étapes dans la chaîne de traitement des données. De plus, les approches déclaratives sont particulièrement adaptées pour cette tâche. Dans le cadre de la programmation par contraintes, différents types de contraintes sont à la disposition de l’utilisateur pour définir le réseau de contraintes à résoudre : des contraintes prédéfinies dans le solveur ou des contraintes définies en extension par un ensemble de valeurs autorisées ou interdites. En outre, un utilisateur expert peut définir ses propres contraintes en établissant la sémantique de la contrainte, ainsi que l’algorithme de filtrage associé [3, 5, 1].

Les principales contributions attendues sont :
— Proposition d’une approche déclarative offrant un bon compromis entre efficacité et flexibilité pour l’extraction de motifs d’intervalles.
— Les approches proposées doivent être capables d’enrichir l’expérience de l’utilisateur en mettant en place des moyens (contraintes ou techniques d’apprentissage) pour éviter d’inonder l’utilisateur avec des motifs inintéressants.
— L’avantage principal des méthodes déclarative réside dans leur aspect générique et tout domaine applicatif générant des données numériques peut être considéré comme un objet d’étude. Néanmoins, nous visons dans cette thèse l’extraction de motifs dans des bases de données moléculaires où les molécules sont décrites par des descripteurs numériques.

Profil du candidat :
Le(a) candidat(e) doit être titulaire d’un diplôme master ou équivalent en informatique.

Formation et compétences requises :
Le(a) candidat(e) doit être titulaire d’un diplôme master ou équivalent en informatique avec des compétences dans le domaine de la programmation par contraintes, la programmation linéaire et la fouille de motifs. Le candidat(e) recherché(e) devra avoir de solides compétences en programmation C++, JAVA, et Python3. La maîtrise des solveurs comme OR-tools, SCIP, Choco serait un vrai plus.

Adresse d’emploi :
GREYC CNRS UMR 6072
6 Boulevard du Maréchal Juin
Bâtiment Sciences 3
Université de Caen Normandie
CS 14032, 14032 CAEN cedex 5

Document attaché : 202204092202_ademif.pdf

Modélisation de l’évolution physiologique d’un patient en réaction à un process de soins.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Université de Nantes / LS2N – LE SiMU – CHU de Nan
Durée : 36 mois
Contact : christine.sinoquet@univ-nantes.fr
Date limite de publication : 2022-05-31

Contexte :
La simulation est un outil pédagogique moderne dédié à l’apprentissage et au maintien des compétences dans le domaine des sciences de la santé. Il permet aux apprenants de s’entraîner à la prise en charge de situations réalistes dans un environnement sécuritaire, sans risque pour le patient (‘‘jamais la première fois sur le patient’’). Le Laboratoire Expérimental de Simulation en Médecine Intensive (LE SiMU) de l’Université de Nantes permet ce type d’apprentissage dans sept spécialités médicales, dont l’anesthésie.
LE SiMU intervient sur simulateurs de patients haute-fidélité (mannequins), avec immersion des agents en formation dans une équipe médicale humaine pleine-échelle interprofessionnelle. Actuellement, les scénarios sont écrits à l’avance, et le formateur fait évoluer les paramètres physiologiques du mannequin “à la main”, en réponse aux actions de l’équipe médicale (y compris celles de l’apprenant immergé dans cette équipe). D’une part, il y a peu de variabilité dans les scénarios. D’autre part, un apprenant n’a accès qu’à un nombre limité de scénarios (environ 3 par demi-journée de formation).
Dans le but d’améliorer la sécurité et la qualité des soins peropératoires, les formateurs du SiMU souhaitent varier la diversité des scénarios à proposer aux internes en anesthésie et infirmiers anesthésistes, en formation initiale, ainsi qu’aux praticiens plus expérimentés, en formation continue. Pour varier les scénarios, il est envisagé à terme d’automatiser la génération de scénarios réalistes de simulation, en s’appuyant sur tout ou partie de la base de profils anesthésiques enregistrés par le CHU de Nantes depuis 2004 (500 000 profils anesthésiques). Dans cette modalité assistée par le numérique, la personne qui suit la formation (interne ou infirmier), fait partie de l’équipe médicale. Les autres membres de l’équipe médicale sont simulés très simplement (icônes réalisant des actions et émettant des informations, sur l’écran de l’ordinateur assigné à l’apprenant).

Sujet :
1 Sujet de thèse

1.1 Objectifs opérationnels

Le problème posé consiste à savoir faire évoluer les paramètres physiologiques d’un patient numérique en réponse à des actions médicales successives. Ce problème équivaut à prédire l’évolution d’une série temporelle, à court terme, jusqu’au déclenchement de la prochaine action médicale, par l’apprenant ou par le reste de l’équipe médicale (qui est virtuelle). Excepté si c’est l’apprenant qui déclenche la prochaine action, cette action doit également être prédite.

Nous devons définir un modèle capable de générer une série multivariée à d variables, et évoluant sous l’effet d’une séquence d’événements horodatés dans le temps continu.

Nous proposons d’apprendre ce modèle à partir des profils anesthésiques d’une cohorte de patients. Le profil anesthésique d’un patient est constitué d’une série temporelle multivariée et d’une trace d’événements. La série temporelle décrit l’évolution dynamique de d paramètres physiologiques (e.g., la fréquence cardiaque) enregistrés via des capteurs, à fréquence constante. La trace d’événements est la séquence horodatée des actions asynchrones de l’équipe médicale (e.g., administration d’un anesthésique).

La prise en charge de ce problème est inédite.

1.2 Limites de l’état de l’art et verrous à lever

Les méthodes statistiques classiques capturent efficacement les relations linéaires dans les séries temporelles, et obtiennent de bons résultats lorsque le jeu de données est de petite taille (e.g., modèle linéaire autorégressif, modèles MA (Moving Average) et ARMA (AutoRegressive Moving Average)). Cependant, ces approches statistiques sont peu efficaces lorsqu’elles sont appliquées à des séries temporelles non linéaires complexes à grande échelle [LZG21]. Dans le cas où la non-linéarité est liée à la présence de changements de régime dans l’évolution des systèmes dynamiques, des propositions majeures de la littérature ont été par exemple le modèle autorégressif à seuil (TAR, Threshold AutoRegressive model) [T90] et le modèle autorégressif à changement de régime Markovien (MSAR, Markov-Switching AutoRegressive model) [H90] pour les changements discrets, le modèle à changement de régime continu (STAR, Smooth Transition AutoRegressive model) [LT94].

Cependant, ces modèles sont inadaptés pour notre objectif, pour diverses raisons. Par exemple, dans le modèle TAR, les changements de régime sont déterminés par les seules variations de la série temporelle. Tous les modèles évoqués précédemment sont incapables de prendre en compte l’existence de dépendances à long terme entre événements, ainsi que la variabilité de la portée des dépendances entre événements.

1.3 Modélisation jointe d’une série temporelle et d’une trace d’événements

Des revues de l’état de l’art récentes consacrées à la prédiction du temps de survie ou du temps de récidive d’une pathologie discutent des diverses façons de représenter les dépendances entre un sous-modèle dédié à la trace d’événements et un sous-modèle dédié à la série temporelle, dans les cadres fréquentiste [HPJ16] et Bayésien [ASG20]. Cependant, ces modèles ne permettent pas la double prédiction nécessaire pour résoudre notre problème.

Dans le domaine de la prédiction de série temporelle multivariée, les approches les plus efficaces actuellement pour prendre en charge les aspects non linéaires et les corrélations entre variables reposent sur les architectures de réseaux de neurones profonds, éventuellement hybridées entre elles, ou encore hybridées avec un modèle classique [LZ20].

Par ailleurs, la littérature récente indique que les processus temporels ponctuels constituent une classe de modèles très utilisée pour la prédiction du prochain événement [Z22]. Les processus de Poisson constituent la classe des processus ponctuels les plus populaires et les plus simples, pour modéliser l’occurrence d’événements indépendants les uns des autres. La composition de processus ponctuels simples (e.g., [SJ10]), et des processus ponctuels plus complexes comme les processus de Cox [C55] et de Hawkes [H71], par exemple, permettent de prendre en compte des dépendances entre événements. Un récent état de l’art est consacré à ces processus [JO20].

Cependant, lorsqu’aucune information n’est disponible sur la distribution des temps d’occurrence des événements, des approches non paramétriques peuvent être utilisées pour apprendre des distributions sophistiquées à partir des données, grâce à des réseaux de neurones. Les réseaux neuronaux récurrents, et spécialement les LSTM (Long Short Term Memory) sont particulièrement utilisés pour apprendre des dépendances complexes (e.g., [TVR17]).

Hormis pour la prédiction du temps de survie ou de récidive évoquée précédemment, la modélisation jointe de trace d’événements et de série temporelle a été peu abordée, jusqu’à ce jour. Deux publications seulement ont été recensées, qui se situent dans la même veine que les travaux envisagés pour la thèse.

Choi et co-auteurs informent un processus de Hawkes au moyen d’une série temporelle, afin de prédire l’évolution de la pathologie d’un patient [CDC15]. Xiao et collaborateurs décrivent un modèle joint combinant deux réseaux de neurones récurrents profonds (des LSTM en l’occurrence), dans le but de réaliser la prédiction informée du prochain événement [XYF19]. Dans cette approche, l’un des LSTM capture les dépendances entre les événements, et l’autre modélise l’influence de la série temporelle sur l’occurrence des événements.

Le cadre de travail de la thèse se démarque des deux approches précédentes puisque notre objectif est de prédire, non seulement le prochain événement, mais aussi l’évolution de la série temporelle.

Pour répondre aux objectifs de la thèse, nous investiguerons donc dans un premier temps comment réaliser une double prédiction en intégrant un processus ponctuel ou une variante de processus ponctuel et une architecture de réseau de neurones profond dédiée à la modélisation de la série temporelle.

Nous examinerons ensuite comment modéliser un processus d’occurrences d’événements à l’aide d’un réseau de neurones profond et comment hybrider ce sous-modèle avec un réseau de neurones dédié à la modélisation de la série temporelle.

2 Plan de travail

Le planning prévu pour la thèse est le suivant :

1. Etude de l’état de l’art sur la prédiction de série temporelle multivariée par utilisation d’un réseau de neurones profond ; étude de l’état de l’art sur la prédiction d’événement via un processus temporel ponctuel d’une part, via un réseau de neurones profond d’une part ; étude de l’état de l’art sur la modélisation d’un processus temporel ponctuel à l’aide d’un réseau de neurones profond.

2. Appropriation du simulateur de profils anesthésiques développé dans le cadre du projet EXAN.

3. Choix de l’environnement de programmation (PyTorch, Keras, TensorFlow etc) pour l’apprentissage profond.

4. Mise au point d’un modèle combinant un modèle neuronal profond modélisant un processus temporel ponctuel pour la prédiction d’événement et un réseau de neurones pour la prédiction de série temporelle ; proposition éventuelle de plusieurs architectures ; développement des prototypes correspondants ; examen de la nécessité et des possibilités d’utiliser des modèles pré-entraînés, examen de la nécessité de recourir à l’augmentation de données.

5. Mise au point du protocole de validation de l’architecture ou des architectures proposées ; mise au point du protocole de validation de l’usage de ces architectures par les utilisateurs de la plateforme de simulation LE SiMU.

6. idem point 4, pour un modèle neuronal profond hybridant deux réseaux de neurones dédiés respectivement à la prédiction d’événement et à la prédiction de série

7. idem point 5, appliqué à l’architecture ou aux architectures proposées en point 6.

Références bibliographiques
[ASG20] M. Alsefri, M. Sudell, M. García-Fiñana and R. Kolamunnage-Dona (2020) Bayesian joint modelling of longitudinal and time to event data: a methodological review. BMC Medical Research Methodology 20, 94.

[C55] D.R. Cox (1955) Some statistical methods connected with series of events. Journal of the Royal Statistical Society 17(2), 129-164.

[CDC15] E. Choi, N. Du, R. Chen et al (2015) Constructing disease network and temporal progression model via context-sensitive Hawkes process. In: IEEE International Conference on Data Mining, pp 721-726.

[H71] A.G. Hawkes (1971) Spectra of some self-exciting and mutually exciting point processes. Biometrika 58, 83–90

[H90] J. D. Hamilton (1990) Analysis of time series subject to changes in regime. Journal of Econometrics, 45(1-2), 39-70.

[HPJ16] G. L. Hickey, P. Philipson, A. Jorgensen and R. Kolamunnage-Dona (2016) Joint modelling of time-to-event and multivariate longitudinal outcomes: recent developments and issues. BMC Medical Research Methodology, 16,117.

[JO20] J. Jang, and R. Oh (2021). A review on Poisson, Cox, Hawkes, shot-noise Poisson and dynamic contagion process and their compound processes. Annals of Actuarial Science,15(3), 623-644.

[LT94] C.-F. J. Lin and T. Teräsvirta (1994) Testing the constancy of regression parameters against continuous structural change. Journal of Econometrics, 62(2), 211-228.

[LZ20] B. Lim B, and S. Zohren S (2020) Time series forecasting with deep learning: a survey. https://arxiv.org/abs/2004.13408.

[LZG21] Z. Liu, Z. Zhu, J. Gao and C. Xu (2021) Forecast methods for time series data: a survey. IEEE Access, 9, 91896- 91912.

[SJ10] A. Simma and M.I. Jordan (2012) Modeling events with cascades of Poisson processes. In: International Conference on Uncertainty in Artificial Intelligence, pp. 546–555.

[T90] H. Tong (1990) Non-linear time series: a dynamical system approach. Oxford University Press.

[TVR17] N. Tax, I. Verenich, M. L. Rosa, M. Dumas. (2017) Predictive business process monitoring with LSTM neural networks. In : International Conference on Advanced Information Systems Engineering, CAiSE2017, Lecture Notes in Computer Science 10253, pp. 477–492.

[XYF19] S. Xiao, J. Yan, M. Farajtabar et al (2019) Learning time series associated event sequences with recurrent point process networks. IEEE Transactions on Neural Networks and Learning Systems, 30(10), 3124–3136.

[Z22] L. Zhao (2022) Event prediction in the big data era : a systematic survey. ACM Computing Surveys, 54(5),1–37.

Profil du candidat :
Master ou équivalent en Mathématiques ou Mathématiques / Informatique ou Informatique, avec spécialisation en science des données ou probabilités / statistique, ainsi qu’en apprentissage automatique (incluant deep learning de préférence)

Formation et compétences requises :
– Compétences théoriques et expérience requises en probabilités / statistiques, mathématiques appliquées, apprentissage automatique

– Si la personne candidate n’a pas d’expérience dans la modélisation par composition de modèles utilisant des réseaux de neurones profonds, qui est l’un des axes d’investigation de la thèse, elle devra en revanche montrer une forte motivation pour s’investir dans ce domaine

– Intérêt pour l’interdisciplinarité (santé)

– Expérience en programmation et bon niveau de programmation

– Bonnes capacités rédactionnelles

– Aptitude au travail en équipe, capacité à rendre compte de l’avancement de ses travaux

Calendrier de la sélection

Les dossiers de candidature seront de préférence envoyés avant le jeudi 21 avril 2022 12H00.
Date limite d’envoi des candidatures : mardi 26 avril 2022 12H00

Les personnes correspondant au profil demandé seront convoquées pour une audition par visio-conférence (au fil de l’eau).
Décision : mi-mai 2022

Pièces à fournir
– CV détaillé
– lettre de motivation
– relevé de notes de Master 1 (avec rang de classement et effectif de la promotion)
– notes de Master 2 hors stage (avec rang de classement et effectif de la promotion)
– résumé du stage en cours (entre 2 et 4 pages, références bibliographiques en sus)
– lettres de recommandation pour l’année en cours
– coordonnées de personnes référentes (prénom, nom, statut, institution (détailler les sigles le cas échéant), ville, adresse mail, numéro de téléphone)

Questions et envoi des dossiers de candidature (archive zip) à christine.sinoquet@univ-nantes.fr

Adresse d’emploi :
Université de Nantes

Document attaché : 202204091843_annon_aiby4_sinoquet_lejus-bourdeau_22_04_09_sat_17h00.pdf

Poste d’Ingénieur-Chercheur en Gestion de connaissances, ontologies, web sémantique et apprentissage

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRT SystemX
Durée : CDI
Contact : georges.hebrail@irt-systemx.fr
Date limite de publication : 2022-06-30

Contexte :
Rattaché au domaine « Data IA », vous intégrez des projets collaboratifs composés d’ingénieurs-chercheurs, de chercheurs industriels et académiques, de post-doctorants et de doctorants. Vous reportez donc hiérarchiquement au Responsable d’équipe et opérationnellement aux Chefs de projet.

Vos missions principales consistent à :

Participer à l’élaboration des propositions méthodologiques, technologiques et architecturales de l’équipe projet en cohérence avec les attentes des partenaires industriels et les propositions des partenaires académiques ;
Analyser les cas d’usages des partenaires industriels et mener les travaux de recherche nécessaires pour lever ces verrous scientifiques et technologiques, produire les livrables correspondants ;
Réaliser, configurer et mettre en place les preuves de concept et les démonstrateurs conformément au contexte opérationnel des partenaires industriels ;
Documenter les travaux réalisés et participer aux transferts des résultats méthodologiques et technologiques vers les équipes des partenaires du projet ;
Contribuer à la dissémination et à l’élaboration de la roadmap scientifique et technologique de votre domaine.
Être référent de thèse (Ingénieur-chercheur référent, co-encadrement de thèse).
Etablir des collaborations avec des laboratoires académiques partenaires.
Conseiller et disséminer les bonnes pratiques permettant de capitaliser et de réutiliser les travaux de l’IRT.

Selon votre profil et vos préférences, vous pourrez évoluer par la suite vers un poste d’Expert, de Chef de projet ou/et Responsable d’équipe/Responsable d’axe.

Sujet :
Les missions seront amenées à évoluer selon les projets. Vous serez dans un premier temps rattaché au projet SMD (Sémantiques Métier pour l’exploitation de Données multi-sources) qui est un projet de coopération avec des acteurs de comme domaines Défense et sécurité, Réseaux ferroviaires, Production et fournisseur d’électricité, fournisseurs d’équipements (analyse des appels d’offres), Fournisseurs de technologies d’analyse des contenus et de données multimédia, etc.

Le projet s’inscrit dans le cadre du programme d’Intelligence Artificielle et d’Ingénierie Augmentée (IA2) mis en œuvre par l’IRT SystemX. Ce projet a pour objectif de croiser des expertises multisectorielles et de mutualiser les efforts de R&D des partenaires sur la thématique de l’hybridation d’approches d’apprentissage numérique (ex. réseaux de neurones pour le traitement des textes, des images, des vidéos, …) et d’approches d’IA symbolique pour l’extraction et la qualification des connaissances à partir de données hétérogènes.

Les missions seront amenées à évoluer selon les projets mais portent pour le démarrage sur :

Participer à la caractérisation des données disponibles ;
Analyser et traiter des documents multimédias ;
Développer ou faire évoluer des outils permettant de construire et utiliser des connaissances à partir de corpus de données hétérogènes :
Intégrer les connaissances dans un processus d’analyse et de traitement automatique ;
Proposer/évaluer des méthodes de génération automatique de graphes de connaissances (besoin adapté au cas d’usage industriel) ;
Concevoir et développer des preuves de concepts en gestion de connaissance ;
(Un plus) Utiliser des fonctionnalités de traitement automatique du langage naturel (NLP) ;
Enrichir les environnements de démonstration ;
Définir et développer de nouveaux schémas d’apprentissage et de fusion de données dans un contexte multimodal hétérogène (sémantique, structurelle, temporelle…)
Enrichir les environnements de démonstration ;

Mots-clés : NLP, IA Symbolique, Machine Learning

Profil du candidat :
Issu d’une formation Bac + 5 minimum, de profil ingénieur ou docteur avec une spécialisation dans la représentation de connaissance, ou en NLP.

Compétences techniques :

Maitrise des concepts, méthodes et algorithmes de construction, gestion et utilisation de connaissances (web sémantique, raisonnement, IA symbolique, …) ;
Maîtrise des concepts, méthodes et algorithmes de Machine Learning, notamment les approches de Deep Learning ;
Maîtrise des environnements logiciels pour la gestion des connaissances et le Machine Learning ;
Web sémantique : OWL, RDF, RDFS, SPARQL, SHACL
Des connaissances technologiques nécessaires pour la définition et la mise en œuvre des outils de Machine Learning (scikitlearn, tensorflow, pytorch) ;
Bonnes connaissances en conception et développement logiciel (python au minimum).
Connaissances souhaitées en adaptation de domaine et en transfert d’apprentissage;
La compréhension des problématiques fonctionnelles et des enjeux numériques des systèmes complexes ;
Les bases scientifiques indispensables pour la maitrise des modèles nécessaires à la formalisation des interactions entre différentes dimensions d’un système complexe ;

Qualités professionnelles et relationnelles :

Curiosité, esprit d’initiative, capacité d’analyse et rigueur
Adaptabilité et autonomie
Capacité à travailler en mode projet: suivi et avancement des travaux, valorisation et communication des résultats
Aisance relationnelle, capacité à travailler en équipe, très bonne communication orale et écrite (en français et anglais)

L’IRT SystemX est engagé en faveur de l’égalité des chances. A ce titre, tous nos postes sont ouverts aux candidats en situation de handicap.

Pour ce poste basé au sein du cluster Paris-Saclay (91), des déplacements occasionnels sont à prévoir en région parisienne. Vous travaillerez au sein d’une équipe jeune, sur des projets attractifs et vous bénéficierez d’avantages tels que : mutuelle intéressante, subvention de l’employeur pour la restauration, 3 semaines de congés en plus du légal, congés supplémentaires en fonction de l’ancienneté, 1% logement, comité économique et social, partenariat avec Science Accueil permettant aux collaborateurs étrangers d’obtenir notamment un accompagnement dans les démarches administratives.

Formation et compétences requises :
–

Adresse d’emploi :
Détails à l’adresse suivante : https://www.irt-systemx.fr/recrutement/ingenieur-chercheur-en-gestion-de-connaissances-ontologies-web-semantique-et-apprentissage-f-h/

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

Prédiction des Concentrations de Polluants Atmosphériques en zone Aéroportuaire par Apprentissage Automatique

Fouille de données sur des transformations électrochimiques : associer des conditions au rendement d

Poste permanent Inria : Ingénieur(e) développement logiciel spécialiste en calcul scientifique pour

Turbulent convection: numerical modelling and physics-guided machine learning

11th International Conference on Complex Networks & Their Applications

Chaire de Professeur Junior – IA hybride – Montpellier

Offre de thèse au LAMSADE

Approches déclaratives efficaces pour l’extraction des motifs d’intervalles fermés

Modélisation de l’évolution physiologique d’un patient en réaction à un process de soins.

Poste d’Ingénieur-Chercheur en Gestion de connaissances, ontologies, web sémantique et apprentissage