Machine Learning for Life Sciences

Date : 2022-11-15 => 2022-11-17
Lieu : Montpellier

The objective of the conference organized by the KIM Data & Life Sciences is to connect researchers and promote interdisciplinary collaborations, in the field of massive data, machine learning and artificial intelligence with connections to life sciences.

Keynote speakers:

Stephen Becker (University of Colorado
Michael Blum (
Julien Chiquet (INRAE, Paris-Saclay University)
Sophie Donnet (INRAE,Paris-Saclay University)
Emmanuel Faure (CNRS & LIRMM, Montpellier)
Flora Jay (CNRS, Paris-Saclay University)
Tim Landgraf (University of Berlin)
Charles-Henri Lecellier (CNRS, IGMM & LIRMM, University of Montpellier)
Diego Marcos (Inria, Montpellier)
Gabriel Peyré (CNRS & École Normale Supérieure Paris)
Daniele Silvestro (University of Fribourg)
Yun S. Song (UC Berkeley)
Bertrand Thirion (Inria, Team Parietal, Univ. Paris-Saclay)
Nathalie Vialaneix (INRAE, Toulouse)

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Bayesian inference with expensive and imperfect data models

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Institut d’Astrophysique de Paris
Durée : 3 à 6 mois
Contact : florent.leclercq@iap.fr
Date limite de publication : 2022-12-26

Contexte :
Surveys of the cosmic large-scale structure carry rich scientific opportunities. Advancing the research frontier requires solving unique and challenging statistical problems, to unlock the information content of massive and complex data vectors. The recently-proposed machine learning technique BOLFI (Bayesian optimisation for likelihood-free inference) makes inference of complex Bayesian hierarchical models under the constraint of a very limited simulation budget possible. Unfortunately, its use is currently hampered by several theoretical and practical challenges.

Sujet :
The goal of this interdisciplinary project is to upgrade the BOLFI algorithm for the extraction of information distributed in massive and heterogeneous data, in the context of expensive and imperfect data models. Motivating problems and applications will come from upcoming galaxy survey data such as Euclid. We will address several issues, including: (i) the parallel acquisition of simulations when only a limited number of noisy likelihood evaluations can be obtained, (ii) the robustification of the technique against model mis-specification, (iii) the definition of summary statistics that maximise the extraction of information, e.g. via information-maximising neural networks (IMNN). The proposed algorithm will be applied to the inference of cosmological parameters using a realistic simulator. Ultimately, the developed method will be an important tool for the extraction of physical information from Euclid data, which has the potential to influence the design of future data analysis pipelines.

Related links and literature / Version française : https://florent-leclercq.eu/supervision.php#internship-2023-info

Profil du candidat :
The student will get experience of statistical modelling, machine learning, data mining, cosmology, and astronomical observations. They should be comfortable with computing (preferably, experience with python and git). This work could naturally lead to a PhD project in data science and/or cosmology, for example in the large-scale structure and distant Universe group of the Institut d’Astrophysique de Paris (IAP).

Formation et compétences requises :
Interest in information science, machine learning, data science, and a taste for (astro)physics.

Adresse d’emploi :
Institut d’Astrophysique de Paris, 98 bis boulevard Arago, 75014 Paris, France

MCF en Intelligence Artificielle (CDD de 3 ans)

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Telecom SudParis/Samovar
Durée : 3 ans
Contact : bruno.defude@telecom-sudparis.eu
Date limite de publication : 2022-10-10

Contexte :
Télécom SudParis est une grande école publique d’ingénieurs reconnue au meilleur niveau des sciences et technologies du numérique. La qualité de ses formations est basée sur l’excellence scientifique de son corps professoral et une pédagogie mettant l’accent sur les projets d’équipes, l’innovation de rupture et l’entreprenariat. Télécom SudParis compte 1 000 étudiantes et étudiants dont 700 élèves ingénieurs et environ de 150 doctorantes et doctorants. Télécom SudParis fait partie de l’Institut Mines-Télécom, premier groupe d’école d’ingénieurs en France, et partage son campus avec Institut Mines-Télécom Business School. Télécom SudParis est co- fondatrice de l’Institut Polytechnique de Paris (IP Paris), Institut de Sciences et Technologies à vocation mondiale avec l’École polytechnique, l’ENSTA Paris, l’ENSAE Paris et Télécom Paris.

Sujet :
Dans le cadre de l’appel à Manifestation d’intérêt Compétences et Métiers d’avenir, Télécom SudParis s’engage à massifier la formation des étudiants.es formés.es à l’intelligence artificielle. L’objectif stratégique du recrutement est donc de répondre à cette demande au niveau de Télécom SudParis, IP Paris et Hi! Paris.

L’objectif du programme AI4Good de TSP est double :
– Massifier la formation de spécialistes en Data Science et Intelligence artificielle
– Développer la Formation d’utilisateurs experts de l’intelligence Artificielle appliquée au bien commun (Santé, Environnement, Education…)

Trois types de missions seront donc couvertes par le poste :
– Enseignement
– Développement des programmes pédagogiques et des filières d’enseignement AI4Good de TSP
– Recherche

Profil du candidat :
Le poste est ouvert sur un profil machine learning, intelligence artificielle ou statistiques. La recherche s’effectuera dans le laboratoire Samovar au sein de l’équipe qui correspondra le plus au profil du candidat-e sélectionné-e.
Activités

1. Enseignement
Pour répondre au besoin de massification en enseignement, le/la MdC recruté.e devra :
– Assurer des enseignements en apprentissage statistique, classification automatique, Data Mining dans la Formation d’Ingénieur sous statut Etudiant
– Coordonner des modules d’enseignement
– Participer à l’encadrement de projets étudiants
– Assurer le tutorat pédagogique d’Étudiants en stage de troisième année

–> Certains enseignements auront vocation à être délivrés en anglais

2. Développement du programme AI4Good
Dans le cadre du développement des programmes pédagogiques et des filières d’enseignement AI4Good de TSP, le/la MdC recruté.e intègrera l’équipe d’Appui et Transformation pédagogique de TSP sous la responsabilité de la Directrice Adjointe des Formations. Dans ce cadre, il/elle devra :
– Assurer une veille scientifique et pédagogique dans le domaine de la formation à l’utilisation de l’intelligence artificielle
– Contribuer au développement des nouvelles filières du programme AI4Good
– Représenter les intérêts de la Direction des Formations de TSP au sein d’Hi! Paris
– Participer au montage du certificat IA/DS d’IP Paris pour les non spécialistes

3. Recherche
Le projet de recherche du/de la candidat(e) se situera dans le domaine des modélisations probabilistes et traitements statistiques appliqués à l’Intelligence artificielle, avec applications dans l’un des domaines prioritaires que sont :
– la Santé
– l’Environnement
– l’Energie
– l’Éducation

Formation et compétences requises :
Doctorat ou

Compétences, connaissances et expériences indispensables

Expérience de l’enseignement et de la recherche avec un goût prononcé pour les applications
Connaissance des pratiques pédagogiques dans l’enseignement supérieur
Maîtrise du français et de l’anglais
Excellentes qualités d’expression écrite et orale
Compétences confirmées dans le domaine de l’Intelligence artificielle

Compétences, connaissances et expériences souhaitables

Connaissances scientifiques étendues dans les domaines des technologies de l’information
Expérience internationale en enseignement-recherche/ Visibilité internationale

Capacités et aptitudes

Qualités relationnelles et pédagogiques permettant de mener des discussions dans le domaine de la data science et de l’intelligence artificielle
Aptitude à la rédaction, à la synthèse
Aptitude à négocier avec des interlocuteurs de haut niveau, internes et externes à l’Institut Mines-Télécom et l’Institut Polytechnique de Paris
Disponibilité
Sens de l’animation et de l’organisation
Dynamisme, curiosité, volonté de découvrir et apprendre

Adresse d’emploi :
Telecom SudParis exerce principalement ces activités d’enseignement à Evry (91) mais certains enseignements peuvent être organisés à Palaiseau (91).

Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 3 ans
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2022-10-31

Contexte :
Le sujet de thèse proposé vise au croisement de deux disciplines principales : l’analyse de réseaux complexes et la modélisation des dynamiques spatiales. La modélisation des dynamiques spatiales est une approche privilégiée pour étudier les processus complexes d’interaction homme-environnement qui sont au centre des systèmes d’utilisation des terres (land use system).
Dans ce contexte, une nouvelle approche fondée sur le concept de graphe d’interaction a été développée au CIRAD/UMR TETIS, avec l’objectif de permettre un meilleur couplage des systèmes de modélisation avec des SIG (Système d’Information Géographique) et améliorer la modélisation des mécanismes qui sont influencés par des structures spatiales dynamiques. Le graphe d’interaction est un graphe (un ensemble de nœuds connectés par des arcs) dont les arcs peuvent porter des fonctions d’interaction. Un système représenté par des graphes d’interaction peut ainsi évoluer lorsque les fonctions d’interactions sont activées et que celles-ci modifient les entités connectées. Les éléments présents dans un espace géographique peuvent ensuite définir des relations spatiales, fonctionnelles, hiérarchiques et même sociales. La mise en œuvre de cette approche s’appuie sur le langage de modélisation Ocelet, et son environnement logiciel de développement (http://www.ocelet.org).
Les modèles développés avec Ocelet sont employés principalement pour simuler des dynamiques spatiales dans différents systèmes territoriaux complexes, comme par exemple, pour comparer plusieurs scénarios d’utilisation des terres. Ces modèles font généralement intervenir plusieurs graphes d’interaction dans des structures porteuses de connaissances du fonctionnement et de l’organisation du territoire. Jusqu’à présent, lors de déploiement de ces modèles, seuls les résultats de simulation sont analysés ; les graphes ne le sont pas, alors qu’ils sont une expression formelle de processus très divers qui interagissent dans le territoire. Ces analyses permettraient notamment d’expliciter les liens entre structure et fonctionnement du territoire, pour viser, à terme, la possibilité d’inférer des connaissances des processus à partir de l’exploration de données spatiales, comme celles issues d’images satellite.

Sujet :
L’objectif global de cette thèse est le développement de méthodologies innovantes, basées sur les techniques d’analyse de réseaux complexes, pour l’analyse des graphes d’interaction issus de la modélisation des dynamiques paysagères. Ce travail permettra d’exploiter de manière originale les modèles de simulation spatiale développés avec l’approche Ocelet, en permettant de créer de nouvelles connaissances à partir des graphes d’interaction modélisés et de ses dynamiques. Des algorithmes de classement, clustering, diffusion de l’information et prédiction des liens spécifiquement adaptés au contexte des relations caractéristiques (e.g., spatiales, fonctionnelles, hiérarchiques et sociales) entre les entités d’un système paysager pourront être développés. Ceci représentera une contribution significative aussi bien dans le domaine de l’analyse de réseaux et science des données, que dans celui de la modélisation et de l’analyse des dynamiques paysagères.
La première étape du travail de recherche est liée à la nécessité de comprendre comment les graphes d’interaction entre les éléments d’un paysage visible sur les images satellite, et qui expriment le fonctionnement du socio-écosystème présent dans le paysage, se traduisent dans la structure en réseau de ces graphes. La seconde étape consistera à développer et implémenter des méthodes d’analyse de réseaux complexes spécifiquement adaptés aux modèles pris en comptes en réponse à la question de recherche précédente. L’idée est d’obtenir une suite de méthodes d’analyse généralisables à différents contextes, qui pourront être ensuite intégrés dans la plateforme Ocelet. Pour mener ce travail, nous adopterons une démarche pluridisciplinaire, où les contributions méthodologiques proposées seront toujours soumises aux avis d’experts en modélisation spatiale des dynamiques paysagères.
Ces deux étapes seront menées d’abord sur une diversité de sites d’études pour lesquels des modèles ont déjà été développés, ou sont en cours de développement (e.g. au Burkina Faso, Sénégal, Mozambique, La Réunion, République du Congo). En particulier, cette thèse sera adossée à deux projets où TETIS est fortement impliquée, et qui mettra en œuvre des modèles spatiaux ambitieux (projet AFD/LUCCIA au Mozambique, pour aider à évaluer la stratégie nationale REDD+, et le projet PUDT Congo, pour aider à optimiser le réseau d’approvisionnement en bois-énergie d’une grande ville). Ensuite, un terrain en Afrique de l’Ouest, en lien avec la question de la sécurité alimentaire, sera privilégié. Des analyses plus contextualisées, plus en lien avec le terrain, seront menées avec une visée explicative des caractéristiques observées dans les réseaux.

Profil du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.

Formation et compétences requises :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.

Adresse d’emploi :
Maison de la télédétection, 500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202209200857_Analyse de réseaux complexes issus de graphes FINAL.pdf

Gouvernance des données dans le contexte de l’enseignement supérieur et de la recherche française

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaBRI (UMR 5800) et IMS (UMR 5218) Université de B
Durée : 3 ans
Contact : Guy.Melancon@u-bordeaux.fr
Date limite de publication : 2022-10-31

Contexte :
Les données sont souvent mises en avant comme potentiel vecteur de développement des organisations. Elles sont présentées comme outil compagnon du pilotage d’une organisation et de la construction de sa stratégie (Waller 2020). La littérature vantant les mérites du « pilotage par les données » est volumineuse, mais emprunte le plus souvent un style qui relève de la vulgarisation scientifique voire de la « propagande » destinée aux acteurs empressée de ne pas rater le rendez-vous d’une transformation qu’il peine à comprendre (Ernst & Young – Mourroux & Deballon 2021), McKinsey (Assur & Rowshankish 2022)…

Dans ce contexte, les aspects de gouvernance des données sont occultés par les questions plus opérationnelles de fouille et d’analyse des données afin d’éclairer la décision; ce sont en effet les usages des données qui intéressent la plupart des acteurs. Bien que la littérature sensibilise au besoin et au bénéfice de doter les organisations d’une gouvernance des données, la définition même de ce qu’est cette gouvernance, sa fonction et sa mise en place sont rarement décrites.

Cela dit, des initiatives sont prises par des organisations afin d’avancer sur le sujet; des définitions, empreintes de pragmatisme en émergent. Par ailleurs, le contexte réglementaire de l’ESRI (Enseignement Supérieur, Recherche et Innovation) apporte des éclairages, mais encore une fois plutôt sur les usages et sur les aspects qui concernent le système d’information, et dans un cadre beaucoup plus large que le seul contexte universitaire (« Cadre Commun d’Urbanisation du SI de l’Etat », v1.0, 2012) (Rapport au Premier Ministre 2016-2017).
La déclinaison du cadre réglementaire au niveau des universités n’est pas immédiate, compte tenu de l’autonomie dont elles disposent en matière stratégique, et des spécificités de leurs missions. La définition de la gouvernance des données, de son organisation et de son fonctionnement dans un établissement universitaire reste à notre sens à faire.

Sujet :
La gouvernance des données suit des ambitions d’un « pilotage par la donnée » de l’établissement, et des objectifs affichés de la politique d’ouverture des données de la recherche. La démarche exige de définir les principes d’une gouvernance guidant toutes initiatives produisant, consommant ou manipulant des données, quelle que soit leur nature, et une mise en cohérence d’initiatives se déployant sur toutes les missions de l’établissement et se déroulant à différentes échelles.

Incidemment, le développement de living labs verra naître des besoins de gestion de données propres à ces projets et constitue en quelque sorte un objet de recherche privilégié pour avancer sur le sujet de la gouvernance. Le lancement d’un projet de recherche action développant les fondements d’une gouvernance des données de l’établissement vient donc répondre au besoin d’une meilleure gestion du cycle de vie des données de ces initiatives, avant que de servir de socle pour définir une gouvernance au niveau de l’établissement.

L’objectif de cette recherche action est d’énoncer clairement les fondements de la gouvernance des données dans le contexte ESRI, et de produire une méthodologie robuste permettant à un établissement universitaire de se doter d’une telle gouvernance. Un corollaire immédiat est la définition au niveau de notre établissement d’une gouvernance des données adaptée à son contexte. La généralisation à tout établissement de l’ESRI, ou à tout le moins aux établissement de profils similaires (membres de UDICE, par exemple) pourra suivre.

Les approches de gouvernance des données sont encore peu documentées, et lorsqu’elles le sont, elles concernent le plus souvent le monde de l’entreprise. La complexité du contexte ESRI en fait une question complexe, certainement due à la multiplicité et l’enchevêtrement des missions de l’établissement, et la multiplicité des acteurs dans le contexte et l’écosystème universitaire.
Ainsi, en associant les perpectives des domaine des systèmes d’information et de la gouvernance de l’information, l’ambition est de proposer un fondement à la gouvernance des données pour un établissement ESRI.

Profil du candidat :
Le.la candidat.e recherché.e, de profil informatique et/ou sciences de l’information, doit montrer un goût pour les questions touchant aux données et aux systèmes d’information, tant d’un point de vue technique qu’organisationnel. Le déroulement du projet amènera le candidat à échanger avec des acteurs aux profils différents, chercheurs impliqués dans des projets soulevant des questions de gouvernance des données ou endossant une responsabilité au niveau institutionnel, par exemple.

Formation et compétences requises :
On peut attendre de la / du candidat.e une formation de type MIAGE ou dans le domaine de l’information et de la communication, par exemple, bien que tout autre profil ou parcours antérieur intéressant pourra être étudié.

Adresse d’emploi :
Université de Bordeaux
351 Cours de la Libération
33405 Talence
France

Document attaché : 202209191621_These_projet_GouD.pdf

ASNUM2022 : Conférence Action Spécifique Numérique Astrophysique

Date : 2022-12-12 => 2022-12-16
Lieu : ENS Lyon

Rationale :
Numerical computation and data analysis are essential aspects of research in astrophysics and astronomy, a field which has historically always been a producer of big data. Thus, whether to analyze photometric or spectroscopic data from large observatories on the ground or in space, or to produce and analyze virtual data from numerical simulations, astrophysics tools require large computing resources and storage, as well as new numerical methods adapted to new or emerging architectures.

This conference at the initiative of the Numerical Specific Action responds to the desire of the community to exchange their thoughts on these different numerical aspects in astrophysics. We encourage everyone to come and share their numerical analysis and modeling work, with the desire that this week of exchange will make it possible to decompartmentalize the themes, and to identify the methodological points of convergence between observations and simulations.

Abstract and registration deadline : 17th October

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Post-doctoral position: Knowledge Representation for materials discovery and product development

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT/Toulouse et SCIENOMICS/Paris
Durée : 12 mois
Contact : cassia.trojahn@irit.fr
Date limite de publication : 2022-09-19

Contexte :
In product development materials are selected and designed based on several criteria including performance, cost of production, availability, recyclability, and others. It is commonly accepted that the chemical space covers at least 1063 molecules making therefore the discovery of new materials with optimal design an impossible task to be performed following exhaustive screening and testing. Learning from known chemicals, translating the design requirements of the products and the constraints of the related processes into requirements for the materials to be discovered and testing then using virtual experiments is a viable route to follow.

SCIENOMICS is developing SIMAGORA, an online marketplace offering virtual experiments for the eco-conception and development of products, and the materials needed. It implements no-code concepts and allows interoperability between simulation engines from diverse domains. The aim is to democratize simulation technology and will provide to the international scientific community the capability to offer cutting-edge virtual experimentation technology to all companies worldwide.

Sujet :
In SIMAGORA semantics will play an important role since it will allow to gather experience and expertise available and implemented in technology that will be used to assist SIMAGORA users to take decisions. Ontologies are one of the critical technologies since they provide a formal ground for a self-guided online AI agent employing decision algorithms and provides automated virtual experimentation strategies for materials discovery and product development.

This post-doc will have the main task of performing research and development activities for enabling semantics-aware data access, integration of heterogeneous sources and interpretation in terms of product design objectives in SIMAGORA. It involves the generation of simulation scenarios (structured graphs in the simulation space) based on ontologies rather than building them ad hoc. Therefore, the project consists of three main activities:
(a) research and development in ontologies that will allow to capture product design and materials knowledge;
(b) conceive methodologies to develop and evaluate knowledge graphs and
(c) contribute to the conception of an AI agent, “robo-advisor”, capable to assist in materials discovery and product development through virtual experimentation execution.

Profil du candidat :
Applicants are required to have a PhD in Computer Science, a strong background in semantic web technologies, ontology engineering, ontology construction and reasoning. Fluency in written / spoken English is required too. A good publication record and strong programming skills will be a plus.
Capability to integrate a diverse group of people and supervise research and development work of PhD candidates.

Formation et compétences requises :
(See profile)

Adresse d’emploi :
Localization : Scienomics, 16 rue de l’Arcade, 75008 Paris, FRANCE with short visits at IRIT, Institut de Recherche en informatique de Toulouse (IRIT) – UPS, 118 Route de Narbonne F-31062 Toulouse Cedex, FRANCE.
Duration : 12 months, starting ASAP – 3 months of trying.

Journée reproductibilité du LabEx Primes

Date : 2022-12-08
Lieu : Campus de la Doua à Lyon

Journée reproductibilité du LabEx Primes

Le LabEx Primes organise une journée scientifique autour de la notion de reproductibilité. Il s’agira d’aborder la reproductibilité d’un résultat scientifique au sens large: reproductibilité expérimentale d’une mesure (influence de la chaine d’acquisition, instrumentation, choix des paramètres), reproductibilité numérique (chaine de traitement) dans le contexte de l’IA, reproductibilité d’une simulation; ainsi que tout ce qui concerne l’analyse statistique qui est mise œuvre, le questionnement sur les sources d’incertitude et d’erreur.

La journée est ouverte à toute personne intéressée. Plus d’information et inscription sur le site: https://reprod-primes.sciencesconf.org/

La journée est gratuite mais l’inscription est obligatoire.

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Postdoc : Analyse multivariée pour les événements extrêmes avec applications aux systèmes multirisques sous changement climatique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Unité de Biostatistique et Processus Spatiaux, INR
Durée : 18 mois
Contact : stephane.girard@inria.fr
Date limite de publication : 2022-11-30

Contexte :
Ce travail de postdoc sera réalisé au sein du projet ANOVEX, financé par Inria et INRAE pour renforcer leurs collaborations autour des risques environnementaux. Les outils statistiques d’analyse multivariée (p. ex. analyse de variance multivariée, analyse de sensibilité, analyse en composantes principales, arbres de décision) sont indispensables pour extraire des structures interprétables à partir de jeux de données complexes, souvent dans une visée de réduction de dimension et de
représentation parcimonieuse du système étudié, et pour construire et valider des modèles statistiques robustes pour la prédiction. Ces outils aident à mieux expliquer et prédire les systèmes à multiples composantes, comme le système climatique ou les risques multiples. Or, les approches classiques exploitent principalement les moyennes et les covariances des variables mesurées, mais sont peu adaptées à des analyses multifactorielles des valeurs extrêmes, souvent associées aux impacts les plus sévères. Ce projet propose des avancées méthodologiques et des implémentations numériques pour adapter ces approches au cadre des événements extrêmes. Dans les applications visées, ces nouveaux outils permettront de mieux caractériser les différences dans les événements extrêmes entre les simulations des différents modèles
climatiques, entre observations et simulations, et de mieux comprendre la sensibilité du risque des feux de forêt aux variables météorologiques à différentes échelles spatio-temporelles. Pour mesurer le risque incendie,
les variables météorologiques sont souvent utilisées en entrée de modèles numériques complexes représentant des processus physiques ou des corrélations statistiques, ou en entrée d’autres algorithmes à construction plus heuristique. Les indicateurs météorologiques du danger de feux de forêt, comme le « Fire Weather Index » (FWI), constituent un très bon exemple. La sensibilité de ces familles d’indicateurs aux événements extrêmes dans le système température-précipitation-humidité-vent, dont les variations d’effectuent dans différentes échelles spatio-temporelles, est encore mal comprise.

Sujet :
Un objectif clé sera de développer des nouvelles représentations mathématiques pour les mesures de risque extrême dans les systèmes multivariables et multi-échelle, afin de pouvoir utiliser les opérations
matricielles classiques, applicables en grande dimension. Une réflexion générale sera à mener sur les approches de réduction de dimension les plus pertinentes pour les événements extrêmes dans des systèmes complexes impliquant de nombreuses variables dépendantes. Dans le volet appliqué, nous ambitionnons une meilleure connaissance des structures des événements extrêmes dans le système climatique en France et en Europe, de leur hétérogénéité spatiale, de leur évolution temporelle sous changement climatique, et de leur impact sur les risques encourus dans les territoires.

Profil du candidat :
Des bonnes connaissances théoriques dans au moins un des trois domaines suivants sont requises : statistique des valeurs extrêmes ; analyse multivariée ; mesures de risque. La programmation en R est également demandée. Des connaissances en sciences du climat seront un atout.

Formation et compétences requises :
Doctorat. Merci d’envoyer un CV (avec la liste des productions scientifiques) et une lettre de motivation, et d’indiquer les coordonnées d’un ou deux encadrant(e)s disposé(e)s à fournir une lettre de recommandation.

Adresse d’emploi :
Unité de Biostatistique et Processus Spatiaux, INRAE Avignon,
Domaine Saint-Paul – Site Agroparc, 228 Rte de l’Aérodrome CS 40509, 84914 Avignon Cedex 9

Document attaché : 202209161207_offre-postdoc-ANOVEX.pdf

Post-doc en Data Mining Engineering pour l’analyse de logs d’activités

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Unité de Recherche LIST3N (Laboratoire Informatiqu
Durée : 12 mois
Contact : babiga.birregah@utt.fr
Date limite de publication : 2022-11-30

Contexte :
Le DataLab-UTT du Laboratoire Informatique et Société Numérique (LIST3N) de l’Université de Technologie de Troyes travaille sur la conception d’Analytics pour la valorisation des données de gestion de projet de certains de ses partenaires industriels. L’objectif est d’améliorer les performances du pilotage de projet par l’analyse temps réel des Logs d’activités.
Nous cherchons à recruter un(e) ingénieur(e) ou un Post-doc en Data Mining pour traiter les logs de cycle d’activités de projets industriels.

Sujet :
La mission consiste à construire un Data pipeline adapté aux problématiques d’exploration des logs de suivi de projets et à proposer des indicateurs de performance pour la détection précoce des divergences.
Du point de vue mathématique, il s’agit de modéliser les données et de construire des algorithmes de détection d’anomalies et de tracking de parterns d’intérêt.
La/le candidat(e) travaillera en étroite collaboration avec nos partenaires industriels sur le projet ainsi qu’avec les chercheurs du DataLab.

Profil du candidat :
La ou le candidat(e) retenu(e) travaillera sur l’analyse des logs de cycles de vie de projets. Elle/il devra avoir:
• une bonne capacité à interagir avec les équipes métiers et les acteurs du projet
• des connaissances en modélisation de données et leur gestion (Spark, AWS, etc.)
• de solides compétences et une bonne expérience en Data Mining avec Python (statistiques, Machine Learning, etc.)
• et de bonnes dispositions à évoluer en mode projet (outils Slack ou Bitbocket ou Trello ou GitHub, etc.)

Formation et compétences requises :
Doctorat en Mathématiques Appliquées ou en Informatique ou en Data science avec ou sans expérience professionnelle.

Adresse d’emploi :
Université de Technologie de Troyes*
12, rue Marie Curie
CS 42060 – 10004 Troyes Cedex

*Des missions en région parisienne auprès de nos partenaires sont à prévoir. Ces missions seront prises en charge par l’université.

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

Machine Learning for Life Sciences

Bayesian inference with expensive and imperfect data models

MCF en Intelligence Artificielle (CDD de 3 ans)

Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère

Gouvernance des données dans le contexte de l’enseignement supérieur et de la recherche française

ASNUM2022 : Conférence Action Spécifique Numérique Astrophysique

Post-doctoral position: Knowledge Representation for materials discovery and product development

Journée reproductibilité du LabEx Primes

Postdoc : Analyse multivariée pour les événements extrêmes avec applications aux systèmes multirisques sous changement climatique

Post-doc en Data Mining Engineering pour l’analyse de logs d’activités