[PhD] Emotion classification from EEG signals, ICube & Cephalgo (Strasbourg)

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube, Strasbourg
Durée : 3 ans
Contact : jonathan.chardin@cephalgo.com
Date limite de publication : 2022-11-30

Contexte :
The thesis will be carried out in partnership between the company CEPHALGO (specialised in the development of hardware for the recording of EEG signals and their statistical study) under the supervision of Dr Jonathan Chardin and the ICube research laboratory under the supervision of Dr Thomas Lampert HDR, Chair of Data Science and AI (specialised in the development of machine learning and deep learning models). The candidate will share his/her time between the CEPHALGO company and the ICube research laboratory.

Keywords: Deep learning, Affective computing, Valence arousal model, Fourier transform, classifiers, machine learning, PCA, wavelets, statistical analysis.

Sujet :
We are looking for a candidate for a PhD thesis in the field of emotion recognition from electroencephalographic (EEG) signals. The objective of the thesis is to perform statistical analysis of EEG signals and to find correlations between quantities extracted from the raw signals and the emotions associated with the signals during their recording. The candidate will first acquire EEG signals from several users to build a study database. The thesis will then have two stages:
1. As a comparison method, a ‘classical’ analysis of the data will be performed. That is to perform any necessary pre-processing (filtering, elimination of bad signals, estimation of the quality of the signals and decomposition into brain waves, i.e. alpha, beta, theta, gamma waves…), make a statistical study on the data (extraction of quantities from the processed signals, i.e. Hjorth parameters, spectral entropy, moments…), and to find correlations between these different quantities and the emotions associated with the signals.
2. This will lead to the development of machine learning ( particularly deep learning) algorithms to associate EEG signals with their corresponding emotions based on state-of-the-art models (transformers, convolutional neural networks, etc).

Profil du candidat :
Desirable skills:
– Good knowledge of signal processing (Fourier transform, wavelet decomposition, spectrograms, etc.)
– Experience in working with EEG data or time-series would be a plus but not necessary
– Care for patients suffering from mental disorders

Formation et compétences requises :
Skills required:
– Master’s degree (M2) in Computer Science or similar with a strong mathematical component
– Experience in machine learning projects, preferably in addition to Deep Learning
– A solid knowledge of the python programming language and associated libraries (numpy, scipy, matplotlib)
– Project management skills when collaborating with other research partners
– Good interpersonal skills to interact with medical professionals and patients
– Adventurous towards the dynamic startup environment and scientific challenges

Adresse d’emploi :
CEPHALGO, Strasbourg

Appel à communication pour l’atelier GAST/EGC’2023 (Gestion et Analyse des données Spatiales et Temporelles)

Date : 2023-01-17
Lieu : Lyon

Résumé :
Dans le cadre du huitième atelier GAST, nous sollicitons des soumissions d’articles autour des thématiques de la gestion et analyse
des données spatiales et temporelles. Nous souhaitons que l’atelier soit un espace d’échange qui regroupe des chercheurs du domaine.
En fonction des possibilités, nous pourrons également envisager la venue d’un invité qui, par ses travaux récents, peut enrichir
les connaissances de la communauté.

Équipe organisatrice :
– Aurélie Leborgne (aurelie.leborgne@unistra.fr), ICube / UNISTRA (Strasbourg)
– Nida Meddouri (nida.meddouri@epita.fr), LRE / EPITA (Paris)
– Loïc Salmon (loic.salmon@isen-ouest.yncrea.fr), L@bISEN / ISEN (Brest)

Descriptif :
Les données spatiales et temporelles s’étendent au sens très large dans cet atelier. Il peut s’agir d’analyser des données enrichies
d’informations de localisation et d’horodatage ; aussi bien que de traiter des sources d’informations complexes dont nous cherchons
à extraire des informations spatiales ou temporelles (documents vidéos, textes, cartes, etc.). Les problématiques associées peuvent
concerner aussi bien les techniques de représentation de ces informations, leurs analyses (en temps réel ou pas) que leur stockage.

Ces thématiques ont connu un intérêt croissant ces dernières années, en particulier avec le développement de nombreuses méthodes d’analyse
de séries temporelles ou de traces mobiles. Il nous apparaît donc important de permettre aux chercheurs de la communauté francophone
(ou autres) de pouvoir se rencontrer pour échanger spécifiquement sur ces thématiques.

Objectifs :
Cet atelier s’inscrit dans la continuité des ateliers des années passées. Un des objectifs est de regrouper les chercheurs du domaine
académique et de l’industrie. Ces derniers s’intéressent aux problématiques liées à la prise en compte de l’information temporelle
ou spatiale (quantitative ou qualitative) dans leurs processus de gestion et d’analyse de données (méthodes et application de l’extraction,
la gestion, la représentation, l’analyse et la visualisation d’informations, apprentissage et extraction de connaissances à partir
des données spatio-temporelles). L’atelier permet de donner la possibilité à un grand nombre de chercheurs intéressés par ces thématiques
de présenter leurs problématiques et approches.

Thèmes de l’atelier (liste non exhaustive) :
Les soumissions attendues porteront sur les besoins, outils, problèmes, techniques, méthodes et algorithmes dédiés à l’analyse :
– Des données temporelles : séries temporelles, données séquentielles, etc…;
– Des données spatiales : images satellites, numériques, données géomatiques et maritimes, etc…;
– Des données spatio-temporelles : données issues de réseaux de capteurs, données biologiques et médicales, traces spatio-temporelles
(déplacements d’espèces vivantes, objets), vidéos, séries d’images satellites, données territoriales, etc. ;
– Des données textuelles évoquant des aspects spatiaux et temporels, etc. ;
– Des flux de données (en temps réel) incluant des informations spatiales, etc. ;
– Des données fédérées dans un environnement distribué géographiquement, etc.

Les questions suivantes pourront, par exemple, y être abordées :
– Recherche et intégration de connaissances spatiales et temporelles dans un processus d’analyse de données;
– Méthodes d’apprentissage profond pour les données spatio-temporelles;
– Extraction et visualisation de motifs ou de règles de classification/prédiction à partir des données spatio-temporelles;
– Modélisation de l’information spatiale et temporelle, prise en compte des aspects hétérogène, multidimensionnel ou multi échelle
des données temporelles et spatiales;
– Représentation, analyse et gestion des données spatio-temporelles incertaines;
– Prise en compte des contraintes d’anonymat dans les données spatiales et temporelles (apprentissage fédéré);
– Explicabilité/interprétabilité des modèles en présence de données temporelles et/ou spatiales;
– Données géo-spatiales et géo-temporelles du Web et de l’Open Data;
– Construction et acquisition de connaissances géo-spatiales/géo-temporelles à partir de textes et/ou d’images;
– Mesure de qualité sur les données spatiales et temporelles;

Les contributions peuvent aborder ces questions de manière conceptuelle ou appliquée sur divers domaines d’application (santé,
transport, industrie, etc.). Les méthodes, modèles et outils qui transcendent les frontières entre plusieurs domaines applicatifs
seront particulièrement appréciés.

Les dates :
Abstract: 22 novembre 2022
Full paper: 25 novembre 2022
Notification : 16 décembre 2022

Instructions aux auteurs :
Les auteurs sont invités à soumettre des travaux de recherche originaux (non publiés ou en cours d’évaluation) autour des thématiques
de l’atelier. Trois formats de papier sont acceptés : résumés étendus de 2 pages; papiers courts de 6 pages et papiers longs de 12 pages.
Les actes n’étant pas imprimés, une certaine flexibilité est possible autorisée autour de ces chiffres.

Les soumissions devront être réalisées au format PDF et devront utiliser le format RNTI disponible en téléchargement à l’adresse :
http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip. La langue officielle de l’atelier est le français, mais il reste ouvert aux
contributions en langue anglaise. La soumission des propositions d’articles se fera exclusivement sous format électronique via le site
EasyChair Conference System : https://easychair.org/conferences/?conf=egc2023 en choisissant lors de la soumission la track GAST
correspondant à l’atelier. Si vous avez des difficultés, n’hésitez pas à nous contacter.

Chaque soumission sera évaluée par 3 évaluateurs. Les critères d’évaluation retenus sont :
– L’adéquation du contenu scientifique de la proposition aux thématiques de l’atelier.
– La mise en évidence d’un résultat scientifique, d’une idée innovante ou de retours d’expériences.
– La qualité scientifique de la soumission.
– La clarté de la présentation (pour un public pluridisciplinaire notamment).
– Le fait que la contribution soit susceptible de donner lieu à des échanges scientifiques intéressants.

Les inscriptions peuvent se réaliser à l’atelier seul ou à tout l’événement (atelier + conférence). Le tarif d’inscription et la procédure
d’inscription sont disponibles sur le site de la conférence EGC : https://egc2023.sciencesconf.org.

Contact : gast_egc2023@easychair.org

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Journées d’étude Musiscale

Annonce en lien avec l’Action/le Réseau : Musiscale

Thème :

Similarités musicales : échelles, dimensions, modèles, usages

Présentation :

Les données musicales constituent une masse d’information considérable qui est cependant mal exploitée du fait de l’absence de paradigme générique permettant de rendre de rendre compte de leurs relations de similarité, et ce à diverses échelles de représentation.
Par similarité, on entend des relations simples qui permettent d’expliquer et de formuler les correspondances entre éléments, séquences temporelles, sections, albums, oeuvres, voire corpus musicaux, en tenant compte de leurs spécificités mais en veillant à faire appel à un paradigme général. Les éléments musicaux s’organisent en effet à différentes échelles, au sein d’un corpus, dans le temps, etc.
Dans tous les cas on peut identifier des éléments qui se répètent, éventuellement avec des variations (reprises de morceaux au sein du corpus, similarités de motifs dans le temps au sein d’un morceau, répétitions de notes au sein d’un motif, etc.).
L’atelier Musiscale vise à définir les propriétés et les structures de données les plus appropriées à ces représentations, en tenant compte de la nature des données mais sans préjuger des utilisations qui peuvent en être faites.

Dans cet objectif, nous organisons les 6 et 7 octobre à Paris les premières journées de l’atelier Musiscale sur la thématique :

« Similarités musicales à différentes échelles, différentes dimensions, différents domaines : modèles, besoins, usages. »

Du : 2022-10-06

Au : 2022-10-07

Lieu : Maison de la Recherche
28 rue Serpente 75006 Paris

Site Web : https://www.madics.fr/ateliers/musiscale/

Pour vous inscrire, vous devez déjà être membre du GDR MaDICS et identifié sur le site.
Inscrivez-vous maintenant !

Postdoc (2 years) at CEA: NLP and genomics

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : CEA List
Durée : 2 years
Contact : deepgenseq@saxifrage.saclay.cea.fr
Date limite de publication : 2023-02-03

Contexte :
The french CEA (Commissariat à l’Energie Atomique et aux Energies Alternatives) is looking for a Postdoctoral Fellow to join its laboratory of semantic analysis of texts and images.

In this exciting project, you will integrate an interdisciplinary team aiming to move closer to the goal of predictive and generative artificial intelligence for biology by exploiting deep contextual language models of biological sequences, whose representations generalize to several applications like the prediction of mutational effects.

TERMS & COMPENSATION

This 2 years position is open to a range of candidates from recent college graduates to more experienced scientists (e.g. post-docs) – the chosen candidate’s salary will be commensurate with their level of education, skills, and experience. Other benefits include:
– 48 days of paid holidays
– on-site subsidized restaurant
– partial remote work is possible, up to 3 days per week and 100 days per year
– CEA contribution to the personal company savings plan

Sujet :
BACKGROUND

Exponential growth in sequencing throughput together with the sampling of natural (uncultured) populations are providing a deeper view of the diversity of proteins sequences across the tree of life. Proteins are molecular engines sustaining cellular life and the unobserved determinants of their structure and function are encoded in the distribution of observed natural sequences. Therefore, such vast amounts of (unlabelled) sequences provide evolutionary data that can form the ground for unsupervised learning of predictive and generative models of biological function.

Our focus here will be to train high-capacity Transformer-based language models on sequence data, in a way analogous to what is done in natural language understanding, where the semantics of words is determined from the contexts in which they appear in sentences. Intrinsic organizing principles captured in the resulting representations can then be applied in transfer learning settings to different prediction sub-tasks using limited experimental data, like the effect of sequence variation on function. Following promising recent results, we plan to also explore zero-shot inference with no additional training and/or supervision from experimental data.

This project will be an excellent opportunity for a candidate who is looking to contribute to cutting-edge research and to train with experts in the field. We are seeking a detail-oriented computer scientist and problem solver passionate in science.

RESPONSIBILITIES

* Tune and optimize existing unsupervised transformer-based language models for protein sequences.
* Develop and optimize code and machine learning algorithms for predictive models.
* Integrate and analyze large data volumes.
* Interact continuously with scientists in an interdisciplinary team.

Profil du candidat :
* Ph.D. or M.Sc. in a quantitative discipline, e.g. Applied Mathematics, Computer Science, Computational Biology, Physics or a closely related discipline.
* Experience with Python, open-source software libraries for machine learning and Linux (file systems, shell, hardware/software monitoring, etc).
* Strong mathematical background and analytical skills.
* Effective organizational skills, e.g. the ability to prioritize work and contribute to the planning of a program of scientific research.
* Demonstrated interpersonal skills including both the ability to work independently and perform collaborative research in an interdisciplinary team environment.
* Good oral and written communication skills.

Preferred: Previous experience with transformer-based techniques for NLP pre-training and unsupervised transformer language models

Formation et compétences requises :
* Ph.D. or M.Sc. in a quantitative discipline, e.g. Applied Mathematics, Computer Science, Computational Biology, Physics or a closely related discipline.

Adresse d’emploi :
LOCATION

We are based on the Paris-Saclay research campus in the south of Paris.

HOW TO APPLY

Interested candidates should submit a resume and short cover letter to deepgenseq@saxifrage.saclay.cea.fr

ABOUT US :

About CEA LIST: https://list.cea.fr/en/

About the LASTI lab: https://kalisteo.cea.fr/index.php/ai/

Semantic Analysis of Text and Images

About Genoscope: https://www.genoscope.cns.fr

Machine Learning for Life Sciences

Date : 2022-11-15 => 2022-11-17
Lieu : Montpellier

The objective of the conference organized by the KIM Data & Life Sciences is to connect researchers and promote interdisciplinary collaborations, in the field of massive data, machine learning and artificial intelligence with connections to life sciences.

Keynote speakers:

Stephen Becker (University of Colorado
Michael Blum (
Julien Chiquet (INRAE, Paris-Saclay University)
Sophie Donnet (INRAE,Paris-Saclay University)
Emmanuel Faure (CNRS & LIRMM, Montpellier)
Flora Jay (CNRS, Paris-Saclay University)
Tim Landgraf (University of Berlin)
Charles-Henri Lecellier (CNRS, IGMM & LIRMM, University of Montpellier)
Diego Marcos (Inria, Montpellier)
Gabriel Peyré (CNRS & École Normale Supérieure Paris)
Daniele Silvestro (University of Fribourg)
Yun S. Song (UC Berkeley)
Bertrand Thirion (Inria, Team Parietal, Univ. Paris-Saclay)
Nathalie Vialaneix (INRAE, Toulouse)

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Bayesian inference with expensive and imperfect data models

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Institut d’Astrophysique de Paris
Durée : 3 à 6 mois
Contact : florent.leclercq@iap.fr
Date limite de publication : 2022-12-26

Contexte :
Surveys of the cosmic large-scale structure carry rich scientific opportunities. Advancing the research frontier requires solving unique and challenging statistical problems, to unlock the information content of massive and complex data vectors. The recently-proposed machine learning technique BOLFI (Bayesian optimisation for likelihood-free inference) makes inference of complex Bayesian hierarchical models under the constraint of a very limited simulation budget possible. Unfortunately, its use is currently hampered by several theoretical and practical challenges.

Sujet :
The goal of this interdisciplinary project is to upgrade the BOLFI algorithm for the extraction of information distributed in massive and heterogeneous data, in the context of expensive and imperfect data models. Motivating problems and applications will come from upcoming galaxy survey data such as Euclid. We will address several issues, including: (i) the parallel acquisition of simulations when only a limited number of noisy likelihood evaluations can be obtained, (ii) the robustification of the technique against model mis-specification, (iii) the definition of summary statistics that maximise the extraction of information, e.g. via information-maximising neural networks (IMNN). The proposed algorithm will be applied to the inference of cosmological parameters using a realistic simulator. Ultimately, the developed method will be an important tool for the extraction of physical information from Euclid data, which has the potential to influence the design of future data analysis pipelines.

Related links and literature / Version française : https://florent-leclercq.eu/supervision.php#internship-2023-info

Profil du candidat :
The student will get experience of statistical modelling, machine learning, data mining, cosmology, and astronomical observations. They should be comfortable with computing (preferably, experience with python and git). This work could naturally lead to a PhD project in data science and/or cosmology, for example in the large-scale structure and distant Universe group of the Institut d’Astrophysique de Paris (IAP).

Formation et compétences requises :
Interest in information science, machine learning, data science, and a taste for (astro)physics.

Adresse d’emploi :
Institut d’Astrophysique de Paris, 98 bis boulevard Arago, 75014 Paris, France

MCF en Intelligence Artificielle (CDD de 3 ans)

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Telecom SudParis/Samovar
Durée : 3 ans
Contact : bruno.defude@telecom-sudparis.eu
Date limite de publication : 2022-10-10

Contexte :
Télécom SudParis est une grande école publique d’ingénieurs reconnue au meilleur niveau des sciences et technologies du numérique. La qualité de ses formations est basée sur l’excellence scientifique de son corps professoral et une pédagogie mettant l’accent sur les projets d’équipes, l’innovation de rupture et l’entreprenariat. Télécom SudParis compte 1 000 étudiantes et étudiants dont 700 élèves ingénieurs et environ de 150 doctorantes et doctorants. Télécom SudParis fait partie de l’Institut Mines-Télécom, premier groupe d’école d’ingénieurs en France, et partage son campus avec Institut Mines-Télécom Business School. Télécom SudParis est co- fondatrice de l’Institut Polytechnique de Paris (IP Paris), Institut de Sciences et Technologies à vocation mondiale avec l’École polytechnique, l’ENSTA Paris, l’ENSAE Paris et Télécom Paris.

Sujet :
Dans le cadre de l’appel à Manifestation d’intérêt Compétences et Métiers d’avenir, Télécom SudParis s’engage à massifier la formation des étudiants.es formés.es à l’intelligence artificielle. L’objectif stratégique du recrutement est donc de répondre à cette demande au niveau de Télécom SudParis, IP Paris et Hi! Paris.

L’objectif du programme AI4Good de TSP est double :
– Massifier la formation de spécialistes en Data Science et Intelligence artificielle
– Développer la Formation d’utilisateurs experts de l’intelligence Artificielle appliquée au bien commun (Santé, Environnement, Education…)

Trois types de missions seront donc couvertes par le poste :
– Enseignement
– Développement des programmes pédagogiques et des filières d’enseignement AI4Good de TSP
– Recherche

Profil du candidat :
Le poste est ouvert sur un profil machine learning, intelligence artificielle ou statistiques. La recherche s’effectuera dans le laboratoire Samovar au sein de l’équipe qui correspondra le plus au profil du candidat-e sélectionné-e.
Activités

1. Enseignement
Pour répondre au besoin de massification en enseignement, le/la MdC recruté.e devra :
– Assurer des enseignements en apprentissage statistique, classification automatique, Data Mining dans la Formation d’Ingénieur sous statut Etudiant
– Coordonner des modules d’enseignement
– Participer à l’encadrement de projets étudiants
– Assurer le tutorat pédagogique d’Étudiants en stage de troisième année

–> Certains enseignements auront vocation à être délivrés en anglais

2. Développement du programme AI4Good
Dans le cadre du développement des programmes pédagogiques et des filières d’enseignement AI4Good de TSP, le/la MdC recruté.e intègrera l’équipe d’Appui et Transformation pédagogique de TSP sous la responsabilité de la Directrice Adjointe des Formations. Dans ce cadre, il/elle devra :
– Assurer une veille scientifique et pédagogique dans le domaine de la formation à l’utilisation de l’intelligence artificielle
– Contribuer au développement des nouvelles filières du programme AI4Good
– Représenter les intérêts de la Direction des Formations de TSP au sein d’Hi! Paris
– Participer au montage du certificat IA/DS d’IP Paris pour les non spécialistes

3. Recherche
Le projet de recherche du/de la candidat(e) se situera dans le domaine des modélisations probabilistes et traitements statistiques appliqués à l’Intelligence artificielle, avec applications dans l’un des domaines prioritaires que sont :
– la Santé
– l’Environnement
– l’Energie
– l’Éducation

Formation et compétences requises :
Doctorat ou

Compétences, connaissances et expériences indispensables

Expérience de l’enseignement et de la recherche avec un goût prononcé pour les applications
Connaissance des pratiques pédagogiques dans l’enseignement supérieur
Maîtrise du français et de l’anglais
Excellentes qualités d’expression écrite et orale
Compétences confirmées dans le domaine de l’Intelligence artificielle

Compétences, connaissances et expériences souhaitables

Connaissances scientifiques étendues dans les domaines des technologies de l’information
Expérience internationale en enseignement-recherche/ Visibilité internationale

Capacités et aptitudes

Qualités relationnelles et pédagogiques permettant de mener des discussions dans le domaine de la data science et de l’intelligence artificielle
Aptitude à la rédaction, à la synthèse
Aptitude à négocier avec des interlocuteurs de haut niveau, internes et externes à l’Institut Mines-Télécom et l’Institut Polytechnique de Paris
Disponibilité
Sens de l’animation et de l’organisation
Dynamisme, curiosité, volonté de découvrir et apprendre

Adresse d’emploi :
Telecom SudParis exerce principalement ces activités d’enseignement à Evry (91) mais certains enseignements peuvent être organisés à Palaiseau (91).

Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 3 ans
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2022-10-31

Contexte :
Le sujet de thèse proposé vise au croisement de deux disciplines principales : l’analyse de réseaux complexes et la modélisation des dynamiques spatiales. La modélisation des dynamiques spatiales est une approche privilégiée pour étudier les processus complexes d’interaction homme-environnement qui sont au centre des systèmes d’utilisation des terres (land use system).
Dans ce contexte, une nouvelle approche fondée sur le concept de graphe d’interaction a été développée au CIRAD/UMR TETIS, avec l’objectif de permettre un meilleur couplage des systèmes de modélisation avec des SIG (Système d’Information Géographique) et améliorer la modélisation des mécanismes qui sont influencés par des structures spatiales dynamiques. Le graphe d’interaction est un graphe (un ensemble de nœuds connectés par des arcs) dont les arcs peuvent porter des fonctions d’interaction. Un système représenté par des graphes d’interaction peut ainsi évoluer lorsque les fonctions d’interactions sont activées et que celles-ci modifient les entités connectées. Les éléments présents dans un espace géographique peuvent ensuite définir des relations spatiales, fonctionnelles, hiérarchiques et même sociales. La mise en œuvre de cette approche s’appuie sur le langage de modélisation Ocelet, et son environnement logiciel de développement (http://www.ocelet.org).
Les modèles développés avec Ocelet sont employés principalement pour simuler des dynamiques spatiales dans différents systèmes territoriaux complexes, comme par exemple, pour comparer plusieurs scénarios d’utilisation des terres. Ces modèles font généralement intervenir plusieurs graphes d’interaction dans des structures porteuses de connaissances du fonctionnement et de l’organisation du territoire. Jusqu’à présent, lors de déploiement de ces modèles, seuls les résultats de simulation sont analysés ; les graphes ne le sont pas, alors qu’ils sont une expression formelle de processus très divers qui interagissent dans le territoire. Ces analyses permettraient notamment d’expliciter les liens entre structure et fonctionnement du territoire, pour viser, à terme, la possibilité d’inférer des connaissances des processus à partir de l’exploration de données spatiales, comme celles issues d’images satellite.

Sujet :
L’objectif global de cette thèse est le développement de méthodologies innovantes, basées sur les techniques d’analyse de réseaux complexes, pour l’analyse des graphes d’interaction issus de la modélisation des dynamiques paysagères. Ce travail permettra d’exploiter de manière originale les modèles de simulation spatiale développés avec l’approche Ocelet, en permettant de créer de nouvelles connaissances à partir des graphes d’interaction modélisés et de ses dynamiques. Des algorithmes de classement, clustering, diffusion de l’information et prédiction des liens spécifiquement adaptés au contexte des relations caractéristiques (e.g., spatiales, fonctionnelles, hiérarchiques et sociales) entre les entités d’un système paysager pourront être développés. Ceci représentera une contribution significative aussi bien dans le domaine de l’analyse de réseaux et science des données, que dans celui de la modélisation et de l’analyse des dynamiques paysagères.
La première étape du travail de recherche est liée à la nécessité de comprendre comment les graphes d’interaction entre les éléments d’un paysage visible sur les images satellite, et qui expriment le fonctionnement du socio-écosystème présent dans le paysage, se traduisent dans la structure en réseau de ces graphes. La seconde étape consistera à développer et implémenter des méthodes d’analyse de réseaux complexes spécifiquement adaptés aux modèles pris en comptes en réponse à la question de recherche précédente. L’idée est d’obtenir une suite de méthodes d’analyse généralisables à différents contextes, qui pourront être ensuite intégrés dans la plateforme Ocelet. Pour mener ce travail, nous adopterons une démarche pluridisciplinaire, où les contributions méthodologiques proposées seront toujours soumises aux avis d’experts en modélisation spatiale des dynamiques paysagères.
Ces deux étapes seront menées d’abord sur une diversité de sites d’études pour lesquels des modèles ont déjà été développés, ou sont en cours de développement (e.g. au Burkina Faso, Sénégal, Mozambique, La Réunion, République du Congo). En particulier, cette thèse sera adossée à deux projets où TETIS est fortement impliquée, et qui mettra en œuvre des modèles spatiaux ambitieux (projet AFD/LUCCIA au Mozambique, pour aider à évaluer la stratégie nationale REDD+, et le projet PUDT Congo, pour aider à optimiser le réseau d’approvisionnement en bois-énergie d’une grande ville). Ensuite, un terrain en Afrique de l’Ouest, en lien avec la question de la sécurité alimentaire, sera privilégié. Des analyses plus contextualisées, plus en lien avec le terrain, seront menées avec une visée explicative des caractéristiques observées dans les réseaux.

Profil du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.

Formation et compétences requises :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.

Adresse d’emploi :
Maison de la télédétection, 500 Rue Jean François Breton, 34090 Montpellier

Document attaché : 202209200857_Analyse de réseaux complexes issus de graphes FINAL.pdf

Gouvernance des données dans le contexte de l’enseignement supérieur et de la recherche française

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LaBRI (UMR 5800) et IMS (UMR 5218) Université de B
Durée : 3 ans
Contact : Guy.Melancon@u-bordeaux.fr
Date limite de publication : 2022-10-31

Contexte :
Les données sont souvent mises en avant comme potentiel vecteur de développement des organisations. Elles sont présentées comme outil compagnon du pilotage d’une organisation et de la construction de sa stratégie (Waller 2020). La littérature vantant les mérites du « pilotage par les données » est volumineuse, mais emprunte le plus souvent un style qui relève de la vulgarisation scientifique voire de la « propagande » destinée aux acteurs empressée de ne pas rater le rendez-vous d’une transformation qu’il peine à comprendre (Ernst & Young – Mourroux & Deballon 2021), McKinsey (Assur & Rowshankish 2022)…

Dans ce contexte, les aspects de gouvernance des données sont occultés par les questions plus opérationnelles de fouille et d’analyse des données afin d’éclairer la décision; ce sont en effet les usages des données qui intéressent la plupart des acteurs. Bien que la littérature sensibilise au besoin et au bénéfice de doter les organisations d’une gouvernance des données, la définition même de ce qu’est cette gouvernance, sa fonction et sa mise en place sont rarement décrites.

Cela dit, des initiatives sont prises par des organisations afin d’avancer sur le sujet; des définitions, empreintes de pragmatisme en émergent. Par ailleurs, le contexte réglementaire de l’ESRI (Enseignement Supérieur, Recherche et Innovation) apporte des éclairages, mais encore une fois plutôt sur les usages et sur les aspects qui concernent le système d’information, et dans un cadre beaucoup plus large que le seul contexte universitaire (« Cadre Commun d’Urbanisation du SI de l’Etat », v1.0, 2012) (Rapport au Premier Ministre 2016-2017).
La déclinaison du cadre réglementaire au niveau des universités n’est pas immédiate, compte tenu de l’autonomie dont elles disposent en matière stratégique, et des spécificités de leurs missions. La définition de la gouvernance des données, de son organisation et de son fonctionnement dans un établissement universitaire reste à notre sens à faire.

Sujet :
La gouvernance des données suit des ambitions d’un « pilotage par la donnée » de l’établissement, et des objectifs affichés de la politique d’ouverture des données de la recherche. La démarche exige de définir les principes d’une gouvernance guidant toutes initiatives produisant, consommant ou manipulant des données, quelle que soit leur nature, et une mise en cohérence d’initiatives se déployant sur toutes les missions de l’établissement et se déroulant à différentes échelles.

Incidemment, le développement de living labs verra naître des besoins de gestion de données propres à ces projets et constitue en quelque sorte un objet de recherche privilégié pour avancer sur le sujet de la gouvernance. Le lancement d’un projet de recherche action développant les fondements d’une gouvernance des données de l’établissement vient donc répondre au besoin d’une meilleure gestion du cycle de vie des données de ces initiatives, avant que de servir de socle pour définir une gouvernance au niveau de l’établissement.

L’objectif de cette recherche action est d’énoncer clairement les fondements de la gouvernance des données dans le contexte ESRI, et de produire une méthodologie robuste permettant à un établissement universitaire de se doter d’une telle gouvernance. Un corollaire immédiat est la définition au niveau de notre établissement d’une gouvernance des données adaptée à son contexte. La généralisation à tout établissement de l’ESRI, ou à tout le moins aux établissement de profils similaires (membres de UDICE, par exemple) pourra suivre.

Les approches de gouvernance des données sont encore peu documentées, et lorsqu’elles le sont, elles concernent le plus souvent le monde de l’entreprise. La complexité du contexte ESRI en fait une question complexe, certainement due à la multiplicité et l’enchevêtrement des missions de l’établissement, et la multiplicité des acteurs dans le contexte et l’écosystème universitaire.
Ainsi, en associant les perpectives des domaine des systèmes d’information et de la gouvernance de l’information, l’ambition est de proposer un fondement à la gouvernance des données pour un établissement ESRI.

Profil du candidat :
Le.la candidat.e recherché.e, de profil informatique et/ou sciences de l’information, doit montrer un goût pour les questions touchant aux données et aux systèmes d’information, tant d’un point de vue technique qu’organisationnel. Le déroulement du projet amènera le candidat à échanger avec des acteurs aux profils différents, chercheurs impliqués dans des projets soulevant des questions de gouvernance des données ou endossant une responsabilité au niveau institutionnel, par exemple.

Formation et compétences requises :
On peut attendre de la / du candidat.e une formation de type MIAGE ou dans le domaine de l’information et de la communication, par exemple, bien que tout autre profil ou parcours antérieur intéressant pourra être étudié.

Adresse d’emploi :
Université de Bordeaux
351 Cours de la Libération
33405 Talence
France

Document attaché : 202209191621_These_projet_GouD.pdf

ASNUM2022 : Conférence Action Spécifique Numérique Astrophysique

Date : 2022-12-12 => 2022-12-16
Lieu : ENS Lyon

Rationale :
Numerical computation and data analysis are essential aspects of research in astrophysics and astronomy, a field which has historically always been a producer of big data. Thus, whether to analyze photometric or spectroscopic data from large observatories on the ground or in space, or to produce and analyze virtual data from numerical simulations, astrophysics tools require large computing resources and storage, as well as new numerical methods adapted to new or emerging architectures.

This conference at the initiative of the Numerical Specific Action responds to the desire of the community to exchange their thoughts on these different numerical aspects in astrophysics. We encourage everyone to come and share their numerical analysis and modeling work, with the desire that this week of exchange will make it possible to decompartmentalize the themes, and to identify the methodological points of convergence between observations and simulations.

Abstract and registration deadline : 17th October

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

[PhD] Emotion classification from EEG signals, ICube & Cephalgo (Strasbourg)

Appel à communication pour l’atelier GAST/EGC’2023 (Gestion et Analyse des données Spatiales et Temporelles)

Journées d’étude Musiscale

Postdoc (2 years) at CEA: NLP and genomics

Machine Learning for Life Sciences

Bayesian inference with expensive and imperfect data models

MCF en Intelligence Artificielle (CDD de 3 ans)

Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère

Gouvernance des données dans le contexte de l’enseignement supérieur et de la recherche française

ASNUM2022 : Conférence Action Spécifique Numérique Astrophysique