Extraction de connaissances sur les changements d’occupation et usage des sols à partir de données textuelles

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2024-12-31

Contexte :
La caractérisation de l’utilisation et de l’occupation des sols (Land Use and Land Cover,
LULC en anglais) et de leurs changements est essentielle pour comprendre les dynamiques
territoriales et gérer durablement les espaces naturels et urbains. La modélisation
spatio-temporelle, qui permet de représenter et projeter ces changements, mobilise des
connaissances expertes, qualitatives ou quantitatives, intégrées dans les modèles sous
forme de règles logiques. L’un des moyens d’obtenir ces connaissances est la sollicitation
d’experts par des entretiens, mais cette approche est coûteuse en temps et présente des
biais.
D’autres sources d’informations peuvent être mobilisées, telles que la littérature scientifique,
les rapports techniques ou encore les articles de presse. La sélection de documents
pertinents et leur analyse est une tâche chronophage pour laquelle des approches
d’extraction automatique peuvent être utilisées. Dans ce contexte, les méthodes de
traitement automatique du langage et d’apprentissage automatique peuvent permettre : (1)
l’extraction automatique d’informations d’intérêt, (2) la normalisation et représentation de ces
informations dans un formalisme adapté, et (3) leur transformation en règles logiques.
L’extraction et représentation des connaissances à partir de données textuelles ont été
étudiées dans le domaine de l’agriculture (Drury et al. 2019; Drury et Roche 2019) et
domaines connexes tels que l’agriculture urbaine (Bhuyan et al. 2024) ou les crises
agrométéorologiques (Zhang et al. 2023). En revanche, peu de travaux ont porté sur le
traitement de données textuelles sur la thématique de l’usage et de l’occupation des sols,
leurs changements, et les drivers associés. Le stage se déroule dans la cadre du projet
ARENA (Automatic Rule Extraction and Network Analysis), financé par le CNES, ayant pour
but d’extraire des informations sur l’usage et l’occupation des sols à partir d’articles
scientifiques et de les combiner avec des réseaux multicouches issus de séries temporelles
d’images satellites. Les recherches les plus proches du projet ARENA sont les travaux de
Kaczmarek (2023) ainsi que les travaux menés dans le cadre du projet Hérelles
(https://herelles-anr-project.cnrs.fr/). Ce stage fait également suite à des travaux menés
précédemment dans le cadre de l’ANR TipHyc (Tipping points in the West African
Hydrological Cycle), sur l’extraction d’information à partir d’articles scientifiques.
Le.a. futur.e stagiaire s’appuiera sur les premiers résultats obtenus pour améliorer les
propositions méthodologiques utilisées et étudiera l’inclusion de nouvelles sources de
données textuelles.

Sujet :
Objectifs du stage
Ce stage a pour objectif de développer une approche pour l’extraction et la formalisation de
connaissances sur l’occupation et usage des sols à partir de sources textuelles, grâce à
l’utilisation de techniques avancées de traitement automatique de la langue et apprentissage
automatique.
Il s’articulera en plusieurs étapes :
1. Identification de sources de données textuelles pertinentes et constitution de corpus
sur une zone d’étude pré-définie,
2. Formalisation de la notion d’information pertinente sur la thématique des
changements d’occupation ou d’utilisation des sols LULC, en collaboration avec des
experts du domaine,
3. Enrichissement d’une nomenclature existante sur l’occupation et usage des sols et
les processus de changement,
3. Comparaison de méthodes d’extraction automatique à partir des corpus d’étude.
Selon les enjeux méthodologiques identifiés, le.a stagiaire sera amené.e à comparer
des approches supervisées, intégrant ou non des règles expertes (Kaczmarek,
2023), et des approches reposant sur des grands modèles de langues (Large
Language Models) (Dagdelen et al. 2024). Le point d’ancrage des connaissances à
extraire sera les changements d’occupation et d’usage des sols et les processus qui
leur sont associés.
4. L’analyse quantitative et qualitative des informations extraites.
Les données d’étude seront en anglais ou en français selon la zone d’étude.
Organisation du stage
Le stage se déroulera sur une période de 6 mois, à compter de février 2025, dans les locaux
de la Maison de la Télédétection à Montpellier.
L’étudiant·e sera accueilli·e au sein de l’équipe MISCA de l’UMR TETIS (Territoire
Environnement Télédétection et Information Spatiale) et sera encadré·e par Sarah Valentin,
chercheuse en fouille de données textuelles au Cirad à l’UMR TETIS et Roberto Interdonato,
chercheur en Intelligence Artificielle, également au Cirad à l’UMR TETIS. Le déroulement du
stage se fera dans un contexte interdisciplinaire, notamment en collaboration avec Simon
Madec, chercheur en télédétection et apprentissage profond au sein de l’UMR TETIS .
En plus de la rédaction d’un mémoire de Master 2 ou de fin d’étude selon les attentes de sa
formation, d’autres modalités de valorisation des résultats seront éventuellement envisagées
avec les encadrants au cours du stage telles que la publication d’un jeu de données (corpus)
et la contribution à un data paper.

Candidature

Envoyer CV, lettre de motivation et relevé de notes M1 (ou 4ème année) avant le 29/11/2024
à Sarah Valentin (sarah.valentin@cirad.fr) et Roberto Interdonato
(roberto.interdonato@cirad.fr), en précisant en objet du mail “CANDIDATURE STAGE
ARENA 2025”.

Profil du candidat :
Compétences recherchées
● Formation en informatique
● Bonne maîtrise du langage de programmation Python
● Connaissances en traitement automatique du langage et/ou apprentissage
automatique
● Maîtrise de l’anglais écrit
● Intérêt pour les applications socio-environnementales et le travail interdisciplinaire.

Formation et compétences requises :
Compétences recherchées
● Formation en informatique
● Bonne maîtrise du langage de programmation Python
● Connaissances en traitement automatique du langage et/ou apprentissage
automatique
● Maîtrise de l’anglais écrit
● Intérêt pour les applications socio-environnementales et le travail interdisciplinaire.

Adresse d’emploi :
Maison de la Télédétection, 500 rue Jean François Breton, 34090, Montpellier

Document attaché : 202411181314_stage_ARENA_2025.pdf

Optimisation Sous Contraintes des Flexibilités des Équipements Consommateurs d’Électricité dans le secteur Résidentiel et Tertiaire

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT – Symhonics
Durée : 3 ans
Contact : chanson@univ-tours.fr
Date limite de publication : 2025-03-01

Contexte :
L’équipe Recherche Opérationnelle, Ordonnancement et Transport, l’équipe Bases de Données et
Traitement des Langues Naturelles (BDTLN) et la société Symphonics proposent un financement de
thèse de doctorat à temps plein pour un début au printemps 2025. La thèse sera basée à Tours avec la
moitié du temps dans les locaux de l’entreprise et l’autre moitié au sein du laboratoire.
La gestion d’un système électrique suppose un équilibre à chaque instant entre production et
consommation. Cela ne peut se faire qu’en modifiant soit la production, soit la consommation ; c’est
ce que l’on dénomme flexibilités dans le système électrique. L’introduction croissante des énergies
renouvelables impose l’augmentation du gisement de flexibilités et notamment celles se trouvant chez
les consommateurs représentant une source peu coûteuse pour satisfaire le besoin de décarbonation
du mix énergétique, enjeu majeur aussi bien sur le plan écologique, qu’économique et social.
C’est le créneau choisi par La société Symphonics qui se positionne sur le marché en proposant de
transformer les bâtiments résidentiels et tertiaires en batteries par le pilotage à la hausse et à la baisse
des équipements énergivores dont la consommation peut être déplacée dans la journée (par ex.
Chauffe-eau, chargeur de véhicule, etc.).

Sujet :
Cette thèse CIFRE propose de s’attaquer à l’optimisation sous contraintes des équipements
consommateurs d’électricité dans les secteurs résidentiel et tertiaire, un enjeu crucial à l’ère de la
transition énergétique et de la digitalisation. L’objectif est de développer des modèles et des
algorithmes qui permettent de maximiser l’efficacité énergétique et la flexibilité des systèmes tout en
respectant les contraintes spécifiques (confort, stabilité du réseau, coûts) associées à ces
environnements.
L’ensemble des modélisations permettant de définir les meilleurs optimums temps réel
possibles nécessite la résolution de plusieurs verrous relevant de l’hybridation de méthodes
issues de la science des contraintes et de la science des données.
Ces verrous sont abordés sous l’angle de l’optimisation qui peut être formulée comme un problème
multi-agents en recherche opérationnelle. Plusieurs agents (la société Symphonics, les clients, les
acteurs du réseau électrique) interviennent dans le processus et leurs objectifs propres sont à prendre
en compte. Par exemple, certains clients voudront optimiser un niveau de confort en termes de
chauffage, et garantir la charge d’un véhicule électrique. A l’échelle du système, la société Symphonics
peut vouloir réduire les émissions de CO2 ou les coûts de livraison de l’électricité. Il faut donc optimiser
la consommation d’électricité tout en tenant compte des différents objectifs des agents. Dans le
contexte de cette thèse, les verrous pour résoudre un tel problème sont nombreux :
– Le passage à l’échelle : l’entreprise vise une application pour des centaines de milliers de
clients, ce qui reste une difficulté majeure pour une résolution efficace du problème en
recherche opérationnelle, dans des temps compatibles avec le scénario industriel (moins de
15 minutes) ;
– Cette optimisation doit s’appuyer sur des informations qui devront être prédites au niveau de
chaque client au fil du temps, sur la base de la connaissance contextuelle et de préférences
(par exemple, prédire la consommation électrique d’un chauffe-eau en hiver heure par heure
pour un client donné) ;
Comme toute approche reposant sur des modèles prédictifs, une attention particulière devra être
apportée à l’explicabilité des solutions proposées.
Enfin, l’hybridation de la recherche opérationnelle et de l’apprentissage artificiel prendra son sens
pour définir des algorithmes de résolution efficaces du problème. Les méthodes d’apprentissage
artificiel pourront notamment permettre de rechercher les meilleurs paramètres de la méthode multi-
agents, ou réduire le nombre de clients en utilisant des approches de clustering de flux de données
pour obtenir des groupes homogènes des clients au cours du temps.
Les modèles et algorithmes feront l’objet de phases de validation empiriques avec les partenaires
équipementiers et fabricants de la société Symphonics et seront pilotées par le Doctorant.

Profil du candidat :
BAC+5. Jeune diplômé ou première expérience
Le candidat recruté devra avoir des connaissances solides en Recherche Opérationnelle (complexité,
méthodes exactes et heuristiques, programmation mathématique) et en apprentissage artificiel et
architectures profondes. Des connaissances en explicabilité seront appréciées.
La maîtrise de certains outils logiciels est un plus : Python, Google Cloud Platform, PostgreSQL, Solveur
MILP.

Formation et compétences requises :

Adresse d’emploi :
Tours: partage du temps entre Symphonics et le LIFAT.

Document attaché : 202411181233_Offre Thèse Symphonics .pdf

Adaptive optics control and learning

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Centre Astrophysique de Lyon
Durée : 5 months
Contact : eric.thiebaut@univ-lyon1.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
Internship supervisors: Eric Thiébaut, Michel Tallon
@ : eric.thiebaut@univ-lyon1.fr, mtallon@obs.univ-lyon1.fr

Address/Workplace: CRAL – site Charles André : 9 avenue C. André, St Genis Laval

Hosting research team: AIRI

Internship title: Adaptive optics control and learning

Summary of proposed work:

Context: Adaptive optics (AO) systems are used by most if not all current large telescopes to counteract the effects of the turbulence on the image quality and achieve diffraction limited angular resolution (i.e. λ/D). AO systems work by sensing the wavefront after its correction by a deformable mirror whose shape is controlled considering the departure of the measured wavefront to the ideal one (e.g. a flat wavefront). The AiRi team at CRAL is leading a project, UPCAO (funded by the French ANR), targeted at developing better algorithms and methods to control in real time (i.e. faster than 1,000 times per second) the shape of the wavefront given measurements by a wavefront sensor (WFS). The objective is to provide optimal wavefront correction under varying observing conditions for the THEMIS AO system, for SAXO+, and for future AO systems on ELTs. There are several ideas to improve current AO control systems: (i) improve the model of the AO system, (ii) account for the variable and uneven quality of the WFS measurements notably the fact that not all measures are always valid, and (iii) account for the spatio-temporal statistics of the turbulence to anticipate its evolution and reduce the effects of the delay between the times of measurements and of the correction by the mirror.

Research directions:
Modeling the AO system: To compute the wavefront correction, AO real time controllers assume a model of the behavior of the components of the AO system notably the wavefront sensor (WFS) and the deformable mirror (DM). Intuitively, the closer the model to reality the better the correction. The behavior of the instrument may be complicated (non-linear) and depends on the operating conditions. It is thus important to develop flexible models whose parameters can be calibrated and updated while the AO system is running (in closed-loop). We are currently considering affine approximations of the possibly non-linear behavior of the system that can be calibrated in real-time by a perturbative method. Another possibility to investigate is to exploit deep learning to automatically build the structure of a general non-linear model and to learn its parameters in real-time.
Wavefront reconstruction: For a linear wavefront sensor (WFS), the reconstruction of the wavefront shape given the measurements and accounting for their uneven quality amounts to solving an inverse problem which has a closed-form solution. For large systems, this solution may be computed in real-time by means of accelerated iterative methods [1]. For new non-linear WFS, fast reconstruction methods compatible with the constraints of real-time have to be developed and AI based methods are emerging as competitive candidates.
Modeling and learning the spatio-temporal behavior of the turbulence: Prediction of the temporal evolution of the wavefront is the key to compensate for the delay between the acquisition of wavefront sensor (WFS) measurements and the time at which the shape of the deformable mirror (DM) can effectively account for these measurements. We are developing a fast approximation of the covariance [2] that can be exploited to learn and apply the spatio-temporal statistics of the wavefront. Another possibility is to develop AI based methods.

[1] Béchet+, “Comparison of minimum-norm maximum likelihood and maximum a posteriori wavefront reconstructions for large adaptive optics systems’’ in J. Opt. Soc. Am. A, 26, 497-508 (2009) https://doi.org/10.1364/JOSAA.26.000497
[2] Thiébaut+, “Beyond FRiM, ASAP: a family of sparse approximation for covariance matrices and preconditioners.” Adaptive Optics Systems VIII. Vol. 12185. SPIE, 2022, https://arxiv.org/pdf/2311.17721

Nature of the financial support for the internship: Labex LIO or team funding

Potential for a follow-up as a PhD thesis: Yes

Profil du candidat :
Background in signal processing, numerical methods or related fields.

Formation et compétences requises :

Adresse d’emploi :
Centre de Recherche Astrophysique de Lyon
9 avenue Charles André
69230 Saint-Genis-Laval

Document attaché : 202411181118_FicheStage_CRAL_2024_AIRI_Thiebaut.pdf

Direct detection and characterization of exoplanets: statistical learning, multi-epoch and multi-spectral data fusion

Offre en lien avec l’Action/le Réseau : BigData4Astro/– — –

Laboratoire/Entreprise : Centre Astrophysique de Lyon
Durée : 5 months
Contact : olivier.flasseur@univ-lyon1.fr
Date limite de publication : 2025-03-01

Contexte :

Sujet :
Internship supervisors: Olivier Flasseur, Eric Thiébaut, Maud Langlois
@ : olivier.flasseur@univ-lyon1.fr, eric.thiebaut@univ-lyon1.fr, maud.langlois@univ-lyon1.fr

Address/Workplace: CRAL – site Charles André : 9 avenue C. André, St Genis Laval

Hosting research team: AIRI

Internship title: Direct detection and characterization of exoplanets: statistical learning, multi-epoch and multi-spectral data fusion

Summary of proposed work:

Context: The direct observation of the close environment of stars can reveal the presence of exoplanets and circumstellar disks, providing crucial information for a better understanding of planetary system formation, evolution, and diversity. Given the very small angular separation with respect to the host star and the huge contrast between the (bright) star and the (faint) exoplanets and disks, imaging the immediate vicinity of a star is extremely challenging. In addition to the use of extreme adaptive optics and a coronagraph, dedicated post-processing methods combining images recorded with the pupil tracking mode of the telescope are needed to efficiently suppress the nuisance component (speckles and noise) corrupting the signals of interest.
Beyond optimal post-processing of individual observations, fusing multiple observations of the same star taken over different epochs can significantly improve the detection sensitivity. The key challenge in this approach lies in accounting for both the nuisance statistics and the orbital motion of the exoplanet across epochs. To address this, the PACOME algorithm (for PACO Multi-Epoch; [1]) has been recently introduced. PACOME leverages statistical modeling of the nuisance component and its correlations at the local scale within a small pixel patch. This approach is inherited from the PACO algorithm, specifically designed for exoplanet detection from individual (mono-epoch) dataset of observations. The by-products of PACO from each epoch provide sufficient statistics that can be optimally combined using PACOME, while efficiently exploring the Keplerian motion of exoplanets. This multi-epoch strategy yields a combined detection score that is directly interpretable as a measure of detection confidence. In addition to improving sensitivity, PACOME enables the estimation of orbital parameters, along with their joint and marginal distributions. Although PACOME achieves state-of-the-art performance, there remains room for improvement, especially near the star. Here, the assumption of a local-scale statistical description of the nuisance component overlooks larger-scale spatial correlations, thus limiting the method’s detection sensitivity.
In this context, data science developments are decisive to improve the detection sensitivity of exoplanets and the accuracy of the estimation of their orbit.

Research directions: This project will build on recent advancements in modeling the nuisance component that corrupts high-contrast total intensity observations. The focus will be on improving exoplanet detection and characterization. Possible research directions include:
1/ Modeling large-scale nuisance correlations: To address the limitations discussed, the goal is to integrate a more refined modeling of the nuisance component within multi-epoch detection algorithms. This can be achieved using the ASAP approach [2], which approximates the precision matrix (i.e., inverse of the covariance matrix) with a structured, sparse model that may better capture large-scale correlations compared to PACO.
2/ Joint spatio-spectral modeling of large-scale correlations: Building on point 1/, the objective is to develop a joint spatio-spectral model of the nuisance that accounts for large-scale correlations across both spatial and spectral dimensions.

Data: The project will focus on developing / improving new processing algorithms using spectroscopic total intensity observations (i.e., spatio-temporal-spectral data recorded with an Integral Field Spectrograph) from the SPHERE instrument, currently operating on the Very Large Telescope (VLT). Several multi-epochs observations are available to both ground the performance of the proposed algorithm and to search for new exoplanets!
Once a proof of concept is established, simulations for HARMONI, one of the first-light instruments of the upcoming Extremely Large Telescope (ELT), may be considered. In this case, the algorithm will be adapted to account for HARMONI’s specific features, particularly its higher spectral resolution. Achieving the required contrast with this instrument will require extended total exposure times on a single star, making a multi-epoch strategy indispensable.

Bibliography:
[1] Dallant+, “PACOME: Optimal multi-epoch combination of direct imaging observations for joint exoplanet detection and orbit estimation.” Astronomy & Astrophysics, 679, A38, 2023, https://arxiv.org/pdf/2309.08679
[2] Thiébaut+, “Beyond FRiM, ASAP: a family of sparse approximation for covariance matrices and preconditioners.” Adaptive Optics Systems VIII. Vol. 12185. SPIE, 2022, https://arxiv.org/pdf/2311.17721

Nature of the financial support for the internship: Labex LIO or team funding

Potential for a follow-up as a PhD thesis: Yes

Profil du candidat :
Background in signal processing, numerical methods or related fields.

Formation et compétences requises :

Adresse d’emploi :
Centre Astrophysique de Lyon
9 avenue Charles André
69230 Saint-Genis-Laval

Document attaché : 202411181114_FicheStage_CRAL_2024_AIRI_Flasseur-1.pdf

CIFRE – Apprentissage faiblement supervisé à grande échelle pour le diagnostic différentiel basé sur la parole

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ECHO & Inria Nancy
Durée : 36 mois
Contact : emmanuel.vincent@inria.fr
Date limite de publication : 2024-12-04

Contexte :

Sujet :
Détails et formulaire de candidature: https://jobs.inria.fr/public/classic/fr/offres/2024-08317

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Paris & Nancy

Synthèse de la parole multilingue appliquée aux langues régionales

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Inria Nancy & LiLPa
Durée : 36 mois
Contact : emmanuel.vincent@inria.fr
Date limite de publication : 2024-12-04

Contexte :

Sujet :
Détails et formulaire de candidature: https://jobs.inria.fr/public/classic/fr/offres/2024-08319

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Nancy

Identification de la sévérité cognitive d’un patient atteint de la maladie d’Alzheimer par apprentissage automatique de données

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire IBISC, Université d’Evry Paris-Saclay
Durée : 6 mois
Contact : Khalifa.Djemal@ibisc.univ-evry.fr
Date limite de publication : 2025-02-28

Contexte :

Sujet :
La détection de signes des pathologies d’Alzheimer qui est une maladie neurodégénérative est une tâche très importante dans un système d’aide au diagnostic médical. En effet, les techniques d’apprentissage automatique offrent aujourd’hui des perspectives pour détecter et identifier des troubles liés à la maladie, évaluer son avancement et à terme pouvoir rééduquer le patient. Dans un premier temps, le candidat fera une étude de l’état de l’art sur les troubles cognitives de la maladie et sur les techniques récentes employées pour reconnaitre la sévérité des patients. Il procèdera ensuite à la mise en place d’un modèle d’apprentissage à partir de bases de données qui permettra l’analyse de ces troubles cognitives conduisant ainsi à la classification et l’identification de la sévérité de la maladie.

[1] Hyun-Soo Choi, Jin Yeong Choe, HanjooKim, Ji Won Han, Yeon Kyung Chi, KayoungKim, Jongwoo Hong, Taehyun Kim, Tae Hui Kim, Sungroh Yoon and Ki Woong Kim. Deep learning based low-cost high-accuracy diagnostic framework for dementia using comprehensive neuropsychological assessment profiles, BMC Geriatrics, 18:234 (2018).

[2] Valeria Manera, Pierre-David Petit, Alexandre Derreumaux, Ivan Orvieto, Matteo Romagnoli, Graham Lyttle, Renaud David, and Philippe H. Robert, ’Kitchen and cooking’, a serious game for mild cognitive impairment and Alzheimer’s disease: a pilot study, Frontiers in Aging Neuroscience, 7: 24, 2015.

[3] Boaz Levy1, Samuel Gable, Elena Tsoy, Nurit Haspel, Brianna Wadler, Rand Wilcox, Courtney Hess, Jacqueline Hogan, Daniel Driscoll and Ardeshir Hashmi. Machine Learning Detection of Cognitive Impairment in Primary Care, Alzheimers Dis Dement, 1(2):38-46, 2017.

[4] Werner P, Rabinowitz S., Klinger E., Korczyn A. D., Josman N., Use of the virtual action planning supermarket for the diagnosis of mild cognitive impairment: a preliminary study, Dement Geriatr Cogn Disord, 27(4):301-9, 2009.

[5] Déborah A. Foloppe, Paul Richard, Takehiko Yamaguchi, Frédérique Etcharry-Bouyx & Philippe Allain, The potential of virtual reality-based training to enhance the functional autonomy of Alzheimer’s disease patients in cooking activities: A single case study, Neuropsychological Rehabilitation, October 2015.

[6] Khalifa Djemal and Hichem Maaref, Intelligent Information Description and Recognition in Biomedical Image Databases, In:Computational Modeling and Simulation of Intellect: Current State and Future Perspectives, Book Edited by Boris Igelnik, pages: 52-80, Publisher IGI Global, ISBN: 978-1-60960-551-3, February 2011.

[7] Florian Maronnat, Margaux Seguin, Khalifa Djemal, Cognitive tasks modelization and description in VR environment for Alzheimer’s disease state identification, in International conference on Image Processing Theory, Tools and Applications (IPTA 2020), November 09-12, 2020, Paris, France.

Profil du candidat :
Master 2 ou équivalent, de préférence des spécialités suivantes :
– Apprentissage automatique (Machine Learning),
– Imagerie Biomédicale
– Informatique Biomédicale,
– Informatique, Réalité Virtuelle et Systèmes Intelligents

Formation et compétences requises :

– Programmation Python, Matlab,
– Machine Learning
– Des connaissances de base en traitement d’images

Adresse d’emploi :
Laboratoire Informatique, Biologie Intégrative et Systèmes Complexes – IBISC 40 rue du Pelvoux, 91020 Evry, France

Document attaché : 202411151746_Sujet-stage-Master2-Djemal-2024-2025.pdf

Inférence de Réseaux à Partir des Données Hétérogènes

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 6 mois
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2025-02-28

Contexte :

Sujet :
Bonjour à tous,

Nous avons le plaisir de vous annoncer une offre de stage de 6 mois au laboratoire TETIS à Montpellier, axée sur le problème d’inférence de réseaux à partir des données hétérogènes epidémiologiques en utilisant des méthodes de Graph Neural Networks.

La date de début est prévue pour février 2025 (flexible). Vous trouverez la description détaillée de l’offre en français et en anglais ici :

https://nubes.teledetection.fr/s/mTiDsdxCPHbNid3

Pour toute question, n’hésitez pas à contacter Nejat Arınık (nejat.arinik@univ-artois.fr) ou moi-même (roberto.interdonato@cirad.fr).

Pour candidater, merci d’envoyer un mail à nejat.arinik@univ-artois.fr et roberto.interdonato@cirad.fr avec sujet “CANDIDATURE STAGE MOOD 2025” en ajoutant les éléments suivants:
– lettre de motivation expliquant vos qualifications, expériences et motivation pour ce sujet (1-2 pages)
— curriculum vitae (1-2 pages)
— relevé de notes de 1ère année de master et les notes de 2ème année de master disponibles ou équivalent pour les écoles
d’ingénieurs
— un lien vers des dépôts de projets personnels (par exemple GitHub ou GitLab)
— toute autre information que vous estimerez utile

N’hésitez pas à transmettre ces offres à des étudiants qui pourraient être intéressés.

Cordialement,

Roberto et Nejat
Roberto and Nejat

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
500 rue Jean Francois Breton, Montpellier

Document attaché : 202411151304_Stage – Inférence de Réseaux à Partir des Données Hétérogènes.pdf

Stage M2 (poursuite en thèse possible) – Machine Learning / Optimisation / Santé – Equipe ORKAD – Lille

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Equipe ORKAD / Laboratoire CRIStAL Lille
Durée : 6 mois
Contact : julie.jacques@univ-lille.fr
Date limite de publication : 2025-02-28

Contexte :
ORKAD est une équipe de recherche du groupe thématique OPTIMA du laboratoire CRIStAL (Centre de Recherche en Informatique, Signal et Automatique de Lille) (UMR CNRS 9189) de l’Université de Lille. L’objectif principal de l’équipe ORKAD est d’exploiter simultanément l’optimisation combinatoire et l’extraction de connaissances pour résoudre des problèmes d’optimisation. Les métaheuristiques ont souvent été utilisées avec succès pour résoudre différentes tâches de machine learning [DhaenensJourdan2022]. En particulier, l’algorithme MOCA-I [Jacques2013-a], permet de classifier des données hétérogènes et mal réparties par méthode d’optimisation, sur des données médicales [Jacques2020]. L’équipe ORKAD a des partenariats avec le CHU de Lille ; notamment dans le cadre du projet européen PATHACOV pour la détection du cancer du poumon à partir de la concentration en composés organiques volatils dans l’air expiré [Hulo2023]. Dans ce stage, nous nous intéressons à l’extension de ces travaux aux données du projet ALCOVE, suite du projet PATHACOV, où l’objectif est de distinguer différentes classes de sujets: sain / malade (avec le stade : I, II, III, IV) ; opérable / non opérable.

Sujet :
Dans le problème de classification multi-label, un enregistrement du jeu de données peut être associé à plusieurs labels : par exemple « cancer du poumon » et « opérable ». Des approches à base de métaheuristiques ont été proposées par le passé pour gérer ce problème, comme par exemple les colonies de fourmis [Otero2010]. La classification multi-label est souvent associée à une répartition déséquilibrée des différents labels à prédire [Tarekegn2021] et une des spécificités de l’algorithme MOCA-I est justement sa capacité à gérer ce déséquilibre [Jacques2013-a]. Dans MOCA-I, la modélisation est adaptée pour la classification binaire partielle (représentation de la solution, opérateurs d’initialisation et de voisinage,…). L’objectif de ce stage est de proposer une nouvelle représentation et opérateurs adaptés au problème de classification multi-label. Des méthodes de configuration automatique d’algorithmes comme irace [López-Ibáñez2016] seront utilisées pour identifier si les nouveaux opérateurs et stratégies proposés sont efficaces sur les benchmarks sélectionnés.

Profil du candidat :
Programmation Objet (Python ou C++) ; Connaissances en machine learning
Des connaissances en C++ et recherche opérationnelle, optimisation combinatoire seraient un plus.

Formation et compétences requises :
M2 en informatique

Adresse d’emploi :
Lieu : Laboratoire CRISTAL, Equipe ORKAD (Université de Lille, France)

Document attaché : 202411141558_Sujet_stage_M2.pdf

workshop Econom’IA 2025

Date : 2025-05-19 => 2025-05-20
Lieu : Nanterre, France

We are proud to announce the second Econom’IA workshop !

At Economix (Université Paris Nanterre) !

Nanterre, France

On May 19-20, 2025.

This workshop aims to explore and foster cutting-edge applications of Artificial Intelligence (AI), Data Analysis Methods, Data Visualization,

and other innovative techniques across all fields of Economics. Econom’IA brings together researchers

from academia and entrepreneurs who use advanced techniques to analyse economic data.

For this second edition, we are honoured to have César Hidalgo (TSE, Toulouse School of Economics) on May 19^th

and Christophe Bénavent (PSL, Paris-Dauphine) on May 20^th as our keynote speakers.

More details:

This 2-day workshop includes:

morning sessions with formal lectures and practical workshops led by established scholars introducing new tools and techniques,
afternoon sessions dedicated to presentations and discussions of papers using at least one of these innovative techniques.

Econom’IA 2025 workshop will focus on the following topics

Graph analysis methods, with a special training given by Lionel Villard on CorText, a publicly available web platform providing data analysis methods.
Large Language Models (LLM), with a special lecture given by Hatim Bourfoune (IDRIS – CNRS).
Innovative Methods Applied to Economics: leveraging AI or data science methods.

Application and deadlines:

Authors wishing to attend the workshop can apply by submitting a single pdf document in English, introducing a research proposal (2-4 pages maximum) or a published paper for presentation.

Submissions must include at least one application of innovative techniques in Economics and will undergo a peer-review process.

Research papers using graph analysis and LLMs are particularly encouraged.

Applications can be submitted at the following link: https://economia.sciencesconf.org/

It is also possible to attend the workshop as an auditor by filling out the form on the workshop website. A confirmation will be sent to you via email.

Deadline for application: January 15, 2025

Notification of acceptance: February 28, 2025

Reduced fee registration and accommodation payment: March 10 – April 11, 2025

Full fee registration and accommodation payment: April 12 – April 25, 2025

Participation fees:

The reduced workshop fee is 150 Euros for registrations before April 11, 2025, and increases to 250 Euros after this date (participants and auditors). Fees include the registration to the workshop (access to lectures and presentations), breaks, lunches and gala dinner. Researchers without financial workshop assistance from their home institutions should contact the organizing committee.

Contact Information:

For inquiries and further information, please contact the workshop organizing committee at economia_orga@groupes.renater.fr

Organizing Committee

Rim Bahroun (Economix, université Paris Nanterre)

Maxime Lucet (LIP6, Sorbonne Université)

François Maublanc (Thema, CY Cergy Paris Université)

Olha Nahorna (Bordeaux School of Economics, université de Bordeaux, CNRS)

Guillaume Pouyanne (Bordeaux School of Economics, université de Bordeaux)

Mickael Temporão (Centre Emile Durkheim, Sciences Po Bordeaux, université de Bordeaux)

Messaoud Zouikri (Economix, université Paris Nanterre)

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

Extraction de connaissances sur les changements d’occupation et usage des sols à partir de données textuelles

Optimisation Sous Contraintes des Flexibilités des Équipements Consommateurs d’Électricité dans le secteur Résidentiel et Tertiaire

Adaptive optics control and learning

Direct detection and characterization of exoplanets: statistical learning, multi-epoch and multi-spectral data fusion

CIFRE – Apprentissage faiblement supervisé à grande échelle pour le diagnostic différentiel basé sur la parole

Synthèse de la parole multilingue appliquée aux langues régionales

Identification de la sévérité cognitive d’un patient atteint de la maladie d’Alzheimer par apprentissage automatique de données

Inférence de Réseaux à Partir des Données Hétérogènes

Stage M2 (poursuite en thèse possible) – Machine Learning / Optimisation / Santé – Equipe ORKAD – Lille

workshop Econom’IA 2025