Proposal for a 3-year PhD or 2-year postdoctoral contract in AI for healthcare

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Equipe HeKA (Inria, Inserm, Univ Paris Cité)
Durée : 3 ou 2 ans
Contact : adrien.coulet@inria.fr
Date limite de publication : 2025-03-01

Contexte :
The 2-year position will take place in the HeKA team (Inria, Inserm, Université Paris Cité), physically located at PariSanté Campus, 2-10 rue d’Oradour-sur-Glane, 75015 Paris. The work is a collaboration between the HeKA team, and the Pompidou hospitals (HEGP) of the AP-HP (Assistance Publique – Hôpitaux de Paris).

This project is part of the PEPR Digital Health project named ShareFAIR, funded by the French Research National Agency.

Sujet :
“Step-by-step guidance to clinical decision, by combining data- and knowledge-driven approaches”

see associated pdf file for more info

Submit your application at https://jobs.inria.fr/public/classic/en/offres/2024-08428

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
PariSanté Campus
2-10 rue d’Oradour-sur-Glane
75015 Paris

Document attaché : 202412041908_phd_or_postdoc_subject_sharefair.pdf

DADY : un modèle fondation de réseau de neurones pour l’observation aérienne time-lapse de systèmes agroécologiques au Sud

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-03-01

Contexte :
Le projet DeepAeroDynamics (DADY) vise à combiner l’imagerie drone multispectrale time-lapse et le deep learning pour faire face aux défis du changement climatique et de la sécurité alimentaire dans les pays du Sud. L’objectif est de développer un modèle fondation capable d’intégrer les données multispectrales, spatiales et temporelles observées par drone aérien dans des environnements complexes et hétérogènes du Sud dans le but d’anticiper et prédire le comportement de plantes cultivées en
agroécologie (Sahel, Madagascar, Guadeloupe).

Sujet :
Le stagiaire sera au coeur du développement d’une architecture deep learning permettant :
● D’analyser des séries temporelles multispectrales d’imagerie drone, et extraire automatiquement des représentations informatives de l’état des systèmes observés.
●D’analyser les dynamiques temporelles en utilisant des modèles de type Transformers pour capturer les évolutions des cultures décrites dans un espace latent.
●De maximiser l’utilisation des données par des techniques d’apprentissage semi-supervisées et des consignes prétextes pour maximiser la capacité d’apprentissage de l’architecture fondation.

Le développement des modèles s’appuiera sur des architectures CNN et Transformers. L’approche sera validée sur des jeux de données déjà acquis et stockés à proximité d’un supercalculateur. Les tests de niveau 1 s’effectueront sur une ferme GPU locale, et les modèles de niveau 2 seront testés sur les supercalculateurs Jean Zay et Adastra (20e mondial au TOP500). Les modèles seront documentés et diffusés
en open-source, accompagnés de scripts pour le fine-tuning.

Profil du candidat :
Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Formation et compétences requises :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en deep learning. Travail avec Python, Pytorch/Tensorflow, Github, Intégration Continue. Expérience en traitement d’images.

Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€
mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av.
Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202412041713_Offre de stage M2 – 2025 – DADY.pdf

DADY : un modèle fondation de réseau de neurones pour l’observation aérienne time-lapse de systèmes agroécologiques au Sud

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD Montpellier
Durée : 6 mois
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2025-01-31

Contexte :
Le projet DeepAeroDynamics (DADY) vise à combiner l’imagerie drone multispectrale time-lapse et le deep learning pour faire face aux défis du changement climatique et de la sécurité alimentaire dans les pays du Sud. L’objectif est de développer un modèle fondation capable d’intégrer les données multispectrales, spatiales et temporelles observées par drone aérien dans des environnements complexes et hétérogènes du Sud dans le but d’anticiper et prédire le comportement de plantes cultivées en
agroécologie (Sahel, Madagascar, Guadeloupe).

Sujet :
Le stagiaire sera au coeur du développement d’une architecture deep learning permettant :
● D’analyser des séries temporelles multispectrales d’imagerie drone, et extraire automatiquement des représentations informatives de l’état des systèmes observés.
●D’analyser les dynamiques temporelles en utilisant des modèles de type Transformers pour capturer les évolutions des cultures décrites dans un espace latent.
●De maximiser l’utilisation des données par des techniques d’apprentissage semi-supervisées et des consignes prétextes pour maximiser la capacité d’apprentissage de l’architecture fondation.

Le développement des modèles s’appuiera sur des architectures CNN et Transformers. L’approche sera validée sur des jeux de données déjà acquis et stockés à proximité d’un supercalculateur. Les tests de niveau 1 s’effectueront sur une ferme GPU locale, et les modèles de niveau 2 seront testés sur les supercalculateurs Jean Zay et Adastra (20e mondial au TOP500). Les modèles seront documentés et diffusés
en open-source, accompagnés de scripts pour le fine-tuning.

Profil du candidat :
Capacité à travailler en équipe dans un environnement mêlant informatique, biologie et agroécologie.

Formation et compétences requises :
Étudiant·e en Master 2 ou école d’ingénieur avec spécialisation en deep learning. Travail avec Python, Pytorch/Tensorflow, Github, Intégration Continue. Expérience en traitement d’images.

Adresse d’emploi :
La rémunération selon barème légal des stages sera de 600€
mensuel, avec accès à la restauration collective le midi. Le stage aura lieu au Cirad de Montpellier, 389 Av.
Agropolis, 34980 Montferrier-sur-Lez.

Document attaché : 202412041713_Offre de stage M2 – 2025 – DADY.pdf

Génération et validation de connaissances depuis des documents textuels

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : EDF R&D
Durée : 6 mois
Contact : victor.charpenay@emse.fr
Date limite de publication : 2025-01-31

Contexte :
La R&D d’EDF (2000 chercheurs) a pour missions principales de contribuer à l’amélioration de la performance des unités opérationnelles du groupe EDF, d’identifier et de préparer les relais de croissance à moyen et long terme. Dans ce cadre, le département Services, Economie, Outils Innovants et IA (SEQUOIA) est un département pluridisciplinaire (sciences de l’ingénieur, sciences humaines et sociales) qui fournit un appui à l’élaboration et au portage des offres, des services et des outils de relation client aux directions opérationnelles du groupe EDF.

Au sein de ce département, ce stage sera rattaché au groupe « Statistiques et Outils d’Aide à la Décision » (SOAD) : cette équipe compte une vingtaine d’ingénieurs chercheurs spécialisés en IA et data science avec des compétences fortes autour du machine learning et du deep learning, du web sémantique, de l’IA symbolique et de l’IA générative (texte, voix, image, multimodalité…), en particulier du NLP (LLM, RAG, data mining,). Le stage portera sur l’interaction entre grands modèles de langage (LLM) et IA symbolique.

Sujet :
Les LLM sont multi-tâches. Ils peuvent aussi bien traduire un texte d’une langue à une autre que répondre à des questions de culture générale. Cependant, il est difficile de contraindre un LLM à n’effectuer qu’une seule tâche, comme répondre seulement par un nombre ou générer des données structurées selon un schéma prédéfini. Il est possible de valider a posteriori la réponse d’un LLM mais si elle s’avère syntaxiquement fausse, il n’existe pas d’approche standard pour corriger cette première réponse sans avoir à en générer une deuxième. L’objectif du stage sera d’explorer une approche neuro-symbolique pour guider la génération de LLM selon un langage contrôlé (comme un langage de requête ou un modèle de données), afin de garantir la conformité syntaxique et sémantique de chaque réponse.

Cette approche sera appliquée à la génération de graphes de connaissances à partir de documents textuels. Au sein du groupe SOAD, nous travaillons sur les possibilités d’intégration des graphes de connaissances pour améliorer la fiabilité et l’explicabilité des systèmes IA, un enjeu clé pour les applications critiques. Cependant la construction des graphes de connaissances reste une tâche coûteuse en termes de temps et de ressources, en particulier lorsqu’il s’agit d’extraire et de structurer ces connaissances à partir de documents textuels. Dans le groupe EDF, de nombreuses connaissances métiers proviennent de documents complexes, comme les descriptions d’infrastructures de production et leurs contraintes d’exploitation. Exploiter ces connaissances permettrait d’accélérer l’adoption de solutions de rupture tout en les fiabilisant et en valorisant l’expertise métier.

Profil du candidat :
• Excellent niveau français oral et écrit
• Curiosité scientifique et forte motivation pour l’innovation

Formation et compétences requises :
• Etudiant(e) en Master 2 ou équivalent école d’ingénieur, spécialité data science, IA ou équivalent
• Compétences solides en programmation, en particulier en Python.
• Connaissance des techniques de traitement du langage naturel (NLP) et des modèles d’IA générative (par exemple, GPT-4).
• Compétences en construction et manipulation de graphes de connaissances (RDF, Neo4j, graphDB, ontologie…) fortement souhaitées.

Adresse d’emploi :
EDF R&D Lab
Saclay (91120)

Document attaché : 202412041504_Offre_Stage_Knowledge_generation_2025.pdf

Classification semi-supervisée avec réseaux de graphes convolutionnels. Application à la prédiction du risque d’infarctus

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC, LISSI
Durée : 6 mois
Contact : aurelien.hazan@u-pec.fr
Date limite de publication : 2025-01-31

Contexte :
Le scanner de perfusion myocardique (ou scintigraphie de perfusion myocardique) est un examen d’imagerie de médecine nucléaire non-invasif qui utilise une petite quantité d’un traceur radioactif

L’acquisition se fait typiquement sur une durée de 20 à 40 minutes, synchronisée au rythme cardiaque permettant ainsi de reconstituer un cycle cardiaque sur une séquence 3D animée
Cependant, ces images scintigraphiques souffrent d’une mauvaise résolution spatiale (environ 1 cm3), et d’un mauvais rapport signal sur bruit.

La méthode la plus efficace utilisée actuellement pour traiter ces deux problèmes est d’augmenter les images de scintigraphie par une image 3D anatomique obtenue par tomographie à rayon X (CT) pour corriger l’atténuation des rayons gamma.

Sujet :
Méthode: Les GNN, sont une classe de modèles de deep learning spécialement conçue pour traiter des données représentées sous forme de graphes. Contrairement aux images classiques, qui sont souvent traitées en utilisant des CNN sur des grilles de pixels, les GNN permettent de capturer des relations complexes entre des éléments non structurés de manière régulière, ce qui peut être particulièrement utile pour les images médicales, la segmentation d’objets ou l’analyse de structures 3D [muller_survey_2024,han_vision_2022]

Un réseau de graphes permettra de recréer un cycle cardiaque complet à partir d’une seule image tomodensitométrique et d’un ECG. La reconstitution permettra de générer sur l’ensemble du cycle cardiaque une représentation de haute qualité de l’atténuation des tissus afin de recaler la correction d’atténuation sur l’acquisition par scintigraphie. Ceci permettrait ainsi d’éviter les artefacts observés.

Dans le but de valider notre approche sur une large base de données représentative des pratiques du service de médecine nucléaire, cette étude s’appuiera sur la base de donnée du CHSF.

Profil du candidat :
La personne recrutée devra justifier d’un diplôme d’ingénieur ou d’un Master, de solides connaissances en intelligence artificielle, par exemple en deep learning (DL), en réseaux de neurones profonds et en codage (Python, Cuda, C++). Des expériences de développement sur processeurs graphiques (GPU) seront très appréciées. Son anglais sera courant. Le candidat sélectionné aura la chance de travailler dans une équipe interdiciplinaire et avec un consortium de data scientists et de cliniciens du centre hospitalier sud-francilien (CHSF)

Formation et compétences requises :

Adresse d’emploi :
Lieux:
IBISC, EVRY.
LISSI, IUT Sénart-Fontainebleau, Lieusaint.

Contact: hichem.maaref@ibisc.univ-evry.fr, aurelien.hazan@u-pec.fr

INFORSID 2025

Date : 2025-06-03 => 2025-06-06
Lieu : Pau, France

INFORSID 2025 @Pau

https://inforsid2025.sciencesconf.org/

Appel à communication

Éthique, Équité et Systèmes d’Information : Construire un numérique responsable et inclusif
Les organisations et le monde vivent actuellement de grandes transformations largement liées aux technologies de l’information et à leurs impacts. Ces transformations, outre leur aspect technique et organisationnel, imposent de nouvelles responsabilités en matière d’éthique, d’équité et de justice sociale, afin que les systèmes d’information (SI) soutiennent une société plus inclusive et équitable. La rapidité des changements des organisations et plus largement les défis sociétaux et environnementaux nécessitent de mettre en place des processus allant souvent au-delà de l’amélioration continue et d’envisager des transformations plus fondamentales pour lesquelles les dimensions d’innovation, de créativité mais aussi de responsabilité sont des facteurs déterminants. L’imprévisibilité de ces mêmes transformations (notamment les effets indirects pervers) requiert plus que jamais une vision systémique dans l’ingénierie et la gouvernance des SI.
Aux niveaux technique et scientifique, les opportunités d’évolution et de transformation supposent une capacité à capter, stocker, organiser, rechercher, analyser, apprendre à partir de gros volumes informations, et nous amène à investiguer de nombreuses problèmes inédits : satisfaire et maîtriser les exigences de volume, vélocité, variété, véracité, valeur des données, respecter les lois relatives à la protection des données, et être pleinement conscients des (et responsables face aux) composants du nouveau monde VUCA (volatilité, incertitude, complexité et ambiguïté). Nous en sommes responsables en tant qu’ingénieurs, en tant que chercheurs, en tant qu’enseignants et en tant que citoyens. Nous avons, plus que jamais, besoin de l’intelligence humaine.
Le déploiement des SI dans cet environnement complexe contenant des données sensibles/massives/hétérogènes génère aussi des risques juridiques, sociaux, et financiers, rendant la sécurité, et notamment la cyber sécurité, centrale dans les préoccupations des directions des systèmes d’information (DSI), des chercheurs et des équipes pédagogiques en SI. Face à ce déploiement de solutions technologiques gourmandes en ressources énergétiques, les SI doivent aussi répondre aux défis environnementaux pour proposer une informatique durable et un numérique responsable.

En 2025, le congrès INFORSID se tiendra du 03 au 06 juin à Pau. Nous sollicitons, comme chaque année, la présentation de travaux de recherche récents, de développements industriels et d’expériences significatives dans le domaine de l’ingénierie et des systèmes d’information, mais également des travaux plus exploratoires, ou simplement une idée sur laquelle débattre.
Les thématiques visées sont les suivantes, sans que cette liste ne soit exhaustive :
• SI ET DONNÉES MASSIVES (BIG DATA) : conception et ingénierie des bases de données NoSQL, stockage et distribution des données (datastores, multistores, etc.), ingénierie des données liées (linked data), SI et Internet des objets, paradigmes de traitements massifs de l’information (map/reduce, in-memory, blockchains), qualité et traçabilité des données (data lineage).
• SI ET SCIENCE DES DONNÉES : mécanismes de raisonnement, analytique, Business Intelligence ingénierie des systèmes décisionnels, entrepôts et lacs de données, bases de données multidimensionnelles et OLAP, fouille dans les données massives (data mining, big mining), SI et fouille (intention mining, process mining, web mining, text mining), analyse des sentiments, apprentissage (deep learning), aide à la décision, SI et visualisation, intelligence artificielle, explicabilité. En plus des enjeux technologiques de traitement et d’apprentissage, cette thématique peut inclure des questions d’éthique et d’équité, telles que la réduction des biais algorithmiques, la transparence des processus décisionnels, et l’impact des systèmes intelligents sur la société.
• SI ET INTERACTION HUMAINE : production participative (crowd sourcing), réalité augmentée et SI, jeux sérieux pour les SI, SI et médiation, usages du SI, SI et accessibilité, SI et handicap, adaptation des SI.
• SI ET RESPONSABILITE SOCIETALE ET ENVIRONNEMENTALE : SI & transformation numérique de la société, SI & nouveaux modes de travail et de collaboration, SI & changement climatique, SI & gestion des ressources, SI & préservation de l’environnement, SI & éthique… Cette thématique vise des travaux abordant la transformation numérique éthique et équitable de la société, en intégrant les nouveaux modes de travail et de collaboration, la prise en compte de l’éthique et de la justice sociale, la lutte contre les discriminations algorithmiques, le SI et le changement climatique, ainsi que la gestion durable des ressources.
• SI ET SÉCURITÉ : sécurité organisationnelle, SI résilients, sécurité d’accès à l’information, sécurité à la conception (“privacy by design”/ “privacy by default”), données ouvertes, données personnelles, SI & respect de la vie privée.
• SI et RÉSEAUX SOCIAUX : ingénierie sociale, discernement, réflexion vs réflexe, éthique, responsabilité, citoyenneté, analyse des sentiments.
• INGÉNIERIE DES PROCESSUS : méthodes pour l’ingénierie de SI à base de services, ingénierie des exigences, architecture d’entreprise, architectures et outils pour les services, SI et services numériques, modélisation/cartographie/orchestration de processus, business process management, Enterprise Resource Planning (ERP).
• INGÉNIERIE DES DOCUMENTS ET DES CONNAISSANCES : modélisation et méta-modélisation des documents, recherche d’informations, graphe de connaissances, médiation de sources d’information, informations multimédia et gestion de contenu, systèmes de recommandation, réseaux sociaux et SI, ontologies, knowledge management.
• SI DÉDIÉS ET ENTREPRISES DU FUTUR : environnement, usine 4.0, habitat intelligent, ville intelligente, développement durable, santé, biologie, éducation, aéronautique, commerce, marketing, banque, logistique, PME, expériences de SI du futur, innovation digitale, SI et bien-être au travail.
• ÉTHIQUE, ÉQUITÉ ET GOUVERNANCE DES SI : Dans un contexte où les systèmes d’information influencent tous les domaines de la société, cette thématique invite les contributions traitant des problématiques d’éthique des SI, de gouvernance équitable, d’inclusivité dans la conception des algorithmes, de justice sociale, de préservation des droits humains dans les technologies, de transparence, et de responsabilité dans l’utilisation des données.
• SI ET IA (GÉNÉRATIVE) : Dans un contexte où les systèmes d’information et l’intelligence artificielle (générative) transforment profondément les dynamiques sociales, économiques et organisationnelles, cette thématique invite les contributions explorant, par exemple, les innovations et défis technologiques liés à l’intégration de l’IA (générative) dans les SI (optimisation des processus métiers, gestion et déploiement des modèles génératifs, amélioration des interactions homme-machine, performance, scalabilité et efficacité des systèmes intégrant ces technologies) ou les enjeux liés à l’impact sociétal de l’IA (générative) (gestion des biais algorithmiques, transparence des modèles, gouvernance des systèmes, préservation des droits des utilisateurs, implications pour la justice sociale et l’inclusivité), …
Toutes les contributions explorant de près ou de loin la conception, l’ingénierie (ingénierie dirigée par les modèles, paradigmes de modélisation, rétro-ingénierie/réingénierie/co-conception des SI) et la gouvernance (gestion des risques, conformité aux réglementations, alignement des SI à la stratégie de l’entreprise, management de projet SI, agilité, SI mobiles et ubiquitaires) des systèmes d’information sont les bienvenues.

DATES IMPORTANTES
Date limite de réception des articles : 14 février 2025
Notification aux auteurs : 04 avril 2025
Date limite de réception des textes définitifs : 06 mai 2025
Dates du congrès : 03 juin – 06 juin 2025

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Explainability of time series prediction models for water resources management

Offre en lien avec l’Action/le Réseau : HELP/– — –

Laboratoire/Entreprise : IRIT – Université Toulouse Capitole
Durée : 12 months
Contact : julien.aligon@irit.fr
Date limite de publication : 2025-01-10

Contexte :

Sujet :
An opening for a postdoctoral position at the IRIT laboratory, Université Toulouse Capitole, is available for research into the explainability of predictive models for time series.

This 12-month postdoctoral position is being offered in collaboration with the LIFAT laboratory at the University of Tours. The position is part of the ANR AIDA project, which aims to develop new actionable and explainable models for water resource management in partnership with BRGM: https://www.brgm.fr/en/identity/brgm-glance

Further details may be found in the attached document.

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :
Université Toulouse Capitole, Site de la Manufacture des Tabacs, 21 Allée de Brienne 31000 Toulouse

Document attaché : 202412031500_Post-doc ANR AIDA.pdf

Réseaux de neurones profonds pour l’analyse de performance et la gestion de microréseaux électriques intelligents

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISSI/CERTES
Durée : 6 mois
Contact : aurelien.hazan@u-pec.fr
Date limite de publication : 2025-01-10

Contexte :

Sujet :
Le CERTES utilise de nombreuses techniques d’apprentissage machine [Ark21] et dispose d’une plateforme technologique de micro-réseaux modulaires et multifonctionnels. Cette plateforme permet d’étudier différents scenarios d’agrégationde plusieurs sources énergétiques (éolien, solaire, stockage, réseau électrique, charges de consommation variable, …) avec la possibilité de générer différents types de défauts
mais aussi d’utiliser de contrôler certaines sources énergétiques pour fonctionner selon des profils imposés, en plus des sources soumises aux conditions climatiques réelles.

Le but de ce stage est d’évaluer l’intérêt de deux types de réseaux de neurones pour l’analyse des microréseaux électriques :

– Les Graph Neural Networks (GNN) sont spécifiquement adaptés aux données sous forme de graphe [Liao22], et sont donc particulièrement pertinents pour les réseaux électriques.

-Les PINN (Physics-Induced Neural Networks) imposent des contraintes
représentant des lois physiques lors de l’apprentissage afin de réduire la
dimension de l’espace latent des paramètres.

Le LISSI dispose d’une expertise dans l’analyse de données sur graphe et sur plusieurs types de réseaux de neurones profonds [Haz21, Aha24]. Les performances de ces réseaux de neurones seront testées avec plusieurs tâches d’intérêt pour le CERTES [Ark21, Tan24]:

-Prédiction de séries temporelles de charge électrique de micro-réseau avec un graph récurrent neural networks (GRNN), comparaison avec d’autres architectures de type LSTM.

-Prédiction de puissance générée par des panneaux photovoltaïques. Calcul approché de flux de puissance (power-flow) et analyse de scenario lors de l’adjonction d’une flotte de véhicules électriques à un petit réseau de distribution industriel.

Dans chaque cas, le stagiaire comparera les performances obtenues avec celles développées précédemment au CERTES, les performances state-of-the-art dans la littérature, et évaluera les avantages et inconvénients.

Références:

[Ark21] Arkhangelski, “Autoconsommation et optimisation de la gestion énergétique des bâtiments”, thèse, UPEC, 2021.

[Haz22] Hazan, “Production process networks: a trophic analysis”, Journal of Physics:Complexity, 4,1, 2022.

[Aha24] Ahamada, Hazan, Vigneron, “Deep Learning and Tensor Decomposition”, in preparation.

[Tan24] Simarro-García, Villena-Ruiz, Tankari, Honrubia-Escribano, Gómez-Lázaro, Lefebvre, “Fast and Extreme Fast Charging Integration for Electric Vehicles: Impact on an Industrial Distribution Network”, International journal of engineering science and application,Vol.8, No.2, 2024.

[Lia22] Liao et al. “A Review of Graph Neural Networks and Their Applications in Power Systems”, Journal of modern power systems and clean energy, vol. 10, no. 2, 2022.

[Kho21] Khodayar et al. “Deep Learning in Power Systems Research: A Review”, Csee journal of power and energy systems, vol. 7, no. 2, march 2021.

Profil du candidat :
Etudiant.e en M2 sciences de l’ingénieur, génie électrique, énergie, machine learning, deep learning.

Compétences (modélisation systémique (Matlab, PSIM, …), calcul de power flow, ML,programmation Python.

Formation et compétences requises :

Adresse d’emploi :
LISSI: site de Sénart, IUT de Sénart-Fontainebleau, 36-37 rue Georges Charpak,77 567 Lieusaint

CERTES: site de Créteil: Bâtiment L5, 61 Avenue du Général De Gaulle, 94000 CRETEIL

Document attaché : 202412030849_2024_sujet_M2_LISSI_CERTES_DEF.pdf

Application de méthodes de Natural Language Processing (NLP) pour l’extraction automatisée de données web pour la création d’une base de données des traits phénotypiques des adventices tropicales

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Cirad
Durée : 6 mois
Contact : gregoire.blanchard@cirad.fr
Date limite de publication : 2025-01-10

Contexte :
L’objectif de ce stage est de définir, extraire et organiser des données de traits phénotypiques et de distribution géographique des adventices tropicales (plantes qui s’établissent spontanément dans les systèmes tropicaux cultivés) afin de construire une base de données complète et exploitable pour décrire et comparer leur caractéristiques et leur diversité. Les plantes adventices des cultures tropicales ont un impact significatif sur la productivité agricole mais aussi sur de multiples services écosystémiques comme le maintien de la fertilité des sols, la réduction de l’érosion, la régulation des bioagresseurs etc. Une meilleure connaissance des traits phénotypiques des adventices tropicales permettrait d’améliorer notre compréhension de leur fonctionnement et de leur écologie, qui déterminent leur développement aux sein des cultures, leur réponse aux facteurs environnementaux et aux pratiques agronomiques, ainsi que leur distribution géographique. C’est donc une étape cruciale pour développer des stratégies de gestion efficaces.

Sujet :
Dans ce contexte, le stage a pour objectif de collecter, de traiter et d’organiser des données pertinentes des traits des plantes en utilisant des techniques de web scraping et le text-mining. La finalité du stage est de construire une base de données relationnelle structurée regroupant les traits des adventices tropicales qui sera un outil précieux pour les
chercheurs, permettant d’effectuer différentes analyses, pour une meilleure compréhension de la réponse des espèces adventices aux facteurs environnementaux et aux pratiques agricoles, ainsi que de leur impact sur le fonctionnement des cultures tropicales. Le/la stagiaire sera responsable du développement des scripts de web scraping en utilisant principalement le langage de programmation Python via des bibliothèques spécialisées. Une première étape sera d’évaluer et de comparer les performances spécifiques de différentes méthodes de text mining (Spacy, GLiNER, UniversalNER) pour l’extraction des entités visées dans le cadre de ce travail. Les méthodes retenues permettront d’extraire des informations spécifiques sur les plantes adventices et leurs traits phénotypiques et éventuellement leur répartition géographique. Les données seront ensuite normalisées et structurées de manière cohérente pour leur intégration dans une base de données relationnelle (PostgreSQL). Enfin, des analyses descriptives des données recueillies pourront être réalisées pour évaluer l’état et le volume des connaissances accumulées dans la base de données, et la distribution des valeurs de traits des espèces en fonction de leur distribution au travers des gradients environnementaux, géographiques et agronomiques.

Profil du candidat :
Formation de niveau Master 2 en cours dans le domaine de l’intelligence artificielle ou de la science des données.

Formation et compétences requises :

Adresse d’emploi :
Stage basé en Guadeloupe (station de Neufchateau, Capesterre-Belle-Eau) avec une mission sur Montpellier pour Digitagora.

Document attaché : 202412021735_Stage_DigitAg_Text_mining.pdf

Research engineer/Post-doctoral position – Physical Informed Neural Networks for Electromagnetic Applications

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIST3N
Durée : 10 to 12 months
Contact : alexandre.baussard@utt.fr
Date limite de publication : 2025-01-10

Contexte :

Sujet :
The research proposed in this project fall within the field of physical informed neural networks for electromagnetic applications. The aim is to use this type of method to generate synthetic data to deal with the lack of data in some applications. Until now, the solution has been to use simulators based on physical models. Several levels of modeling can be used such as approximate physical models or the so-called exact models. However, these models are either too simplified or too time-consuming and computationally demanding. Moreover, even if in theory the exact models can consider all the physical phenomena, at the end there always exist differences with real data.
The goal of this project is to evaluate the physical informed neural networks (PINNs) as an alternative solution to physical models. PINNs are becoming increasingly popular but there are still number research works to do, especially when dealing with 3D problems. We also must take into account the fact that the electromagnetic field is complex-valued. In this project we will first evaluate PINN to compute the scattered field from object considering 2D configurations. Depending on the results, 3D problems can be considered.

Profil du candidat :
We are looking for a highly motivated candidate to study PINNs for electromagnetic applications. The candidate should possess the following qualifications:
• A robust background in machine learning, signal processing, or applied mathematics
• Strong programming abilities in Python and PyTorch.

Formation et compétences requises :
Research engineer or Ph.D. with strong experience in deep learning and, if possible, PINNs. Basic knowledge of electromagnetism and modeling would be appreciated.

Adresse d’emploi :
LIST3N – Université de Technologie de Troyes