
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS
Offre en lien avec l’Action/le Réseau : MACLEAN/– — –
Laboratoire/Entreprise : Lab-STICC/IMT Atlantique
Durée : 24 months
Contact : ronan.fablet@imt-atlantique.fr
Date limite de publication : 2023-03-24
Contexte :
Several postdoc positions are opened in INRIA Odyssey team (https://team.inria.fr/odyssey/) at IMT Atlantique/Lab-STICC. The successful candidate will also join OceaniX group at IMT Atlantique/Lab-STICC (https://cia-oceanix.github.io/), a group dedicated to physics-informed AI for the monitoring and surveillance of the oceans. OceaniX chair gathers an interdisciplinary group with expertise in numerical modeling, applied math deep learning, remote sensing and ocean science to leverage AI technologies and paradigms to address key challenges in ocean modeling and forecasting, observing system design and control, surveillance and monitoring of maritime activities. OceaniX chair also benefits from strong academy-industry partnerships (e.g., Ifremer, CNES, CLS, NavalGroup, Eodyn, OceanDataLab, Mercator Ocean International).
Sujet :
In the context of the newly-funded H2020 project Edito-Model Lab, which aims to develop the next-generation of European hybrid modeling and forecasting core engines for the Digital Twins of the Ocean, these postdocs will explore, propose and assess deep learning schemes for ocean data assimilation. Topics of interest cover methodological aspects at the interface between deep learning and data assimilation, especially towards probabilistic neural data assimilation schemes, and ocean data assimilation challenges for upper ocean dynamics using multi-platform observation data (e.g., satellite-derived observations, in situ data…). They will benefit from and contribute to the interdisciplinary interactions between Edito-Model Lab partners involved in WP “AI-based emulators for ocean modeling and forecasting”, namely ocean modeling groups (IGE: Dr. J. Le Sommer, Grenoble, France; BSC: Dr. M. Castrillo, Barcelona, SP), coastal ocean science (Deltares: Dr. G. El Serafy, Delft, Netherlands), Ocean data assimilation (NERSC: Dr. L. Bertino, J. Brajard, Bergen, Norway) and AI (IMT Atlantique: Prof. R. Fablet, Brest, France; Hereon: Dr. D. Greenberg, Geesthahct, Germany).
Profil du candidat :
Applications are encouraged from candidates with a Ph.D in applied math/machine learning/data science and a strong interest in interdisciplinary and marine science as well as a PhD in ocean science/geoscience and some previous experience in machine learning.
Formation et compétences requises :
Candidates should have a strong interest and commitment to research. Creativity with an aim towards independent research is highly emphasized.
Adresse d’emploi :
IMT Atlantique, Brest, France
Send CV, statement of research interests and the contact information of at least two references to ronan.fablet@imt-atlantique.fr. Review of applications will begin immediately and continue until the position is filled.
Document attaché : 202211240951_postdoc_offer_edito_model_lab2022.docx.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIFO, UFR ST
Durée : permanent
Contact : mirian@univ-orleans.fr
Date limite de publication : 2023-03-29
Contexte :
Un poste de professeur des universités est à pourvoir à l’université d’Orléans, avec rattachement recherche au LIFO.
Sujet :
Ce poste est ouvert aux candidatures proposant une intégration dans l’équipe PAMDA du LIFO.
Profil du candidat :
La personne recrutée devra s’intégrer à l’équipe PAMDA/LIFO en contribuant pour la convergence des problématiques gestion de données et calculs intensifs, renforçant soit :
• l’axe BD sur des aspects théoriques ou appliqués de la gestion des données notamment pour les graphes de données (extraction et évolution de schéma, maintenance par rapport à des contraintes, interrogation intelligente et efficace) ;
• l’axe parallélisme sur le parallélisme implicite au sein du workflow pour les étapes d’analyse de données ;
• l’interaction entre les deux axes vers un contexte HPDA.
Formation et compétences requises :
La personne recrutée devra renforcer notre capacité à diriger des recherches, créer des opportunités de collaboration impliquant nos jeunes collègues enseignants-chercheurs ainsi que d’autres laboratoires nationaux ou étrangers. Elle devra s’investir dans l’animation scientifique et administrative de notre laboratoire; contribuer à augmenter notre dynamique, étant force de proposition de nouveaux projets.
Les candidatures externes contribuant à améliorer la diversité du laboratoire sont vivement encouragées.
Adresse d’emploi :
POSTE PR 27 – Université d’Orléans
Composante : UFR Sciences et Techniques
Recherche: Laboratoire d’Informatique Fondamentale d’Orléans (LIFO, EA 4022). Équipe PAMDA.
https://www.univ-orleans.fr/lifo/
Pour plus des détails, se référer à:
https://www.univ-orleans.fr/fr/univ/universite/travailler-luniversite/personnels-enseignants-et-chercheurs/enseignants-chercheurs
https://www.univ-orleans.fr/upload/public/2023-02/FOP_0450855K_4555.pdf
https://www.univ-orleans.fr/lifo/equipe.php?id=2
Contact (recherche) :
• Mirian HALFELD FERRARI : mirian@univ-orleans.fr (directrice du LIFO)
Téléphone : 02 38 49 25 83
• Sophie ROBERT : Sophie.Robert@univ-orleans.fr (responsable de l’équipe PAMDA)
Téléphone : 02 38 49 70 87
Contact (enseignement) :
TESSIER Alexandre ou LIEDLOFF Mathieu
Mail : direction.sciences-info@listes.univ-orleans.fr
Téléphone : +33 2 38 41 70 11 et +33 2 38 49 49 10
Document attaché : 202303110737_VfinalCAC-Profil_Poste_PR_27_UFR ST_LIFO.pdf
Offre en lien avec l’Action/le Réseau : MACLEAN/– — –
Laboratoire/Entreprise : IRISA & FEM
Durée : 11 mois
Contact : sebastien.lefevre@irisa.fr
Date limite de publication : 2023-03-30
Contexte :
Ce recrutement s’inscrit dans le projet OWFSOMM sur la standardisation des outils et méthodes de suivi de la mégafaune marine à l’échelle des parcs éoliens offshores (https://www.france-energies-marines.org/projets/owfsomm/).
Sujet :
L’objectif est le développement de solutions deep learning pour l’analyse de vidéos 360°.
Se référer au sujet détaillé pour plus d’infos : https://www.france-energies-marines.org/nous-rejoindre/ingenieur-de-recherche-chercheur-postdoctoral-en-apprentissage-profond-pour-le-suivi-de-la-megafaune-marine-a-partir-de-donnees-videos-360-f-h/
Profil du candidat :
Doctorat ou diplôme d’ingénieur en informatique / mathématiques appliquées / traitement du signal avec spécialisation en vision par ordinateur / apprentissage profond.
Formation et compétences requises :
Doctorat ou diplôme d’ingénieur en informatique / mathématiques appliquées / traitement du signal avec spécialisation en vision par ordinateur / apprentissage profond.
Adresse d’emploi :
Brest ou Vannes
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIFO, UFR ST
Durée : permanent
Contact : mirian@univ-orleans.fr
Date limite de publication : 2023-03-30
Contexte :
Poste de professeur des universités en informatique à l’Université d’Orléans.
Date de recrutement : 01/09/2023
Sujet :
Activités d’enseignement et besoins d’encadrement :
La personne recrutée intégrera le pôle informatique de l’UFR Sciences et Techniques de l’Université d’Orléans.
Recherche:
Ce poste est ouvert aux candidatures proposant une intégration dans l’équipe PAMDA du Laboratoire d’Informatique Fondamentale d’Orléans (LIFO, EA 4022).
Profil du candidat :
Les travaux de l’équipe PAMDA s’inscrivent dans deux axes de recherche : les bases de données et le parallélisme.
Formation et compétences requises :
La personne recrutée devra s’intégrer au projet scientifique de l’équipe en contribuant pour la convergence des problématiques gestion de données et calculs intensifs.
Adresse d’emploi :
LIFO – Batiment IIIA – Rue Léonard de Vinci – BP6759
45067 Orléans Cedex 2
Document attaché : 202301022201_V1-annoncePoste-PR27.txt
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LASTIG
Durée : 36 mois
Contact : clement.mallet@ign.fr
Date limite de publication : 2023-03-31
Contexte :
Earth Observations (EO) nowadays refer to sensors with different modalities capturing rich and complementary information. EO are typically large-scale, multimodal, and multi-resolution. They often display a complex structure in which the spatial, temporal,
and spectral dimensions are entangled. This structure is influenced by
phenomenons operating at widely different scales, complex domain shifts (the distribution and appearance of certain classes vary significantly across regions and throughout the year), atmospheric conditions, and cumulative weather, resulting in inherently
non-stationary processes. While these characteristics complexify the analysis of EO, their absolute
spatial and temporal referencing of remote sensing allows us to align different acquisitions easily.
The deep learning paradigm is gradually being adopted as an indispensable tool for the automatic analysis of EO. However, the state-of-the-art solutions suffer from
multiple limitations: (1) existing deep-based models are not well-suited to the structure of EO, (2) large-scale annotation is unrealistic, (3) the limited spatio-temporal extent and task-specificity of existing
datasets and models result in poor generalization, (4) most annotated datasets remain focused on specific areas and environments, biasing the community towards particular architectures.
We propose to address the previous limitations by developing a Foundation Model of Earth Observations, trained on extensive unannotated data. Such a model should be rich, expressive, compact and efficient for most domain shifts and geographical bias. We will explore the idea of reciprocal cross-modal training to leverage the multimodality and georeferential alignment of EO data.
Sujet :
Foundation models refer to large neural networks trained on a vast amount of data and widely used for further applications or research. Such models can be built upon without having to be trained from scratch. This strategy both saves computation time and provides expressive
features/state-of-the-art encoders, and decreases the annotation and hardware requirements usually associated with large modern networks.
We propose a new learning paradigm dubbed “Cross-modal reciprocal learning” to train such foundation models from unannotated multi-modal EO.
Text-Image contrastive pretraining has shown impressive results in computer vision, leading to expressive and influential
foundation models. Contrastive learning has been recently explored for EO by exploiting spatial alignment across time series or for cross-modal localization. We propose generalizing text-image contrastive learning to the multi-modal setting with spatially aligned
observations. We require the features extracted from acquisitions of an area through different modalities to be more similar than any descriptors of another area. By forcing spatial alignment across sensors, the features must describe the only shared
latent variable: the actual semantics of the acquired area (e.g., road, building, plant species).
Generalizing contrastive learning to the multi-domain setting raises several theoretical and technical
challenges. First, the classic two-modalities formulation leads to an exponential complexity w.r.t the number of sensors, quickly becoming impractical and requiring us to develop an adapted loss and sampling procedure. Second, cross-modal learning implies the simultaneous training of several
large networks and the manipulation of costly multi-modal batches. This raises technical issues such as inefficiency in memory use and prolonged training times. Lastly, if we only reward the encoders
for spatial alignment across modalities, they may be discouraged from retaining sensor-specific information. This would result in weaker individual representations discarding the strength of each
sensor at the benefit of the lowest common denominator. This critical concern may be mitigated with multi-task learning and self-supervision.\
Depending on the application cases, we will focus on several modalities among the six following ones: Sentinel-2 Optical Time Series, Sentinel-1 Radar Time Series, High Resolution orthoimages, hyperspectral images, aerial LiDAR, and spaceborne LiDAR.
The PhD project also includes application cases related to the exploitation of the designed model. We will focus on standard downstream tasks such as multi-domain land-cover classification or crop mapping, and biogeophysical variable estimation (e.g., biomass estimation).
Profil du candidat :
– Familiarité avec la vision par ordinateur, l’apprentissage machine et l’apprentissage profond;
– Maîtrise de Python et familiarité avec PyTorch;
– Curiosité, rigueur, motivation;
– (Optionnel) Familiarité avec l’apprentissage auto/faiblement supervisé et contrastif;
– (Optionnel) Expérience avec l’imagerie aérienne ou satellite et la classification pour l’occupation des sols.
Formation et compétences requises :
Master 2 en informatique, computer sciences, mathématiques appliquées ou télédétection
Adresse d’emploi :
IGN, 73 avenue de Paris, 94160 Saint-Mandé
Document attaché : 202301111252_These2023_LASTIG_EO_reciprocal_learning.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : ONERA – Centre de Palaiseau – Département Optique
Durée : CDI
Contact : sidonie.lefebvre@onera.fr
Date limite de publication : 2023-03-31
Contexte :
Présentation de l’ONERA
L’ONERA, acteur central de la recherche aéronautique et spatiale, emploie plus de 2000 personnes. Placé sous la tutelle du ministère des Armées, il dispose d’un budget de 266 millions d’euros (2022), dont plus de la moitié provient de contrats d’études, de recherche et d’essais. Expert étatique, l’ONERA prépare la défense de demain, répond aux enjeux aéronautiques et spatiaux du futur, et contribue à la compétitivité de l’industrie aérospatiale. Il maîtrise toutes les disciplines et technologies du domaine. Tous les grands programmes aérospatiaux civils et militaires en France et en Europe portent une part de l’ADN de l’ONERA : Ariane, Airbus, Falcon, Rafale, missiles, hélicoptères, moteurs, radars… Reconnus à l’international et souvent primés, ses chercheurs forment de nombreux doctorants.
Présentation du département
Le Département Optique et Techniques Associées, DOTA, a pour mission de réaliser des études et recherches liées à l’utilisation du domaine optique (ondes électromagnétiques comprises entre l’ultraviolet moyen (200 nm) et le domaine des THz (1 THz ~ 300 μm). Ces études sont réalisées en premier lieu au profit du domaine Aéronautique, Espace et Défense, mais également pour d’autres domaines comme la sécurité, l’environnement, l’astronomie, et l’imagerie médicale.
Le DOTA a la maîtrise de l’ensemble de la chaîne optique, depuis la source jusqu’aux traitements des signaux issus des systèmes optiques, en vue de réaliser des produits.
Sujet :
Missions
L’Unité Modélisation Physique de la Scène Optronique (MPSO) développe et met en œuvre des outils de référence pour modéliser et caractériser l’environnement optronique pour le dimensionnement et l’évaluation des performances des capteurs terrestres ou embarqués sur avion ou satellite. Cette unité se compose d’une quinzaine de personnes comprenant des ingénieurs de recherche et des doctorants. Elle participe activement au Laboratoire de Mathématiques Appliquées (LMA2S, https://w3.onera.fr/lma2s/) et au Laboratoire d’Intelligence Artificielle de l’ONERA.
Sous la responsabilité du responsable d’unité et en collaboration avec les chercheurs de différentes unités du DOTA, vous développez et mettez en œuvre des méthodologies d’apprentissage profond pour différentes applications, parmi lesquelles :
l’inversion de données instrumentales (lidar, spectromètres…) ou simulées pour la caractérisation de l’environnement et des cibles,
la détection de couvertures nuageuses pour des missions satellitaires, le choix de sites de réception pour les télécommunications optiques, la fusion et le clustering de données météorologiques,
l’estimation, le démélange et la classification de paramètres physiques atmosphériques ou terrains (végétation, minéraux, plastiques…),
la simulation de données par Intelligence Artificielle, …
Pour toutes ces applications, un point important est la quantification des incertitudes associées à l’utilisation des méthodes de Deep Learning, en lien avec le Groupement d’Intérêt Scientifique LARTISSTE (https://uq-at-paris-saclay.github.io/).
Vous contribuez au développement des activités du département en étant force de propositions dans l’élaboration de projets scientifiques (Union Européenne, EDA…), en initiant des collaborations avec les équipes universitaires spécialistes du domaine du Deep Learning et de la Datascience, avec les partenaires industriels de l’ONERA et en participant aux activités des laboratoires de mathématiques appliquées et d’intelligence artificielle.
Vous assurez également des activités d’encadrement de stagiaires, doctorants ou post-doctorants et valorisez vos travaux dans des journaux à comité de lecture et des conférences ;
Vos missions sont conditionnées par l’obtention d’une habilitation de Défense nationale.
Profil du candidat :
Docteur ou ingénieur possédant des compétences solides en intelligence artificielle et machine learning
Intérêt prononcé pour la recherche appliquée et la mise au point de nouveaux algorithmes
Formation et compétences requises :
Maîtrise avérée du langage Python
Expérience réussie dans le traitement de gros volumes de données
Bonnes qualités rédactionnelles et d’organisation nécessaires
Bon niveau d’anglais indispensable
Adresse d’emploi :
ONERA – Centre de Palaiseau
6 Chemin de la Vauve aux Granges
91120 PALAISEAU
Pour postuler, utiliser le lien direct : https://emea3.recruitmentplatform.com/apply-app/pages/application-form?jobId=Q6EFK026203F3VBQB68LOF6FJ-3083&langCode=fr_FR
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Centrale Lille Institut / CRIStAL
Durée : Fonctionnaire
Contact : pierre.chainais@centralelille.fr
Date limite de publication : 2023-03-31
Contexte :
Centrale Lille Institut ouvre au concours un poste de Maître de Conférences 61/27 « Science des données ». Il est annoncé ici sur Galaxie :
https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/FIDIS/0597139P/FOPC_0597139P_30.pdf
La personne recrutée sera intégrée aux activités « machine learning & traitement du signal » :
au département d’enseignements « Mathématiques-Informatique » de Centrale Lille
à l’UMR CRIStAL (Centre de Recherche en Informatique, Signal et Automatique de Lille – UMR 9189
Mots-clefs : Science des données et apprentissage statistique, traitement du signal, intelligence artificielle, reconstruction, restauration, analyse.
Sujet :
Le profil est intitulé “Science des données”.
La personne recrutée sera intégrée
• A l’équipe pédagogique du département Mathématique et Informatique, avec une activité d’enseignement orientée vers le domaine de la science des données, et plus particulièrement du traitement du signal et de l’apprentissage statistique et exercée au sein de l’ensemble des formations de Centrale Lille, d’une part
• Au Centre de Recherche en Informatique, Signal et Automatique de Lille (CRIStAL, UMR 9189 CNRS) et rattachée à l’équipe Signal, Modèles et Applications (SigMA), d’autre part
Profil du candidat :
Profil enseignement
De manière générale, la personne recrutée devra participer aux enseignements autour de la thématique science des données & IA au sein de l’établissement, ainsi qu’à l’encadrement des diverses activités pédagogiques telles que les projets et suivis de stages.
Les besoins en enseignement sont à l’interface entre traitement du signal, science des données et apprentissage statistique, dans l’ensemble des formations de Centrale Lille. Il s’agira prioritairement d’interventions en traitement du signal et apprentissage statistique dans les différentes années de formation à l’École Centrale de Lille. En particulier, plusieurs enseignements devront être assumés dans le parcours de « science des données & IA » en dernière année.
L’établissement est aussi impliqué dans des formations de master telles que le master de science des données (data science), co-accrédité par l’Université de Lille et l’IMT Nord Europe. Les enseignements y sont dispensés intégralement en anglais. La personne recrutée devra s’impliquer dans ce master pour les disciplines relevant de ses compétences. Rappelons que ce master bénéficie du soutien du graduate programme « Information & Knowledge Society » (animation scientifique, bourses d’études et de mobilité,…)
Profil de recherche
La personne recrutée développera ses recherches en lien avec le traitement statistique du signal et des images et/ou de l’apprentissage statistique (machine learning) autour de thèmes tels que : méthodes d’inférence en grande dimension, problèmes inverses, modèles génératifs, approches bayésiennes, méthodes de Monte Carlo, optimisation…
Elle participera aux projets de l’équipe, aussi bien sur les aspects méthodologiques qu’en lien avec les applications. On citera par exemple, sans caractère limitant, les applications en astronomie et en astrophysique, en télédétection, en sécurité de l’information multimédia, en imagerie polarimétrique…
Remarque : Le poste sur lequel vous candidatez est susceptible d’être situé dans une “zone à régime restrictif” au sens de l’article R.413-5-1 du code pénal. Si tel est le cas, votre nomination et/ou votre affectation ne pourront intervenir qu’après autorisation d’accès délivrée par le chef d’établissement, conformément aux dispositions de l’article 20-4 du décret n°84- 431 du 6 juin 1984.
Profil commun
Compte-tenu du contexte de l’établissement, la personne recrutée devra par ailleurs démontrer une aptitude au travail en équipes interdisciplinaires indispensable aux formations d’ingénieurs dispensées par Centrale Lille et une appétence prononcée pour les pédagogies actives et les activités de formation fondées sur une activité de projet. Il est attendu qu’elle ait un investissement équilibré dans des missions et responsabilités en enseignement et en recherche.
Mots-clefs
Science des données et apprentissage statistique, traitement du signal, intelligence artificielle, reconstruction, restauration, analyse.
Formation et compétences requises :
Thèse de doctorat en traitement du signal et des images, apprentissage statistique, mathématiques appliquées, informatique, en lien avec la science des données. Qualification en section 61, 27 ou 26.
Adresse d’emploi :
Contacts
– Recherche : Patrick BAS (patrick.bas@cnrs.fr),
– Formation : Pierre CHAINAIS (pierre.chainais@centralelille.fr)
Document attaché : 202303070903_FOPC_0597139P_30.pdf
Offre en lien avec l’Action/le Réseau : DOING/– — –
Laboratoire/Entreprise : LLL-CNRS
Durée : 12 mois
Contact : anne-lyse.minard@univ-orleans.fr
Date limite de publication : 2023-03-31
Contexte :
Le projet régional DOING vise à développer des méthodes et des outils pour, dans un premier temps, extraire des informations de données textuelles en les structurant dans une base de données graphe, puis pour manipuler de façon intelligente ce graphe de connaissance. Le domaine d’application choisi est le domaine de la santé, avec en premier lieu l’utilisation de données disponibles librement (tels que des cas cliniques). DOING vise à concevoir une nouvelle forme de requêtes déclaratives, pouvant intégrer des analyses, qui guideront les spécialistes du domaine de la santé dans leur prise de décision. DOING est conçu sur une réelle collaboration interdisciplinaire (Traitement Automatique des Langues, Bases de Données et Intelligence Artificielle) pour transformer des données en information puis en connaissance.
DOING (https://www.univ-orleans.fr/lifo/evenements/doing/) est basé sur une collaboration inter-disciplinaire pour transformer des données en information puis en connaissance.
Ce projet s’inscrit dans le cadre de l’action DOING@MADICS et du groupe de travail DOING@DIAMS.
Sujet :
Le travail de recherche concerne la tâche 1 du projet DOING, et se concentrera principalement sur le 2ème volet concernant l’extraction des relations.
(1) Détection et catégorisation des entités d’intérêt (e.g, pathologie, traitement). Un premier travail a été effectué pour développer un système à base de CRF (Minard et al., 2020) dans le cadre de notre participation à la campagne d’évaluation DEFT 2020. Une tâche consistera à améliorer ce système, éventuellement en utilisant d’autres corpus de cas cliniques : corpus de DEFT 2019, 2020 annotés avec des entités cliniques ; corpus E3C en cours d’annotation (Magnini et al., 2020).
(2) Détection et catégorisation des relations entre les entités. L’extraction des relations permet de faire émerger un sens qui sera représenté dans graphe de données que nous cherchons à construire. Nous nous focaliserons sur deux types de relations essentielles :
(2.1) Les relations de coréférences : elles existent entre deux unités linguistiques faisant référence à une même entité du discours (par exemple “Alice ressent des frissons. Ce symptôme est lié à sa fièvre.”). Les techniques actuelles reposent sur des modèles neuronaux classiques, génériques, entraînés des corpus du domaine général, et souffrent d’une importante dégradation de performance lorsqu’ils sont appliqués à un autre domaine (Zhang et al., 2020). Tout en considérant la spécificité de la coréférence en langue de spécialité médicale, nous chercherons à développer des modèles relativement génériques, plus robustes en termes de performance inter-domaine et explicables. Pour lever ce dernier verrou, nous utiliserons des techniques d’apprentissage statistique interprétable (arbres de décision, forêts d’arbres aléatoires) proposées par notre groupe TAL (Desoyer et al., 2014). En parallèle, nous pourrons adapter le système neuronal proposé par le laboratoire LATTICE dont le concepteur est associé au LIFO (Grobol, 2020).
(2.2) Les relations temporelles : elles permettent d’ordonner les événements concernant un patient (l’apparition des symptômes, les traitements suivis, etc.). Nous travaillerons au développement d’un système d’extraction d’informations temporelles et testerons des méthodes permettant de pallier la faible quantité de données dans le domaine médical. Nous poursuivrons également les travaux entamés dans les projets Temporal et ODIL par notre groupe TAL (Lefeuvre-Halftermeyer et al., 2016), en évaluant la généricité du schéma proposé et en étudiant l’ajout possible de la notion de containers (Pustejovsky and Stubbs, 2011).
(3) Interaction entre l’extraction des informations, la construction et l’exploitation des bases de données graphe. Une méthode viserait à considérer comment l’extraction des relations peut bénéficier des approches utilisées sur les bases de données graphe (page rank, betweenness, etc). Les observations issues de T3 viendraient compléter et s’intégrer aux résultats de T1 pour l’instanciation de la base.
BIBLIOGRAPHIE
Grobol L., Coreference resolution for spoken French. Thèse Univ. Paris Sorbonne Nouvelle, 2020.
Lefeuvre-Halftermeyer A., Antoine J-Y., Couillault A., Schang E., Abouda L., Savary A., Maurel D., Eshkol I. and Battistelli D. Covering various Needs in Temporal Annotation: a Proposal of Extension of ISO TimeML that Preserves Upward Compatibility. In Proceedings of the 10th Int. Conf. on Language Resources and Evaluation (LREC), 2016.
Magnini B., Altuna B., Lavelli A., Speranza M., Zanoli R. The E3C Project:Collection and Annotation of a Multilingual Corpus of Clinical Cases. In Proceedings of CLiC-it 2020.
Minard A-L., Roques A., Hiot N., Halfeld-Ferrari M., Savary A. DOING@DEFT : cascade de CRF pour l’annotation d’entités cliniques imbriquées. Actes 27° conférence TALN, Nancy, France, 2020.
[16] Pustejovsky J. and Stubbs A. Increasing Informativeness in Temporal Annotation. In Proceedings of the 5th Linguistic Annotation Workshop. Ass. for Computational Linguistics, Stroudsburg, PA, USA, LAW V ’2011.
Zhang H., Zhao X., Song Y. A Brief Survey and Comparative Study of Recent Development of Pronoun Coreference Resolution – preprint arXiv:2009.12721, 2020.
Desoyer A., Landragin F., Tellier I., Lefeuvre A., Antoine J.-Y. Les coréférences à l’oral : une expérience d’apprentissage automatique sur le corpus ANCOR, Traitement Automatique des Langues, TAL, vol. 55 (2), 2014.
Profil du candidat :
Le candidat doit :
– posséder un doctorat en informatique ou en linguistique avec une spécialisation en TAL
– avoir des connaissances préalables en apprentissage automatique
– une expérience passée sur les thématiques suivantes sera appréciée : résolution de coréférences, extraction de relations temporelles, extraction d’information en domaine de spécialité
Le travail de recherche est mené au Laboratoire Ligérien de Linguistique (LLL) à Orléans. La personne recrutée devra être présente physiquement (il n’est pas possible de travailler à distance).
Formation et compétences requises :
Doctorat en informatique ou en linguistique avec une spécialisation en TAL.
Adresse d’emploi :
LLL, Université d’Orléans, Orléans
Document attaché : 202303021429_post-doc_tache1_DOING.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Sesstim, Aix Marseille University
Durée : 24 Mois
Contact : raquel.urena@univ-amu.fr
Date limite de publication : 2023-03-31
Contexte :
The Sesstim is a multidisciplinary group with research interest in Artificial intelligence applied to health.
This post doc would be carried out in collaboration with data scientist, oncologist and bio statisticiens.
Sujet :
Applying deep learning and machine learning techniques to model the medical pathway of elderly patients recovering from cancer and predicting fatal events. The data used for the analysis will be electronic health records and medical reimbursement data.
Profil du candidat :
Good knowledge of Machine Learning and Deep Learning approaches.
Python programming, ( Keras, tensorflow, scikit learn)
Data cleaning and preparation skills.
Capacity of dealing with large scale datasets
Good publication records in the field of computer science and artificial intelligence.
Formation et compétences requises :
PhD in computer science or artificial intelligence.
Master in Computer Science or related field.
Solid programming knowledge
Adresse d’emploi :
Sciences Economiques et Sociales de la Santé et Traitement de l’Information Médicale
Faculté des sciences médicales et paramédicales – 27 Bd Jean Moulin 13385 Marseille Cedex 5 FRANCE
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : IMT Atlantique
Durée : 24 months
Contact : carlos.granero-belinchon@imt-atlantique.fr
Date limite de publication : 2023-04-01
Contexte :
This project is multidisciplinary and focuses on the development of new Deep Learning models for non-linear multiscale description of complex systems. Applications in different topics such as fluid turbulence, remote sensing and ocean dynamics can be considered.
Sujet :
The main objective of this postdoc position is the formulation of multiscale DL models able to extract non-linear couplings. Moreover, we want this models to 1) be based on the physics of the studied system, and so to have a physics guided learning, and 2) to be interpretable from a physics point of view. With this purpose both the loss function and the model architectures will be adapted. Moreover, in order to emulate chaotic and complex systems a stochastic component will be included and the incertitudes of the reconstructed states quantified.
Thus, this project aims to reconstruct the unknown states of the studied complex system from physical knowledge of the system and available data that can be spatially distant, prior in time, at coarser resolution etc. We can then envisage physics-informed super-resolution, data generation and forecasting (Fablet et al. 2021) among other applications.
For example in the case of ocean modelling, the multiscale and non-linear nature of ocean surface dynamics plays a fundamental role in biogeochemical, ecological and climatic processes and consequently its characterization is a main topic in the current oceanographic research. Today the ocean dynamics can be studied through a large variety of remote sensing images of the ocean surface (Yahia et al. 2010, Renosh et al. 2015, Qiu et al. 2020) as well as from numerical simulations (Lellouche et al. 2021).
Profil du candidat :
Candidates are required to have a PhD in Deep Learning/Machine learning with strong experience in Neural Networks. The candidate must have passed at least 18 months in a non-French laboratory between May 1, 2019 and the start of the project.
Formation et compétences requises :
Good skills in python, pytorch, pytorch lightning are also required, as well as a background in teamwork. Previous experience in a multidisciplinary research team will also be considered as positive. Ideally (but not necessarily), the candidate will have previous experience in fluid physics and/or oceanography.
Adresse d’emploi :
The Postdoc will work in collaboration with Carlos Granero-Belinchon and Ronan Fablet from IMT Atlantique, Simon van Gennip from Mercator Ocean International, and Bertrand Chapron from Ifremer. Thus, the research team is composed by physicist, oceanographers and artificial intelligence researchers from different laboratories, leading to a multidisciplinary project. Moreover, the postdoc will develop within the OSE research team at IMT (https://cia-oceanix.github.io/) which is a dynamic research group on image processing and artificial intelligence for Oceanography and Climate. The postdoc will also be part of the new Inria team Odissey (https://team.inria.fr/odyssey/).
The post-doctoral position is a two-year full-time appointment starting during 2023. Gross salary will depend on the experience of the candidate, up to approx. 55,000 €/year (net salary: up to approx. 30,000 €/year). The candidate will also benefit from French social insurance, and will have up to 45 days of annual leave. The candidate will be able to benefit up to 90 days of remote working per year.
The candidate will be based at the IMT Atlantique Campus (Brest) in a dynamic and stimulating working environment at five minutes walking from the beach.
Within the framework of the ANR JCJC project SCALES the postdoc will have funding for participation in conferences, publication fees and visits to external laboratories. Moreover, within the framework of the ANR Chair OCEANIX the postdoc will have access to compute servers : Datarmor and servers from OSE at IMT Atlantique.
Teaching activities at IMT Atlantique will also be proposed to the postdoc, mainly in signal processing, computer vision and artificial intelligence. These actvities, which imply an additional salary, will not be mandatory.
Motivated candidates should send a CV and a motivation letter to: carlos.granero-belinchon@imt-atlantique.fr.
The Postdoc is expected to start during 2023.
Document attaché : 202212021346_Postdoc_ANR-SAD_v2.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LICIIS / Université de Reims Champagne-Ardenne
Durée : 4 ans
Contact : Luiz-Angelo.Steffenel@univ-reims.fr
Date limite de publication : 2023-04-01
Contexte :
Poste PR en section 27 – calcul HPC, IA et visualisation scientifique
Sujet :
Bonjour, un poste PR 27 (Chaire Professeur Junior) est ouvert à l’Université de Reims Champagne-Ardenne.
Profil du candidat :
Le profil du candidat sera à la frontière des domaines du calcul HPC, de l’IA et de la visualisation scientifique (modélisation de synthèse, analyse immersive). La description détaillée du poste se trouve à
https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/FIDIS/0511296G/FOPC_0511296G_4550.pdf
Le candidat recruté intégrera le Le Laboratoire d’Informatique en Calcul Intensif et Image pour la Simulation (LICIIS). Le LICIIS est également une unité sous contrat (LRC DIGIT) avec le Commissariat à l’Energie Atomique et aux Énergies Alternatives (CEA), et il est le principal opérateur de deux des plus importantes infrastructures de l’URCA : le Centre de Calcul régional ROMEO (supercalculateur classé au 249ème rang mondial du TOP500 et au 20ème rang du GREEN500 au moment de sa mise en service en 2018) et le Centre Image.
Formation et compétences requises :
L’emploi se fait sur un support CPJ (Chaire Professeur Junior) de 4 ans, avec titularisation dans un poste permanent (à temps plein) à la fin du mandat. Un doctorat en HPC, en visualisation scientifique ou l’équivalent dans un domaine connexe est requis.
Adresse d’emploi :
Les candidatures se font via le site Galaxie. La date limite de dépôt des candidatures est le 30 mars 2023.
Merci de transmettre cette offre aux personnes qui pourraient être intéressées.
contact : luiz-angelo.steffenel@univ-reims.fr / laurent.lucas@univ-reims.fr
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LIFAT Tours France
Durée : 12 mois
Contact : jyramel@univ-tours.fr
Date limite de publication : 2023-04-05
Contexte :
Le laboratoire LIFAT et le CESR de Tours recherchent un ingénieur R&D ou Postdoc pour enrichir leurs travaux de recherche déjà engagés dans le cadre du projet ANR “Typoref” traitant de l’analyse d’images de documents anciens numérisés.
Sujet :
Plus de détails sur le poste :
https://lifat.univ-tours.fr/medias/fichier/fiche-de-poste_1678280458291-pdf
Profil du candidat :
– Poste à pourvoir à partir de septembre 2023
– Durée : CDD de 12 mois (durée et salaire négociable selon compétences)
Formation et compétences requises :
Compétences
Développement logiciel et ingénierie, Python, HTML, CSS, JS
Apprentissage automatique, vision par ordinateur
Capacité à travailler en équipe, esprit curieux et rigoureux
Adresse d’emploi :
LIFAT – Université de Tours
Tours – France
Document attaché : 202303151852_Fiche de poste (2).pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : INSA Toulouse & LAAS-CNRS
Durée : infty
Contact : Helene.Waeselynck@laas.fr
Date limite de publication : 2023-04-05
Contexte :
Bonjour a tous
Un poste MCF 27 est ouvert à l’INSA de Toulouse.
Sujet :
Les recherches s’effectueront au sein de l’équipe TSF du LAAS-CNRS, sur un profil machine learning pour les systèmes de confiance (sûreté, résilience, sécurité & vie privée, explicabilité, transparence).
Profil du candidat :
Liens:
https://www.laas.fr/public/fr/postes-denseignants-chercheurs-a-pourvoir
https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/ANTEE/2023_1/0310152X/FOPC_0310152X_4118.pdf
Formation et compétences requises :
Attention, date limite de dépôt des dossiers : Jeudi 30 mars 2023 à 16 h
Des profils combinant machine learning & fouille de données seraient bien sur tout à fait bienvenus !
Adresse d’emploi :
Toulouse
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Laboratoire d’Informatique, de Modélisation et d
Durée : CDI
Contact : batton@emse.fr
Date limite de publication : 2023-04-14
Contexte :
Mines Saint-Etienne est une Ecole de l’Institut Mines-Télécom (IMT), 1er groupe public d’écoles d’ingénieurs et de management de France. L’IMT est un EPSCP (grand établissement) sous la tutelle du Ministère de l’Économie, des Finances et de la Souveraineté Industrielle et Numérique.
L’École Nationale Supérieure des Mines de Saint-Étienne (Mines Saint-Etienne) est chargée de missions de formation, de recherche et d’innovation, de transfert vers l’industrie et de culture scientifique, technique et industrielle.
Le Laboratoire d’Informatique, de Modélisation et d’Optimisation des Systèmes (LIMOS ), Unité Mixte de Recherche (UMR 6158) en informatique, et plus généralement en Sciences et Technologies de l’Information et de la Communication (STIC), est le laboratoire d’accueil. Le LIMOS est principalement rattaché à l’Institut des Sciences de l’Information et de leurs Interactions (INS2I) du CNRS et de façon secondaire à l’Institut des Sciences de l’Ingénierie et des Systèmes (INSIS). Il a pour tutelles académiques l’Université Clermont Auvergne (UCA) et Mines Saint-Etienne (MSE). Il est également membre de Clermont Auvergne INP. Le positionnement scientifique du LIMOS est centré autour de l’Informatique, la Modélisation et l’Optimisation des Systèmes Organisationnels et Vivants.
Sujet :
Mines Saint-Etienne recrute un Maître de conférence: Science des données et Apprentissage statistique, Intelligence Artificielle pour l’industrie et les territoires du futur ( profil mathématiques appliquées – et informatique)
Le poste proposé est ouvert au sein du département GMI (Génie Mathématique et Industriel) de l’institut Henri Fayol avec des activités de recherche développées dans l’axe SIC de l’UMR CNRS 6158 LIMOS.
Il s’agit de renforcer les compétences de Mines Saint-Etienne en mathématiques appliquées particulièrement en science des données et apprentissage statistique, Intelligence Artificielle, en lien avec l’industrie et les territoires du futur, par l’identification et la conception optimale de systèmes industriels tant d’un point de vue recherche qu’en enseignement.
Profil du candidat :
Le candidat ou la candidate, devra être titulaire d’un doctorat en mathématiques appliquées ou en science des données (sections CNU n°26, n°27, n°61) ou équivalent. La qualification aux fonctions de maître de conférences par le CNU n’est pas exigée mais sera favorablement appréciée. Une expérience significative en enseignement dans les domaines listés ci-dessous (moniteur, vacataire et/ou ATER) à un niveau de second ou troisième cycle sera appréciée.
https://institutminestelecom.recruitee.com/o/maitre-de-conferences-en-sciences-des-donnees-et-apprentissage-statistique-fh
Formation et compétences requises :
Le candidat devra disposer des compétences fortes dans le domaine: des Sciences des données et/ou de l’Apprentissage Statistique à partir de données complexes (données massives, données hétérogènes, séries temporelles, graphes, flux de données, données imprécises ou incertaines, données fonctionnelles), Intelligence Artificielle. Une expérience postdoctorale sera fortement appréciée.
Adresse d’emploi :
Mines Saint-Etienne , 158 cours Fauriel, 42023 Saint-Etienne cedex 2
Document attaché : 202302201051_MSE_LIMOS_FAYOL_maitre_conférences_CDGIMT_FR_Science des données -Apprentissage statistique_2023.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 3 ans
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2023-04-17
Contexte :
L’objectif global de cette thèse est le développement de méthodologies innovantes, basées sur les techniques d’analyse de réseaux complexes, pour l’analyse des graphes d’interaction issus de la modélisation des dynamiques paysagères.
La modélisation des dynamiques spatiales est une approche privilégiée pour étudier les processus complexes d’interaction homme-environnement qui sont au centre des systèmes d’utilisation des terres (land use system). Dans ce contexte, une nouvelle approche fondée sur le concept de graphe d’interaction a été développée au CIRAD/UMR TETIS, avec l’objectif de permettre un meilleur couplage des systèmes de modélisation avec des SIG (Système d’Information Géographique) et améliorer la modélisation des mécanismes qui sont influencés par des structures spatiales dynamiques. Le graphe d’interaction est un graphe (un ensemble de nœuds connectés par des arcs) dont les arcs peuvent porter des fonctions d’interaction. Un système représenté par des graphes d’interaction peut ainsi évoluer lorsque les fonctions d’interactions sont activées et que celles-ci modifient les entités connectées. Les éléments présents dans un espace géographique peuvent ensuite définir des relations spatiales, fonctionnelles, hiérarchiques et même sociales. La mise en œuvre de cette approche s’appuie sur le langage de modélisation Ocelet, et son environnement logiciel de développement (http://www.ocelet.org).
Sujet :
Les modèles développés avec Ocelet sont employés principalement pour simuler des dynamiques spatiales dans différents systèmes territoriaux complexes, comme par exemple, pour comparer plusieurs scénarios d’utilisation des terres. Ces modèles font généralement intervenir plusieurs graphes d’interaction dans des structures porteuses de connaissances du fonctionnement et de l’organisation du territoire. Jusqu’à présent, lors de déploiement de ces modèles, seuls les résultats de simulation sont analysés ; les graphes ne le sont pas, alors qu’ils sont une expression formelle de processus très divers qui interagissent dans le territoire. Ces analyses permettraient notamment d’expliciter les liens entre structure et fonctionnement du territoire, pour viser, à terme, la possibilité d’inférer des connaissances des processus à partir de l’exploration de données spatiales, comme celles issues d’images satellite.
Ce travail permettra d’exploiter de manière originale les modèles de simulation spatiale développés avec l’approche Ocelet, en permettant de créer de nouvelles connaissances à partir des graphes d’interaction modélisés et de ses dynamiques. Des algorithmes de classement, clustering, diffusion de l’information et prédiction des liens spécifiquement adaptés au contexte des relations caractéristiques (e.g., spatiales, fonctionnelles, hiérarchiques et sociales) entre les entités d’un système paysager pourront être développés. Ceci représentera une contribution significative aussi bien dans le domaine de l’analyse de réseaux et science des données, que dans celui de la modélisation et de l’analyse des dynamiques paysagères.
La première étape du travail de recherche est liée à la nécessité de comprendre comment les graphes d’interaction entre les éléments d’un paysage visible sur les images satellite, et qui expriment le fonctionnement du socio-écosystème présent dans le paysage, se traduisent dans la structure en réseau de ces graphes. La seconde étape consistera à développer et implémenter des méthodes d’analyse de réseaux complexes spécifiquement adaptés aux modèles pris en comptes en réponse à la question de recherche précédente. L’idée est d’obtenir une suite de méthodes d’analyse généralisables à différents contextes, qui pourront être ensuite intégrés dans la plateforme Ocelet. Pour mener ce travail, nous adopterons une démarche pluridisciplinaire, où les contributions méthodologiques proposées seront toujours soumises aux avis d’experts en modélisation spatiale des dynamiques paysagères.
Ces deux étapes seront menées d’abord sur une diversité de sites d’études pour lesquels des modèles ont déjà été développés, ou sont en cours de développement (e.g. au Burkina Faso, Sénégal, Mozambique, La Réunion, République du Congo). En particulier, cette thèse sera adossée à deux projets où TETIS est fortement impliquée, et qui mettra en œuvre des modèles spatiaux ambitieux (projet AFD/LUCCIA au Mozambique, pour aider à évaluer la stratégie nationale REDD+, et le projet PUDT Congo, pour aider à optimiser le réseau d’approvisionnement en bois-énergie d’une grande ville). Ensuite, un terrain en Afrique de l’Ouest, en lien avec la question de la sécurité alimentaire, sera privilégié. Des analyses plus contextualisées, plus en lien avec le terrain, seront menées avec une visée explicative des caractéristiques observées dans les réseaux.
Profil du candidat :
Caractéristiques attendues du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.
Formation et compétences requises :
Caractéristiques attendues du candidat :
– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.
Adresse d’emploi :
500 rue Jean François Breton, Montpellier
Document attaché : 202303300902_Analyse de réseaux complexes pour l’analyse de dynamique paysagère.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : IRIT
Durée : 9 mois
Contact : pascal.dayre@irit.fr
Date limite de publication : 2023-04-23
Contexte :
Faisant suite à l’open data, le mouvement de la science ouverte prône les principes FAIR pour développer une culture de la gestion et du partage des données chez tous les acteurs de la recherche. Les principes FAIR formalisent des lignes directrices pour améliorer le repérage [F], l’accessibilité [A], l’interopérabilité [I] et la réutilisation [R] des ressources numériques scientifiques.
Le contexte métier est celui du dispositif de recherche (LabEx DRIIHM)
rassemblant 13 observatoires scientifiques, les observatoires « hommes-milieux » (OHM) qui étudient les dynamiques environnementales, culturelles et sociétales sur ces territoires, à différentes échelles spatiales et temporelles.
Des données hétérogènes et multidisciplinaires sont produites chaque année. Au-delà de leurs incontournables stockage et catalogage, il est crucial d’améliorer le partage et l’ouverture de ces données pour favoriser les analyses croisées interdisciplinaires et communiquer les résultats scientifiques auprès de la société.
Sujet :
Dans le cadre du projet ANR SO-DRIIHM, il/elle effectuera une mission d’administration et de gestion d’une base de données graphe d’une plateforme pour la science ouverte.
La plateforme internet est composée d’un backend (les services du serveur) et d’un frontend (IHM web). Le backend persiste ses métadonnées avec un serveur sparQL.
La base de données graphe est utilisée pour la gestion des métadonnées descriptives des données et aussi de la plateforme.
La mission consiste dans un premier temps à une prise en main des ontologies et vocabulaires de référence pour les données ouvertes sur le web des données, puis à faire un travail d’administration de la base de données (sauvegardes, restaurations, importations, exploitation des logs, métrologie et optimisation des requêtes, …) et aussi à écrire les requêtes selon les besoins des développements du frontend et du backend. Travail pour l’intégration de données sur des ETL et/ou ELT pour moissonner ou publier vers des services tiers.
Dans un deuxième temps, il/elle collaborera avec l’équipe à la modélisation des méta-données utilisées pour étendre les ontologies de référence et enrichir les services, les fonctionnalités et l’ergonomie de la plateforme et aussi à la mise en place du cycle de vie des métadonnées selon des règles de gestion.
SHACL sera étudié pour le contrôle de la qualité et des insertions des métadonnées.
Une participation aux développement peut être envisagée.
Profil du candidat :
Bac + 5 en informatique, en base de données graphes, en web des données, en développement web.
Formation et compétences requises :
Bac + 5 en informatique
– Construire et administrer un système de base de données (expertise).
– Connaître les bases de données graphe (sparQL endpoint, triple store). Avoir un usage avéré d’une moteur de base sparQL (graphDB, virtuoso, …).
– Maîtriser le langage de requête et du protocole sparQL.
– Connaître les outils et les standards du web des données: RDF/RDFS, OWL, les vocabulaires et ontologies.
– Savoir modéliser une base de données graphe.
– Connaître les standards du web des données comme DCAT est un plus.
– Connaître les technologies du web (http, JSON, XML, …).
– Connaître les langages python et javascript est un plus.
– Connaître SHACL et la qualité des données est un plus.
– Être curieux et souhaiter apprendre.
– Connaître Github ou gitlab et Docker (apprécié).
– Rédiger et mettre à jour la documentation fonctionnelle et technique.
– Travailler en équipe.
Adresse d’emploi :
https://emploi.cnrs.fr/Offres/CDD/UMR5602-EMILER-005/Default.aspx
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LTCI, Telecom Paris, Institut Polytechnique de Par
Durée : 2 years
Contact : pavlo.mozharovskyi@telecom-paris.fr
Date limite de publication : 2023-04-25
Contexte :
2-year postdoc position is available at the Image, Data and Signal department of Telecom Paris (https://www.telecom-paris.fr/) – one of the leading French engineering schools, a member of Institut Polytechnic de Paris (https://www.ip-paris.fr/).
Sujet :
The position is within the project LS-Depth-CaP funded by the Starting Grant of the French National Agency for Research in category Artificial Intelligence (ANR JCJC, CE23). The successful candidate is expected to conduct research on the topics including either or both theoretical and computational constituents focused on development of large-scale and robust statistical and machine learning methodology.
Profil du candidat :
Expected qualifications of the successful candidate:
– PhD (or equivalent) degree in statistics / data science / machine learning / artificial intelligence.
– Knowledge of programming in languages of machine learning: R / Python, C / C++, or similar.
– A good command of English.
Formation et compétences requises :
To candidate, following documents:
– Motivation letter.
– Curriculum vitae.
– Name(s) / email(s) of at least two references.
– Any other element(s) considered by the candidate useful for the application.
are to be uploaded at:
https://institutminestelecom.recruitee.com/o/postdoctorante-ou-postdoctorant-en-statistique-computationnelle-et-machine-learning-a-telecom-paris-cdd-de-24-mois
Adresse d’emploi :
Telecom Paris
19 place Marguerite Perey, F-91120, Palaiseau, France
https://institutminestelecom.recruitee.com/o/postdoctorante-ou-postdoctorant-en-statistique-computationnelle-et-machine-learning-a-telecom-paris-cdd-de-24-mois
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Institut des Geosciences de l’Environnement, Gren
Durée : 12 months (renewable
Contact : Julien.Lesommer@univ-grenoble-alpes.fr
Date limite de publication : 2023-04-25
Contexte :
Mesoscale eddies are essential oceanic processes and their effect needs to be accurately represented in ocean components of climate models. In these models, the representation of mesoscale eddy processes affects the simulated means states, but also the overall variability and the response to changing conditions. Yet, because the spatial scales of mesoscale eddies are not explicitly represented in most ocean components of climate models, their effect is accounted for by subgrid closures.
The design of eddy closures for ocean models is an active field of research. With the development of scientific machine learning and its applications to fluid simulations, several eddy closures based on deep learning have been proposed (see Zanna and Bolton 2021). However, to date there has been no systematic evaluation of the impact of these new closures in full-scale realistic simulations. An important question is in particular whether their performance can be easily transferred from one ocean model to another.
Sujet :
The general mission is to conduct research work investigating the impact of machine learning based mesoscale eddy closures in ocean circulation models. The selected candidate will contribute to the M2LINES international project.
The selected candidate will contribute to a joint study aiming at analyzing the impact of several machine learning based eddy closures across different ocean models as part of the M2LINES international project. The work will specifically focus on the scheme proposed by Guillaumin and Zanna (2021) and its impact in the NEMO and MOM6 ocean circulation models. The selected candidate will be in charge of defining a test bed (simulation protocols, evaluation metrics) for assessing the impact of eddy closures in the NEMO 1/4° global ocean model (eORCA025). The work will then focus on refining the implementation of the Guillaumin and Zanna (2021) scheme in the NEMO ocean model and on performing a series of (ocean-only) model experiments. He/she will then analyze the results and contribute to the comparison with a companion effort with the MOM6 ocean model.
The work will be developed and implemented in close coordination with the MOM6 team, as part of the M2LINES collaboration. An important part of the work is therefore the participation in the M2LINES project activities (group meetings, seminars, etc). Regular visits to LOCEAN in Paris will also be required. The selected candidate will be expected to monitor upcoming publications, to write scientific articles, to present results in international conferences and to the relevant NEMO working groups (https://forge.nemo-ocean.eu/wgs).
Profil du candidat :
The selected candidate will hold a PhD in physical oceanography or in computational fluid dynamics, or computer science.
Formation et compétences requises :
The selection will be based on the following scientific and technical criteria: experience in geoscientific modeling, understanding of oceanic processes, experience Fortran and Python coding, experience in scientific writing, experience with one the prominent machine learning libraries (PyTorch, TensorFlow) (not compulsory); motivation to disseminate scientific results; ability to work within a team and in an international context.
The selection panel will also consider the gender balance of the entire research team.
Adresse d’emploi :
Institut des Géosciences de l’Environnement, Maison Climat Planète, 70 rue de la Physique, Domaine Universitaire, 38400 St Martin d’Hères
More information : https://lesommer.github.io/2023/02/15/postdoc-eddy-params-ml/
Please contact : julien.lesommer@univ-grenoble-alpes.fr and julie.deshayes@locean.ipsl.fr
Review of applications will begin immediately and continue until the position is filled.
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Institut des Geosciences de l’Environnement, Gren
Durée : 18 months (renewable
Contact : Julien.Lesommer@univ-grenoble-alpes.fr
Date limite de publication : 2023-04-25
Contexte :
The combination of machine learning with scientific computing is an active area of research which is expected to improve geoscientific models and their integration into broader numerical systems, such as climate models and operational forecasting systems. A key practical question for these models is to define how machine learning components can be encoded and maintained into pre-existing legacy codes, written in low level abstraction languages (as FORTRAN). Several practical options exist, each coming with pros and cons. Neural networks may for instance directly be implemented in FORTRAN, one could alternatively use the C/C++-bindings of specific machine learning libraries or more generic high level coupling interfaces. But the trade-offs between these different strategies are usually model and use-case specific.
The NEMO ocean / sea-ice model (https://www.nemo-ocean.eu) and the CROCO ocean model (https://www.croco-ocean.org) are two important tools for the oceanographic community, in particular in the context of operational forecasting systems and european Earth System Models. Their development roadmaps involve the definition of sustainable interfaces for trainable components to be leveraged on-line during model simulations. A working group dedicated to machine learning related developments has been set-up as part of the NEMO development team.
Sujet :
The selected candidate will be in charge of providing quantitative information and developing practical solutions for a sustainable implementation of trainable components into the NEMO and the CROCO ocean models. This will involve defining benchmark use-cases of machine learning based components in ocean models. These will be based for instance on subgrid parameterizations already developed as part of the M2LINES project. The selected candidate will define quantitative metrics for intercomparing the different available options for coupling AI-based trainable components and legacy ocean models, and implement several options into the NEMO and CROCO ocean models. Possible options may include Infero (https://github.com/ecmwf-projects/infero), ICCS Fortran ML Bridge (https://github.com/Cambridge-ICCS/fortran-ml-bridge), HPE SmartSim (https://github.com/CrayLabs/SmartSim), Melissa (https://gitlab.inria.fr/melissa) or OASIS (https://oasis.cerfacs.fr/en/). The work will then involve performing systematic intercomparison based on realistic model simulations to be performed on HPC resources. The selected candidate will then write reports on the results and present the outcome of the work to relevant working group and project meetings. He/She will participate also in the discussions and meetings of the M2LINES and MEDIATION projects.
Profil du candidat :
The selected candidate will hold a MSc in computer science, engineer or PhD.
Formation et compétences requises :
The selection will be based on the following scientific and technical criteria: demonstrated experience in High Performance Computing; demonstrated experience in Fortran/C/C++ and Python coding; demonstrated experience in (at least) one of the prominent machine learning frameworks (PyTorch, TensorFlow,… ); basic understanding of Computational Fluid Dynamics and subgrid closures for fluid flows;
experience in running atmospheric, ocean circulation or climate models (not compulsory); demonstrated ability to work within a team.
The selection panel will also consider the gender balance of the entire research team. Junior candidates with a fresh title are also welcome.
This position may help you build a curriculum in the very active domain of hybridization between Numerical Simulation and Deep Learning (ML4Sci)
Adresse d’emploi :
Institut des Géosciences de l’Environnement, Maison Climat Planète, 70 rue de la Physique, Domaine Universitaire, 38400 St Martin d’Hères
More information : https://lesommer.github.io/2023/02/15/research-engineer-ml/
Please contact : julien.lesommer@univ-grenoble-alpes.fr and jurelie.albert@univ-grenoble-alpes.fr
Review of applications will begin immediately and continue until the position is filled.
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : LITIS, INSA Rouen
Durée : Chaire de Professeur
Contact : laurent.vercouter@insa-rouen.fr
Date limite de publication : 2023-04-28
Contexte :
Un poste de Chaire de Professeur Junior (CPJ) est à pourvoir pour la rentrée 2023 à l’INSA Rouen Normandie, laboratoire LITIS, sur la thématique « Intelligence Artificielle pour une Mobilité Intelligente Sûre ». Des imageries conventionnelles et non-conventionnelles aux algorithmes d’apprentissage statistique robustes, adaptables et aux approches sémantiques pour des décisions explicables.
Sujet :
Le/la candidat.e intègrera le département Informatique, Traitement de l’Information (http://iti.insa-rouen.fr) pour ses enseignements et au sein du LITIS l’équipe App (https://www.litislab.fr/equipe/app), MIND (https://www.litislab.fr/equipe/mind) ou STI (https://www.litislab.fr/equipe/sti) selon l’adéquation de son profil aux thèmes de recherche de ces équipes.
Date limite de candidature sur Galaxie : 27 avril 2023
Contact recherche : laurent.vercouter@insa-rouen.fr
Contact enseignement : geraldine.del_mondo@insa-rouen.fr
Profil du candidat :
Le profil complet est disponible sur Galaxie: https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/FIDIS/0760165S/FOPC_0760165S_4108.pdf
Formation et compétences requises :
–
Adresse d’emploi :
INSA Rouen Normandie
Document attaché : 202304011226_FOPC_0760165S_4108.pdf
