3-years fully-funded PhD position available on Analyzing Semantic Indoor Trajectories for understanding Museum visitors’ movement at LS2N/Nantes University, France and Museology Research Laboratory, Ionian University, Corfu, Greece

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LS2N
Durée : 36 mois
Contact : claudia.marinica@univ-nantes.fr
Date limite de publication : 2024-03-31

Contexte :
One fully funded PhD position (3 years) is available on the topic of Analyzing Semantic Indoor Trajectories for understanding Museum visitors’ movement at the Laboratory of Digital Sciences of Nantes (LS2N) in Nantes University, France.
This PhD subject is built on an international collaboration between DUKe research team of LS2N lab, Nantes, France, and the Museology Research Laboratory of the Department of Archives, Library Science and Museology at the Ionian University in Corfu, Greece, together with museums in Corfu, Greece, including the Corfu Museum of Asian Art, the Mon Repos Museum in Corfu, and the Corfu art Gallery.

Sujet :
Co-supervisors:
Assistant Professor Claudia Marinica, Assistant Professor Fabien Picarougne, Full Professor Fabrice Guillet from LS2N/Nantes University, France
Context and scope:
Museums have been studying their visitors for decades to understand why visitors go to museums, what they do there, how they learn, and what their engagement and satisfaction may be. The main objective of this PhD subject is to develop new techniques for visitors’ movement analysis, by building for each visitor its trajectory inside the museum. The originality of this work comes from enhancing visitors’ trajectories with (1) indoor space constraints restraining the visitor’s movement (e.g. position of doors, corridors, etc.), and (2) contextual and/or semantic information related to the museum or the visitor. Thus, in this PhD, we propose to work towards 3 challenges: (1) express new movement collected data under an existing formalism, called SITM (Semantic Indoor Trajectory Model), (2) develop trajectory data mining techniques applied over SITM trajectory data to extract trajectory patterns describing the visitors’ movement, (3) while the previous challenge aims to help museums to enhance visitors’ experience, this third challenge aims to encourage the museums to take managerial decisions (such as deriving improved evacuation routes) by providing movement predictions. To this end, we propose to formalize SITM trajectories as trajectory time series and to work towards developing trajectory time series classification algorithms. Visitors’ data already collected from partner Museums and to be collected through LBS or systems comprise datasets to be analyzed.

Detailed description of the subject is available here:
https://uncloud.univ-nantes.fr/index.php/s/SZcteLRe7TDZY4N

*****
Expected start: September/October, 2024
Application deadline: April 1st, 2024

We offer. The PhD will take place in the DUKe research team of LS2N lab, Nantes, France. The most of the DUKe team members work in the Polytech Nantes Engineering School of the Nantes University, thus the PhD Student will have an office there. We are a dynamic research team composed of 20 permanent researchers and around 10 PhD students and postdocs.
Given the context of the international collaboration of the PhD subject, the PhD student will maybe have to make some research stays in the Museology Research Laboratory at the Ionian University in Corfu, Greece and also visit some of the Museums providing the data.

How to apply. Interested candidates can submit their applications by sending:
– Curriculum vitae
– Letter of Motivation specific to this PhD position
– Abstract of master thesis
– At least two recommendation letters
– Degree certificates for the recent years
– List of publications (if any)
Contact: Assistant Professor Claudia Marinica (Claudia.Marinica@univ-nantes.fr)

Profil du candidat :
Your profile. We expect to welcome a candidate fulfilling the following requirements:
– Completion of an excellent master or diploma in Computer Science
– Strong programming skills and experience
– Background knowledge in the following areas are highly appreciated: data mining, deep learning, time series classification
– Ability to develop methods and concept
– Willingness to contribute in interdisciplinary projects
– Organizational and analytical skills
– Ability to work in a team, problem-solving skills, and creative thinking
– Excellent spoken and written communication skills in English

Formation et compétences requises :
Your profile. We expect to welcome a candidate fulfilling the following requirements:
– Completion of an excellent master or diploma in Computer Science
– Strong programming skills and experience
– Background knowledge in the following areas are highly appreciated: data mining, deep learning, time series classification
– Ability to develop methods and concept
– Willingness to contribute in interdisciplinary projects
– Organizational and analytical skills
– Ability to work in a team, problem-solving skills, and creative thinking
– Excellent spoken and written communication skills in English

Adresse d’emploi :
Polytech Nantes, Rue Christian Pauc, 44300 Nantes

Document attaché : 202403010840_A-SITM PhD subject.pdf

MCF en IA -Economics and Computation-

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT : Institut de Recherche en Informatique de To
Durée : Permanent
Contact : ravat@irit.fr
Date limite de publication : 2024-03-01

Contexte :
Un poste de MCF est ouvert au concours en 2024 à l’Université Toulouse Capitole pour intégrer le Département Intelligence Artificielle de l’IRIT (https://www.irit.fr/departement/intelligence-artificielle/), avec un profil recherche en “Economics and Computation”

Sujet :
Le profil détaillé du poste est accessible au lien suivant:

https://www.irit.fr/~Umberto.Grandi/wp-content/uploads/sites/128/2024/02/Profil-MCF-2024-IA-FR-EN_v6.pdf

Profil du candidat :

Formation et compétences requises :

Adresse d’emploi :

Document attaché : 202402281542_Profil-MCF-2024-IA-FR-EN_v6.pdf

Généricité, contexte et explicabilité dans les systèmes de recommandation

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LAMSADE – Université Paris-Dauphine
Durée : 3 ans
Contact : elsa.negre@dauphine.fr
Date limite de publication : 2024-03-01

Contexte :
Financement : Ce sujet est prioritaire pour une demande de bourse de thèse du ministère.

Sujet :
Sujet : L’objectif principal de cette thèse est d’étudier la diversité des systèmes de recommandation, leurs points communs et différences (d’un point de vue algorithmique mais aussi applicatif) dans un contexte de grande masse de données en constante évolution, ainsi que de comprendre de tels systèmes dans leur contexte. Il s’agira ensuite de tendre vers un modèle de système générique de recommandation capable d’expliquer à l’utilisateur les recommandations retournées.

Profil du candidat :
Candidatures : Les candidats intéressés sont invités à envoyer une lettre de motivation, un CV, leurs relevés de notes (Licence + Master) avec classements (Master 2 également, éventuellement partiel), et une ou plusieurs lettres de recommandation, le plus tôt possible, avant le 27 mars 2024. Une seconde sélection sera ensuite faite par l’école doctorale et le laboratoire sur la base d’une audition en mai 2024.

Formation et compétences requises :
M2/Ingénieur informatique/Mathématiques

Adresse d’emploi :
Université Paris-Dauphine,
place du Maréchal de Lattre de Tassigny,
75016 Paris

Document attaché : 202402280948_PhD-Dauphine-Reco.pdf

Poste MCF 27 – Gestion de données massives, Intelligence artificielle appliquée à la santé – ISIS Castres / INUC / Laboratoire recherche IRIT

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT
Durée : CDI
Contact : imen.megdiche@irit.fr
Date limite de publication : 2024-03-01

Contexte :
Un poste de MCF 27 est ouvert au concours.
Profil : Gestion de données massives, Intelligence artificielle appliquée à la santé

https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/ANTEE/2024_1/0811293R/FOPC_0811293R_4182.pdf

Les personnes intéressées sont invitées à prendre contact avant la date de clôture des candidature le 29 mars 2024 :
imen.megdiche@irit.fr ou imen.megdiche@univ-jfc.fr
elyes.lamine@univ-jfc.fr

Sujet :
Profil recherche : laboraoire IRIT , département Gestion des données
Le poste est ouvert à toutes les thématiques connexes à l’ingénierie, au traitement des données massives et de l’intelligence artificielle.
Dans le domaine de la santé, les masses de données hétérogènes et multimodales issues de l’écosystème numérique de gestion de données de santé (données cliniques, données génomiques, imagerie médicale, données de capteurs portables…) remettent en cause les méthodes de gestion et d’analyse de données classiques. La candidate ou le candidat apportera une expertise de recherche sur :
• les verrous d’hétérogénéité et de multimodalité des données de santé avec une attention particulière sur la qualité des données
• la conception de modèles de connaissances pour l’intégration et l’accès aux masses de données médicales et/ou sanitaires hétérogènes
• L’analyse décentralisée (ou fédérée) de données de santé en incluant les problématiques d’équité
• L’application de techniques d’apprentissage automatique pour l’interprétation des données complexes et massives, qu’il s’agisse de données structurées ou non structurées ainsi que des données multimodales (ex : médicales ou biologiques).
Le projet d’intégration du candidat devra s’inscrire dans le développement de la stratégie de recherche locale d’ISIS Castres.

Profil enseignement : école d’ingénieur ISIS Castres , Institut National Universitaire Jean François Champollion

Le/la maître(esse) de conférences recruté(e) viendra renforcer les rangs de l’équipe pédagogique de l’école d’ingénieurs ISIS à Castres. Ses principales missions pédagogiques consisteront à assurer des activités d’enseignement et d’encadrement des apprenants du cycle ingénieur et du cycle préparatoire.
Il(elle) sera investi(e) dans le montage et la coordination des enseignements liés à l’IA et l’ingénierie des données pour le parcours « Données de santé et intelligence artificielle »
Il(elle) développera, assurera et coordonnera un ensemble d’enseignements (cours, TP, TD, projet, etc.). Il(elle) mettra en oeuvre des méthodes pédagogiques (par projet, face à face ou à distance) pour un public varié (élèves ingénieurs, étudiants du cycle préparatoire) dans tout ou partie des domaines suivants : Informatique, gestion de données, intelligence artificielle, sciences des données.
En outre, l’école accorde une grande valeur à l’innovation pédagogique, et Le/la maître(esse) de conférences recruté(e) jouera un rôle essentiel dans les initiatives visant à innover et transformer les méthodes d’enseignement. Par conséquent, il est fortement souhaité qu’il (elle) possède une connaissance des plateformes numériques telles que Moodle, ainsi qu’une expérience pratique des pédagogies actives.

Profil du candidat :
CNU 27

Formation et compétences requises :
Qualification CNU 27

Adresse d’emploi :
ISIS Castres

Document attaché : 202402271423_ProfilPoste_COS27.pdf

1 poste de MCF

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CNAM
Durée : permanent
Contact : cedric.du_mouza@cnam.fr
Date limite de publication : 2024-03-01

Contexte :
Le Centre d’études et de recherche en informatique et communications (Cédric) regroupe les activités de recherche en sciences du numérique menées au Conservatoire national des arts et métiers (Cnam). Les chercheurs permanents du Cédric sont tous aussi des enseignants en informatique, en mathématiques appliquées ou en électronique.

Le laboratoire mène des recherches fondamentales et appliquées. Le Cédric entretient des rapports avec les principaux acteurs industriels et publics des Technologies de l’Information et de la Communication (Tic). Il a des relations privilégiées avec de nombreux laboratoires de la région parisienne, de province ou de l’étranger. Le laboratoire participe à des contrats de recherche fondamentale ou technologique (transfert et mise en œuvre de résultats de recherche, contrats industriels) ainsi qu’à des contrats de réseaux de recherche français et européens (ANR, IST, etc.). Il est également membre du pôle Systém@tic (groupes Sécurité-Défense et Logiciels Libres).

Le laboratoire compte actuellement 176 membres dont 91 permanents et 5 administratifs affectés. Le Cédric est reconnu par le ministère de la Recherche, de la Technologie et de l’Enseignement Supérieur comme Equipe d’Accueil (EA 1395 d’abord, actuellement EA 4629) depuis sa création. Sa taille et sa maturité actuelles en font le laboratoire de recherche le plus important du Cnam et l’un des laboratoires d’informatique reconnus de la région parisienne.

Sujet :
Le.la candidat.e intégrera l’équipe ISID ou l’équipe ROC de l’axe 3 (confiance et
sécurité numériques) du laboratoire CEDRIC (https://cedric.cnam.fr). Son activité de
recherche s’inscrira dans le cadre des travaux de recherche de cybersécurité
menés au sein de ces deux équipes. Le.la candidat.e intégrera les projets de
recherche en cours et à venir, menés également en collaboration avec d’autres
laboratoires ou équipes du Cnam.
Au sein de l’équipe ISID, un projet d’équipe transverse portant sur la cybersécurité
des infrastructures critiques, en particulier les systèmes industriels, offrira des
axes de développement pour la recherche du.de la candidat.e. L’équipe ISID
développe plusieurs travaux de recherche en sécurité informatique qui pourraient
accueillir le.la candidat.e : les thématiques portent sur la génération automatique
de modèles d’explication et de chemins d’attaques, à base d’IA (“knowledge
graph”, “treillis”, “ontologies” ) /ML pour modéliser puis explorer les données
d’incident (logs, OSINT,…), pour l’analyse de vulnérabilités (MITRE TTP), la
détection d’anomalie, l’investigation numérique et l’analyse de risque. Les projets
en cours sont 1 ANR (CoRReAU) obtenu en 2022, et des contrats industriels signés
en 2022/2023. Au sein de ces projets, le.la candidat.e. pourra également
développer des travaux sur l’évaluation de la sécurité : IoC (indicateurs de
compromission), évaluation de graphes d’attaques, de politiques de sécurité, de
codes malveillants dans les binaires. Les cas d’applications cyber sont les véhicules
connectés, la santé, les drones, les réseaux d’eau (CPS/PLC/SCADA), les IIoT, etc.
Au sein de l’équipe ROC, les activités du.de la candidat.e porteront sur la sécurité
des systèmes embarqués, sur la définition et l’évaluation d’algorithmes de
détection d’attaques, sur la fiabilité des réseaux et des systèmes distribués, et sur
la protection des données personnelles (dans un contexte IoT en combinant des
mécanismes de chiffrement et d’anonymisation). De plus, le.la candidate est
susceptible de travailler sur la gestion auto-souveraine des identités numériques
en utilisant la Blockchain, la gestion de pannes d’infrastructure, la détection
d’intrusions et de chemins d’attaques dans les systèmes cyber-physiques en
explorant des méthodes d’IA (comme les GNN). Les derniers projets qui portent
3
sur ces thèmes sont : leprojet H2020 « A Secure and Reusable Artificial Intelligence
Platform for Edge Computing in Beyond 5G Networks (AI@EDGE) », len projet ANR
GNADiS qui a démarré en octobre 2023 et le projet européen GRAPH4SEC sur la
détection d’attaques et de pannes à l’aide des GNN. L’équipe a de plus des contrats
bilatéraux avec Thales sur chiffrement et détection d’attaques, avec Sopra Steria
sur les Blockchains, avec Orange sur les modèles de sécurité pour les systèmes
embarqués, et avec CS Covidy’s sur les GNN. Plusieurs thèses en cours forment un
terrain fertile de départ pour ces travaux : utilisation des modèles d’IA sur des
données chiffrées homomorphiquement, protection des données IoT à l’aide de la
confidentialité différentielle et de l’apprentissage fédéré, gestion souveraine des
identités numériques à l’aide de la technologie Blockchain, sécurité des VANETs,
détection d’anomalies à l’aide de techniques d’IA/ML, etc.
Les activités de recherche de.la candidat.e doivent porter sur les thèmes d’une
des équipes ou sur les deux. Le.la candidat.e pourra ainsi développer l’activité de
recherche autour des plateformes d’entrainement et d’expérimentation
existantes et à venir, et encadrer les travaux scientifiques associés, par exemple
par l’encadrement de doctorants et d’étudiants des masters orientés recherche.
Un bon équilibre entre les différentes activités (enseignement, recherche et
administration) sera particulièrement apprécié.

Profil du candidat :
En plus de correspondre au profil recherche présenté ci-dessus, nous recherchons pour ce poste un candidat qui pourra assurer les missions d’enseignement suivantes au sein de l’EPN 05 (département informatique) :
– dispenser une unité d’enseignement sur la cybersécurité des infrastructures
informatiques (niveau I2 ou I3 du diplôme d’ingénieur en informatique) : le
candidat devra proposer un projet d’intégration dans deux unités
d’enseignements du diplôme, majeure cybersécurité ;
– participer aux enseignements de niveau M1 et M2 dispensés dans le cadre du
Master Sécurité Informatique, Cybersécurité et Cybermenaces : le candidat devra
proposer un projet d’intégration dans deux unités du master ;
– participer ou prendre en charge le pilotage de la future plateforme Cnam cyber
en lien avec ces enseignements,
– participer aux tutorats de mémoire d’ingénieur et de master.

Formation et compétences requises :
Titulaire d’un Doctorat en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
Conservatoire National des Arts et Métiers, 2 rue Conté, 75003 Paris.

Document attaché : 202402270925_5 – EPN 05_Se curite informatique (Galaxie 4310).pdf

Télécom SudParis ouvre un poste de MCF en informatique – Data IntElliGence and knowledge

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : SAMOVAR/Télécom SudParis
Durée : CDI
Contact : julien.romero@telecom-sudparis.eu
Date limite de publication : 2024-03-01

Contexte :
Fr : https://institutminestelecom.recruitee.com/o/mcinformatiqueintelligencedonneesconnaissance
En: https://institutminestelecom.recruitee.com/l/en/o/mcinformatiqueintelligencedonneesconnaissance

TELECOM SudParis is hiring an assistant Professor (Maître de Conférences) in Computer Science for the Computer Science Department (https://www.inf.telecom-sudparis.eu/). We are looking for a high-potential candidate with teaching and research experience in the field of Computer Science carrying a research project related to the activities of the DIEGO research group (Data IntElliGence and knowledge, https://www.inf.telecom-sudparis.eu/diego/). The DIEGO group is part of the ACMES team (https://samovar.telecom-sudparis.eu/index.php/en/accueil-2/) of the SAMOVAR laboratory.

Sujet :
The recruitment aims to strengthen the research field of the DIEGO group. We are seeking candidates whose research aligns with at least one of the following axes: Artificial Intelligence and Cloud Continuum. Candidates whose research projects are in the Artificial Intelligence axis should have strong skills in research topics related to knowledge representation and reasoning (symbolic/generative AI, automated reasoning, and uncertainty/inconsistency management) and/or data processing (text and data mining and machine/deep learning). The candidate should demonstrate their ability to conduct high-level research on fundamental aspects of machine learning methods and algorithms based on complex data (structured or unstructured, such as text, images, or graphs). The development of synergies between neural learning and symbolic learning will be appreciated, particularly for explainable and frugal AI. The applicant should also have implemented and studied model learning methods and demonstrated the ability to develop innovative methods for analyzing and interpreting data in a variety of application frameworks. For the Cloud continuum axis, we are seeking candidates with strong skills in research topics related to service and process management: service orchestration, composition, and discovery, and process discovery, conformance and prediction. The targeted applications encompass crosswise use cases, specifically in healthcare and the industry of the future, thereby amplifying the potential impact of their research across diverse domains.
The candidate will be responsible for teaching and organizing courses in the engineering and master programs at Télécom SudParis. Besides teaching, the recruitee should design and organize teaching activities for undergraduate and graduate students, coordinate pedagogical teams and supervise students in scholar and research projects, internships, etc.

Profil du candidat :
Job requirement:
Level of training: PhD in Computer science

Essential skills:
– Strong publication record
– Significant experience in teaching and research
– Fluency in English and French (spoken and written)
– Good experience in setting up and/or execution of industrial, European or national contracts
– International experience is a plus
– Qualification by the CNU in the 27th section is desired

Abilities:
– Organizational and animation skills
– Ability to work in a team, ability to dialogue
– Relational and pedagogical qualities
– Ability to write and summarize

Formation et compétences requises :

How to apply:
Applications should be submitted on the school website:
Fr : https://institutminestelecom.recruitee.com/o/mcinformatiqueintelligencedonneesconnaissance
En: https://institutminestelecom.recruitee.com/l/en/o/mcinformatiqueintelligencedonneesconnaissance

An application should include:
– a detailed CV including a record of teaching activities and a list of publications (reference to international publication rankings and repositories such as ERA Core, SJR, ISI, etc. is desired)
– a statement of planned research and teaching activities at Telecom SudParis
– coordinates of at least two referees
– as well as any material deemed interesting by the candidate to demonstrate his/her abilities

Application deadline: March 31, 2024
Audition expected date: May 22, 2024
Expected start date (flexible): September 1, 2024
Location: Évry-Courcouronnes, France (24 km south of Paris)

Candidates are strongly encouraged to contact the department to discuss and refine their research and teaching projects:
• Djamel Belaïd (Djamel_dot_Belaid_@_telecom-sudparis.eu), head of the computer science department
• Walid Gaaloul (Walid_dot_gaaloul_@_telecom-sudparis.eu), leader of the Samovar/ACMES research team
• Moahmed Sellami (Moahmed_dot_Sellami_@_telecom-sudparis.eu), leader of the DIEGO research group

Adresse d’emploi :
Télécom SudParis, Palaiseau/Evry

Knowledge graph completion leveraging pre-trained language models and GNNs

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : ISID and Vertigo teams at Centre d’études et de re
Durée : 6 mois
Contact : nada.mimouni@cnam.fr
Date limite de publication : 2024-03-01

Contexte :
In the field of cultural heritage, and painting in particular, the management of large collections has become increasingly complex over the years. Heritage data, including aspects such as names, creators, representations and images, have posed significant challenges for curators and researchers alike.
Semantic knowledge graphs have emerged as a promising approach to representing cultural heritage datasets. They provide a structured framework for integrating heterogeneous data sources, enabling comprehensive exploration and reasoning about cultural artworks and
their relationships. However, existing knowledge graphs are far from complete in this domain, and creating and populating semantic models for heritage data is a resourceintensive undertaking, requiring substantial human expertise. Knowledge graph completion (KGC) approaches have been proposed to enhance knowledge graphs by completing their missing connections. In this work, we aim to extend knowledge-graph completion techniques to this specific data domain, by leveraging both pre-trained language models and Graph Neural Networks (GNNs) to facilitate the efficient creation and extension of
knowledge graphs.

Sujet :
The work will be organized as follows:
– Related work: analysis of existing approaches on the use of pre-trained language models and GNNs to improve knowledge graph completion (KGC).
– Data: collection and creation of benchmarks to evaluate the models.
– Methodology: definition of a methodology for data preparation and knowledge graph enrichment.
– Interpretation and evaluation: carry out a quantitative assessment of the proposed methods for KGC, based on the created benchmarks, in order to establish their effectiveness in this context. An effort towards explaining these results should be made.

Profil du candidat :
A master degree in one or more of the following areas: machine learning, natural language processing, symbolic AI, semantic web.

Formation et compétences requises :
As a minimum requirement, the successful candidate should have:
• A master degree in one or more of the following areas: machine learning, natural language processing, symbolic AI, semantic web.
• Excellent programming skills (Java or Python)
• Excellent command of English
• Experience with machine learning and graphs

Adresse d’emploi :
Conservatoire National des Arts et Métiers Paris, 2 rue Conté, 75003

Document attaché : 202402231005_Internship_KGC_CNAM-list.pdf

Seismic Waves to Marine Pulses: A Cura6on Pipeline for Building an Earth Sciences and Biodiversity Data Lake in the Portuguese Carabela Jellyfish and Seismology Studies

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : LIRIS et ERIC
Durée : 4-6 mois
Contact : jerome.darmont@univ-lyon2.fr
Date limite de publication : 2024-03-01

Contexte :
Projet international LETITIA (Lac de donnéEs, expérimenTation, vIe, Terre, curatIon, explorAtion)

HOME

Sujet :
The project focuses on designing and creating a data lake for gathering and integrating (meta)data on data-driven experiments in life and earth sciences.

The integration and fusion of data and metadata in the fields of life and earth sciences calls for
the proposal of data and knowledge representations to structure the diverse information
collected and produced for/within an experimental framework. Data lakes appear to be a
relevant solution for managing and making available this diversity of data. Metadata models
need to be devised to connect the data, and appropriate organisation and exploration
mechanisms need to be devised that are relevant in the context of life and earth sciences.
The extraction of value through data-driven experiments in the life and earth sciences is
determined by two main elements. (1) First, the maintenance of metadata collecting the
conditions under which experiments are performed (quantitative perspective) to preserve the
memory of the experimental process of knowledge production and to enable understanding
and reproducibility. (2) Secondly, an open science perspective that can go beyond the sharing
of data and must consider the sharing of know-how, decision-making, elements of expertise,
project management and the people within projects who define the context in which
experiments are carried out (qualitative perspective).

Profil du candidat :
MSc in Computer/Data Science

Formation et compétences requises :
databases (data models, querying, distributed databases –
preferable), data processing techniques (preferable), good programming skills

Adresse d’emploi :
Genoveva Vargas-Solar, CNRS, LIRIS
genoveva.vargas-solar@cnrs.fr
Jérôme Darmont, U. Lumière Lyon 2, ERIC
jerome.darmont@univ-lyon2.fr

Document attaché : 202402221539_letitia-internship-position.pdf

Ingénieur d’études en administration des systèmes d’information

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de physique du globe de Paris
Durée : 12 à 36 mois
Contact : satriano@ipgp.fr
Date limite de publication : 2024-03-07

Contexte :
Le Centre de données de l’IPGP (http://datacenter.ipgp.fr) a pour mission de collecter, gérer, pérenniser et fournir l’accès aux données géophysiques issues des observatoires et des expériences scientifiques de l’IPGP. Il assure l’interconnexion avec l’infrastructure de recherche Epos-France et des centres de données internationaux.

Le Centre de données maintient également un entrepôt ouvert de données d’observation et de recherche (IPGP Research Collection, https://research-collection.ipgp.fr).
Au sein du Centre de Données, l’ingénieur travaillera dans une équipe de 4 personnes (3 ingénieurs et 1 chercheur) et en étroite collaboration avec les ingénieurs des observatoires de l’IPGP.

Sujet :
Participer à l’administration, l’exploitation et l’évolution du système d’information du Centre de données IPGP.

Participer à la gestion des données et à la gestion et développement des applications pour la gestion des données.

Profil du candidat :
Ingénieur d’études

BAP : E – Informatique, Statistiques et Calcul scientifique

Ouvert aux fonctionnaires par voie de détachement.

Formation et compétences requises :
Expérience minimale de 2 ans.
Diplôme : Licence ou Master en informatique.

Compétences :
● Avoir une connaissance approfondie des systèmes d’information
● Avoir une connaissance approfondie des systèmes de gestion de bases de données
● Maîtriser un langage de requêtes SQL
● Maîtriser un langage de programmation procédural ou orienté objet ou un langage interprété
● Maîtriser le système d’exploitation Linux
● Connaître les technologies et langages de programmation web
● Avoir de notions de base sur les réseaux informatiques
● Être rigoureux dans le traitement de données
● Savoir analyser et formaliser des besoins des utilisateurs (chercheurs, ingénieurs) en traitement de l’information
● Communiquer et faire preuve de pédagogie
● Savoir planifier et respecter des délais
● Avoir un bon niveau d’anglais technique

Adresse d’emploi :
Institut de physique du globe de Paris, site Cuvier,
1 rue Jussieu, 75005 Paris

Document attaché : 202402220942_Ingenieur-detudes-en-administration-des-systemes-dinformation-Centre-de-donnees.pdf

Contribution to a python library for temporal sequences analysis

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Equipe AIstroSight/Inria Lyon
Durée : 9 mois
Contact : thomas.guyet@inria.fr
Date limite de publication : 2024-03-07

Contexte :
The AIRACLES Chair (https://www.bernoulli-lab.fr/project/chaire-ai-racles/) focuses on developing methods and tools for analyzing care pathways. In particular, it is interested in COVID patients to describe and understand their care pathways within the APHP, according to different waves. Data collected by information systems (Electronic Health Records) provide access to rich information on hospital stays for a very large population of hospitalized patients.
This information constitutes their care pathway and is modeled by a temporal sequence of cares, which is a collection of timestamped events. Within the context of the AIRACLES project, we are interested in the longitudinal description of patients. Hence, the temporal information is an important dimension of the data, but it requires data analytics tools that can handle this information. For instance, clustering patients based on their care pathways would require adapting classical clustering approaches to specifically handle the temporal dimension of the data.
There is no standard way to address the problem of timed sequence clustering. Many different techniques have been proposed in the literature. Depending on the analysis to be conducted and on the data characteristics, the analyst may be interested in testing different approaches and choosing the most suitable one. Unfortunately, this would require a lot of effort to compare different implementations coming from different researchers/developers.
This motivates the need to develop a Python library dedicated to the analysis of timed sequences. The objective of this library is to gather a collection of data science tools that can be used to analyze timed sequences. The choice of the Python language fits the current practices in the field of data science but also the environment provided for analyzing EHR data at APHP. This is motivated by the success of the development of libraries such as:
• TraMineR1, which proposes different methods to analyze state sequences but with the R language.
• tslearn2 or aeon3, which are Python libraries for the analysis of time series, but time series data are slightly different from timed sequences.
The success of these time series libraries is based on the quality of the implementations and the wide involvement of the community to integrate their algorithms. The project that we propose aims to offer a well-conceived and well-implemented library that will integrate a few algorithms for timed sequence analysis and, in a second step, to open it to integrate contributions from different teams.

Sujet :
The objective of the engineer will be to contribute to the conception and development of a Python library dedicated to the analysis of time sequences.
1. You will collaborate with supervisors to propose the overall architecture of the library (defining main packages and organization) and plan the development phases of the project.
2. You will implement the structure of the collaborative development project based on Inria GitLab tools (including documentation generation, testing, continuous integration, etc.).
3. You will implement and test a data structure for timed sequences, including visualization tools and import/export functionalities. This data structure must be flexible, compatible with other storage facilities (such as pandas dataframes), and provide efficient accessibility functionalities.
4. You will select and implement clustering methods for timed sequences. Clustering will be the primary class of methods to be implemented, starting with metric-based clustering techniques.
5. You will contribute to experimenting with the library on real studies of care pathways in collaboration with data scientists at APHP.

Profil du candidat :
You are an engineer with good knowledge in Python library development and good practices for contributing to collaborative development projects (Git, GitLab, continuous integration, documentation generation, package design, etc.). You have from 0 (M2 interns) to 10 years of experience in Python development.
Practical skills with libraries such as Pandas, NumPy, Matplotlib, or Seaborn are expected. Additionally, some knowledge of advanced libraries like scikit-learn, SciPy, and Arrow is considered a plus.
You are interested in contributing to the development of an impactful Python library and value clean, shareable, tested, and well-documented code. Your background knowledge in data science is also welcomed, as you may need to implement algorithms described in scientific articles or research code.
No specific background in timed sequence or care pathways analysis is required.

Formation et compétences requises :
You are an engineer with good knowledge in Python library development and good practices for contributing to collaborative development projects (Git, GitLab, continuous integration, documentation generation, package design, etc.). You have from 0 (M2 interns) to 10 years of experience in Python development.
Practical skills with libraries such as Pandas, NumPy, Matplotlib, or Seaborn are expected. Additionally, some knowledge of advanced libraries like scikit-learn, SciPy, and Arrow is considered a plus.
You are interested in contributing to the development of an impactful Python library and value clean, shareable, tested, and well-documented code. Your background knowledge in data science is also welcomed, as you may need to implement algorithms described in scientific articles or research code.
No specific background in timed sequence or care pathways analysis is required.

Adresse d’emploi :
Inria Lyon ou Paris

Document attaché : 202402220924_inge_aistrosight.pdf