Généricité, contexte et explicabilité dans les systèmes de recommandation

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LAMSADE – Université Paris-Dauphine
Durée : 3 ans
Contact : elsa.negre@dauphine.fr
Date limite de publication : 2024-03-01

Contexte :
Financement : Ce sujet est prioritaire pour une demande de bourse de thèse du ministère.

Sujet :
Sujet : L’objectif principal de cette thèse est d’étudier la diversité des systèmes de recommandation, leurs points communs et différences (d’un point de vue algorithmique mais aussi applicatif) dans un contexte de grande masse de données en constante évolution, ainsi que de comprendre de tels systèmes dans leur contexte. Il s’agira ensuite de tendre vers un modèle de système générique de recommandation capable d’expliquer à l’utilisateur les recommandations retournées.

Profil du candidat :
Candidatures : Les candidats intéressés sont invités à envoyer une lettre de motivation, un CV, leurs relevés de notes (Licence + Master) avec classements (Master 2 également, éventuellement partiel), et une ou plusieurs lettres de recommandation, le plus tôt possible, avant le 27 mars 2024. Une seconde sélection sera ensuite faite par l’école doctorale et le laboratoire sur la base d’une audition en mai 2024.

Formation et compétences requises :
M2/Ingénieur informatique/Mathématiques

Adresse d’emploi :
Université Paris-Dauphine,
place du Maréchal de Lattre de Tassigny,
75016 Paris

Document attaché : 202402280948_PhD-Dauphine-Reco.pdf

Poste MCF 27 – Gestion de données massives, Intelligence artificielle appliquée à la santé – ISIS Castres / INUC / Laboratoire recherche IRIT

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT
Durée : CDI
Contact : imen.megdiche@irit.fr
Date limite de publication : 2024-03-01

Contexte :
Un poste de MCF 27 est ouvert au concours.
Profil : Gestion de données massives, Intelligence artificielle appliquée à la santé

https://www.galaxie.enseignementsup-recherche.gouv.fr/ensup/ListesPostesPublies/ANTEE/2024_1/0811293R/FOPC_0811293R_4182.pdf

Les personnes intéressées sont invitées à prendre contact avant la date de clôture des candidature le 29 mars 2024 :
imen.megdiche@irit.fr ou imen.megdiche@univ-jfc.fr
elyes.lamine@univ-jfc.fr

Sujet :
Profil recherche : laboraoire IRIT , département Gestion des données
Le poste est ouvert à toutes les thématiques connexes à l’ingénierie, au traitement des données massives et de l’intelligence artificielle.
Dans le domaine de la santé, les masses de données hétérogènes et multimodales issues de l’écosystème numérique de gestion de données de santé (données cliniques, données génomiques, imagerie médicale, données de capteurs portables…) remettent en cause les méthodes de gestion et d’analyse de données classiques. La candidate ou le candidat apportera une expertise de recherche sur :
• les verrous d’hétérogénéité et de multimodalité des données de santé avec une attention particulière sur la qualité des données
• la conception de modèles de connaissances pour l’intégration et l’accès aux masses de données médicales et/ou sanitaires hétérogènes
• L’analyse décentralisée (ou fédérée) de données de santé en incluant les problématiques d’équité
• L’application de techniques d’apprentissage automatique pour l’interprétation des données complexes et massives, qu’il s’agisse de données structurées ou non structurées ainsi que des données multimodales (ex : médicales ou biologiques).
Le projet d’intégration du candidat devra s’inscrire dans le développement de la stratégie de recherche locale d’ISIS Castres.

Profil enseignement : école d’ingénieur ISIS Castres , Institut National Universitaire Jean François Champollion

Le/la maître(esse) de conférences recruté(e) viendra renforcer les rangs de l’équipe pédagogique de l’école d’ingénieurs ISIS à Castres. Ses principales missions pédagogiques consisteront à assurer des activités d’enseignement et d’encadrement des apprenants du cycle ingénieur et du cycle préparatoire.
Il(elle) sera investi(e) dans le montage et la coordination des enseignements liés à l’IA et l’ingénierie des données pour le parcours « Données de santé et intelligence artificielle »
Il(elle) développera, assurera et coordonnera un ensemble d’enseignements (cours, TP, TD, projet, etc.). Il(elle) mettra en oeuvre des méthodes pédagogiques (par projet, face à face ou à distance) pour un public varié (élèves ingénieurs, étudiants du cycle préparatoire) dans tout ou partie des domaines suivants : Informatique, gestion de données, intelligence artificielle, sciences des données.
En outre, l’école accorde une grande valeur à l’innovation pédagogique, et Le/la maître(esse) de conférences recruté(e) jouera un rôle essentiel dans les initiatives visant à innover et transformer les méthodes d’enseignement. Par conséquent, il est fortement souhaité qu’il (elle) possède une connaissance des plateformes numériques telles que Moodle, ainsi qu’une expérience pratique des pédagogies actives.

Profil du candidat :
CNU 27

Formation et compétences requises :
Qualification CNU 27

Adresse d’emploi :
ISIS Castres

Document attaché : 202402271423_ProfilPoste_COS27.pdf

1 poste de MCF

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CNAM
Durée : permanent
Contact : cedric.du_mouza@cnam.fr
Date limite de publication : 2024-03-01

Contexte :
Le Centre d’études et de recherche en informatique et communications (Cédric) regroupe les activités de recherche en sciences du numérique menées au Conservatoire national des arts et métiers (Cnam). Les chercheurs permanents du Cédric sont tous aussi des enseignants en informatique, en mathématiques appliquées ou en électronique.

Le laboratoire mène des recherches fondamentales et appliquées. Le Cédric entretient des rapports avec les principaux acteurs industriels et publics des Technologies de l’Information et de la Communication (Tic). Il a des relations privilégiées avec de nombreux laboratoires de la région parisienne, de province ou de l’étranger. Le laboratoire participe à des contrats de recherche fondamentale ou technologique (transfert et mise en œuvre de résultats de recherche, contrats industriels) ainsi qu’à des contrats de réseaux de recherche français et européens (ANR, IST, etc.). Il est également membre du pôle Systém@tic (groupes Sécurité-Défense et Logiciels Libres).

Le laboratoire compte actuellement 176 membres dont 91 permanents et 5 administratifs affectés. Le Cédric est reconnu par le ministère de la Recherche, de la Technologie et de l’Enseignement Supérieur comme Equipe d’Accueil (EA 1395 d’abord, actuellement EA 4629) depuis sa création. Sa taille et sa maturité actuelles en font le laboratoire de recherche le plus important du Cnam et l’un des laboratoires d’informatique reconnus de la région parisienne.

Sujet :
Le.la candidat.e intégrera l’équipe ISID ou l’équipe ROC de l’axe 3 (confiance et
sécurité numériques) du laboratoire CEDRIC (https://cedric.cnam.fr). Son activité de
recherche s’inscrira dans le cadre des travaux de recherche de cybersécurité
menés au sein de ces deux équipes. Le.la candidat.e intégrera les projets de
recherche en cours et à venir, menés également en collaboration avec d’autres
laboratoires ou équipes du Cnam.
Au sein de l’équipe ISID, un projet d’équipe transverse portant sur la cybersécurité
des infrastructures critiques, en particulier les systèmes industriels, offrira des
axes de développement pour la recherche du.de la candidat.e. L’équipe ISID
développe plusieurs travaux de recherche en sécurité informatique qui pourraient
accueillir le.la candidat.e : les thématiques portent sur la génération automatique
de modèles d’explication et de chemins d’attaques, à base d’IA (“knowledge
graph”, “treillis”, “ontologies” ) /ML pour modéliser puis explorer les données
d’incident (logs, OSINT,…), pour l’analyse de vulnérabilités (MITRE TTP), la
détection d’anomalie, l’investigation numérique et l’analyse de risque. Les projets
en cours sont 1 ANR (CoRReAU) obtenu en 2022, et des contrats industriels signés
en 2022/2023. Au sein de ces projets, le.la candidat.e. pourra également
développer des travaux sur l’évaluation de la sécurité : IoC (indicateurs de
compromission), évaluation de graphes d’attaques, de politiques de sécurité, de
codes malveillants dans les binaires. Les cas d’applications cyber sont les véhicules
connectés, la santé, les drones, les réseaux d’eau (CPS/PLC/SCADA), les IIoT, etc.
Au sein de l’équipe ROC, les activités du.de la candidat.e porteront sur la sécurité
des systèmes embarqués, sur la définition et l’évaluation d’algorithmes de
détection d’attaques, sur la fiabilité des réseaux et des systèmes distribués, et sur
la protection des données personnelles (dans un contexte IoT en combinant des
mécanismes de chiffrement et d’anonymisation). De plus, le.la candidate est
susceptible de travailler sur la gestion auto-souveraine des identités numériques
en utilisant la Blockchain, la gestion de pannes d’infrastructure, la détection
d’intrusions et de chemins d’attaques dans les systèmes cyber-physiques en
explorant des méthodes d’IA (comme les GNN). Les derniers projets qui portent
3
sur ces thèmes sont : leprojet H2020 « A Secure and Reusable Artificial Intelligence
Platform for Edge Computing in Beyond 5G Networks (AI@EDGE) », len projet ANR
GNADiS qui a démarré en octobre 2023 et le projet européen GRAPH4SEC sur la
détection d’attaques et de pannes à l’aide des GNN. L’équipe a de plus des contrats
bilatéraux avec Thales sur chiffrement et détection d’attaques, avec Sopra Steria
sur les Blockchains, avec Orange sur les modèles de sécurité pour les systèmes
embarqués, et avec CS Covidy’s sur les GNN. Plusieurs thèses en cours forment un
terrain fertile de départ pour ces travaux : utilisation des modèles d’IA sur des
données chiffrées homomorphiquement, protection des données IoT à l’aide de la
confidentialité différentielle et de l’apprentissage fédéré, gestion souveraine des
identités numériques à l’aide de la technologie Blockchain, sécurité des VANETs,
détection d’anomalies à l’aide de techniques d’IA/ML, etc.
Les activités de recherche de.la candidat.e doivent porter sur les thèmes d’une
des équipes ou sur les deux. Le.la candidat.e pourra ainsi développer l’activité de
recherche autour des plateformes d’entrainement et d’expérimentation
existantes et à venir, et encadrer les travaux scientifiques associés, par exemple
par l’encadrement de doctorants et d’étudiants des masters orientés recherche.
Un bon équilibre entre les différentes activités (enseignement, recherche et
administration) sera particulièrement apprécié.

Profil du candidat :
En plus de correspondre au profil recherche présenté ci-dessus, nous recherchons pour ce poste un candidat qui pourra assurer les missions d’enseignement suivantes au sein de l’EPN 05 (département informatique) :
– dispenser une unité d’enseignement sur la cybersécurité des infrastructures
informatiques (niveau I2 ou I3 du diplôme d’ingénieur en informatique) : le
candidat devra proposer un projet d’intégration dans deux unités
d’enseignements du diplôme, majeure cybersécurité ;
– participer aux enseignements de niveau M1 et M2 dispensés dans le cadre du
Master Sécurité Informatique, Cybersécurité et Cybermenaces : le candidat devra
proposer un projet d’intégration dans deux unités du master ;
– participer ou prendre en charge le pilotage de la future plateforme Cnam cyber
en lien avec ces enseignements,
– participer aux tutorats de mémoire d’ingénieur et de master.

Formation et compétences requises :
Titulaire d’un Doctorat en Informatique (ou un diplôme équivalent)

Adresse d’emploi :
Conservatoire National des Arts et Métiers, 2 rue Conté, 75003 Paris.

Document attaché : 202402270925_5 – EPN 05_Se curite informatique (Galaxie 4310).pdf

Télécom SudParis ouvre un poste de MCF en informatique – Data IntElliGence and knowledge

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : SAMOVAR/Télécom SudParis
Durée : CDI
Contact : julien.romero@telecom-sudparis.eu
Date limite de publication : 2024-03-01

Contexte :
Fr : https://institutminestelecom.recruitee.com/o/mcinformatiqueintelligencedonneesconnaissance
En: https://institutminestelecom.recruitee.com/l/en/o/mcinformatiqueintelligencedonneesconnaissance

TELECOM SudParis is hiring an assistant Professor (Maître de Conférences) in Computer Science for the Computer Science Department (https://www.inf.telecom-sudparis.eu/). We are looking for a high-potential candidate with teaching and research experience in the field of Computer Science carrying a research project related to the activities of the DIEGO research group (Data IntElliGence and knowledge, https://www.inf.telecom-sudparis.eu/diego/). The DIEGO group is part of the ACMES team (https://samovar.telecom-sudparis.eu/index.php/en/accueil-2/) of the SAMOVAR laboratory.

Sujet :
The recruitment aims to strengthen the research field of the DIEGO group. We are seeking candidates whose research aligns with at least one of the following axes: Artificial Intelligence and Cloud Continuum. Candidates whose research projects are in the Artificial Intelligence axis should have strong skills in research topics related to knowledge representation and reasoning (symbolic/generative AI, automated reasoning, and uncertainty/inconsistency management) and/or data processing (text and data mining and machine/deep learning). The candidate should demonstrate their ability to conduct high-level research on fundamental aspects of machine learning methods and algorithms based on complex data (structured or unstructured, such as text, images, or graphs). The development of synergies between neural learning and symbolic learning will be appreciated, particularly for explainable and frugal AI. The applicant should also have implemented and studied model learning methods and demonstrated the ability to develop innovative methods for analyzing and interpreting data in a variety of application frameworks. For the Cloud continuum axis, we are seeking candidates with strong skills in research topics related to service and process management: service orchestration, composition, and discovery, and process discovery, conformance and prediction. The targeted applications encompass crosswise use cases, specifically in healthcare and the industry of the future, thereby amplifying the potential impact of their research across diverse domains.
The candidate will be responsible for teaching and organizing courses in the engineering and master programs at Télécom SudParis. Besides teaching, the recruitee should design and organize teaching activities for undergraduate and graduate students, coordinate pedagogical teams and supervise students in scholar and research projects, internships, etc.

Profil du candidat :
Job requirement:
Level of training: PhD in Computer science

Essential skills:
– Strong publication record
– Significant experience in teaching and research
– Fluency in English and French (spoken and written)
– Good experience in setting up and/or execution of industrial, European or national contracts
– International experience is a plus
– Qualification by the CNU in the 27th section is desired

Abilities:
– Organizational and animation skills
– Ability to work in a team, ability to dialogue
– Relational and pedagogical qualities
– Ability to write and summarize

Formation et compétences requises :

How to apply:
Applications should be submitted on the school website:
Fr : https://institutminestelecom.recruitee.com/o/mcinformatiqueintelligencedonneesconnaissance
En: https://institutminestelecom.recruitee.com/l/en/o/mcinformatiqueintelligencedonneesconnaissance

An application should include:
– a detailed CV including a record of teaching activities and a list of publications (reference to international publication rankings and repositories such as ERA Core, SJR, ISI, etc. is desired)
– a statement of planned research and teaching activities at Telecom SudParis
– coordinates of at least two referees
– as well as any material deemed interesting by the candidate to demonstrate his/her abilities

Application deadline: March 31, 2024
Audition expected date: May 22, 2024
Expected start date (flexible): September 1, 2024
Location: Évry-Courcouronnes, France (24 km south of Paris)

Candidates are strongly encouraged to contact the department to discuss and refine their research and teaching projects:
• Djamel Belaïd (Djamel_dot_Belaid_@_telecom-sudparis.eu), head of the computer science department
• Walid Gaaloul (Walid_dot_gaaloul_@_telecom-sudparis.eu), leader of the Samovar/ACMES research team
• Moahmed Sellami (Moahmed_dot_Sellami_@_telecom-sudparis.eu), leader of the DIEGO research group

Adresse d’emploi :
Télécom SudParis, Palaiseau/Evry

Knowledge graph completion leveraging pre-trained language models and GNNs

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : ISID and Vertigo teams at Centre d’études et de re
Durée : 6 mois
Contact : nada.mimouni@cnam.fr
Date limite de publication : 2024-03-01

Contexte :
In the field of cultural heritage, and painting in particular, the management of large collections has become increasingly complex over the years. Heritage data, including aspects such as names, creators, representations and images, have posed significant challenges for curators and researchers alike.
Semantic knowledge graphs have emerged as a promising approach to representing cultural heritage datasets. They provide a structured framework for integrating heterogeneous data sources, enabling comprehensive exploration and reasoning about cultural artworks and
their relationships. However, existing knowledge graphs are far from complete in this domain, and creating and populating semantic models for heritage data is a resourceintensive undertaking, requiring substantial human expertise. Knowledge graph completion (KGC) approaches have been proposed to enhance knowledge graphs by completing their missing connections. In this work, we aim to extend knowledge-graph completion techniques to this specific data domain, by leveraging both pre-trained language models and Graph Neural Networks (GNNs) to facilitate the efficient creation and extension of
knowledge graphs.

Sujet :
The work will be organized as follows:
– Related work: analysis of existing approaches on the use of pre-trained language models and GNNs to improve knowledge graph completion (KGC).
– Data: collection and creation of benchmarks to evaluate the models.
– Methodology: definition of a methodology for data preparation and knowledge graph enrichment.
– Interpretation and evaluation: carry out a quantitative assessment of the proposed methods for KGC, based on the created benchmarks, in order to establish their effectiveness in this context. An effort towards explaining these results should be made.

Profil du candidat :
A master degree in one or more of the following areas: machine learning, natural language processing, symbolic AI, semantic web.

Formation et compétences requises :
As a minimum requirement, the successful candidate should have:
• A master degree in one or more of the following areas: machine learning, natural language processing, symbolic AI, semantic web.
• Excellent programming skills (Java or Python)
• Excellent command of English
• Experience with machine learning and graphs

Adresse d’emploi :
Conservatoire National des Arts et Métiers Paris, 2 rue Conté, 75003

Document attaché : 202402231005_Internship_KGC_CNAM-list.pdf

Seismic Waves to Marine Pulses: A Cura6on Pipeline for Building an Earth Sciences and Biodiversity Data Lake in the Portuguese Carabela Jellyfish and Seismology Studies

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : LIRIS et ERIC
Durée : 4-6 mois
Contact : jerome.darmont@univ-lyon2.fr
Date limite de publication : 2024-03-01

Contexte :
Projet international LETITIA (Lac de donnéEs, expérimenTation, vIe, Terre, curatIon, explorAtion)

HOME

Sujet :
The project focuses on designing and creating a data lake for gathering and integrating (meta)data on data-driven experiments in life and earth sciences.

The integration and fusion of data and metadata in the fields of life and earth sciences calls for
the proposal of data and knowledge representations to structure the diverse information
collected and produced for/within an experimental framework. Data lakes appear to be a
relevant solution for managing and making available this diversity of data. Metadata models
need to be devised to connect the data, and appropriate organisation and exploration
mechanisms need to be devised that are relevant in the context of life and earth sciences.
The extraction of value through data-driven experiments in the life and earth sciences is
determined by two main elements. (1) First, the maintenance of metadata collecting the
conditions under which experiments are performed (quantitative perspective) to preserve the
memory of the experimental process of knowledge production and to enable understanding
and reproducibility. (2) Secondly, an open science perspective that can go beyond the sharing
of data and must consider the sharing of know-how, decision-making, elements of expertise,
project management and the people within projects who define the context in which
experiments are carried out (qualitative perspective).

Profil du candidat :
MSc in Computer/Data Science

Formation et compétences requises :
databases (data models, querying, distributed databases –
preferable), data processing techniques (preferable), good programming skills

Adresse d’emploi :
Genoveva Vargas-Solar, CNRS, LIRIS
genoveva.vargas-solar@cnrs.fr
Jérôme Darmont, U. Lumière Lyon 2, ERIC
jerome.darmont@univ-lyon2.fr

Document attaché : 202402221539_letitia-internship-position.pdf

Ingénieur d’études en administration des systèmes d’information

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de physique du globe de Paris
Durée : 12 à 36 mois
Contact : satriano@ipgp.fr
Date limite de publication : 2024-03-07

Contexte :
Le Centre de données de l’IPGP (http://datacenter.ipgp.fr) a pour mission de collecter, gérer, pérenniser et fournir l’accès aux données géophysiques issues des observatoires et des expériences scientifiques de l’IPGP. Il assure l’interconnexion avec l’infrastructure de recherche Epos-France et des centres de données internationaux.

Le Centre de données maintient également un entrepôt ouvert de données d’observation et de recherche (IPGP Research Collection, https://research-collection.ipgp.fr).
Au sein du Centre de Données, l’ingénieur travaillera dans une équipe de 4 personnes (3 ingénieurs et 1 chercheur) et en étroite collaboration avec les ingénieurs des observatoires de l’IPGP.

Sujet :
Participer à l’administration, l’exploitation et l’évolution du système d’information du Centre de données IPGP.

Participer à la gestion des données et à la gestion et développement des applications pour la gestion des données.

Profil du candidat :
Ingénieur d’études

BAP : E – Informatique, Statistiques et Calcul scientifique

Ouvert aux fonctionnaires par voie de détachement.

Formation et compétences requises :
Expérience minimale de 2 ans.
Diplôme : Licence ou Master en informatique.

Compétences :
● Avoir une connaissance approfondie des systèmes d’information
● Avoir une connaissance approfondie des systèmes de gestion de bases de données
● Maîtriser un langage de requêtes SQL
● Maîtriser un langage de programmation procédural ou orienté objet ou un langage interprété
● Maîtriser le système d’exploitation Linux
● Connaître les technologies et langages de programmation web
● Avoir de notions de base sur les réseaux informatiques
● Être rigoureux dans le traitement de données
● Savoir analyser et formaliser des besoins des utilisateurs (chercheurs, ingénieurs) en traitement de l’information
● Communiquer et faire preuve de pédagogie
● Savoir planifier et respecter des délais
● Avoir un bon niveau d’anglais technique

Adresse d’emploi :
Institut de physique du globe de Paris, site Cuvier,
1 rue Jussieu, 75005 Paris

Document attaché : 202402220942_Ingenieur-detudes-en-administration-des-systemes-dinformation-Centre-de-donnees.pdf

Contribution to a python library for temporal sequences analysis

Offre en lien avec l’Action/le Réseau : TIDS/– — –

Laboratoire/Entreprise : Equipe AIstroSight/Inria Lyon
Durée : 9 mois
Contact : thomas.guyet@inria.fr
Date limite de publication : 2024-03-07

Contexte :
The AIRACLES Chair (https://www.bernoulli-lab.fr/project/chaire-ai-racles/) focuses on developing methods and tools for analyzing care pathways. In particular, it is interested in COVID patients to describe and understand their care pathways within the APHP, according to different waves. Data collected by information systems (Electronic Health Records) provide access to rich information on hospital stays for a very large population of hospitalized patients.
This information constitutes their care pathway and is modeled by a temporal sequence of cares, which is a collection of timestamped events. Within the context of the AIRACLES project, we are interested in the longitudinal description of patients. Hence, the temporal information is an important dimension of the data, but it requires data analytics tools that can handle this information. For instance, clustering patients based on their care pathways would require adapting classical clustering approaches to specifically handle the temporal dimension of the data.
There is no standard way to address the problem of timed sequence clustering. Many different techniques have been proposed in the literature. Depending on the analysis to be conducted and on the data characteristics, the analyst may be interested in testing different approaches and choosing the most suitable one. Unfortunately, this would require a lot of effort to compare different implementations coming from different researchers/developers.
This motivates the need to develop a Python library dedicated to the analysis of timed sequences. The objective of this library is to gather a collection of data science tools that can be used to analyze timed sequences. The choice of the Python language fits the current practices in the field of data science but also the environment provided for analyzing EHR data at APHP. This is motivated by the success of the development of libraries such as:
• TraMineR1, which proposes different methods to analyze state sequences but with the R language.
• tslearn2 or aeon3, which are Python libraries for the analysis of time series, but time series data are slightly different from timed sequences.
The success of these time series libraries is based on the quality of the implementations and the wide involvement of the community to integrate their algorithms. The project that we propose aims to offer a well-conceived and well-implemented library that will integrate a few algorithms for timed sequence analysis and, in a second step, to open it to integrate contributions from different teams.

Sujet :
The objective of the engineer will be to contribute to the conception and development of a Python library dedicated to the analysis of time sequences.
1. You will collaborate with supervisors to propose the overall architecture of the library (defining main packages and organization) and plan the development phases of the project.
2. You will implement the structure of the collaborative development project based on Inria GitLab tools (including documentation generation, testing, continuous integration, etc.).
3. You will implement and test a data structure for timed sequences, including visualization tools and import/export functionalities. This data structure must be flexible, compatible with other storage facilities (such as pandas dataframes), and provide efficient accessibility functionalities.
4. You will select and implement clustering methods for timed sequences. Clustering will be the primary class of methods to be implemented, starting with metric-based clustering techniques.
5. You will contribute to experimenting with the library on real studies of care pathways in collaboration with data scientists at APHP.

Profil du candidat :
You are an engineer with good knowledge in Python library development and good practices for contributing to collaborative development projects (Git, GitLab, continuous integration, documentation generation, package design, etc.). You have from 0 (M2 interns) to 10 years of experience in Python development.
Practical skills with libraries such as Pandas, NumPy, Matplotlib, or Seaborn are expected. Additionally, some knowledge of advanced libraries like scikit-learn, SciPy, and Arrow is considered a plus.
You are interested in contributing to the development of an impactful Python library and value clean, shareable, tested, and well-documented code. Your background knowledge in data science is also welcomed, as you may need to implement algorithms described in scientific articles or research code.
No specific background in timed sequence or care pathways analysis is required.

Formation et compétences requises :
You are an engineer with good knowledge in Python library development and good practices for contributing to collaborative development projects (Git, GitLab, continuous integration, documentation generation, package design, etc.). You have from 0 (M2 interns) to 10 years of experience in Python development.
Practical skills with libraries such as Pandas, NumPy, Matplotlib, or Seaborn are expected. Additionally, some knowledge of advanced libraries like scikit-learn, SciPy, and Arrow is considered a plus.
You are interested in contributing to the development of an impactful Python library and value clean, shareable, tested, and well-documented code. Your background knowledge in data science is also welcomed, as you may need to implement algorithms described in scientific articles or research code.
No specific background in timed sequence or care pathways analysis is required.

Adresse d’emploi :
Inria Lyon ou Paris

Document attaché : 202402220924_inge_aistrosight.pdf

5th International Workshop on Intelligent Data – From Data to Knowledge

Date : 2024-08-28
Lieu : Bayonne, France

****************************
CALL FOR PAPERS
DOING 2024: 5th International Workshop on Intelligent Data – From Data to Knowledge
****************************
August 28, 2024
Bayonne, France

In conjunction with ADBIS 2024

DOING@ADBIS 2024

Home – Technology Event

******************
IMPORTANT DATES
******************
Paper submission: 29 April, 2024 at 5 a.m. CET
Notification of acceptance: 8 June , 2024
Camera-ready due: 18 June , 2024
Workshop day: 8 August , 2024

******************
SUBMISSIONS
******************
DOING workshop accepts short (limited to 6-8 pages) and long (limited to 12 pages) papers. DOING reserves the right to accept as short papers those submitted as long, describing interesting and innovative ideas but still requiring further technical development. Papers should be written in English, formatted in Latex and present substantially original results. We adopt a double blind review policy: the papers submitted for review MUST NOT contain the authors’ names, affiliations, or any information that may disclose the authors’ identity. Authors should consult Springer’s authors’ guidelines and use their proceedings templates (you can download the templates available on the bottom of that page).

The workshop papers will be published by Springer in Communications in Computer and Information Science (CCIS). The authors of selected workshop papers will be invited to submit an extended version of their contributions to a special issue of an international journal.

ADBIS 2024 continues to participate in the Diversity and Inclusion (D&I) initiative of the Database community aiming to guide researchers in our community to adopt a more inclusive mindset in general toward different individuals.

**** Papers must be submitted via EASY CHAIR: https://easychair.org/conferences/?conf=adbis2024

******************
AIMS AND SCOPE
*******************

The workshop focuses on transforming data into information and then into knowledge. The idea is to gather researchers to discuss two main problems :

how to extract information from textual data and represent it in knowledge bases;
how to propose intelligent methods for handling and maintaining these databases with new forms of requests, including efficient, flexible, and secure analysis mechanisms, adapted to the user, and with quality and privacy preservation guarantees.

******************
TOPICS OF INTEREST
******************

We invite the submission of work-in-progress that address various aspects of information extraction from textual data, intelligent and efficient interrogation, and maintenance of (large) knowledge bases. The workshop welcomes submissions of theoretical, technical, experimental, methodological papers, application papers, position papers and papers on experience reports addressing – though not limited to – the following topics:

Artificial intelligence in databases and information systems
Data curation, annotation, and provenance
Data management and analytics
Data mining and knowledge discovery
Data models and query languages
Data quality and data cleansing
Data science (theory and techniques)
Context-aware and adaptive information systems
Constraints extraction from text
Natural language processing
Indexing, query processing and optimization
Information and knowledge extraction
Information integration
Information quality
Graph databases
Knowledge bases (querying, management, evolution and dynamics)
Machine learning for knowledge graph construction, completion, refinement
Machine learning for knowledge and information extraction, for instance, named entity disambiguation, sentiment analysis, relation extraction, or the detection of claims, facts and stances from unstructured documents
Machine Learning in NLP
Management of large volumes of data
Methodologies, models, algorithms, and architectures for applied data science
NLP for Digital Humanities
NLP & Knowledge Graphs
Privacy, trust and security in databases
Query processing and optimization
Question answering over knowledge graphs
Text databases

Preferred Application Domains (but not limited to).

Bio-sciences and healthcare
Environmental issues

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Ingénieur·e de Recherche en calcul scientifique et IA

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : INRAE
Durée : fonctionnaire
Contact : simon.de-givry@inrae.fr
Date limite de publication : 2024-03-30

Contexte :
https://jobs.inrae.fr/concours/concours-externes-ingenieurs-cadres-techniciens-h-f/ir24-mathnum-3

L’unité “Mathématiques et Informatique Appliquées Toulouse” (MIAT) a pour mission de développer des méthodes mathématiques et/ou informatiques pour résoudre des problèmes identifiés avec nos collaborateurs biologistes et agronomes. L’unité est composée de deux équipes, SaAB et SCIDYN, et de deux plateformes, la plateforme GENOTOUL-bioinfo et la plateforme RECORD.
Vous serez accueilli-e au sein de l’équipe Statistiques et Algorithmique pour la Biologie (SaAB).
Une partie importante de l’activité de l’équipe SaAB est menée en intelligence artificielle (IA) pour les sciences du vivant. L’équipe SaAB est composée de 10 personnes (DR, CR, IR et IE). Sur la thématique de l’IA, l’équipe SaAB mène des travaux en optimisation discrète (dans les modèles graphiques) et programmation par contraintes depuis plus de vingt ans. Elle intègre ses travaux dans la plateforme open-source toulbar2. Plus récemment, elle développe des travaux hybrides à l’interface de l’optimisation et du machine learning, notamment avec l’arrivée d’une CR en 2018 et commence à investir le thème des réseaux de neurones profonds.
L’équipe collabore en IA au niveau régional (Institut d’Intelligence Artificielle de Toulouse, Université Paul Sabatier, CNRS), national (MIA Paris, Universités de Caen, Marseille et Montpellier et Télécom Paris) et international (Universités de Aalto, Barcelone, Cork, Heidelberg, Hong-Kong et Prague). Les fruits de ses travaux en IA sont appliqués en génétique (unité GenPhySE), en métabolomique (Télécom Paris, Université de Aalto, INRIA), en réseaux de gènes (unité LIPME) et en design de protéines (Toulouse Biotechnology Institute, Duke University, KU Leuven). Par le passé, des applications en agronomie (planification/conception, SCIDYN, unité Écodéveloppement) ont également été abordées.

Sujet :
Pour les applications d’intérêt, vous aurez le rôle de responsable opérationnel-le et d’interface avec nos partenaires. Vous aurez en charge la mise en oeuvre de la modélisation, des méthodes et leurs expérimentations pour permettre aux chercheurs de l’équipe d’apporter de manière plus efficace leur expertise sur les questions finalisées et continuer à développer la méthodologie.
Vous interviendrez de façon plus spécifique en appui au développement de code en IA. Notamment, le code source de toulbar2 est en C++ pour des raisons d’efficacité et une interface (ou package) en Python est ajoutée pour faciliter la réutilisation du programme. Vous développerez des solutions pour l’optimisation de code et la parallélisation (GPU). Vous contribuerez à pérenniser les résultats des travaux de recherche de l’équipe et à avoir une science ouverte avec la diffusion de logiciels libres de qualité, performants, extensibles et fédérateurs. La maîtrise des outils d’intégration et de livraison continue (CI/CD) doit vous permettre d’y contribuer.

Profil du candidat :
Des connaissances approfondies en algorithmique sont indispensables. Vous avez de bonnes notions sur au moins l’un des domaines IA de l’équipe (Recherche Opérationnelle (RO) / programmation par contraintes ou apprentissage automatique / réseau de neurones).
Pour assurer vos missions, vous avez des compétences avérées en développement logiciel, notamment avec le langage de programmation C++. Une expérience d’une API GPU type CUDA/OpenCL serait appréciée. Idéalement, vous avez déjà démontré votre capacité à concevoir des logiciels diffusables via CI/CD (gitlab, github,…).
Enfin, vous avez des qualités relationnelles affirmées pour travailler en équipe, une rigueur scientifique, de solides facultés d’organisation, de bonnes compétences pédagogiques et la capacité à vous adapter. Des qualités rédactionnelles en anglais sont indispensables.

Formation et compétences requises :
Master, diplôme d’études approfondies, diplôme d’études supérieures spécialisées, diplôme d’ingénieur.

Adresse d’emploi :
INRAE, MIAT, Chemin de Borderouge, 31326 Castanet Tolosan cedex