Cinquième Symposium du GDR CNRS MaDICS

Présentation

La cinquième édition du Symposium MaDICS aura lieu les 24 et 25 Mai 2023 à Troyes en présentiel.

Ce Symposium a pour objectif de réunir la communauté MaDICS à l’occasion de conférences scientifiques invitées, de sessions dédiées aux Actions et Ateliers du GDR, mais également d’une demi-journée plus spécialement à destination des doctorants et jeunes chercheurs (cf Appel à posters)… et bien sûr de nombreux moments de convivialité !

En espérant que vous serez nombreux pour partager ce moment ensemble.

Du : 2023-05-24
Au : 2023-05-25
Lieu : Université de Technologie de Troyes, 12 rue Marie Curie (Venir à l’UTT, Plan des bâtiments)

Programme

Mercredi 24 mai 2023
10h00 Accueil et caféHall M
10h30 Session d’ouvertureAmphi C001
Introduction, présentation du GDR et questions
11h00 Keynote Guillaume Levavasseur (IPSL Climate Modeling Center) – Amphi C001
De la production à l’analyse de données massives en modélisation du climat : défis et solutions pour le prochain rapport du GIEC (Résumé)

12h00 Pause repasSalle M104
13h45 Session Actions et Ateliers 1
Action BigData4Astro
Salle P102
Programme
Atelier FedSed
Salle S102
Programme
Action RoCED
Salle S204
Programme
15h45 Pause – Hall M
16h00 Mise en lumière de travaux de Jeunes Chercheuses et Jeunes ChercheursAmphi C001
La session JCJC aura le plaisir d’accueillir les exposés invités suivants :
Paul Boniol (Centre Borelli, ENS Paris-Saclay, Gif-sur-Yvette)
Detection of Anomalies and Identification of their Precursors in Large Data Series Collections
Maelle Moranges (UMR5292 CNRS / INSERM U1028, CRNL, Lyon)
Analyses d’imageries cérébrales à partir d’extraction de sous-graphes attribués exceptionnels afin d’explorer la variabilité individuelle dans la perception olfactive
Olivier Flasseur (Université de Lyon, Université Lyon 1, ENS de Lyon, CNRS, Centre de Recherche Astrophysique de Lyon UMR 5574, Saint-Genis-Laval)
Exploring the circumstellar environment by direct imaging at high contrast : a focus on data-driven approaches
17h30 Gong showAmphi C001
Flash talks de doctorants
18h30 Session posters avec cocktailHall M
19h30 Fin de la journée
Jeudi 25 mai 2023
9h00 Sessions Actions et Ateliers 2Amphi C002
Action BigData4Astro
Salle P102
Programme
Atelier Educ’Action
S102
Programme
Atelier Musiscale
Salle S204
Programme
11h00 Pause – Hall M
11h15 Keynote Marc Chemillier (Centre d’Analyse et de Mathématique Sociales, EHESS) – Amphi C002
Du machine learning au web scraping : interaction des musiciens de TikTok avec un logiciel d’improvisation musicale (Résumé).

12h15 Pause repasSalle M104
14h00 Sessions Actions et Ateliers 3
Action DOING
Salle P102
Programme
Action DSChem
Salle P202
Programme
Action HELP
Salle S204
Programme
Action SimpleText
Salle C102
Programme
16h00 Fin du Symposium

Programme de l’Action BigData4Astro

Mercredi 24 mai 2023 13h45-15h45 – Salle P102
13h45 Bienvenue, rappel des objectifs et contenu des deux sessions par les responsables de l’Action
14h00 Présentation de Jenny Sorce (Laboratoire CRIStAL, Lille)
From observations to cosmological simulations and back: solving an inverse problem
14h40 Présentation Yohan Dubois (IAP, Paris)
Nouvelles de l’AS Numérique INSU
15h10 Table ronde
Leviers (ou Catalyseurs) de l’interdisciplinarité Données / Astro : Formation, Recrutement, Projets incitatifs.
Possibilité d’intervenant(e)s et invité(e)s en ligne
15h40 Conclusion de la première session
15h45 Fin
Jeudi 25 mai 2023 9h00-11h00 – Salle P102
9h00 Bienvenue, rapide débriefing de la première session
9h10 Présentation de Pierre Palud (Centrale Lille)
Efficient Bayesian inference to solve the mystery of the birth of stars
9h30 Présentation de Roman Le Montagner (IJCLab, Paris-Saclay)
Fink: Enabling discovery of astronomical transients objects in large alert data streams
9h50 Présentation de Anass Bairouk (LIRMM Montpellier)
Astronomical Image Time Series Classification Using Convolutional Attention
10h10 Table ronde
Défi du traitement des masses d’observations astro : dans les méthodes, les outils techniques, les ressources, l’organisation, les compétences.
Possibilité d’intervenant(e)s et invité(e)s en ligne
10h55 Conclusion des deux sessions
11h00 Fin

Programme de l’Atelier FedSed

Mercredi 24 mai 2023 13h45-15h45 Salle S102
13h45 Bienvenue et introduction
Olivier Teste, Marco Lorenzi , Laetitia Kameni et Imen Megdiche
14h00 Présentation de Emmanuel Bacry
État de l’art et défis dans la recherche académique de l’apprentissage fédéré.
14h30 Présentation de Sujeevan Aseervatham (Orange)
Défis de recherche industriels de l’apprentissage fédéré vu par Orange
15h00 Défis cliniques et Dévélopement de la plateforme Fedbiomed (à confirmer)
15h20 Présentation de Omar EL Rifai
L’apprentissage fédéré pour la gestion de données sensibles
15h40 Conclusion
15h45 Fin

Programme de l’Action RoCED

Mercredi 24 mai 2023 13h45-15h45 – Salle S204
Graphes de connaissances et humanité numérique
13h45 Beinvenue et introduction
13h50 Présentation de Nathalie Abadie (IGN)
Enjeux et verrous des graphes de connaissances géohistoriques
14h15 Présentation de Béatrice Markhoff (CITERES)
OpenArchaeo, plateforme Web sémantique pour l’archéologie
14h40 Présentation de Nathalie Hernandez (IRIT)
Les graphes de connaissances pour représenter les unités territoriales en histoire
15h15 Présentation de Molka Dhouib (WIMMICS)
Construction d’un graphe de connaissance à partir des annotations manuelles de textes de zoologie antique
15h40 Conclusion
15h45 Fin

Programme de l’Atelier Educ’Action

Jeudi 25 mai 2023 9h00-11h00 – Salle S102
9h00 Qu’est-ce qu’EDUC’ACTION et comment travaille-t-on ensemble?
Philippe Dessus et Emilie Hoareau : présentation de la fusion des lexiques proposés par les participants venant de différentes disciplines.
9h10 Réflexion collective sur l’éthique
Emilie Hoareau : compte rendu des retours de l’étude des plateformes éducatives – objectifs et historiques, utilisateurs, données.
9h40 Quelques plateformes éducatives en France
Emilie Hoareau : compte rendu des retours de l’étude des plateformes éducatives – objectifs et historiques, utilisateurs, données.
9h50 Questionnaires et entretiens
Salomé Cojean et Alexandra Salou : premières ébauches de questionnaires / entretiens et séance d’échanges avec le public.
Quelles représentations de l’IA et de ses applications pédagogiques auprès des étudiants en informatique et en sciences de l’éducation ?
Quels aspects éthiques sont les plus importants à considérer selon les individus (chercheurs / enseignants / élèves / etc.) ?
Quels aspects éthiques sont à considérer dans une recherche sur l’éthique de l’AIED ?
10h10 Ethiques des plateformes éducatives
Philippe Dessus : compte rendu des questions éthiques soulevées par les plateformes éducatives.
10h35 Quels autres projets menons-nous et comment vous pouvez participer ?
Présentation du projet Emergence de Fabrice Jouanot et des soumissions MIAI de Sihem Amer-Yahia et de Salomé Cojean.
Montage de l’action EDUC’ACTION,
Dynamique de collaborations en sous-groupes,
Projet de publication collective à l’automne.
10h50 Questions et réactions du public
11h00 Fin

Programme de l’Atelier Musiscale

Jeudi 25 mai 2023 9h00-11h00 – Salle S204
9h00 Introduction – Rappels des objectifs et retour sur les précédentes journées d’étude
9h20 Exposé jeune chercheur·se
Louis Couturier
Bomi Yi
Antoine Villedieu
10h20 Ken Déguernel (CRIStAL, Univ Lille)
Modélisation de la structure comme processus compositionnel
10h50 Discussions
11h00 Fin

Programme de l’Action DOING

Jeudi 25 mai 2023 14h00-16h00 – Salle P102
14h00 Introduction de la demi-journée de travail
14h05 Keynote Liat Peterfreund (CNRS, LIGM, Univ. Gustave Eiffel) Bio

A Researcher’s Digest of GQL (résumé)

14h50 Perceval Wajsburt (AP-HP)
Outils de traitement des comptes-rendus cliniques dans les entrepôts de données de santé (résumé)

15h35 Echanges avec Mirian Halfeld Ferrari-Alves (LIFO, Orléans), Anne-Lyse Minard-Frost (LLL, Orléans) et Genoveva Varga-Solar (LIRIS, Lyon)
Les verrous scientifiques du traitement de textes pour la représentation et la découverte d’information et de la connaissance par des techniques de TAL, IA et BD.
16h00 Fin

Programme de l’Action DSChem

Jeudi 25 mai 2023 14h00-16h00 – Salle P202
14h00 Présentation de Dominique Douguet (directrice du GDR BigDataChim)
Présentation du GDR BigDataChim (résumé)

14h40 Présentation de Bertrand Cuissart
L’analyse des données de petite taille peut être importante en chimie (résumé)

15h20 Fin

Programme de l’Action HELP

Jeudi 25 mai 2023 14h00-16h00 – Salle S204
14h00 Nicolas Labroche, Julien Aligon
Ouverture de l’atelier, rappel des objectifs scientifiques
14h10 Présentation de Paul Boniol
“dCAM: Dimension-wise Class Activation Map for Explaining Multivariate Data Series Classification”, publié à SIGMOD 2022.
14h50 Exposé court
14h50 Présentation de Jérémy Rohmer (BRGM Orléans)
“Explainable machine learning to help the prediction of Geoscience processes: introduction with a focus on the challenges” (résumé)

14h50 Table ronde
Devenir de l’action HELP, nouveaux challenges pour la prochaine action Madics.

Programme de l’Action SimpleText

Jeudi 25 mai 2023 14h00-16h00 – Salle C102
14h00 Welcome and Overview of the SimpleText track
14h15 Présentation de Jaap Kamps (University of Amsterdam)
“What Happens when Laypersons Search Scientific Articles?”
14h45 Présentation de Florian Boudin (Laboratoire des Sciences du Numérique de Nantes)
“DELICES : Indexer la littérature scientifique par expansion sémantique”
15h15 Présentation de Hosein Azarbonyad (Elsevier, The Netherlands)
“Answers instead of Articles: Helping Users Understand Scientific Content”
15h35 Table Ronde
The promise of ChatGPT
16h00 Fin

Appel à posters

Le GDR MaDICS organise une session poster spécialement consacrée aux jeunes chercheuses et jeunes chercheurs souhaitant présenter leurs travaux en science des données ou big data. Ils auront ainsi l’occasion de rencontrer des collègues académiques et acteurs industriels intéressés par ces thématiques et présents lors de cette journée.

Bourses

Le GDR MaDICS offre un certain nombre de bourses aux jeunes chercheuses et jeunes chercheurs présentant un poster. Cette bourse permet de couvrir les frais de mission pour la participation à l’ensemble du symposium, selon les règles habituelles de la fonction publique.

Résultats

La sélection pour les posters et les bourses sera faite selon l’adéquation des travaux aux thèmes du GDR et, en ce qui concerne les bourses, selon le nombre de demandes par laboratoire. Les résultats seront diffusés le 18 avril 2023.

Journées Recherche Reproductible : état des lieux

Date : 2023-03-08 => 2023-03-09
Lieu : Institut Pasteur, Paris

Un nombre croissant de chercheurs s’intéresse à la problématique de la reproductibilité, dont la définition même peut grandement varier d’une discpline à une autre (observationnelle, expérimentale, statistique, computationnelle, …). Or, nous avons rarement l’occasion de poser un regard inter-disciplinaire sur nos approches et définitions respectives. Ces journées sont donc un lieu d’échanges et d’information pour dresser un premier état des lieux de la reproductibilité en France. Le but est de favoriser les interventions courtes suivies de discussion permettant à tout un chacun de mieux comprendre les problématiques des autres. Nous essayons donc de rassembler des scientifiques de toutes disciplines.

L’autre but des ces journées est de réfléchir à une organisation nationale nous permettant d’échanger des informations sur les formations, les ateliers, les conférences et de pouvoir péréniser l’organisation de ces journées. Dans de nombreux pays, il existe des réseaux académiques nationaux dédiés à la question de la reproductibilité, comme par exemple au Royaume Uni (www.ukrn.org), en Finlande (www.finnish-rn.org), en Italie (www.itrn.org), en Allemagne (reproducibilitynetwork.de), en Suisse (www.swissrn.org), etc. Un des enjeux de ce workshop est donc de réfléchir à la définition et à la gouvernance d’un tel réseau, à son positionnement vis à vis d’instances comme le COSO (par exemple).

Plus d’information sur notre site !

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Analysis of time series in robotic surgery

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRISA / Rennes
Durée : 24 mois
Contact : simon.malinowski@irisa.fr
Date limite de publication : 2023-01-31

Contexte :
Surgical robotics is now widely used with, for instance, more than 5000 Da Vinci systems and one million procedures performed worldwide. Surgery is a complex activity, in a very small anatomical volume, and with a lot of variability between patients and between surgeons. The global objective of the two-year SPARS (Sequential Pattern Analysis in Robotic Surgery: Understanding Surgery) project led by the MediCIS team (LTSI (1), Inserm, Rennes 1 University) is to develop data analysis approaches being able to provide a better understanding of the surgical practice, from complex surgical data. The approaches will be developed thanks to the complementary skills available in the project’s consortium, including time series analysis. In this consortium, the IRISA laboratory (Rennes and Vannes) is calling for applications for a post-doctoral research position (duration two years) on time series analysis.

(1) Laboratoire Traitement du Signal et de l’Image

Sujet :
In the SPARS project context, a trajectory compiles information on the 3D location of the tip of a surgical instrument at the hands of the surgeon, at a constant frequency. The candidate will be mostly involved in one of the three workpackages of the SPARS project. A first task will focus on clustering and classification for such trajectories. Various practical objectives are pursued, including the generation of a model corresponding to a cluster or a class, the characterization of operating modes specific to a type of patient or a type of surgeon, the provision of advice to practitioners in the case of robotic surgeries that are not or not very well documented, the identification of the level of expertise of a practitioner, the prediction of the surgical procedure to be chosen according to the type of patient. These investigations will use dissimilarity measures based on temporal alignment, as DTW [SC71] or elastic kernels as proposed in [CVB07], [CB17] and [M19a]. This task will also address co-clustering for trajectories. The investigations will focus on how to combine time series with other types of data for a co-clustering purpose, using either deep learning [XCZ19] if enough data is available, symbolic representation [BBC15] or latent block [BLN20] models that all need to be adapted to the specificity of kinematics data.

Once a cluster or a class is obtained, another task will be to compute an average trajectory from a set of trajectories. The practical objectives will be the following: highlight deviations from the average trajectory that are potentially interpretable (as characteristics of the practitioner, or of the patient, for example) ; identify the best operating mode to young practitioners or trainees if it is possible to correlate the operating mode with clinical results. Intuitively, on the graphical representation of a time series, variability related to temporality (phase) concerns the abscissa axis, and variability related to shape concerns the ordinate axis. To compute a consensus trajectory, the second task of the package will examine how to extract the atemporal form and the variable component related to temporality, assuming that this atemporal form may be interpreted as an approximation of the consensus. The problem of shape and phase separation has been studied in [PZ16], [SSV10] and [M19a]. The second task will examine how to improve the preliminary work in [M19b], notably by proposing other kernels.

[BBC15] A. Bondu, M. Boullé, A. Cornuéjols (2015) Symbolic representation of time series: a hierarchical coclustering formalization. In : International Workshop on Advanced Analysis and Learning on Temporal Data, pp. 3-16.

[BLN20] R. Boutalbi, L. Labiod, M. Nadif (2020) Tensor latent block model for co-clustering. International Journal of Data Science and Analytics, 1-15.

[CVB07] M. Cuturi, J.-P. Vert, O. Birkenes, T. Matsui (2007) A kernel for time series based on global alignments. In: IEEE International Conference on Acoustics, Seepch and Signal Processing, ICAPPS, vol. 2, pp. II–413–II–416.

[CB17] M. Cuturi, M. Blondel (2017) Soft-DTW: a differentiable loss function for time-series. In: International Conference on Machine Learning (ICML), 894-903.

[M19a] P.-F. Marteau (2019) Times series averaging and denoising from a probabilistic perspective on time-elastic kernels. International Journal of Applied Mathematics and Computer Science, 29 (2), 375-392.

[M19b] P.-F. Marteau (2019) On the separation of shape and temporal patterns in time series. Application to signature authentication. https://hal.archives-ouvertes.fr/hal-02373531v2.

[PZ16] V. M. Panaretos, Y. Zemel (2016) Amplitude and phase variation of point processes. The Annals of Statistics, 44(2), 771-812.

[SC71] H. Sakoe, S. Chiba (1971) A dynamic programming approach to continuous speech recognition. In: ICA, Paper 20 CI3.

[SSV10] L. M. Sangalli, P. Secchi, S. Vantini, and V. Vitelli (2010) k-mean alignment for curve clustering. Computational Statistics and Data Analysis, 54(5), 1219-1233.

[XCZ19] D. Xu, W. Cheng, B. Zong et al. (2019) Deep co-clustering. In: SIAM International Conference on Data Mining (SDM), 414-422.

Profil du candidat :
Documents to be provided :

Profile with Doctorate:
– detailed Curriculum Vitae including a complete list of publications
– letter of motivation indicating the candidate’s research interests and achievements to date,

– a selection of publications,

– letters of recommendation for the current year,

– contact details of two referees (at least) with whom the candidate has worked (first name, surname, status, institution (give details of acronyms if applicable), city, e-mail address, telephone number)

Profile with Master degree:
– detailed Curriculum Vitae
– letter of motivation,

– Master 2 marks (with rank and number of students in the year)
– letters of recommendation for the current year,

– contact details of two referees (at least) with whom the candidate has worked (first name, surname, status, institution (give details of acronyms if applicable), city, e-mail address, telephone number)

Questions or application files (zip archive only) should be sent to the four contact persons below:

simon.malinowski@irisa.fr

christine.sinoquet@univ-nantes.fr

pierre-francois.marteau@univ-ubs.fr

pierre.jannin@univ-rennes1.fr (SPARS project leader)

Simon Malinowksi http://people.irisa.fr/Simon.Malinowski/

Christine Sinoquet https://christinesinoquet.wixsite.com/christinesinoquet

Pierre-François Marteau https://people.irisa.fr/Pierre-Francois.Marteau/

Pierre Jannin https://medicis.univ-rennes1.fr/members/pierre.jannin/index

Formation et compétences requises :
PhD Degree in computer Science
Knowledge of machine learning with temporal data

Adresse d’emploi :
IRISA
Campus de Beaulieu
Rennes

Apprentissage semi- et auto-supervisé exploitant du clustering avec connaissances

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFO
Durée : 6 mois
Contact : thi-bich-hanh.dao@univ-orleans.fr
Date limite de publication : 2023-01-31

Contexte :
La cartographie du potentiel minéral consiste principalement à déterminer le lien statistique entre un ensemble d’occurrences minérales (points) et une carte géologique (polygones) dans le but d’indiquer des zones favorables en termes de potentiel minier. La majorité de ces cartes de favorabilité sont générées par des techniques numériques, et notamment depuis quelques années par des méthodes d’intelligence artificielle. Cependant les méthodes actuelles comportent des défauts liés à la qualité des données, à la présence d’approximations infondées et à l’utilisation de méthodes supervisées sur des données majoritairement non annotées [1,2]. Nous nous intéressons à explorer de nouvelles pistes pour améliorer la précision de la cartographie prédictive du potentiel minéral par le couplage d’une part de l’intégration de connaissances géologiques dans des algorithmes de clustering afin d’obtenir des clusters mieux fondées géologiquement, et d’autre part de l’utilisation de méthodes d’apprentissage semi-supervisé ou auto-supervisé pour la construction de carte.

Ce sujet s’intègre dans le cadre du projet ANR Contrats doctoraux IA.iO Artificial Intelligence in Orléans: Learning from heterogeneous data and expert knowledge. Applications in geological and environmental sciences. Le stage sera encadré conjointement par des membres du LIFO et des membres du BRGM. Un financement de thèse est prévue suite à ce sujet.

Sujet :
L’objet du stage est d’étudier les deux volets :
utilisation de méthodes de clustering existantes et intégration de connaissances [3,4,5] en vue d’améliorer les données d’entrées des modèles de prédictivité minérales. Les connaissances géologiques sont des ontologies développées au BRGM.
étude de méthodes semi-supervisées ou auto-supervisées pour détecter des anomalies sur la carte géologique en tirant partie de l’apprentissage non-supervisé (clustering). Le résultat du clustering sera utilisé avec peu de données labellisées pour améliorer le modèle de prédiction d’apprentissage semi-supervisé ou auto-supervisé [6, 7].
Les solutions à étudier incluent l’apprentissage non-supervisé, et l’apprentissage profond avec faible supervision.

Travail attendu :
– Rapport d’étude des méthodes d’apprentissage non-supervisé sur les données géologiques.
– Rapport d’étude des méthodes auto- et semi- supervisées existantes tirant partie de l’apprentissage non-supervisé.
– Etude et implémentation d’une nouvelle méthode (ou amélioration d’une méthode existante)

Profil du candidat :
– Profil Informatique, machine learning ou mathématique appliquée.
– Capacité de synthèse et de rédaction permettant une restitution régulière, claire et efficace du travail effectué.

Formation et compétences requises :
Master et/ou école d’ingénieur en Mathématiques/Informatique

Adresse d’emploi :
Les candidats sont encouragés à nous contacter au plus tôt possible. Envoyez nous votre candidature à Thi-Bich-Hanh Dao (thi-bich-hanh.dao@univ-orleans.fr) en joignant votre dossier en un seul fichier pdf, comprenant un CV, une lettre de motivation et vos relevés de notes depuis le baccalauréat. Les documents peuvent être en anglais ou en français.

Document attaché : 202212150852_Stage-2023.pdf

Ingénieur(e) de recherche – Développement d’un environnement digital des plateformes scientifiques

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CEDRIC, CNAM
Durée : 12 mois
Contact : elena.kornyshova@cnam.fr
Date limite de publication : 2023-01-31

Contexte :
Le Conservatoire National des Arts et Métiers (CNAM) et l’Institut de Radioprotection et de Sûreté Nucléaire (IRSN, i.e. l’expert public en matière de recherche, d’expertise et de surveillance relatives à la sûreté nucléaire et aux risques radiologiques liés à la protection de l’homme et de l’environnement) se sont associés dans un projet commun de Cartographie Immersive Etendue (CIE) afin d’innover l’environnement digital des chercheurs. Dans ce cadre, nous recrutons un ingénieur de recherche dont la mission est de proposer les premières fonctionnalités du projet CIE intégrant une démarche de fouille de processus, base des enjeux de suivi et d’adaptation du dispositif au besoin des chercheurs.

Sujet :
L’IRSN exploite un ensemble d’installations expérimentales, d’équipements scientifiques et techniques, de moyens de métrologie et de moyens mobiles spécialisés d’intervention. Ces moyens sont regroupés par Plateformes Scientifiques et Techniques (PST). Le projet de Cartographie Immersive Etendue (CIE) a pour objectif de mettre en place un environnement digital facilitant la vie au quotidien des chercheurs (chercheurs # les équipes de recherche – chef de laboratoire, techniciens, ingénieurs, chercheurs, thésards…) utilisant des PST. Ce projet vise à recentrer le chercheur sur ses activités de recherche en améliorant/optimisant ses activités périphériques : partage/diffusion d’informations en interne de l’organisation, animation de communautés internes et externes, promotion scientifique, suivi économique/contractuel simplifié…
La mission couvre le périmètre de l’exploitation des données des PST (Base de données web – utilisation de la solution : https://www.bdi.fr/fr/plateforme-craft/) dans 2 espaces communautaires distincts (Digital workplace multi-PST et Digital workplace dédié à une PST spécifique – utilisation de la solution : https://www.jalios.com/). L’utilisation de la visite virtuelle comme levier d’adhésion pourra être prise en compte (Outil utilisé – https://vrtice.com/).
Travaux à réaliser :
• Préparer un état de l’art des travaux existants dans le domaine des dispositifs d’UX et d’EX applicables au contexte du périmètre ;
• Consolider l’analyse des besoins des utilisateurs menée par l’Université de Nice afin d’identifier notamment la liste des exigences fonctionnelles et techniques ;
• Participer à la définition de l’architecture cible de l’environnement digital en tenant compte du système d’information en place et des règles d’urbanisation ;
• Faire des recommandations de fouille de processus intentionnel pour une amélioration de l’efficacité des dispositifs et le renforcement de l’adhésion des utilisateurs ;
• Sur la base de l’analyse des besoins, et des dispositifs pilotes, coordonner la réalisation de POCs (support d’un alternant M2) intégrant le monitoring de fouille de processus.

Profil du candidat :
Bac+5 en Informatique.
Publications souhaitées.
Autonomie

La candidature doit inclure :
– Curriculum Vitae à jour ;
– Lettre de motivation ;
– Le rapport de master ;
– Les publications liées aux travaux de recherche du candidat ;
– Eventuellement une ou plusieurs lettres de recommandation.

Formation et compétences requises :
Compétences en ingénierie des systèmes d’information, fouille de processus, programmation Web

Adresse d’emploi :
2, rue Conté, 75003, Paris

Poste MCF , Toulouse 3 (IRIT)

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : Toulouse 3 IRIT
Durée : permanent
Contact : morvan@irit.fr
Date limite de publication : 2023-02-28

Contexte :
La personne recrutée sera rattachée à la FSI de l’Université Paul Sabatier et effectuera ses recherches au sein du laboratoire IRIT

Sujet :
Systèmes de gestion de données efficaces dans des environnements Clouds

Profil du candidat :
Le laboratoire a comme objectif de recruter des personnes ayant un dossier scientifique de grande qualité, qui
l’enrichissent par une ouverture et une indépendance scientifiques, et un réseau national et international.
Le (la) candidat(e) devra démontrer une autonomie scientifique qui s’exprimera au travers de son parcours,
d’un programme de recherche pour les 3 à 5 ans à venir, et d’un projet d’intégration à l’IRIT.
Une mobilité thématique ou géographique sera un plus pour le (la) candidat(e). Il est souhaitable qu’un(e)
candidat(e) ait une expérience de recherche avérée avec des collègues autres que ses encadrant(e)s de thèse.

Formation et compétences requises :
https://www.irit.fr/wp-content/uploads/2022/11/UT3-FSI-MCF27-Gestion-donne%CC%81es.pdf

Adresse d’emploi :
Université Paul Sabatier, Toulouse 3
Laboratoire IRIT

Enhancing earthquake location with domain adaptation

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut de Physique du Globe de Paris, Université
Durée : 6 mois
Contact : seydoux@ipgp.fr
Date limite de publication : 2023-01-30

Contexte :
Earthquakes express stress release in active geological objects and provide information about the underlying physical processes, such as fluid migrations and stress perturbations [1]. Therefore, our primary motivation is to form accurate seismic catalogs to enable precise monitoring of such active systems. The quality of seismic catalogs involves detection capabilities and location accuracy and depends on the geometry of the seismic station arrays [2] and the background seismic noise [3]. Since the 2000s, seismologists have densified and extended seismic networks in different seismically active areas to build high-quality catalogs [4]. This is the case of the eruption in Mayotte that triggered the deployment of ocean-bottom seismometers and land seismic sensors in the area [5]. The earthquake catalogs inferred in those areas prove of high quality, providing a better understanding of the region’s dynamics thanks to high-resolution seismic catalogs illuminating the geophysical features. But ocean- bottom seismometers are often deployed temporarily because of their maintenance cost, providing time-limited, high-quality data.

References:
1. Namiki, A. et al. Volcanic activities triggered or inhibited by resonance of volcanic edifices to large earth- quakes. Geology 47, 67–70 (2019).
2. Poiata, N., Satriano, C., Vilotte, J.-P., Bernard, P. & Obara, K. Multiband array detection and location of seismic sources recorded by dense seismic networks. Geophys. J. Int. 205, 1548–1573 (2016).
3. Longuet-Higgins, M. S. A theory of the origin of microseisms. Philosophical Transactions of the Royal Society of London. Series A, Mathematical and Physical Sciences 243, 1–35 (1950).
4. Rost, S. & Thomas, C. Array seismology: Methods and applications. Reviews of geophysics 40, 2–1 (2002).
5. Saurel, J.-M. et al. Mayotte seismic crisis: building knowledge in near real-time by combining land and
ocean-bottom seismometers, first results. Geophysical Journal International 228, 1281–1293 (2022).

Sujet :
This work aims to correct the systematically biased hypocenters obtained with a permanent seismic array from the hypocenters inferred with a temporary array with an adequate geometry, as illustrated in the figure below. We consider the case of Mayotte to develop the method and show the potential outcomes on other datasets of interest. We will learn the catalog bias from the events detected with the trusted array over five weeks and test the prediction quality over one week. Once successful, we will deploy the technique over several years of continuous data at Mayotte and other contexts.

Profil du candidat :
We seek candidates with a strong taste for programming, physics, and inverse problem-solving. A motivated candidate for learning about and applying artificial intelligence techniques is strongly preferred. The target programming language is Python, although we are open to other suggestions. We plan to use the Scikit-Learn library or the PyTorch framework to develop the strategy, or equivalent in other languages.

Formation et compétences requises :
Data science
Programming
Signal processing
Physics/Seismology

Adresse d’emploi :
Institut de Physique du Globe de Paris
1, Rue Jussieu, 75005 Paris

Document attaché : 202212131255_DiiP_Master_2023.pdf

FSEP IR à la Plateforme CorTexT, Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS), Champs sur Marne, Paris

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIS / Plateforme CorTexT
Durée : FSEP
Contact : lionel.villard@esiee.fr
Date limite de publication : 2023-01-15

Contexte :
La plateforme CorTexT est localisée sur le campus de l’Université Gustave Eiffel, dans l’Est Parisien, au sein du Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS). Fondée en 2009, elle est une infrastructure de recherche expérimentale pour les sciences sociales. La plateforme CorTexT est un instrument essentiel, par exemple, pour analyser la structuration des communautés d€experts dans différents secteurs de politique internationale, la transformation des réseaux d’innovation industrielle, ou encore la compréhension de la structure des discours et des modes d’action collective dans les controverses politiques en ligne.
Une partie importante des méthodes originales produites sont mises à disposition au sein de l’application web collaborative CorTexT Manager (https://www.cortext.net/anf-tdm-2021-focus-cortext-manager/). En 2021, 1313 utilisateurs actifs provenant de 550 institutions ou villes identifiées ont eu une activité avec les services de la plateforme CorTexT, générant 66 000 calculs traités par son infrastructure. 10% de cette communauté d€utilisateurs est académique (https://www.cortext.net/publications/). Ces auteurs ont publié depuis 2012 plus de 275 documents (articles scientifiques, actes de conférence, thèse…).
Le pilotage de la plateforme CorTexT est assuré par son directeur technique, Philippe Breucker, et son directeur scientifique, Lionel Villard, et est composé de quinze membres aux compétences et profils très variés : ingénieur.e.s (systèmes, backend, front-end et données), ingénieur.e.s d’étude et enseignants-chercheurs. L’ingénieur-e de recherche s’intégrera à cette équipe, échangera avec ces différents profils, et participera à l’avancement des travaux de la plateforme.

Sujet :
A cheval entre la BAP D et la BAP E, la mission de l’ingénieur-e de recherche est de concevoir et mettre en œuvre des développements informatiques pour l’analyse de données en sciences sociales au sein de la plateforme CorText, l€infrastructure de recherche pour les sciences sociales computationnelles du Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS).

Profil du candidat :
-Contribuer à la réflexion sur les techniques et les méthodes de la plateforme CorTexT et du LISIS
-Effectuer une veille sur les méthodes en émergence dans le champ des sciences sociales computationnelles (Social Network Analysis/SNA, Natural Language Processing/NLP, Complex Systems€)
-Etre force de proposition par une production scientifique originale dans ce champ, soutenue par une production logicielle
-Participer aux accompagnements de projets de recherche réalisés avec la plateforme sur les sciences, les techniques et l’innovation en société (domaine d’ancrage du laboratoire)
-Travailler à l’interface entre l’équipe technique de la plateforme (et sa direction) et les chercheurs du laboratoire
-Participer aux actions de valorisation et de dissémination (présentation de travaux en conférence, communication externe, formations à l’outil CorTexT Manager, animation du forum de questions/réponses des utilisateurs, …)
-Participer aux transformations de la ferme de serveurs de la plateforme et de la production logicielle (essentiellement autour de la construction de services web) de la plateforme en relation avec ses ingénieur.e.s
-Poursuivre le développement des derniers ensembles de méthodes travaillés au sein de la plateforme (e.g., analyse de réseaux géographiques, modèle à blocs stochastiques)
-Développer et formaliser des méthodes permettant la production, le recueil ou l’analyse des données ou de corpus

Formation et compétences requises :
Savoirs :
-Compétences poussées en statistiques (voire mathématiques) et informatique
-Compréhension de la diversité de méthodes quali-quanti en sciences sociales et de leurs enjeux et applications est souhaitable
-Connaissance des enjeux méthodologiques autour des techniques d’enquête en ligne en SHS, et sur les sources de données du web
-Connaissances en inférence statistique, éventuellement de la modélisation stochastique et de la comparaison de modèles
-Connaissances en ergonomie et interfaces humain-machine est un plus
-Capacité à mobiliser à la fois les référentiels du traitement automatique de la langue ainsi que celui de la modélisation et de l’analyse des réseaux et, à défaut, avoir une connaissance fine de l’un de ces deux champs serait appréciée

Savoirs faire :
-Maîtrise des démarches classiques en NLP : collecte de données, structuration, pré-traitement (lemmatisation, tokenisation), traitements et visualisation
-Maîtrise des démarches classiques en SNA : collecte de données, structuration, choix de représentation (projections, hypergraphes), traitements et visualisation
-Maitrise fine d€au moins un langage serveur
-Maîtrise d’outils de manipulation, analyse, modélisation statistique et visualisation de réseaux
-Maîtrise d’outils d’analyse automatique de la langue
-Maitrise d’outils d€interrogation et manipulation de données
-Maitrise des outils et méthodes de développement collaboratif
-Maîtrise de bibliothèques de visualisation de données
-Connaissance des formats de stockage de données

Savoirs-être :
-Travail en équipe et sens du collectif
-Sens de la communication, notamment dans l’organisation du dialogue entre savoirs «ingénieuriques» et sciences sociales
-Adaptabilité
-Curiosité
-Autonomie
-Rigueur

Adresse d’emploi :
CorText Platform,
Laboratoire Interdisciplinaire Sciences Innovations Sociétés
2 Allée Jean Renoir
93 160 Noisy-le-Grand
France

SimPa : Similarité entre Patients

Date : 2023-03-13
Lieu : Paris Santé Campus
2 – 10 Rue d’Oradour-sur-Glane
75015 Paris
France

L’objectif de la journée SimPa est double :

  • documenter les cas pratiques en santé dans lesquels les méthodes de calcul de similarité entre patients sont utiles;
  • documenter les solutions existantes, par exemple, mais sans y être limité, pour les systèmes fondées sur des méthodes d’apprentissage automatique.

En bref, nous espérons que cette journée permettra une rencontre des communautés d’informatique médicale,  santé publique et traitement
automatique de la langue et d’échanger sur la recherche de contenus textuels « similaires » en TAL.

Les communications sollicitées concernent les thématiques suivantes, sans y être limitées pour autant :

  • Définition et identification des phénomènes de similarité textuelle en santé, explorant un continuum allant de l’identité des chaînes de caractères à la similarité sémantique et thématique entre documents ;
  • Retours d’expérience sur l’utilisation de systèmes de TAL pour la détection de similarité en santé ;
  • Identification de « cas similaires » : cohortes de patients, inclusion dans des essais cliniques, dossiers patients dupliqués,…
  • Représentation de patients, modèles “deep patient”
  • Similarité multimodale incluant le texte création de jumeaux numériques à partir de compte-rendus textuels, génération de données patient synthétiques (notamment des textes).

Les travaux portant sur d’autres langues que le français sont les bienvenus.

Les communications pourront sans restriction concerner des travaux déjà publiés, des résultats préliminaires non publiés, ou être des points de vue sur le domaine. Les propositions de communications orales sont attendues avant le 20 janvier 2023 sous la forme d’un résumé de 2 pages maximum (hors référence). Le style des soumissions doivent suivre le style TALN disponible ici. Les soumissions se feront sur https://easychair.org/conferences/?conf=simpa2023.

Présentations invitées :

  • Nicolas Fiorini (R&D, Algolia, Paris)
  • Nigam Shah (Stanford, à distance)

Dates importantes :

– Soumission des résumés : 20 Janvier 2022
– Notification aux auteurs et autrices : mi ou fin février 2023
– Date de la journée  : lundi 13 mars 2023

Organisation :

  • Adrien Coulet, équipe HeKA, Inria, Inserm, UPCité
  • Christel Gérardin, APHP, IPLESP
  • Aurélie Névéol, Université Paris Saclay, CNRS, LISN
  • Xavier Tannier, Sorbonne Université, LIMICS

Comité scientifique :

  • François Antonini, Assistance Publique Hôpitaux de Marseille
  • Sandra Bringay, Université Paul Valery, Montpellier 3, LIRMM
  • Vincent Claveau, CNRS, IRISA
  • Natalia Grabar, CNRS, STL
  • Thomas Guyet, Inria Lyon 
  • Vianney Jouhet, CHU de Bordeaux, BPH
  • Lina Soualmia, Université de Rouen Normandie, LITIS
  • les membres du comité d’organisation

 

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

apprentissage automatique pour la prévision météorologique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : UMR SPE
Durée : 5 à 6 mois
Contact : paoli_c@univ-corse.fr
Date limite de publication : 2023-01-30

Contexte :
Ce stage s’inscrit dans le cadre du projet ANR SAPHiR1 (“Sensor Augmented weather Prediction at HIgh Resolution”) coordonné par le laboratoire Sciences Pour l’Environnement (SPE) UMR CNRS 6134. Ce programme scientifique consiste à proposer de nouvelles méthodes de prévision d’événements météorologiques rares et extrêmes à haute résolution spatiale et temporelle. Dans ce contexte, deux missions complémentaires sont envisagées, la première orientée analyse de données et Machine Learning (ML), la seconde orientée ingénierie logicielle.

Sujet :
Missions : deux missions complémentaires sont envisagées
1. ML : le stagiaire aura pour mission de développer des codes informatiques permettant de prédire des séries temporelles environnementales, basés sur des techniques et architectures de Deep Learning. Le stagiaire participera également à l’analyse et la gestion des données hétérogènes nécessaire au projet : données météorologiques historiques, données issues de capteurs, données Lidar SAETTA2, images satellites, etc.
2. Ingénierie logicielle : le stagiaire aura pour mission de réaliser une application Web/mobile (multi-plateformes type Flutter) pour la visualisation grand-public des données et résultats de simulation. Le stagiaire participera à la réflexion de l’architecture du SI de SAPHIR : déploiement continu, structuration des codes, etc.

Profil du candidat :
Profil recherché : Bac+5 Informatique – Mathématiques

Modalité de candidature : envoyer un mail à paoli_c@univ-corse.fr en joignant un CV, une lettre de motivation et vos relevés de notes postbac. Un classement en année n-1 serait un plus nous permettant de bien compléter le dossier.

Formation et compétences requises :
Compétences requises : Développement Web/Mobile – Analyse de données – Machine Learning – Python – Gestionnaire de versions – autonomie – intérêt pour la recherche et le travail en équipe.

Adresse d’emploi :
UMR SPE 6134 – Université de Corse – Travail possible en télétravail occasionnel

Document attaché : 202212130946_2022-12-09-cpaoli-offreStageM2-Saphir.pdf