Classification de lésions intrahépatiques en histopathologie par apprentissage profond (deep learning)

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CReSTIC
Durée : 4 à 6 mois
Contact : eric.desjardin@univ-reims.fr
Date limite de publication : 2023-01-31

Contexte :
Les cholangiocarcinomes représentent un groupe hétérogène de cancers développés à partir des canaux biliaires intra ou extra-hépatique. Le diagnostic est histologique, souvent réalisé sur biopsie. Il peut être difficile à établir en raison de la ressemblance morphologique de certains cholangiocarcinomes avec d’autres ou avec des lésions intra-hépatiques bénignes comme l’adénome ou l’hamartome biliaire.
Le but de ce projet est de développer un algorithme diagnostique basé IA permettant de prédire avec une précision optimale le diagnostic de malignité/bénignité des lésions ductulaires intra-hépatiques. Dans ce contexte, il s’agira d’explorer, développer et expérimenter des architectures de réseaux de neurones profonds permettant de classer ces lésions avec une prédiction diagnostique optimale.

Sujet :
Ce stage se positionne dans le cadre d’un projet pluridisciplinaire qui regroupe des experts en informatique, histopathologie et médecine associant IA et Imagerie médicale.
La première étape du projet s’est concentrée sur la collecte et l’annotation des données, la sélection des patients puis le recueil des données cliniques, la numérisation des lames et l’annotation des lames virtuelles.

Le stage proposé débute à la suite de ces travaux préalables sur les données. Le travail à réaliser concerne le développement d’algorithmique pour la classification des lésions histologiques sur les lames numérisées par réseaux de neurones convolutifs (deep learning). Le schéma d’analyse suivant est proposé :
• Segmentation des régions d’intérêt (ROI) annotées sous formes d’imagettes de même taille (tuiles) ; puis extraction de ces tuiles. Les lames numériques annotées entières étaient trop lourdes pour les analyses utilisant les réseaux de neurones convolutifs ; il est nécessaire de segmenter les régions annotées en petites imagettes (tuiles) le plus souvent de 256 pixels de côté pour réaliser les analyses. Le programme d’extraction permet de conserver les données d’annotation et la coordonnée de la tuile dans la lame afin de présenter les résultats de probabilité diagnostique sous forme de carte de prédiction sur la lame numérique.
• Développement et entraînement de réseaux de neurones convolutifs (CNN) alimentés par les tuiles extraites des ROI classées (bénin / malin) sur une cohorte d’entraînement. Si le modèle U-net est bien identifié dans le cadre du traitement des images en histopathologie computationnelle, diverses autres architectures de CNN et/ou prétraitements des données, méritent d’être investigués dans un objectif de recherche de la structure la plus efficace et la plus robuste. Cette phase est généralement très consommatrice en termes de ressources humaines et matérielles. La plateforme OpenMOLE sera la base de plans d’expérimentation de recherche des meilleurs solutions (architectures, paramètres, ensembles d’apprentissage et de validation…) grâce à une distribution automatisée des tâches sur des environnements de calculs intensifs et un recueil centralisé des résultats pour analyse.

Profil du candidat :
Le(la) candidat(e) sera en Master 2 ou en 3e année d’école d’ingénieur.

Formation et compétences requises :
Compétences impératives :
• Intelligence artificielle, machine learning, deep learning
• Programmation Python
• Librairies usuelles de deep learning (TensorFlow, Keras. . . )
• Analyse d’images
Compétences souhaitées mais non-indispensables :
• Imagerie histopathologique

Adresse d’emploi :
Université de Reims Champagne-Ardenne, site de Reims
Laboratoire CReSTIC, Campus Moulin de la Housse

Document attaché : 202211081618_CHOLANGIA.pdf

Research engineer or postdoctorate candidate on Semantic Web Technologies application to inteoperability between research data repositories

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LIG
Durée : 12 motns
Contact : Marie-Christine.Rousset@imag.fr
Date limite de publication : 2023-01-31

Contexte :
PerSCiDO platform (https://perscido.univ-grenoble-alpes.fr/) is an open platform for sharing research datasets in a way that makes them easily findable thanks to a user-friendly interface and semantic metadata enabling in particular to link datasets with related scientific publications and software. PerSCiDO promotes the use of standard identifiers to improve the visibility of datasets and to facilitate their linkage with related publications or source code. PerSCiDO is based on the Semantic Web technologies and the Linked Data principles. As a result, it can be easily extended to new metadata to describe datasets of varied domains. A distinguishing characteristics of PerSCiDO is that the description of datasets with rich metadata is decoupled with the storage od the datasets themselves, which facilitates its interoperability with other platforms.

Sujet :
After getting familiar with the current version of PerSCiDO, the goal is to extend the functionalities of the current version of PerSCiDO in two directions: first, to take into account easily new metadata coming from standards of some domains ; second, to develop the interoperability of PerSCiDO with other existing or future research data repositories.

This position is funded by the European project FAIR-IMPACT (https://fair-impact.eu/fair-impact-expanding-fair-solutions-across-eosc) and the candidate will be hosted in the SLIDE group (https://www.liglab.fr/fr/recherche/equipes-recherche/slide) of the Laboratory of Informatics in Grenoble (LIG). This group develops scalable algorithms and infrastructures for data management, data mining, data linkage, ontology-based data access and crowdsourcing. SLIDE is involved in the FAIR-IMPACT WP6 aiming at making interoperable the tools and platforms for sharing research data in the European Open Science Cloud (EOSC). The candidate will participate to the regular meetings of the FAIR-IMPACT European project, and is expected to be source of proposals within Task 6.1 “Semantic and Technical core interoperability across domains”.He will also have to validate the proofs-of-concepts on a certain number of use cases defined in the project

Profil du candidat :
We are looking for a motivated research engineer or postdoctorate candidate, with a good experience of Semantic Web technologies (RDF, RDFS, SPARQL) and programming skills in pytho, with some experience in using docker and gitlab or github.

Formation et compétences requises :
PhD in computer science.
– Expertise in Semantic Web technologies (RDF, RDFS, SPARQL)
– Expertise in Python (framework Flask)
– Expertise in operating systems (Debian)
– Some experience on Gitlab and Docker

Adresse d’emploi :
he work will take place in the SLIDE group (https://www.liglab.fr/fr/recherche/equipes-recherche/slide) of the Laboratory of Informatics in Grenoble (LIG). This group develops scalable algorithms and infrastructures for data management, data mining, data linkage, ontology-based data access and crowdsourcing. SLIDE is partner of the European project FAIR-IMPACT (https://fair-impact.eu/fair-impact-expanding-fair-solutions-across-eosc) in which this offer will take place, more particularly in the WP6 that targets to make interoperable the tools and platforms for sharing research data in the European Open Science Cloud (EOSC).

Research engineer or postdoctorate candidate on Semantic Web Technologies application to inteoperability between research data repositories

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : LIG
Durée : 12 motns
Contact : Marie-Christine.Rousset@imag.fr
Date limite de publication : 2023-01-31

Handling missing values based on Deep learning and Attention Mechanism

Offre en lien avec l’Action/le Réseau : MACLEAN/Doctorants

Laboratoire/Entreprise : David, UVSQ
Durée : 6 mois
Contact : mustapha.lebbah@uvsq.fr
Date limite de publication : 2023-02-28

Contexte :
voir le fichier pdf

Sujet :
voir le fichier pdf
Handling missing values based on Deep learning and Attention Mechanism

Profil du candidat :
End of engineering degree, M2 in data science, statistics and/or artificial intelligence. Good experience in programming, especially with the PyTorch/deeplearning4j framework.

Formation et compétences requises :
End of engineering degree, M2 in data science

Adresse d’emploi :
aboratoire David, UFR des sciences, 45 avenue des
Etats-Unis, 78035 Versailles

Document attaché : 202211080645_internshipuvsq.pdf

Caractérisation des formalismes et performances de modèles de simulation de culture en grille pour le riz pluvial en Afrique de l’Ouest

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : TETIS
Durée : 6 mois
Contact : maguelonne.teisseire@teledetection.fr
Date limite de publication : 2022-12-19

Contexte :
Au sein du laboratoire TETIS à Montpellier, un modèle de simulation des cultures (SARRA, Baron et al,, 2005) a été proposé depuis plusieurs années. Il permet, sur la base d’un bilan hydrique dynamique simple, d’estimer l’impact de scénarios climatiques sur une culture annuelle. Sa déclinaison logicielle SARRA-H est spécifiquement adaptée à l’analyse d’impact du climat sur la croissance des céréales sèches (mil, sorgho, maïs, riz) et du rendement potentiel en milieu tropical. La version la plus récente de SARRA, SARRA-O (http://sarra-h-dev.teledetection.fr), introduit la possibilité de spatialiser les simulations de culture selon le principe de modèle de simulation de cultures en grille (gridded crop model, GCM). La littérature présente également des GCM adaptés d’autres plateformes de simulation de cultures (DSSAT, WOFOST, STICS…).
L’objectif de ce stage est de réaliser une comparaison des formalismes et des performances de SARRA-O avec des GCM alternatifs, en prenant comme cas d’étude le riz pluvial en Afrique de l’Ouest. Le riz est la culture vivrière la plus importante au monde, et on estime qu’il constitue l’aliment de base de la moitié de l’humanité. Les pays d’Afrique de l’Ouest sont fortement dépendants du riz pour leurs calories alimentaires. Cependant, une gestion inadéquate de l’eau, des sols et des cultures y compromet toujours la productivité du paddy. La production rizicole y est également menacée par la variabilité des précipitations annuelles, les fluctuations dans les dates de démarrage de saison, et l’augmentation de l’aridité. L’utilisation de GCM dans ce contexte répond donc à des enjeux liés notamment à la sécurité alimentaire.

Sujet :
L’objectif de ce stage est de positionner la suite SARRA-O par rapport à ses concurrents nationaux ou internationaux, en utilisant le riz pluvial comme cas d’étude. Cette comparaison suivra une grille d’évaluation à définir en adéquation avec les standards académiques. De façon plus précise, le travail à réaliser se décompose de la façon suivante :
1. Une familiarisation des différents concepts liés au modèle SARRA-O ;
2. Un état de l’art permettant de lister les modèles similaires à SARRA-O ou partageant les mêmes objectifs d’estimation de rendements ;
3. La définition d’une grille de comparaison des modèles selon principalement les données en entrée (incluant les différents paramètres et la calibration nécessaire selon le type de culture), la méthode adoptée, les données en sortie ;
4. La sélection avec l’équipe encadrante de 2 à 3 modèles alternatifs à SARRA-O ainsi que des mesures d’évaluation adaptées aux modèles choisis ;
5. La réalisation de simulations à partir des modèles sélectionnées, et leur évaluation face à des données observées sur le riz pluvial en Afrique de l’Ouest.

Le cas d’étude s’inscrit dans le cadre de travaux de TETIS sur l’impact du changement climatique sur le rendement du riz en Afrique de l’Ouest. Le/la stagiaire bénéficiera de l’aide d’un autre étudiant qui travaillera sur la calibration du modèle SARRA-O pour le cas du riz pluvial à partir d’un ensemble de données expérimentales d’Afrique de l’Ouest (Sénégal, Côte d’Ivoire) et de Madagascar.

Bibliographie :

Baron, C., Sultan, B., Balme, M., Sarr, B., Traore, S., Lebel, T., Janicot, S., & Dingkuhn, M. (2005). From GCM grid cell to agricultural plot: scale issues affecting modelling of climate impact. Philosophical Transactions of the Royal Society B: Biological Sciences, 360(1463), 2095–2108. https://doi.org/10.1098/rstb.2005.1741

Profil du candidat :
Dernière année Ingénieur agro ou Master 2 ou (stage de césure ou de fin d’études)

Formation et compétences requises :
Le stage exige des connaissances de base en agronomie, une bonne maîtrise du langage de programmation Python (+ librairies Pandas et Numpy), une aisance à la manipulation de fichiers et de l’appétence pour les approches de modélisation.
Une bonne maîtrise écrite de l’anglais (lu) est indispensable.

Adresse d’emploi :
UMR TETIS (Territoires, Environnement, Télédétection et Information Spatiale)
Maison de la Télédetection
500, rue J.F.Breton 34093 MONTPELLIER Cedex 5

Document attaché : 202211071542_Offre de stage état des lieux modélisation.pdf

Internship proposal: Domain Adaptation by using Riemannian Geometry for Remote Sensing Data

Offre en lien avec l’Action/le Réseau : MACLEAN/– — –

Laboratoire/Entreprise : LISTIC, University Savoie Mont-Blanc
Durée : 6 months
Contact : guillaume.ginolhac@univ-smb.fr
Date limite de publication : 2023-04-01

Contexte :
Domain Adaptation is a field of machine learning that consists of developing learning techniques with a different set of training and test data [Moreno-Torres et al., 2012]. This type of methods is
interesting because it allows either to strongly limit the training phase and thus achieve frugality, or to do supervised learning in domains with very little labeled data. A significant number of techniques are used to address this problem such as methods based on optimal transport [Courty et al., 2017]. On the other hand, Riemannian geometry has shown its interest in learning when the features used in classification are subject to constraints such as covariance matrices in EEG [Barachant et al., 2012]. Similarly, in a recent work, it has been shown that these mathematical tools are robust to transformations of the training data [Collas et al., 2022]. The performance loss is then very small if we
consider several features and their associated geometry.

Sujet :
We propose to apply more specifically the tools of Riemannian geometry to the problem of domain adaption. More particularly, we propose to study the interest of deep networks specific to covariance matrices and their associated layers. These networks are based on different Riemannian geometry tools and have shown good performances in computer vision. In particular, we will rely on the following papers [Li et al., 2017, Huang and Gool, 2017] proposing specific layers for covariance matrices. With the help of these papers, the work of the trainee will first consist in assessing the interest of these networks for domain adaptation.

Then we will develop new learning methods to study multivariate image time series in remote sensing. Specifically, we will adapt the networks used in [Rußwurm et al., 2020] by adding covariance matrix specific layers inspired by [Li et al., 2017, Huang and Gool, 2017]. The application goal is then to classify agricultural fields which is practically impossible without temporal information.

Finally, we will test the previously developed approaches on the dataset [pas, ] which contains time series of optical and SAR images over the same period. We will then be able to perform the learning phase on the optical images and measure the performance loss by applying our algorithms on the SAR data. Indeed, many optical data are labeled which is much rarer for SAR images because they are often a little noisier and a little more difficult to analyze for non-specialists. On the other hand, they are very interesting because they allow a better periodicity and give relevant information even at night or in the presence of clouds.

Profil du candidat :
Master/Engineering student with knowledge in statistics and machine learning (having followed courses on these topics is strongly advised). Good coding skills in Python.

Formation et compétences requises :
Master/Engineering student with knowledge in statistics and machine learning (having followed courses on these topics is strongly advised). Good coding skills in Python.

Adresse d’emploi :
LISTIC, Annecy, FRANCE

Document attaché : 202211071629_FrugalDomainAdaptationRADAR.pdf

Fusion methods of multispectral data with multiple resolutions and missing entries. Application to Sentinel-2 and Sentinel-3 images

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LISIC
Durée : 6 mois
Contact : matthieu.puigt@univ-littoral.fr
Date limite de publication : 2023-02-01

Contexte :
The satellite observation of our planet has known important instrumental advances for several decades, with significant developments in terms of spatial resolution (e.g., in water color remote sensing, with a high spatial resolution of 10-60 m) and in terms of spectral resolution (hyper-spectral imagery). A Multi-Spectral (MSI) or Hyper-Spectral Image (HSI) consists of a data cube whose two axes describe the spatial variations and one axis describes the spectral variations. The main difference between HSI and MSI lies in the very small number of spectral bands observed in the latter.

However, due to physical constraints, increasing the number of spectral bands in HSI implies a decrease of the spatial resolution. Therefore, today, our planet is observed by MSI sensors (with a good spatial resolution but a low spectral one), HSI sensors (with a good spectral resolution but a low spatial one), and imagers with intermediate properties.

In the framework of this internship, we are interested in coastal marine observation via data from the Sentinel-2 and Sentinel-3 satellites. The images obtained by these two satellites allows to study the color of the ocean, i.e., the spatial and temporal distribution of the concentration of phytoplankton, suspended matter, and organic matter. Sentinel-2 data consists of cubes with 13 spectral bands for a spatial resolution varying from 10 to 60~m (depending on the bands), acquired approximately every 5 days. Sentinel-3 data are cubes with 21 spectral bands for a spatial resolution of 300~m, which are daily acquired. In marine observation, to understand the complex phenomena occurring in coastal environments, the data available must combine:
– a good spectral resolution to better analyze the biogeochemical medium (chlorophyll, particles in suspension, etc.);
– a good spatial resolution to better understand the distribution phenomena of this environment which are much more complex in a coastal environment than in the open sea;
– a short period of acquisition of these images to identify phenomena that are very concentrated in time (phytoplankton blooms for example).

No satellite data currently allows these three constraints to be met.

Sujet :
Our recent work on multi-sharpening [1,2], in spatio-temporal fusion [3], and in spatial-(spectral-)temporal fusion [4] allowed us to initiate some work on different problems.

In the framework of this internship, we propose to jointly process Sentinel-2 and Sentinel-3 data approximately acquired at the same time (spatial-spectral fusion aka multi-sharpening), in order to generate new MSI data with the number of spectral bands of Sentinel-3 and the spatial resolution of Sentinel-2. However, this internship significantly differs from our previous work as follows:
1. We aim to process data on which atmospheric correction we performed [5], so that a comparison with in situ measurements is possible. However, this processing provides new issues such as missing entries (corresponding to land areas, clouds, and ships) or negative values without any physical meaning.
2. We aim to jointly process the three Sentinel-2 spatial resolutions with the unique Sentinel-3 one, thus hoping improving the fusion quality.
3. We aim to perform comparisons with in situ measurements.

The considered methods will use a regularized matrix / tensor factorization formalism and/or a deep-learning formalism.

References:
[1] A. Alboody, M. Puigt, G. Roussel, V. Vantrepotte, C. Jamet, and T. K. Tran. Experimental comparison of multi-sharpening methods applied to Sentinel-2 MSI and Sentinel-3 OLCI images. In Proc. IEEE WHISPERS’21, 2021.
[2] A. Alboody, M. Puigt, G. Roussel, V. Vantrepotte, C. Jamet, and T. K. Tran. DeepSen3: Deep multi-scale learning model for spatial-spectral fusion of Sentinel-2 and Sentinel-3 remote sensing images. In Proc. IEEE
WHISPERS’22, 2022.
[3] C. T. Cissé, A. Alboody, M. Puigt, G. Roussel, V. Vantrepotte, C. Jamet, and T. K. Tran. A new deep learning method for multispectral image time series completion using hyperspectral data. In Proc. IEEE ICASSP’22, 2022.
[4] A. Hadir, A. Alboody, M. Puigt, G. Roussel, V. Vantrepotte, C. Jamet, and T. K. Tran. S2S3-STFGAN: a GAN-based spatio-temporal fusion method for sentinel-2 and sentinel-3 data. Submitted.
[5] F. Steinmetz and D. Ramon. Sentinel-2 MSI and sentinel-3 OLCI consistent ocean colour products using POLYMER. In Proc. SPIE “Remote Sensing of the Open and Coastal Ocean and Inland Waters”, volume
10778, 2018.

Profil du candidat :
Pursuing scientific studies in the field of data sciences (signal and image processing, computer science with a focus in artificial intelligence / machine learning, applied mathematics), you are curious and very comfortable in programming (Matlab, Python). You read and speak fluent English with ease. Although not compulsory, a first experience in data factorization (e.g., matrix or tensor decomposition, blind source separation, dictionary learning) or in deep learning will be appreciated.

Formation et compétences requises :
To apply, please send an e-mail to {claire.guilloteau, matthieu.puigt, gilles.roussel} @univ-littoral.fr while attaching the documents that can support your application:
– your resume;
– a cover letter;
– your transcripts for the last year of B.Sc, the first year of M.Sc, and the last year of M.Sc (if the latter is available);
– two reference letters or the names and means of contact of two academic advisers.

Adresse d’emploi :
The internship will take place in the new Longuenesse branch of LISIC laboratory which is currently dedicated to hyperspectral imaging. Today, this recently created branch has 6 faculty members, 1 post-doctoral researcher, and 4 Ph.D. students. The internship will take place in Longuenesse, Northern France.

Many exchanges will take place with the LOG laboratory, located in Wimereux, Northern France. The LOG will bring its skills on ocean color, in particular on the analysis of merged images and their validation. The LOG will provide in-situ validation measurements and images in coastal areas of interest (Eastern Channel, Guyana, Cambodia, Vietnam).

Both laboratories are located in the heart of the Regional Natural Park of “Caps et Marais d’Opale”, close to Lille, England, Belgium, and Northern Europe (Amsterdam is only 4~h drive from Longuenesse).

Document attaché : 202211022108_Stage_SFR_2023_LISIC_LOG_English.pdf

Maître-assistant associé en Apprentissage statistique et Aide à la décision pour l’Industrie et les territoires du futur

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Mines Saint-Etienne
Durée : 12 mois
Contact : batton@emse.fr
Date limite de publication : 2022-11-15

Contexte :
Mines Saint-Etienne recrute un Maître Assistant Associé (équivalent post-doc) pour 12 mois en sciences des données ‘Apprentissage statistique et aide à la décision pour l’industrie et les territoires du futur’. Le poste proposé est ouvert au sein du département GMI (Génie Mathématique et Industriel) avec des activités de recherche développées dans les axes SIC ou MAAD de l’UMR CNRS 6158 LIMOS.

Sujet :
La mission de recherche consiste à développer des travaux en lien avec l’un ou plusieurs de ces domaines : probabilités, statistiques, sciences de données, méta-modélisation pour l’estimation. Il est notamment attendu le développement d’approches en modélisation mathématique pour l’aide à la décision par processus aléatoires discrets ou continus en science des données.
La mission d’enseignement consiste à assurer des cours, des travaux dirigés et pratiques dans l’enseignement des mathématiques réalisé en formation initiale du cycle Ingénieur Civil des Mines (ICM) dans les domaines des méthodes numériques, probabilités et statistiques, science des données,

Profil du candidat :
Le candidat ou la candidate, titulaire d’un doctorat Mathématiques appliquées ou en Science des données (sections CNU n°26, n°61, n°24),

Formation et compétences requises :
Des compétences fortes dans le domaine des sciences de données et de l’apprentissage statistique, de l’aide à la décision. Ces compétences pourront intégrer la modélisation statistique de processus discrets et/ou continus, des approches fonctionnelles en science de données, des approches d’optimisation décisionnelle liées aux méthodes par renforcement ou de l’optimisation continue sous incertitude.

Adresse d’emploi :
Ces missions s’exerceront sur le Campus de Saint-Etienne (42) de Mines Saint-Etienne.

Document attaché : 202210281537_FAYOL_Maître_assistant_2022_sciences_des_données-FR v2.pdf

Utilisation des méthodes machine learning sur les données hospitalières de la pharmacie clinique pour l’identification automatique des erreurs de prescriptions médicamenteuses

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : SESSTIM, Faculté des Sciences Médicales et Paraméd
Durée : 5-6 mois
Contact : jean-charles.dufour@univ-amu.fr
Date limite de publication : 2023-03-31

Contexte :
Le Service transversal de Pharmacie Clinique et Soins Pharmaceutiques de l’APHM en collaboration avec le service BioSTIC de l’APHM et le SESSTIM (Unité Mixte de Recherche UMR1252 labélisée par l’Inserm, l’IRD et Aix-Marseille Université) cherche à améliorer la sécurité et la pertinence des ordonnances médicamenteuses via une analyse pharmaceutique détaillée, automatisée et systématisée. Pour cela l’utilisation de méthodes de Machine Learning sont envisagées.
Pour réaliser l’analyse des données, implémenter et évaluer les méthodes de Machine Learning un stage de 5 à 6 mois est proposé avec une gratification financière pour un(e) étudiant(e) niveau ingénieur ou master 2 en science des données ou intelligence artificiel. Le stage est à pourvoir dès février-mars 2023.

Sujet :
Il s’agit de contribuer à l’optimisation des prescriptions médicamenteuse. Le stage porte sur l’implémentation et l’évaluation de différentes méthodes de Machine Learning en utilisant des données de vie réelle (prescription hospitalière) de la pharmacie clinique. Le principe est d’évaluer et d’appliquer un ensemble de méthodes d’IA afin de faciliter et optimiser l’analyse automatisée des ordonnances médicamenteuses dans le contexte hospitalier.
Mission du stagiaire : Nettoyer et analyser les données. Rechercher et identifier des méthodes d’IA applicables sur ces données. Implémenter les méthodes, entrainer les modèles, sélectionner les modèles les plus performants. Documenter les développements réalisés.

Profil du candidat :
Capacité d’analyse et de synthèse, forte autonomie et esprit d’initiative, connaissances du métier de la santé appréciée, capacité de travailler en mode projet : rendre compte des avancements des travaux et communication des résultats, bonne communication à l’oral et à l’écrit (Français et/ou Anglais).

Formation et compétences requises :
Bonnes connaissances en machine learning et notamment algorithmes supervisés (SVM, Random Forest, Arbre de décision, Réseaux de neurones,…). Maîtrise d’environnement python.

Adresse d’emploi :
Faculté des sciences médicales et paramédicales, Marseille

Document attaché : 202210281005_Proposition-Stage-SESSTIM-PharmacoClin-ML-octobre2022.pdf

Managing the variability of complex software families using Polyadic Concept Analysis

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : DISP, Université Lyon 2
Durée : 6 mois
Contact : giacomo.kahn@univ-lyon2.fr
Date limite de publication : 2022-11-30

Contexte :
Des études menées au sein de plusieurs industries montrent que les éditeurs de logiciels ont tendance à produire des variantes de systèmes logiciels en réutilisant de manière ad-hoc des clones de projets précédents, aboutissant ainsi à des familles de logiciels similaires où chaque produit est géré et maintenu séparément. L’ingénierie des lignes de produits logiciels regroupe un ensemble de méthodes basées sur la réutilisation systématique d’artefacts logiciels afin de développer, maintenir et faire évoluer en parallèle un ensemble de variantes d’une même famille de logiciels. Cela permet de réduire le temps et le coût de développement et de maintenance de la famille de logiciels tout en augmentant sa qualité. La migration depuis une famille de produits logiciels vers une ligne de produits est donc une problématique essentielle partagée par de nombreux éditeurs de logiciels. La modélisation et la gestion de la variabilité, i.e., quels artefacts varient entre les variantes logicielles et comment, est un point central de ces méthodes.

Sujet :
L’ingénierie des lignes de produits multiples est un domaine émergeant qui se consacre à la représentation et la gestion de la variabilité dans des familles de logiciels qui sont considérés comme complexes du fait de leur hétérogénéité, de leur taille ou encore de leur architecture. Cette complexité donne lieu à des données pouvant inclure de multiples dimensions (e.g., caractéristiques logicielles, contexte et environnement, équipe de développement, dépendances avec d’autres systèmes) ce qui présente un réel défi lorsque l’on cherche à les analyser avec les techniques actuelles. La migration depuis une famille de logiciels complexes vers une ligne de produits multiples nécessite donc de reconsidérer et d’adapter les techniques traditionnelles de rétro-ingénierie de la variabilité afin de manipuler des données plus complexes.

L’objectif de ce stage est d’utiliser une extension de l’analyse formelle de concepts, l’analyse polyadique (PCA), qui permet d’extraire des motifs et des informations de données multi-dimensionnelles, afin d’extraire la variabilité d’un ensemble de familles de logiciels complexes.

Profil du candidat :
Master 2 informatique, avec des penchants pour le génie logiciel et les approches de représentation et d’extraction de connaissance.

Formation et compétences requises :
Ingénierie logicielle, représentation des connaissances

Adresse d’emploi :
Laboratoire Disp, pôle RTI, Université Lyon 2

Document attaché : 202210280931_23PropPCADISP_Fiche-appel-à-candidature.pdf

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

Classification de lésions intrahépatiques en histopathologie par apprentissage profond (deep learning)

Research engineer or postdoctorate candidate on Semantic Web Technologies application to inteoperability between research data repositories

Research engineer or postdoctorate candidate on Semantic Web Technologies application to inteoperability between research data repositories

Handling missing values based on Deep learning and Attention Mechanism

Caractérisation des formalismes et performances de modèles de simulation de culture en grille pour le riz pluvial en Afrique de l’Ouest

Internship proposal: Domain Adaptation by using Riemannian Geometry for Remote Sensing Data

Fusion methods of multispectral data with multiple resolutions and missing entries. Application to Sentinel-2 and Sentinel-3 images

Maître-assistant associé en Apprentissage statistique et Aide à la décision pour l’Industrie et les territoires du futur

Utilisation des méthodes machine learning sur les données hospitalières de la pharmacie clinique pour l’identification automatique des erreurs de prescriptions médicamenteuses

Managing the variability of complex software families using Polyadic Concept Analysis