Scene flow estimation for the measurement of growth induced plant movements

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube, Université de Strasbourg, CNRS
Durée : 6 mois
Contact : remi.allegre@unistra.fr
Date limite de publication : 2023-02-28

Contexte :
Le sujet proposé s’inscrit dans le contexte d’un projet de recherche de l’équipe Informatique Géométrique et Graphique du laboratoire ICube (Université de Strasbourg, CNRS) et de biophysiciens de l’Université Paris Diderot et de l’ENS Lyon. Le projet concerne l’étude des mouvements de croissance de plantes à partir de séquences de photographies prises depuis plusieurs points de vue.

Sujet :
Le sujet de stage porte sur l’estimation du flux optique et du flux de scène à partir à partir de séquences de photographies de plantes en croissance, en utilisant des approches par apprentissage profond.

Le sujet détaillé est disponible (en anglais) en suivant le lien ci-dessous :
https://igg.unistra.fr/People/allegre/Sujets/2022-2023-SuiviPlantes_Stage_M2_EN.pdf

Profil du candidat :
Un niveau M2 ou dernière année d’école d’ingénieur en informatique est requis, avec des connaissances de base en vision par ordinateur ou traitement d’images, ainsi qu’en apprentissage automatique.

Une ouverture vers le domaine d’application en biophysique est nécessaire pour pouvoir échanger avec les experts de la croissance des plantes.

Formation et compétences requises :
Un niveau M2 ou dernière année d’école d’ingénieur en informatique est requis, avec des connaissances de base en vision par ordinateur ou traitement d’images, ainsi qu’en apprentissage automatique.

Adresse d’emploi :
Le stage se déroulera dans les locaux de l’équipe Informatique Géométrique et Graphique du laboratoire ICube, situés sur le campus d’Illkirch, à proximité de Strasbourg (300 bd Sébastien Brant, 67412 Illkirch).

Séminaire Pr. Ioannis Tsamardinos – Machine Learning Automatisé pour la Découverte des Connaissances (Automated Machine Learning for Knowledge Discov

Date : 2022-11-25
Lieu : Curium ENSEA (6, avenue du Ponceau 95014 Cergy-Pontoise)

Chères et chers collègues,

nous avons le plaisir de vous inviter au séminaire autour du Machine Learning Automatisé pour la Découverte des Connaissances.

Nous accueillerons au Curium ENSEA (6, avenue du Ponceau 95014 Cergy-Pontoise) M. Ioannis Tsamardinos (Professeur à l’Université de Crete) Vendredi 25 Novembre à 10 h.

Suivre le séminaire en distanciel sera possible sur ZOOM (lien en description).

Vous trouvez tous les détails ci-dessous.

Cordialement,
Vassilis Christophides et Michele Linardi
ENSEA – CYU

Title: Automated Machine Learning for Knowledge Discovery

Abstract: Automated Machine Learning, or AutoML, is a newly emerging field in Machine Learning. It promises to automate predictive modeling, democratize machine learning to non-experts, boost the productivity of experts, ensure the statistical validity of the modeling process, and even surpass human experts in quality. AutoML should not only strive to produce a high-quality model, but all information, explanations, interpretations, and decision support a human expert would. In this talk, we’ll present the challenges of AutoML and the design choices we made to construct the Just Add Data Bio, or JADBio for short, AutoML platform. JADBio is particularly suited for very high dimensional data with millions of features, and low-sample datasets that present statistical estimation challenges. Particularly, JADBio focuses on Knowledge Discovery in the form of Feature Selection and identifying one or more minimal-size subsets that lead to the optimal model. Feature Selection is often the primary goal of the analysis as a first step to understanding the causal relations in our data. We’ll also discuss on-going efforts to construct an Automated Causal Discovery engine that strives to take AutoML a step further and return the best possible Causal Model that fits the data.

Short Bio: Ioannis Tsamardinos, Ph.D., is a Professor at the Computer Science Department of the University of Crete, CEO, and co-founder of JADBio (Gnosis Data Analysis PC), a University start-up. He obtained his Ph.D. from the Intelligent Systems Program at the University of Pittsburgh in 2001. Prof. Tsamardinos’ main research directions include machine learning, bioinformatics, and artificial intelligence. More specifically his computer science work emphasizes automated machine learning, feature selection, and causal discovery. Prof. Tsamardinos has over 140 publications in international journals, conferences, and books. Distinctions with colleagues and students a Gold Medal in the Student Paper Competition in MEDINFO 2004, the Outstanding Student Paper Award in AIPS 2000, the NASA Group Achievement Award for participation in the Remote Agent team, and others. Statistics on recognition of work include more than 10000 citations (1000+ a year), and h-index of 40 (as estimated by Google Scholar). Ioannis has been awarded the European and Greek national grants of excellence, the ERC Consolidator, and the ARISTEIA II grants respectively.

Participer à la réunion Zoom
https://cnrs.zoom.us/j/93377455419?pwd=Z2l4RU1yaklBQ3ZIdWFQN2ZxSzRndz09

ID de réunion : 933 7745 5419
Code secret : 8R5xU9

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Normalisation automatique de variables issues de bases de données en agroécologie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UR AIDA et UMR TETIS – #DigitAg
Durée : 6 mois
Contact : sandrine.auzoux@cirad.fr
Date limite de publication : 2022-12-15

Contexte :
Les études agro-écologiques génèrent de nombreuses bases de données hétérogènes en termes de structure et de contenu, qui sont difficilement exploitables et nécessitent une curation pour être mobilisées dans des approches statistiques ou de modélisation. La curation consiste à sélectionner les données les plus pertinentes et les enrichir de métadonnées nécessaires à leur compréhension pour pouvoir les rendre accessibles, partageables et réutilisables (principes FAIR).
Pour annoter les données et augmenter la précision des termes utilisés, un collectif interdisciplinaire de chercheurs du CIRAD a construit un dictionnaire des variables (Auzoux et al, 2018). Une variable est constituée de termes sémantiques issus des connaissances expertes et d’ontologies de référence. La liste des variables du dictionnaire a été définie pour faciliter la comparaison et l’analyse des données, et les liens avec les modèles de culture.

Un premier travail exploratoire sur la curation de bases de données en agroécologie, constituées à partir de 28 expérimentations sur la canne à sucre à La Réunion, a été réalisé lors d’un stage de Master 2 (Ngaba, 2022). Il a permis de tester et de valider une approche de fouille de textes pour automatiser la normalisation des variables créées et utilisées par les chercheur.e.s pour décrire leurs données.

Sujet :
L’objectif de ce stage est d’automatiser la labellisation des variables hétérogènes des chercheur.e.s issues des bases de données en agroécologie à partir d’une liste de variables standardisées (dictionnaire des variables). Plusieurs méthodes de fouille de texte seront mobilisées pour proposer les variables du dictionnaire les plus en phase avec les variables des bases de données :
– des mesures de proximité lexicale (Maedche et al., 2002),
– des méthodes de proximités contextuelles (Salton et al., 1988) fondées sur la description des variables issues des bases de données,
– des méthodes de proximités contextuelles fondées sur des corpus : des contextes seront constitués à partir de corpus textuels et de méthodes de plongements de mots (Mikolov et al., 2013) et de modèles de langues issus des méthodes d’apprentissage profond (Devlin et al., 2019).

Au-delà d’une extension de la méthode en proposant des méthodes originales de fouille de texte, un objectif important de ce stage consiste à proposer une approche générique pour labelliser les données et faciliter l’interopérabilité des bases de données en agroécologie.

Ce stage se déroulera en 3 grande étapes :
– Etape 1 : Appropriation des données et codes
– Etape 2 : Préparation de nouveaux jeux de données pour étudier la généricité de l’approche
– Etape 3 : Extension de l’approche de mise en lien de variable

Dans le cadre d’une démarche science ouverte, les codes sources et les données seront mises à dispositions sur la forge logicielle et le Dataverse du CIRAD. Les résultats de ce stage pourront donner lieu à deux publications scientifiques (Data paper et article scientifique).

Profil du candidat :
Le profil que nous recherchons, est un informaticien (Master 2 ou école d’ingénieur) ayant une formation en science des données ayant une maitrise des bases de données, des méthodes de fouille de texte et d’analyse de données. Une ouverture sur l’interdisciplinarité est indispensable pour pouvoir dialoguer avec les experts métiers.

Formation et compétences requises :
SGBD PostgreSQL, R studio, Python

Adresse d’emploi :
– Accueil à l’UMR TETIS à la Maison De la Télédétection sur le campus Agropolis de Montpellier
– Encadrement : 2 unités de recherche de #DigitAg (UR Aïda et UMR TETIS) sont impliquées dans cet encadrement. Le stagiaire évoluera dans une équipe pluridisciplinaire composée de deux informaticiens (Sandrine Auzoux et Mathieu Roche), un biostatisticien (Benjamin
Heuclin), et deux agronomes (Aude Ripoche et Mathias Christina).
– Période de stage : de février/mars à juillet/août 2023 (6 mois)
– Rémunération : indemnité au tarif en vigueur : 600 euros/mois x 6 mois = 3600 € + tickets restaurant
– 1 mission sera réalisée à La Réunion en milieu de stage pour présenter les premiers résultats et pour discuter plus en détail avec les encadrants et les partenaires réunionnais de la généricité de l’approche.

Document attaché : 202211181636_Stage_Digitag_TextMining.pdf

Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD – UMR TETIS
Durée : 3 ans
Contact : roberto.interdonato@cirad.fr
Date limite de publication : 2022-12-15

Contexte :
Le sujet de thèse proposé vise au croisement de deux disciplines principales : l’analyse de réseaux complexes et la modélisation des dynamiques spatiales. La modélisation des dynamiques spatiales est une approche privilégiée pour étudier les processus complexes d’interaction homme-environnement qui sont au centre des systèmes d’utilisation des terres (land use system).
Dans ce contexte, une nouvelle approche fondée sur le concept de graphe d’interaction a été développée au CIRAD/UMR TETIS, avec l’objectif de permettre un meilleur couplage des systèmes de modélisation avec des SIG (Système d’Information Géographique) et améliorer la modélisation des mécanismes qui sont influencés par des structures spatiales dynamiques. Le graphe d’interaction est un graphe (un ensemble de nœuds connectés par des arcs) dont les arcs peuvent porter des fonctions d’interaction. Un système représenté par des graphes d’interaction peut ainsi évoluer lorsque les fonctions d’interactions sont activées et que celles-ci modifient les entités connectées. Les éléments présents dans un espace géographique peuvent ensuite définir des relations spatiales, fonctionnelles, hiérarchiques et même sociales. La mise en œuvre de cette approche s’appuie sur le langage de modélisation Ocelet, et son environnement logiciel de développement (http://www.ocelet.org).
Les modèles développés avec Ocelet sont employés principalement pour simuler des dynamiques spatiales dans différents systèmes territoriaux complexes, comme par exemple, pour comparer plusieurs scénarios d’utilisation des terres. Ces modèles font généralement intervenir plusieurs graphes d’interaction dans des structures porteuses de connaissances du fonctionnement et de l’organisation du territoire. Jusqu’à présent, lors de déploiement de ces modèles, seuls les résultats de simulation sont analysés ; les graphes ne le sont pas, alors qu’ils sont une expression formelle de processus très divers qui interagissent dans le territoire. Ces analyses permettraient notamment d’expliciter les liens entre structure et fonctionnement du territoire, pour viser, à terme, la possibilité d’inférer des connaissances des processus à partir de l’exploration de données spatiales, comme celles issues d’images satellite.

Laboratoire d’accueil :

Le doctorant ou la doctorante sera accueilli dans le laboratoire TETIS à Montpellier (France). Le laboratoire TETIS est une Unité Mixte de Recherche (UMR) entre INRAE, le CIRAD, AgroParisTech et le CNRS.
L’UMR TETIS mène des recherches méthodologiques sur la gestion de l’information spatiale. Une approche intégrée de la chaîne de l’information spatiale est mise en œuvre, de l’acquisition à son usage, en passant par son traitement et sa gestion.

Sujet :
L’objectif global de cette thèse est le développement de méthodologies innovantes, basées sur les techniques d’analyse de réseaux complexes, pour l’analyse des graphes d’interaction issus de la modélisation des dynamiques paysagères. Ce travail permettra d’exploiter de manière originale les modèles de simulation spatiale développés avec l’approche Ocelet, en permettant de créer de nouvelles connaissances à partir des graphes d’interaction modélisés et de ses dynamiques. Des algorithmes de classement, clustering, diffusion de l’information et prédiction des liens spécifiquement adaptés au contexte des relations caractéristiques (e.g., spatiales, fonctionnelles, hiérarchiques et sociales) entre les entités d’un système paysager pourront être développés. Ceci représentera une contribution significative aussi bien dans le domaine de l’analyse de réseaux et science des données, que dans celui de la modélisation et de l’analyse des dynamiques paysagères.
La première étape du travail de recherche est liée à la nécessité de comprendre comment les graphes d’interaction entre les éléments d’un paysage visible sur les images satellite, et qui expriment le fonctionnement du socio-écosystème présent dans le paysage, se traduisent dans la structure en réseau de ces graphes. La seconde étape consistera à développer et implémenter des méthodes d’analyse de réseaux complexes spécifiquement adaptés aux modèles pris en comptes en réponse à la question de recherche précédente. L’idée est d’obtenir une suite de méthodes d’analyse généralisables à différents contextes, qui pourront être ensuite intégrés dans la plateforme Ocelet. Pour mener ce travail, nous adopterons une démarche pluridisciplinaire, où les contributions méthodologiques proposées seront toujours soumises aux avis d’experts en modélisation spatiale des dynamiques paysagères.
Ces deux étapes seront menées d’abord sur une diversité de sites d’études pour lesquels des modèles ont déjà été développés, ou sont en cours de développement (e.g. au Burkina Faso, Sénégal, Mozambique, La Réunion, République du Congo). En particulier, cette thèse sera adossée à deux projets où TETIS est fortement impliquée, et qui mettra en œuvre des modèles spatiaux ambitieux (projet AFD/LUCCIA au Mozambique, pour aider à évaluer la stratégie nationale REDD+, et le projet PUDT Congo, pour aider à optimiser le réseau d’approvisionnement en bois-énergie d’une grande ville). Ensuite, un terrain en Afrique de l’Ouest, en lien avec la question de la sécurité alimentaire, sera privilégié. Des analyses plus contextualisées, plus en lien avec le terrain, seront menées avec une visée explicative des caractéristiques observées dans les réseaux.

Profil du candidat :
Caractéristiques attendues du candidat :

– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.

Formation et compétences requises :
Caractéristiques attendues du candidat :

– Une solide formation en informatique (analyse des réseaux complexes et fouille de graphes, fouille de données).
– De bonnes compétences en programmation (Python préférablement) sont attendues.
– Il ou elle devrait avoir terminé (ou sur le point de terminer) un master.
– Bon niveau d’anglais écrit et parlé.
– L’intérêt et/ou une expérience dans les sciences appliquées, notamment en agronomie / environnement / géographie, et dans la mise en œuvre de modèles de simulation seront appréciés.

Adresse d’emploi :
500 rue Jean François Breton, 34000, Montpellier

Document attaché : 202211181533_Analyse de réseaux complexes issus de graphes d’interaction pour l’analyse de dynamique paysagère.pdf

Analyse d’images de microscopie électronique par réseaux profonds.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire d’Informatique et Systèmes LIS – UMR C
Durée : 4 à 6 mois
Contact : marc-emmanuel.bellemare@univ-amu.fr
Date limite de publication : 2023-02-28

Contexte :
Dans le cadre d’un projet collaboratif de recherche biomédicale sur l’endocardite infectieuse (EI) nous souhaitons développer une approche par réseaux profonds (deep-learning) pour la segmentation d’images de microscopie électronique à balayage dans le but d’analyser l’ultrastructure de valves cardiaques. Ce projet s’appuie sur une collaboration entre le laboratoire Informatique et Systèmes, expert dans l’analyse d’image, et le laboratoire Mephi, expert en microbiologie et en microscopie électronique. L’EI est une pathologie grave, associée à un diagnostic difficile et une grande mortalité. L’EI est caractérisée par une infection bactérienne ou fongique de l’endocarde avec une destruction des valves cardiaques et la formation d’un dépôt fibrino-plaquetaire inflammatoire et infecté, ou végétation. Malgré l’amélioration des stratégies diagnostiques et thérapeutiques, l’incidence et la gravité de la maladie semblent rester inchangées au fil des ans. La microscopie électronique à balayage (MEB) est une technique de microscopie électronique capable de produire des images en haute résolution de la surface d’un échantillon. Par une approche innovante par MEB, a démontré une hétérogénéité de l’ultrastructure des vegetations d’EI qui dépend du microorganisme infectieux. Cette approche innovante a ainsi montré sa force mais elle s’appuie sur une analyse experte des images qui reste manuelle et fastidieuse

Sujet :
L’objectif du stage est de développer une méthode à base de réseaux profonds pour accélérer l’analyse des images des végétations, c’est-à-dire pour identifier et quantifier automatiquement les éléments biologiques présents (plaquettes, fibrine, globules, bactéries). Pour cela, il s’agira dans un 1er temps de définir la meilleure stratégie de segmentation en tenant compte des différentes résolutions disponibles. Dans un 2nd temps il s’agira de choisir une architecture de réseaux de neurones profonds avec un « pipeline » de traitements adaptés.

Profil du candidat :
Le candidat ou la candidate de niveau Bac+5, formé(e) au traitement des images, sera intéressé(e) par un projet pluridisciplinaire et l’imagerie médicale. La programmation des algorithmes se fera avec le langage python et les réseaux profonds seront développés avec l’API PyTorch. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées.

Formation et compétences requises :
Une formation de master ou ingénieur avec des compétences en traitement d’images est attendue. Des compétences en classification ou en mathématiques appliquées seront particulièrement appréciées.

Adresse d’emploi :
Le stage se déroulera à Marseille dans les locaux de l’équipe Image & Modèles du LIS à St Jérôme (site de Polytech’) ou dans ceux de l’équipe MEPHI de l’IHU Méditerranée Infection, selon les besoins.
Aix-Marseille Université – Bâtiment Polytech GI,
Campus scientifique de St Jérôme – Av. Escadrille Normandie Niemen -13397 Marseille Cedex 20

Document attaché : 202211181337_Sujet_Master2_SegmentationDL-SEM_2023.pdf