Apprentissage frugal et compressé pour l’interprétation des scènes sous-marines

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : L@bISEN Yncréa Ouest, Equipe Vision-AD et Thales B
Durée : 3 ans
Contact : ayoub.karine@yncrea.fr
Date limite de publication : 2023-07-30

Contexte :
L’océan couvre la plus grande partie de la surface de la Terre (environ 71%) avec une superficie de 361 millions de kilomètres carrés. De ce fait, cette richesse naturelle est étudiée avec la plus grande attention pour répondre à des enjeux écologiques et économiques cruciaux. Dans ce sens, les recherches scientifiques peuvent se scinder en deux grandes familles à savoir l’étude de la surface des océans et l’étude du milieu sous-marin. C’est dans le contexte général de l’interprétation du milieu sous-marin que s’articule le présent sujet de thèse. L’interprétation directe de ce milieu par un être humain reste une tâche risquée, coûteuse et difficile compte tenu du temps et des coûts liés aux systèmes d’acquisition et aux missions sous-marines. En conséquence, il est nécessaire de développer de nouvelles méthodes visant à définir des outils technologiques de prise de décision pour l’exploration automatique du milieu sous-marin.

Sujet :
Les données concernant le milieu sous-marin peuvent être acquises via des systèmes d’observation à l’instar des drones sous-marins autonomes (AUV, Autonomous Underwater Vehicle). Ces systèmes sont dotés de capteurs de vision leur permettant d’acquérir des vidéos sous-marines optiques. L’analyse automatique de ces flux vidéo permet d’interpréter avec plus de finesse l’espace sous-marin pour des missions de cartographie, d’études des habitats, de suivis de structures sous-marines ou encore pour la recherche d’objets immergés. Dans la présente thèse, nous nous intéressons à la segmentation sémantique qui vise à affecter une classe à chaque pixel dans les vidéos. Ainsi, la carte de segmentation générée représente une classification fine des différentes zones (substrats et objets) de la scène observée. En vision sous-marine, cette tâche est effectuée en s’inspirant des méthodes d’intelligence artificielle ayant montré leurs suprématies dans l’interprétation du milieu aérien à l’instar des réseaux de neurones profonds [1, 2]. Étant donné qu’une vidéo est une succession d’images (frames), la solution la plus directe pour sa segmentation sémantique est d’appliquer un modèle de prédiction à chacune de ses images en utilisant un CNN (Convolutional Neural Network) par exemple [3]. Cependant, cette solution naïve ne fait pas preuve de bonne performance pour la segmentation. Ceci est dû principalement à la nonconsidération de la relation temporelle entre les images de la vidéo. Contrairement aux images statiques, l’information temporelle est d’une grande importance dans le traitement des vidéos. Elle permet de modéliser la progression de la scène observée dans le temps. Par conséquent, les travaux récents traitant cette problématique essaient de prédire les classes associées aux pixels d’une image à l’instant “t” en utilisant les classes affectées aux pixels des images précédentes (“t-1”, “t-2”, etc.). Pour ce faire, plusieurs travaux, après la segmentation sémantique de chaque image, ajoutent un module d’agrégation (flux optique, tracking, etc.) suivi d’un réseau de neurones séquentiel (RNN, LSTM, Transformer, etc.). D’autres familles de méthodes n’utilisent que quelques images de la vidéo (appelés keyframes) et propagent les cartes caractéristiques

vers les autres images à travers le flux optique. Néanmoins, l’adaptation de ces méthodes en vision sous-marine a montré des limites en termes de robustesse, mais aussi en termes de temps de calcul. Ces deux limites sont respectivement liées, principalement, à deux facteurs : (1) la non-disponibilité d’un grand jeu de données étiquetées de vidéos sous-marines, ceci à cause des coûts élevés des missions d’acquisition (systèmes coûteux et annotation manuelle chronophage des vidéos pour les experts). (2) le nombre important des opérations et des paramètres utilisés dans les approches neuronales pour la segmentation des vidéos sous-marines. Pour combler ces deux limites, le présent sujet de thèse vise à proposer des architectures neuronales compressées capables d’apprendre à partir d’un très faible volume de vidéos et d’offrir des performances de segmentation élevées.

Concernant la première limite, la piste de l’apprentissage frugal (Few-Shot Learning) [4, 5] sera étudiée. Il s’agit d’une approche apte à apprendre à partir d’un nombre limité de données d’apprentissage étiquetées. Cela est atteint en se basant sur l’accumulation de différentes connaissances préalables extraites à partir d’autres bases de données (appelée donnée de base) plus grandes. Cette étape fait référence à l’apprentissage de représentation. Finalement, le nombre réduit des données d’apprentissage (appelées support) est utilisé pour construire la fonction de décision.

Quant à la deuxième limite, la distillation de connaissances (Knowledge Distillation) [6, 7] pourrait être une approche prometteuse. Le principe de cette approche consiste à transmettre les connaissances d’un grand réseau de neurones qui donne de bonnes performances sur une tâche spécifique, dit enseignant, vers un autre réseau réduit, dit étudiant. L’objectif est que le réseau étudiant imite l’apprentissage du réseau enseignant. Autrement dit, l’apprentissage du réseau étudiant est supervisé par le réseau enseignant. Ainsi, il est possible d’aboutir à un réseau de neurones performant en segmentation sémantique avec une taille réduite, facilement embarquable dans les drones autonomes sous-marins grâce à sa rapidité d’inférence et sa consommation énergétique réduite. La méthode mise en oeuvre pourra ainsi être utilisée pour segmenter, en temps réel et précisément, les fonds marins en fonction des substrats présents. Enfin, des données dynamiques 3D, de type nuage de points, pourront être utilisées afin de renforcer la segmentation sémantique et produire des relevés encore plus précis pour créer une cartographie des fonds marins.

*** Références :
[1] Islam, M. J., Edge, C., Xiao, Y., Luo, P., Mehtaz, M., Morse, C., & Sattar, J. “Semantic segmentation of underwater imagery : Dataset and benchmark”, IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2020.
[2] Chicchon, M., & Bedon, H. “Semantic Segmentation of Underwater Environments Using DeepLabv3+ and Transfer Learning”, Smart Trends in Computing and Communications (pp. 301-309). Springer, Singapore, 2022.
[3] T. Zhou, F. Porikli, D. J. Crandall, L. V. Gool and W. Wang, “A Survey on Deep Learning Technique for Video Segmentation”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022.
[4] Snell, J., Swersky, K., & Zemel, R. “Prototypical networks for few-shot learning”, Advances in neural information processing systems, 30, 2017.
[5] Wang, K., Liew, J. H., Zou, Y., Zhou, D., & Feng, J. “Panet : Few-shot image semantic segmentation with prototype alignment”, Proceedings of the IEEE/CVF International Conference on Computer Vision (pp. 9197-9206), 2019.
[6] Liu, Y., Shu, C., Wang, J., & Shen, C. “Structured knowledge distillation for dense prediction”, IEEE transactions on pattern analysis and machine intelligence, 2020.
[7] Karine, A., Napoléon, T., Jridi, M., “Semantic Images Segmentation for autonomous driving using Self-Attention Knowledge Distillation”, 16th IEEE International Conference

Profil du candidat :
• Expérience en intelligence artificielle et vision par ordinateur
• Des connaissances en apprentissage profond appliqué à la vision par ordinateur.
• Intérêt pour la vision sous-marine

Formation et compétences requises :
Dans l’idéal, le candidat doit avoir :
• suivi un cursus de Master ou d’Ingénieur dans un des domaines suivants : intelligence artificielle, vision par ordinateur, science des données, mathématiques appliquées ;
• de solides compétences en algorithmique et en programmation : Python, PyTorch, Tensoflow, Keras… ;

Adresse d’emploi :
20 Rue Cuirassé Bretagne, 29200 Brest

Document attaché : 202305041329_TheseVisionSousMarine_LabISEN-Thales.pdf

Estimation de l’état de la mer par vidéo

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Informatique, Image et Interaction (L3
Durée : 3 ans
Contact : sylvain.marchand@univ-lr.fr
Date limite de publication : 2023-07-30

Contexte :
La Rochelle Université va se doter d’une plate-forme dont l’objectif à terme est de devenir un voilier autonome, capable de sentir son environnement avec des capteurs et de prendre les bonnes décisions.

Sujet :
Lors de la navigation, il est fondamental de pouvoir estimer voire anticiper l’état de la mer, la direction et la période de la houle, les vagues plus importantes, ainsi que les brusques variations de vent (risées) qui peuvent être observées à la surface de la mer. C’est en général le rôle d’un équipier, appelé « numéro 1 ». Dans le cadre de la navigation en solitaire, on ne peut plus s’appuyer sur cet équipier. Or ces informations sont essentielles pour pouvoir anticiper et gagner en performance ou en sécurité, et pourraient être prises en compte par des centrales de navigation (« pilotes automatiques ») de nouvelle génération (dotées d’intelligence artificielle). Une autre application est l’observation des vagues sur le littoral, pour mesurer voire anticiper l’érosion des côtes par exemple. Là aussi, cela se fait actuellement via l’observation humaine principalement. C’est un cas plus simple car la caméra est fixe (ce qui est rarement le cas sur un voilier…). Nous proposons de concevoir une méthode pour estimer automatiquement ces informations (état de la mer, houle voire variations de vent), à l’aide de séquences d’images (type vidéo) possiblement issues d’un unique capteur (cas monoculaire, mais peut-être avec une vision à 360 degrés), avec des contraintes de sobriété énergétique. Une première piste est la conception d’une nouvelle transformée mathématique, combinaison de deux transformées existantes (Fourier et Hough), approche introduite dans le domaine du son pour estimer la direction et la période entre des fronts d’onde. Il faudra également étendre cette transformée à la dimension temporelle (pour les séquences d’images). Il faudra faire l’acquisition de données, concevoir la ou les méthode(s) d’estimation ainsi que le dispositif matériel final (« capteur intelligent »).

Profil du candidat :
Master Informatique ou équivalent.

Formation et compétences requises :
Master Informatique,
analyse d’images / vidéos, traitement du signal et des images,
des connaissances en navigation à la voile étant un plus.

Adresse d’emploi :
Laboratoire Informatique, Image et Interaction (L3i), La Rochelle Université.

Document attaché : 202305040957_Sujet_MARCHAND.pdf

Poste IR pérenne, équipe HeKA, Inria Paris

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Inria Paris, Equipe HeKA, PariSanté Campus
Durée : poste IR pérenne
Contact : adrien.coulet@inria.fr
Date limite de publication : 2023-05-31

Contexte :
Un poste d’ingénieur pérenne en santé numérique est ouvert à Inria pour rejoindre l’équipe HeKA (https://team.inria.fr/heka/), sur le développement de la librairie medkit (https://heka.gitlabpages.inria.fr/medkit/index.html).

Sujet :
2023-DT-IR-8 : Ingénieur-e spécialiste en santé numérique – corps IR- BAP E
Fiche de poste : https://www.inria.fr/sites/default/files/2023-04/2023-DT-IR-8_0.pdf
Candidature : https://candidat.inria.fr/SelectCandidat/selectcandidat.html?#modify-application;idOffre=450
Page générale des concours : https://www.inria.fr/fr/concours-externes
Calendrier :
– Recueil des candidatures : du 28 avril au 29 mai 2023,
– Admissibilité (étude des dossiers par les jurys) : du 1er juin au 12 juin 2023,
– Admission (épreuve écrite & entretien oral avec les jurys) : du 12 juin au 7 juillet 2023,
– Nomination : à compter du 1er septembre 2023.

Profil du candidat :
Expérience en développement Python
Intérêt pour les applications en santé de l’informatique
Intérêt pour l’apprentissage machine
Bases de l’apprentissage machine

Formation et compétences requises :
Niveau de diplôme exigé :Bac + 5 ou équivalent
Autre diplôme apprécié : Doctorat ou diplôme d’ingénieur
Facilité de communication à l’écrit et à l’oral
Connaissances en développement logiciel

Adresse d’emploi :
PariSanté Campus, 2-10 rue d’Oradoure-sur-Glane, 75015 Paris

Document attaché : 202305030834_2023-DT-IR-8_0.pdf

Tenure Track Faculty Position (Chaire de Professeur Junior) in

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS Lab and INSA Rouen Normandy
Durée : 5 years
Contact : paul.honeine@univ-rouen.fr
Date limite de publication : 2023-06-10

Contexte :
Keywords: artificial intelligence, smart mobility, machine learning, computer vision, human-computer interaction, automatic decision making

Deadline for applications (via Galaxie website): 10th of May 2023

Contract duration: 5 years

After evaluation of the scientific achievements and professional capabilities of the chairholder by a tenure commission, he/she will be eligible for a full-tenure position of Professor.

Salary and human and financial resources:

In order to carry out the research and teaching projects, the Chair will be co- funded by the National Agency of Research (ANR) with an amount of 200 k€ (of which at least 120 k€ of payroll, thesis or postdoc).

The gross monthly salary is 3443.5 €/month.

Application and contacts:

First, interested candidates should send a Curriculum Vitae and a list of publications accompanied by a short cover letter to both:
– Laurent Vercouter (laurent.vercouter@insa-rouen.fr), Research contact
– Géraldine Del Mondo (geraldine.del_mondo@insa-rouen.fr), Teaching contact
This preliminary step is essential to discuss the research and teaching projects and the integration in the laboratory.

Second, they should apply officially via the Galaxie website where the position offer will be published. The selected candidates for the audition will present their project to the selection committee with the conditions specified in the invitation letter.

Evaluation criteria:

• Excellence of the candidate, motivation, supervisory skills
• Quality and originality of the research and teaching projects
• Integration of the project within the laboratory
• Ability to establish collaborative networks

Sujet :
Research activity description:

The LITIS laboratory is a research unit attached to INSA Rouen Normandie, Université Rouen Normandie and Université Le Havre Normandie. The LITIS groups lead researches in several fields belonging to the domain of computer science and applied mathematics. The scientific project of the chair will be developed in a transversal project on Artificial Intelligence for Safe and Smart Mobility involving the expertise of several LITIS teams.

This project mobilizes the App (machine learning), MIND (human-computer interaction and decision making) and STI (computer vision) teams of LITIS that contribute to the objective of safe autonomous mobility covering issues ranging from perception to decision making. At the level of perception for an autonomous vehicle, the aim is to develop efficient approaches for multi-sensor data fusion for a complete 3D mapping and semantic analysis of road scenes. The use of conventional and non-conventional imagery allows for the processing of data under adverse weather conditions. The development of statistical learning algorithms adapted to the diversity of data (structured, non-Euclidean geometric, spatio-temporal, multi-modal/multi-sensor) is another issue considered with deep architectures. Finally, coordination, control and interaction issues are also addressed through shared decision making with users and the development or learning of explainable models. On this aspect, decentralized solutions and/or including a symbolic dimension and integrating explanation interfaces are favored.

The chair will contribute to at least one of these issues, with a preference for cross-disciplinary profiles linking these teams. A detailed description of the research topics of the three LITIS groups involved is available on the laboratory web site https://www.litislab.fr/.

Teaching activity description:

The chairholder will have a teaching duty of 64 hours per year during the tenure- track period. She/He will be attached to the Computer Science and Information Technology Department (ITI, http://iti.insa-rouen.fr) at INSA Rouen Normandie. She/He will be involved in the ITI department teaching classes as well as in the preparatory cycle (STPI).

Profil du candidat :
The candidate must hold a Ph.D. thesis in Computer Science or any closely related field with the research profile of the employment, with a solid experience on Artificial Intelligence fields such as machine learning, computer vision, human-computer interaction or/and automatic decision making. Previous experiences in projects applying Artificial Intelligence for smart mobility will be appreciated. The excellence of the candidate must be reflected in a significant scientific output (publications in top-tier peer-reviewed journals, communication in top-tier peer-reviewed international conferences of her/his domain).

Formation et compétences requises :
The candidate must be able to manage research activities, to lead national and international research projects and to supervise young researchers. The candidate must demonstrate teamwork skills.

Adresse d’emploi :
INSA Rouen Normandy

Assistance logicielle à l’exploration de l’espace des enquêtes qualitatives : Étude de cas en sociologie

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIST3N – UTT
Durée : 3 ans
Contact : joris.falip@utt.fr
Date limite de publication : 2023-05-10

Contexte :
Les sciences sociales ont souvent recours à l’analyse de transcriptions d’entretiens. L’outil numérique Cassandre, développé par l’Université de Liège en collaboration avec l’UTT, permet de guider l’utilisateur à travers les étapes de cette analyse. Le projet n-quiry a pour but d’explorer l’apport de techniques d’intelligence artificielle, de lexicométrie ou de visualisation afin de détecter dans les données des tendances et signaux faibles pouvant aiguiller l’analyse du corpus d’entretiens.

Sujet :
OBJECTIFS SCIENTIFIQUES

Plusieurs produits de la recherche sont attendus, notamment :

assistance à la conduite de l’enquête : faciliter l’identification des pistes à explorer ou à délaisser selon le corpus actuel, mais aussi permettre de déceler la saturation théorique afin de suggérer la clôture de l’enquête ;
assistance à la lecture et l’analyse des entretiens : détection de tendances et signaux faibles grâce à la lexicométrie et sa visualisation directement au sein du texte ;
assistance à l’articulation de cas et la théorisation : exploration à partir de règles établies ou émergentes, par le biais de différentes visualisations augmentées (graphes, matrices…). Les travaux conduits dans le cadre de ce sujet auront pour objectif de proposer des solutions qui, tout en assistant le processus d’analyse qualitative, conservent l’humain au centre de la boucle de traitement et d’interprétation des données. Cela implique l’élaboration ou la sélection d’algorithmes de machine learning (pour l’analyse statistique du texte) et de visualisation appropriés facilitant l’exploration des données par l’utilisateur. Le choix de ces éléments et leur intégration dans Cassandre (ou Hyperglosae) devra s’articuler avec les règles usuelles prescrites par la méthode qualitative.

ENVIRONNEMENT DE TRAVAIL

L’équipe de recherche Tech-CICO est un environnement interdisciplinaire stimulant regroupant des chercheurs en informatique, linguistique, psychologie, sociologie et gestion. Les séminaires mensuels ainsi que les séminaires de fin d’année permettent aux doctorant•e•s de se tenir informé•e•s des dernières recherches menées dans l’équipe comme hors de l’équipe, mais aussi de présenter leurs travaux dans un contexte tout aussi exigeant que bienveillant.

PARTENARIAT

Le projet doctoral bénéficiera du partenariat étroit existant avec Christophe Lejeune de l’Université de Liège, partenariat à l’œuvre depuis des années notamment autour de la conception du logiciel Cassandre. En tant qu’auteur d’un manuel qui fait référence sur la question et expert scientifique, Christophe Lejeune accompagne des centaines de praticiens par an dans leur usage de Cassandre. Dans le cadre du projet doctoral, ces praticiens de la recherche qualitative (chercheurs confirmés ou apprenants) pourront être contactés pour être observés, interviewés ou pour participer à des expérimentations.

Ce projet de thèse s’inscrit au sein du réseau Hypertopic/Hyperglosae, animé par l’un des encadrants de la thèse. Ce réseau, au travers de ses séminaires et ses plateformes open source, étudie l’assistance logicielle à la construction du sens. Le/la candidat(e) pourra s’appuyer sur les échanges et les outils du réseau tout en y contribuant à travers ses propres recherches.

Profil du candidat :
Le/la candidat(e) devra obligatoirement :

– être titulaire d’un diplôme de niveau bac+5 en informatique, attestant de compétences en conception et réalisation de dispositifs numériques,
– avoir suivi une formation d’initiation à la recherche (état de l’art, bibliographie, citations…),
– disposer de solides compétences rédactionnelles (en français et en anglais).

Après avoir pris connaissance du sujet et des ressources référencées, les candidat•e•s, sont invité•e•s à écrire aux deux encadrants (joris.falip@utt.fr et aurelien.benel@utt.fr) en explicitant ce qui les intéresse dans ce sujet et en joignant un CV.

Formation et compétences requises :
D’autres domaines de compétence seront appréciés :

– le génie logiciel et le développement Web (backend et frontend),
– l’intelligence artificielle : machine learning et/ou approches symboliques,
– visualisation de données,
– analyse automatique de texte (text mining).

Adresse d’emploi :
Equipe Tech-CICO, Laboratoire LIST3N
Université de Technologie de Troyes

Call for Participation – TOTh 2023 Conference & Training – Registration is open

Date : 2023-05-30 => 2023-06-02
Lieu : Université Savoie Mont Blanc
Campus Scientifique du Bourget du Lac

===========================================================================
TOTh 2023 – Terminology & Ontology: Theories and applications
University Savoie Mont Blanc (France)

Conference: 1 & 2 June 2023 / Training session: 30 & 31 May 2023

Home

Conference Program: http://toth.condillac.org/wp-content/uploads/2023/04/TOTh_2023_Program_En.pdf

Opening Talk: “Naissance et renaissance de la terminologie botanique au XVIe siècle”. Philippe Selosse, Université Lyon II – http://toth.condillac.org/opening-talk
Training session: “Terminology & Digital Humanities”: http://toth.condillac.org/training-2023-dh

Registration: http://toth.condillac.org/registration

Conference Fees: Student: 25 € – Academic: 75 € – Other/Industrial : 150 €
Training Fees: Student: 50 € – Academic: 100 € – Other/Industrial : 150 €
===========================================================================

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Modélisation d’un Apprentissage humain via ses Réponses Imparfaites et Elicitation

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRISA
Durée : 3 ans
Contact : constance.thierry@irisa.fr
Date limite de publication : 2023-08-31

Contexte :
De plus en plus d’apprenant, se tournent vers un nouveau système de cours à distance appelé MOOCs (Massive Open Online Course). Cette distance avec le participant, présente l’avantage pour ce dernier d’apprendre en tout lieu et à tout moment sans contraintes géographique et temporelle forte. L’inconvénient pour le maître d’apprentissage qui conçoit ces cours est que l’apprentissage distanciel complexifie l’estimation
de l’assimilation de l’information. Parmi les méthodes existantes pour évaluer l’acquisition de connaissances chez l’apprenant, l’utilisation de questions fermées comme des questionnaires à choix multiple (QCM) est la plus fréquente. Ils peuvent être classifiés en deux catégories : les QCM à réponses uniques (QCM-RU) et les QCM à réponses multiples (QCM-RM). Pour les QCM-RU, l’étudiant ne peut choisir qu’une unique réponse parmi l’ensemble proposé. Un problème inhérent aux QCM-RU est leur rigidité qui limite la capacité des répondants à s’exprimer. Ces questionnaires
ne donnent pas la possibilité aux étudiants de rendre compte de leur ignorance, leur imprécision et leur incertitude. Par conséquent, si les répondants hésitent entre deux (ou plusieurs) réponses, ils en choisiront une au hasard. Le problème dans le domaine de l’éducation est qu’une réponse aléatoire ne reflète pas exactement le niveau réel des connaissances de l’apprenant.

Sujet :
Il est essentiel de parvenir à définir une approche de contrôle des connaissances qui permette un retour qui rende mieux compte de l’apprentissage réel de l’individu inscrit aux cours en ligne. Pour ce faire, nous proposons dans cette thèse un système où l’apprenant répond à un questionnaire d’évaluation avec une possibilité d’être imprécis en cas d’hésitation tout en donnant sa certitude. L’objectif est de parvenir à estimer la connaissance du contributeur grâce à ses réponses imparfaites, mais aussi d’interagir avec lui afin de dynamiser cet apprentissage en lui donnant par exemple un retour sur sa réponse. Il faudrait ainsi estimer l’apprentissage de façon dynamique afin de déterminer le moment où l’apprenant a acquis les connaissances promises par le cours. Il s’agit également d’identifier son degré d’acquisition des connaissances pour l’optimisation du retour qui lui sera fait.

Profil du candidat :
Intéressé par la modélisation de contribution humaine, l’analyse et l’exploitation de données.
Des connaissances de la théorie des fonctions de croyance seraient un plus.

Formation et compétences requises :
École d’ingénieur ou master en informatique

Adresse d’emploi :
IUT de Lannion

Document attaché : 202304271257_These_druid.pdf

Uncertainty quantification for machine and deep learning techniques

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : FEMTO-ST
Durée : 3years
Contact : noura.dridi@ens2m.fr
Date limite de publication : 2023-06-30

Contexte :
Most of the real physical system and everyday situations include
uncertainty. This is the case for medical diagnosis, weather forecasting, evolution of the stock market and so on. In the literature two types of uncertainty are distinguished:
aleatoric uncertainty denotes the one that is inherent to the data, e.g., noise in measurements or natural variability of the inputs, and epistemic uncertainty related to the model and due to lack of knowledge. Measuring the uncertainty is important, so as to support the user in the action to take. For example, when an anomaly is detected, with weak confidence level, another source of information should be added (image, human intervention, etc.) before planning intervention actions. More generally, quantification of the prediction uncertainty allows to trust or not predictions. In fact, incorrect overconfident predictions can be harmful and lead to erroneous decision.

Sujet :
Goal of the thesis: The goal of this thesis is to develop a robust method to evaluate uncertainty for machine and deep learning algorithm predictions. Major of works focused on improving the algorithm performance, few works deal with measuring the uncertainty
related to the predictions. In particular in this thesis we want to relax some hypothesis in the existing approach related to the distribution of the data and symmetry of the algorithm. This subject is challenging with many theoretical and applicatives difficulties. It is multidisciplinary including competences in probability, statistic and data processing. The
two principal goal are:
-First, we aim to measure the impact of uncertainty miss evaluation on the decision.
-The second part is focused on developing new method to quantify uncertainty, that can be applied to different type of data and without restrictive constraint on distribution or the exchangeability.
The third part, includes generalization of the proposed method when we have noisy and/or missing data.
The second part include study of the theoretical aspects: proof of convergence, complexity issue. In addition to practical aspects: independence from the chosen algorithm, architecture of the NN, implementation… Finally, a validation criterion is defined to attest
the performance of the uncertainty measure.

Profil du candidat :
Master in applied mathematics (or equivalent). Probability, statistic.
Good skills in Python programming. Experience in machine learning/deep learning

Formation et compétences requises :
Master in applied mathematics (or equivalent: engineering school diploma)

Adresse d’emploi :
FEMTO-ST
15B avenue des Montboucons
25030 Besançon cedex France

Document attaché : 202304261402_ThesisOfferFEMTO.pdf

Fouille de séquences sémantiques

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIFAT
Durée : 3 ans
Contact : thomas.devogele@univ-tours.fr
Date limite de publication : 2023-05-26

Contexte :
Les séquences ou trajectoires sémantiques sont des suites de valeurs sémantiques ayant une durée et chronologiquement ordonnées. L’ensemble de ces valeurs peut être décrit à l’aide d’une ontologie. Ces séquences représentent des processus divers : trajectoires de vie, déplacements journaliers, dossiers patients et flux d’activités diverses (par ex. étapes dans la production de produits, exercices d’e-learning, requêtes dans un système d’information, chansons d’une playlist…).
L’analyse de séquences sémantiques (Parent et al. 2013) permet de répondre à diverses problématiques sociétales, industrielles ou individuelles, par exemple : la détection de comportements dangereux (ex. déplacements à risque, notamment d’enfants, suites dangereuses de prises de médicaments), la détection de difficultés et goulots d’étranglement (notamment quand il s’agit d’activités répétitives), l’apprentissage de patrons de comportement (pour ensuite créer des groupes, observer des caractéristiques communes, recommander des actions, apprendre des intérêts), et la comparaison de comportement experts et novices (pour qualifier, recommander et proposer des plans d’amélioration).
En 2021, Clément Moreau (Moreau 2021) a soutenu sa thèse sur la fouille de séquences de mobilité sémantique. Il a proposé des mesures pour la comparaison, l’analyse et la découverte de comportements d’humains. Ces travaux de recherche ont ouvert de nombreuses perspectives très prometteuses.

Sujet :
L’objectif de cette thèse est d’étendre ces travaux et de répondre à une partie des verrous soulevés par ces perspectives :
• Généricité : La thèse de Clément Moreau s’intéressait principalement aux séquences sémantiques représentant des déplacements humaines. Une question intéressante concerne comment étendre ces travaux à d’autres types de données, notamment pour prendre en compte des activités complexes et en présence d’incomplétudes. Un couplage avec la dimension géographique est possible.
• Mesure de similarité : Le calcul de similarité entre activités et entre séquence est un point clé pour l’analyse des séquences. Clément Moreau a proposé deux mesures, CED et FTH basées respectivement sur la distance d’édition (Wagner et Fischer 1974) et la distance de Hamming(Hamming 1950). Une étude comparative approfondie est encore à réaliser. Plus particulièrement, quelles caractéristiques sont à privilégier pour choisir et régler les paramètres de la mesure de similarité ? Comment mesurer la similarité entre des séquences incomplètes ou de durées différentes ?
• Langage d’interrogation : Ces mesures doivent pouvoir être reprises dans le cadre d’un langage d’interrogation permettant d’extraire des séquences proches d’un patron générique.
• Analyse visuelle interactive : Lors de la thèse de Clément Moreau, un outil de visualisation : SIMBA a été proposé. Cet outil est complexe, il doit être amélioré afin de proposer des résumés (patterns) plus simples des séquences d’un même cluster et ainsi favoriser l’explicabilité du processus. De même, l’analyse doit être plus interactive et mieux intégrer les préférences utilisateurs.

Profil du candidat :
fouille de données, ML, sciences des données, séries temporelles

Formation et compétences requises :
master en informatique

Adresse d’emploi :
3 place Jean Jaurès, 41000 Blois

Document attaché : 202304260715_TheseFouilleSequences2023.pdf

Physics-Aware Deep Learning for Modeling Spatio-Temporal Dynamics.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Sorbonne Universite – Institut des Systèmes Intell
Durée : 36 mois
Contact : patrick.gallinari@sorbonne-universite.fr
Date limite de publication : 2023-05-26

Contexte :
Physics-aware deep learning is an emerging research field aiming at investigating the potential of AI methods to advance scientific research for the modeling of complex natural phenomena. This research topic investigates how to leverage prior knowledge of first principles (physics) together with the ability of machine learning at extracting information from data. This is a fast-growing field with the potential to boost scientific progress and to change the way we develop research in a whole range of scientific domains. An area where this idea raises high hopes is the modeling of complex dynamics characterizing natural phenomena occurring in domains as diverse as climate science, earth science, biology, fluid dynamics, etc.

Sujet :
The objective of the PhD project is the development of Physics-aware deep learning methods for the modeling of complex spatio-temporal dynamics. The direct application of state-of-the-art deep learning (DL) methods for modeling and solving physical dynamics occurring in nature is limited by the complexity of the underlying phenomena, the need for large amounts of data and their inability to learn physically consistent laws. This has motivated the recent exploration of physics-aware methods incorporating prior physical knowledge. Although promising and rapidly developing, this research field faces several challenges. For this PhD project we will address two main challenges, namely the construction of hybrid models for integrating physics with DL and generalization issues which condition the usability of DL for physics.

— Integrating DL and physics for spatio-temporal dynamics forecasting and solving PDEs

In physics and many related fields, partial differential equations (PDEs) are the main tool for modeling and characterizing the dynamics underlying complex phenomena. Combining PDE models with ML is a natural idea when building physics-aware DL models and it is one of the key challenges in the field. This has been explored for two main directions: (i) augmenting low resolution solvers with ML in order to reach the accuracy of high-fidelity models at a reduced computational cost, and (ii) complementing incomplete physical models with ML by integrating observation data through machine learning. A first direction of the PhD will then be to investigate hybrid physics-DL models using the recently proposed framework of neural operators. The latter opens the possibility of combining and learning multiple spatio-temporal scales within a unified formalism, a challenge in DL.

— Domain generalization for deep learning based dynamical models

Explicit physical models come with guarantees and can be used in any context (also called domain or environment) where the model is valid. These models reflect explicit causality relations between the different variables involved in the model. This is not the case for DL: statistical models learn correlations from sample observations, their validity is usually limited to the context of the training domain. This is a critical issue for the adoption of ML for modeling the physical world. In relation with the construction of hybrid models as described above, one will investigate this issue along two main directions. The first one is a purely data-based approach and exploits ideas from learning from multiple environments through task decomposition. The second one, takes a dual perspective, relying on prior physical knowledge of the system equations and directly targets the problem of solving parametric PDEs, exploiting ideas from meta-learning.

Profil du candidat :
Computer science or applied mathematics. Good programming skills.

Formation et compétences requises :
Master degree in computer science or applied mathematics, Engineering school. Background and experience in machine learning.

Adresse d’emploi :
Sorbonne Université (S.U.), Pierre et Marie Campus in the center of Paris. The candidate will integrate the MLIA team (Machine Learning and Deep Learning for Information Access) at ISIR (Institut des Systèmes Intelligents et de Robotique).

Document attaché : 202304251022_2023-04-PhD-Description-Physics-Aware-Deep-Learning.pdf