Offre en lien avec l’Action/le Réseau : – — –/Doctorants
Laboratoire/Entreprise : Laboratoire d’Imagerie et Vision Artificielle (Im
Durée : 36 mois
Contact : alamin.mansouri@ube.fr
Date limite de publication : 2025-05-29
Contexte :
L’apparence visuelle d’une surface est le résultat de processus d’une grande complexité. D’une part il y a des phénomènes multi-physiques qui concernent l’interaction entre la surface observée et son environnement lumineux. D’autre part, les mécanismes psychovisuels intrinsèques au système visuel humain. Or, la maîtrise de l’apparence est un défi un enjeu important dans de nombreux domaines tels que l’industrie, notamment dans l’industrie du luxe, du cosmétique, de l’emballage, de l’aéronautique ou de l’automobile mais aussi des domaines culturels (patrimoine culturel numérique) ou les industries créatives où les besoins en termes de numérisation de l’apparence sont croissants.
Plusieurs méthodes ont été mises en œuvre afin de prendre en compte cet enjeu de la maîtrise de l’apparence des surfaces. L’approche la plus fréquente consiste à opérer une ou plusieurs étapes de contrôle de la qualité d’aspect des surfaces, en mettant en œuvre une analyse sensorielle visuo-tactile. Cette approche sensorielle est toujours aujourd’hui la référence en industrie même si elle est intrinsèquement et inévitablement subjective car elle réaliser par un contrôleur humain rendant le résultat difficilement répétable et/ou reproductible. L’approche instrumentale, qui vise à mettre en œuvre une mesure physique d’un ou plusieurs attributs agissant sur l’apparence des surfaces (rugosité avec ou sans contact, réflectance, brillance, etc.) est une autre façon de tenter de répondre à cet enjeu. L’idée de mettre en œuvre une numérisation de l’apparence des surfaces permet d’envisager la possibilité de pouvoir quantifier objectivement les attributs d’apparence et in fine, permettre le pilotage fonctionnel des processus de fabrication (dans le cadre industriel) ou la restauration/la sauvegarde des surfaces (dans le cadre du patrimoine) et de finition de surfaces.
Une de ces approches dites instrumentales est basée sur une technique d’imagerie qui se focalise sur la numérisation de la réflectance. La réflectance d’un point de surface peut être définie comme étant la proportion de lumière réfléchie par un point d’une surface relativement à une référence (souvent point blanc lambertien). Généralement, la réflectance peut être décrite par deux composantes principales : la composante angulaire et la composante spectrale. La première exprime la relation géométrique entre la source d’illumination, la surface observée et l’observateur/caméra. Quant à la deuxième, elle est liée à réflexion en fonction des longueurs d’onde. C’est en changeant la position spatiale de la source d’éclairage et en filtrant la lumière réfléchie selon les longueurs d’onde qu’on peut mesurer ces deux composantes.
La technique d’imagerie appelée Reflectance Transformation Imaging (RTI), permettant de mesurer la composant angulaire a connu un développement important dans le domaine du patrimoine culturel et se déploie progressivement dans le domaine industriel. La technique RTI est analogue à la manière dont l’humain inspecte instinctivement une surface. En effet, ce dernier, comme le font les contrôleurs humains lors d’une analyse sensorielle, fait miroiter la surface sous son environnement lumineux en effectuant des rotations de la surface changeant alors l’angle d’éclairage.
Du point de vue mise en œuvre, La technique RTI consiste en une caméra fixe orthogonale à la surface et un éclairage orienté vers la surface dont on fait varier la position (theta, phi) tout en restant à distance fixe de l’objet d’étude tel que montré dans les exemples de la Figure 2. Pour certains angles d’éclairage, des images sont acquises. On mesure alors en chaque image la réflectance angulaire locale de la surface. Ainsi à partir d’une acquisition RTI on obtient un lot d’images, qui permettront de reconstruire la scène avec une source de lumière virtuelle pour aider au contrôle visuel de la surface.
Problématiques
RTI est une technique d’imagerie multimodale produisant de grandes quantités de données complexes, notamment lorsqu’elle est combinée à d’autres modalités d’imagerie (Miuli-spectral, Photostéréométrie, variation de focus, etc.). Malgré de nombreuses recherches et avancées pour rendre l’acquisition, le traitement et l’analyse des données plus robuste et utile à l’utilisateur final, la technique RTI présente encore des limites.
En effet, les acquisitions RTI sont souvent réalisées en lumière blanche et les images enregistrées sont soit en niveau de gris soit en couleur (lorsqu’une caméra couleur est utilisée). Étant donné les limitations liées à l’information de l’intensité et l’information couleur, il est de plus en plus recours à des acquisitions multispectrales combinées avec une acquisition RTI. Se pose alors le problème de modélisation conjointe des informations spectrale et angulaires et leur exploitation aussi bien pour optimiser l’acquisition que pour les traitement subséquents (construction de la saillance, rendu, etc.
Par ailleurs, un paramètre important d’une acquisition RTI concerne les positions d’éclairage pour lesquelles on va acquérir des images. Ces positions sont généralement réparties de manière uniforme dans l’espace theta et phi et leur nombre est, selon le dispositif d’acquisition, soit fixe soit laissé à l’appréciation de l’opérateur qui effectue l’acquisition. Plusieurs problèmes sont alors soulevés par ces choix de paramètres. Premièrement, la disposition uniforme des angles d’éclairage n’est pas forcément adaptée à toutes les surfaces étudiées. Chaque surface, voire chaque point dans le cas de multi-matériaux, possède ses propres propriétés surfaciques, interagissant différemment avec l’environnement lumineux. La disposition uniforme des angles d’éclairage permet d’avoir un aperçu du comportement moyen de la surface mais ne permet pas d’avoir une mesure adaptée et optimisé à celle-ci. Deuxièmement, le nombre de positions d’éclairage influe beaucoup sur le temps d’acquisition. Or, certains domaines, tels que ceux de l’industrie, demande des temps de mesure très courts afin de répondre aux besoins de contrôle qualité en production où la vitesse est un critère primordial. Il serait ainsi important de réduire le temps de cycle d’acquisition des images RTI en optimisant le nombre et la distribution spatiale des positions d’éclairage tout en gardant la même qualité de données fournie à l’utilisateur final.
Sujet :
Approche
Les avancées dans le domaine de l’apprentissage automatique, en particulier les techniques basées sur les réseaux de neurones, ont révolutionné l’imagerie numérique, y compris l’imagerie non conventionnelle. Ces méthodes ont démontré leur pertinence et performance dans une variété de tâches telles que la segmentation, la détection, la localisation et le suivi, dans des domaines d’application divers tels que la médecine, la télédétection, le contrôle qualité et la bio-mécanique. Elles remplacent souvent des modèles analytiques exhaustifs, parfois complexes, par des modèles implicites construits à partir de données expérimentales labélisées complètement ou ou partiellement. Ces approches sont privilégiées lorsque les données d’entraînement sont disponibles et sont même indispensables lorsque les phénomènes sous-jacents sont complexes, caractérisés par une forte non-linéarité et/ou l’absence de modèles analytiques complets. C’est particulièrement le cas pour les applications de caractérisation de l’apparence en lien avec la perception visuelle, où les processus cognitifs sont complexes et multiphysiques.
Le travail de recherche portera sur l’optimisation multi-objectif du processus d’acquisition RTI spectrale pour le rendre rapide et adaptatif. La rapidité serait la conséquence d’une acquisition continue et l’adaptabilité implique de déterminer le nombre optimal de directions d’éclairage ainsi que leur répartition spatiale (chemin d’éclairage) pour chaque matériau ou type de surface. Pour cela nous investiguerons deux approches : la première est une approche supervisée ou semi-supervisée qui consiste en la création et l’entraînement d’un réseau de neurones profond sur des données réelles et simulées sur plusieurs matériaux permettant de déterminer les directions d’éclairage critiques.
En complément, une approche plus exploratoire intégrera les capacités des modèles d’IA générative à apprendre une représentation implicite de la BRDF à partir d’un échantillonnage partiel. Ces modèles permettront de généraliser la modélisation de l’apparence à de nouveaux matériaux avec peu de données, en inférant des comportements photométriques plausibles. L’IA générative jouera également un rôle dans la simulation et l’évaluation de scénarios d’acquisition, permettant de tester virtuellement différentes configurations sans avoir recours à une acquisition physique systématique.
La deuxième approche sera inspirée des techniques récentes en reconstruction 3D permettant l’estimation de poses et le rendu réaliste d’objets 3D à partir de quelques positions. Elle visera à reconstruire implicitement l’information spatiale et spectrale à partir de vues d’éclairage limitées, en utilisant des architectures de réseaux de neurones modifiées pour intégrer des contraintes physiques liées aux propriétés de réflexion des surfaces. Ces modèles pourraient, à terme, produire un rendu interactif temps réel de la réponse spectrale sous illumination variable.
Profil du candidat :
Être titulaire d’un Master 2 ou équivalent en vision par ordinateur, Image et intelligence artificielle.
Avoir des connaissances en imagerie de l’apparence et modèles physiques et graphiques associés.
Avoir des connaissances solides en programmation et architectures de réseaux de neurones.
Formation et compétences requises :
Être titulaire d’un Master 2 ou équivalent en vision par ordinateur, Image et intelligence artificielle.
Avoir des connaissances en imagerie de l’apparence et modèles physiques et graphiques associés.
Avoir des connaissances solides en programmation et architectures de réseaux de neurones.
Adresse d’emploi :
Laboratoire ImViA
Bâtiment I3M
16 Avenue Sully
21000 Dijon
Document attaché : 202505050920_Sujet Thèse contrat doctoral MESRI pour diffusion FR.pdf