Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : Université de Caen Normandie
Durée : Fonctionnaire d’éta
Contact : bruno.cremilleux@unicaen.fr
Date limite de publication : 2025-04-07
Contexte :
Contact pour la recherche : Bertrand Cuissart
Contact pour les enseignements : Sébastien Péron
Sujet :
En 2025, l’équipe CODAG du GREYC (Caen, CNRS UMR 6072) recrutera une maîtresse ou un maître de conférences en informatique. Le profil de recherche, centré sur les données textuelles, la linguistique computationnelle et le traitement automatique des langues, pourrait intéresser l’auditoire de cette liste de diffusion. Les personnes intéressées sont chaleureusement invitées à prendre contact avec l’équipe, afin que nous puissions les éclairer davantage sur le contexte et les objectifs de ce recrutement à venir.
Spécialisée en sciences des données, l’équipe CODAG se distingue par son très fort attachement à l’intelligibilité et à la supervision des processus mis en œuvre. L’équipe accorde ainsi une place centrale aux interactions avec les experts spécialistes des données traitées, à l’évaluation des données et connaissances qu’elle exploite et génère, sans perdre de vue la nécessité de minimiser les ressources informatiques mobilisées.
Cet attachement à la supervision entendue en un sens assez large éclaire les grandes orientations de l’équipe. CODAG vise le développement de méthodes respectueuses des spécificités des domaines d’application et l’implication des experts de ces domaines dans le paramétrage et dans l’évaluation de ces méthodes. L’équipe a ainsi ouvert son champ d’étude à des structures de données variées et privilégie les approches symboliques de la fouille de données, les approches déclaratives reposant notamment sur les modélisations par contraintes, la représentation fine des connaissances ou encore la mesure de la valeur des données d’entrée ou de sortie des systèmes.
Parmi les structures auxquelles l’équipe consacre ses travaux, le texte, que ce recrutement vise plus spécialement, occupe une place particulière. La diversité, la richesse et la complexité des structures qu’il présente offre de multiples occasions d’interactions fécondes avec les spécialistes des sciences du texte, et tout particulièrement avec les linguistes. Sur ces données textuelles, l’équipe privilégie les approches symboliques, plus propices à ces interactions, à l’intelligibilité, à la formalisation et à la capitalisation des règles et connaissances. CODAG préconise l’hybridation de ces approches avec des méthodes d’exploration automatique des données, qui permettent de renforcer les capacités d’observation à grande échelle et de découverte des règles et connaissances. À l’heure où les méthodes d’apprentissage et plus spécialement les LLMs bouleversent les disciplines du texte, l’équipe souhaite prolonger cet effort d’hybridation, en explorant les possibilités d’exploiter ces méthodes dans la perspective de compréhension fine et d’explication des phénomènes textuels, en lien avec les sciences du langage.
Intégrée à l’équipe CODAG, la personne recrutée participera au renforcement des liens avec les disciplines du texte, et en particulier avec le laboratoire CRISCO de l’université de Caen. Ayant une solide culture en science des données et capable d’une utilisation éclairée des méthodes de machine learning, ainsi qu’une sensibilité claire aux questions de supervision mentionnées ci-dessus, elle possédera soit une expérience préalable de l’application de ces méthodes à des problèmes de TAL ou de linguistique computationnelle, soit un projet clair d’application des méthodes dont elle est spécialiste à des données textuelles. Les candidatures de qualité s’appuyant sur un projet d’intégration soigné en lien avec les autres thématiques de l’équipe seront aussi les bienvenues, même si leur lien avec le texte reste prospectif.
Pour les enseignements, la personne recrutée rejoindra l’UFR des Langues Vivantes Étrangères (LVE) de l’université de Caen, et interviendra principalement au sein du département des Langues Étrangères Appliquées (LEA), département où elle sera amenée à prendre aussi, progressivement, des responsabilités.
Thèmes : traitement automatique des langues, linguistique computationnelle, sémantique, fouille de données, human in the loop, science des données, optimisation, programmation par contraintes, ontologies et ingénierie des connaissances
Profil du candidat :
Formation et compétences requises :
Adresse d’emploi :
Université de Caen Normandie