Synthèse de la parole multilingue appliquée aux langues régionales

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Inria
Durée : 24 mois
Contact : emmanuel.vincent@inria.fr
Date limite de publication : 2026-04-04

Contexte :
Ce poste d’ingénieur.e se place dans le cadre du Défi Inria COLaF “Corpus et Outils pour les Langues de France”, dont l’objectif est de créer des corpus, des modèles et des logiciels ouverts et inclusifs pour les langues de France. Cela inclut les langues régionales (alsacien, breton, corse, occitan, picard, etc.) et d’outre-mer (créoles, langues polynésiennes, langues kanakes, mahorais, etc.) et les langues d’immigration non-territoriales (arabe dialectal, arménien occidental, berbère, judéo-espagnol, romani, yiddish).

Le/la ingénieur.e sera co-encadré.e par Vincent Colotte et Emmanuel Vincent et lorsque nécessaire par Pascale Erhart. Il/elle bénéficiera de l’expertise de l’équipe Multispeech en traitement de la parole et celle de LiLPa en dialectologie, en phonétique de corpus et en TAL. Il/elle collaborera avec les ingénieurs chargés de la création et la distribution des corpus et des briques logicielles et avec les autres partenaires du projet.

Sujet :
La synthèse vocale est une technologie-clé pour la valorisation des langues régionales et d’immigration. Ces langues restent cependant largement ignorées des fournisseurs de technologies linguistiques [1], qui entraînent classiquement les systèmes de synthèse vocale sur des jeux de données monolingues de haute qualité enregistrés en studio par un petit nombre d’acteurs professionnels. Cette méthode induit un coût élevé pour chaque langue et limite le nombre de voix et leur expressivité.

L’objectif de ce poste est de concevoir un système de synthèse vocale multilingue et multi-voix applicable aux langues régionales et de le distribuer pour qu’il soit largement utilisé. Parmi les systèmes de synthèse vocale multilingue existants, IMS Toucan [2] est le seul à couvrir plus de 7000 langues. Il s’appuie sur le phonétiseur multilingue transphone [3], l’encodeur articulatoire PanPhon [4], le synthétiseur FastSpeech 2 [5] conditionné sur des plongements de locuteur et de langue et le vocodeur HiFi-GAN [6] entraînés sur un corpus de 18000 heures de parole en 462 langues. Deux défis subsistent: réduire le caractère haché de la voix et les erreurs de phonétisation, tous deux plus prononcés pour les langues peu dotées non vues à l’apprentissage. L’ingénieur collaborera avec une doctorante travaillant sur cette thématique, qui considère aussi CMS [7] et StyleTTS 2 [8].

Pour réduire le caractère haché, la doctorante financée par le projet exploite les enregistrements vocaux disponibles pour les langues régionales et d’immigration visées. Nous exploiterons donc d’autres langues proches sur le plan phonétique et/ou morphologique. Pour améliorer la phonétisation, nous exploiterons aussi les connaissances phonologiques disponibles, avec une attention particulière à la variabilité des prononciations. L’ingénieur.e travaillera sur ces deux sujets et, plus généralement, sur l’évaluation des systèmes de TTS développés par le Défi COLaF sur d’autres langues régionales de France, selon ses compétences et ses souhaits, et sur la mise à disposition concrète et l’utilisabilité de ces logiciels de TTS. L’approche développée sera validée notamment pour l’alsacien, qui est la deuxième langue régionale parlée en France en nombre de locuteurs tout en restant une langue sous-dotée [9]. Le travail de recherche s’appuiera sur les jeux de données collectés et enregistrés par les ingénieurs du Défi COLaF.

[1] DGLFLF, Rapport au Parlement sur la langue française 2023, https://www.culture.gouv.fr/Media/Presse/Rapport-au-Parlement-sur-la-langue-francaise-2023
[2] F. Lux, S. Meyer, L. Behringer, F. Zalkow, P. Do, M. Coler, E.A.P. Habets, N.T. Vu, “Meta learning text-to-speech synthesis in over 7000 languages”, in Interspeech, 2024, pp.4958-4962.
[3] X. Li, F. Metze, D. Mortensen, S. Watanabe, and A. Black, “Zero-shot learning for grapheme to phoneme conversion with language ensemble”, in Findings of ACL, 2022, pp.2106-2115.
[4] D.R. Mortensen, P. Littell, A. Bharadwaj, K. Goyal, C. Dyer, L.S. Levin, “PanPhon: A resource for mapping IPA segments to articulatory feature vectors”, in 26th International Conference on Computational Linguistics (COLING), 2016, pp.3475-3484.
[5] Y. Ren, C. Hu, X. Tan, T. Qin, S. Zhao et al., “FastSpeech 2: Fast and high-quality end-to-end text to speech”, in 9th International Conference on Learning Representations (ICLR), 2021.
[6] J. Kong, J. Kim, J. Bae, “HiFi-GAN: Generative adversarial networks for efficient and high fidelity speech synthesis”, in NeurIPS, 2020, pp.17022-17033.
[7] J. Schalkwyk, A. Kumar, D. Lyth, S. E. Eskimez, Z. Hodari, C. Resnick, R. Sanabria, R. Jiang, and the Sesame team., “CSM: A conversational speech generation model”, https://github.com/SesameAILabs/csm, 2025.
[8] Y. A. Li, C. Han, V. Raghavan, G. Mischler, N. Mesgarani, “StyleTTS 2: Towards human-level text-to-speech through style diffusion and adversarial training with large speech language models”, in NeurIPS, 2023, pp.19594-19621.
[9] D. Bernhard, A.-L. Ligozat, M. Bras, F. Martin, M. Vergez-Couret, P. Erhart, J. Sibille, A. Todirascu, P. Boula de Mareüil, D. Huck, “Collecting and annotating corpora for three under-resourced languages of France: Methodological issues”, Language Documentation & Conservation, 2021, 15, pp.316-357.

Profil du candidat :
Master ou Diplôme d’ingénieur en traitement de la parole, TAL, machine learning, linguistique informatique ou dans un domaine lié.
Solides compétences en programmation Python/Pytorch.
Une expérience préalable en traitement de la parole ou en TAL sera un atout.
La connaissance d’une langue régionale, d’outre-mer ou non-territoriale de France est un plus.

Formation et compétences requises :
Merci de postuler en ligne à l’adresse: https://jobs.inria.fr/public/classic/fr/offres/2026-09871

Adresse d’emploi :
615, rue du Jardin Botanique
54600 Villers-lès-Nancy

AI4EO spring school 2026

Date : 2026-04-08 => 2026-04-10
Lieu : Vannes

Following the successful AI4EO 2025 symposium in Rennes last Fall, we are organizing a Spring School on AI4EO in Vannes from April 8 to 10, 2026 with the support of Erasmus Mundus Joint Master Copernicus Master in Digital Earth, Cluster SequoIA, IRISA – Institut de Recherche en Informatique et Systèmes Aléatoires, University of South Brittany, and European Space Agency – ESA.
The program features lectures and hands-on sessions on foundation models, MLOps, Responsible AI and generative models, as well as a data-driven project and some social events! The list of speakers includes Pedram Ghamisi and Weikang Yu from Helmholtz-Zentrum Dresden-Rossendorf (HZDR), Adam Stewart from Technical University of Munich, Stéphane May from Centre National d’Études Spatiales, Iris de Gélis from Observatoire de Paris | PSL, Nicolas Audebert from IGN – French Mapping Agency (Institut Géographique National), and Pierre Adorni from IRISA – Institut de Recherche en Informatique et Systèmes Aléatoires
If you are interested, register ASAP since the number of seats is limited!
All details here: https://www-obelix.irisa.fr/ai4eo-spring-school-2026/

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

SI-DH @ INFORSID 2026 : Appel à communication

Date : 2026-05-26
Lieu : Toulouse

3ème édition Atelier Systèmes d’Information et Humanités Numériques (SI-HN)

Thématique Spéciale : Le cycle de la temporalité : Extraction, Modélisation et Interrogation

Présentation de l’Atelier
Cet atelier explore la relation bidirectionnelle entre les systèmes d’information (SI) et les humanités numériques (HN). Cette année, nous plaçons au cœur de nos échanges le défi de la temporalité.
En sciences humaines, le temps est une donnée plurielle, incertaine et souvent non linéaire. L’objectif est de réunir des chercheurs pour discuter de la manière dont les SI peuvent capturer, structurer et restituer cette complexité temporelle, du document brut jusqu’à l’interface de recherche.

Axe Thématique : Le défi du temps dans les SI pour les HN
Nous sollicitons des contributions originales portant sur l’ensemble de la chaîne de traitement de la donnée temporelle :
1. Extraction de la temporalité
• Analyse de textes : Reconnaissance automatique d’entités temporelles (NER) dans des corpus historiques.
• Interprétation du flou : Passage d’expressions naturelles (« à l’aube du XVIIe », « sous le règne de… ») à des données exploitables.
• Corrélation de sources : Extraire et réconcilier des dates issues de documents hétérogènes (archives, registres, récits).
2. Modélisation et Représentation
• Temporalités multiples : Coexistence du temps historique (l’événement), narratif (le récit) et documentaire (la production de l’objet).
• Structures complexes : Modélisation temporelle dans les graphes de connaissances et les ontologies.
• Incertitude : Représentation formelle de l’imprécision, des intervalles flous et des événements à durée indéterminée.
• Discordances et Autorité des Sources : les conflits de temporalités avec une gestion des contradictions entre gisements de données hétérogènes (ex: une date estimée dans un registre médiéval devenant une “vérité” factuelle par sédimentation dans les encyclopédies modernes) et l’arbitrage et traçabilité, en abordant le questionnement sur la primacité de la source directe (le document d’époque) versus la source compilée, et modélisation de la preuve pour trancher ou maintenir la divergence.
3. Interrogation et Exploitation
• Langages de requêtes temporels : Comment interroger des relations de type « avant », « pendant » ou « contemporain de » dans des bases de données HN ?
• Visualisation et navigation : Interfaces pour explorer des chronologies non linéaires ou des réseaux spatio-temporels.
• Alignement d’ontologies : Interroger des systèmes ayant des référentiels temporels hétérogènes.

Thématiques Générales sollicitées
Outre le focus sur la temporalité, l’atelier reste ouvert aux travaux portant sur :
• SI et Disciplines : Applications à l’Histoire, l’Art, la Philosophie, le Droit…
• Méthodes SHS et SI : Amélioration des modèles SI par l’apport des sciences humaines.
• Études de cas : Retours d’expérience sur des projets concrets mêlant ingénierie des données et recherche patrimoniale.

Nous sollicitons des travaux originaux présentant des avancées théoriques, des développements méthodologiques ou des retours d’expériences critiques. Les contributions peuvent prendre la forme de communications de recherche (présentant des résultats consolidés), de notes de projets (exposant des travaux en cours ou des protocoles expérimentaux) ou de démonstrations logicielles mettant en avant des outils d’extraction ou de visualisation temporelle. Une attention particulière sera portée aux propositions démontrant une réelle collaboration interdisciplinaire, où les défis posés par les sources humaines ont conduit à une innovation ou une adaptation des modèles de systèmes d’information classiques. Les articles peuvent être rédigés en français ou en anglais et d’une longueur de 8 à 12 pages au format (peu compact !) de la conférence INFORSID (Springer LNCS). Les articles sont à soumettre sur le site suivant :
https://easychair.org/conferences/?conf=sihn2026

Dates importantes :
17/04 à 12h clôture de l’envoi des soumissions
04/05 notification aux auteurs
26/05 atelier SIDH
Pour vos questions ou remarques vous pouvez vous adresser aux organisateurs de l’atelier :
Stéphane Lamassé stephane.lamasse@univ-paris1.fr
Cédric du Mouza dumouza@cnam.fr

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

FUSION-KG: Framework for Unified multimodal Semantic extractION for Knowledge Graphs construction

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : ICube Strasbourg
Durée : 3 ans
Contact : franco.giustozzi@insa-strasbourg.fr
Date limite de publication : 2026-05-11

Contexte :
Environmental restoration projects generate large volumes of heterogeneous documentation, including technical reports, project plans, cartographic materials, engineering drawings, and photographic records. These materials contain valuable but fragmented knowledge describing intervention strategies, environmental contexts, technical constraints, and outcomes.
Within the TETRA project (ANR-22-FAI2-0006), previous research efforts primarily concentrated on text-based knowledge extraction using Large Language Models (LLMs), enabling the structuring of restoration knowledge from technical and narrative reports. While this approach demonstrated the potential of large language models for semantic modeling and ontology enrichment, it remained largely confined to textual sources. However, restoration documentation increasingly includes rich visual materials, such as maps, technical drawings, aerial imagery, and photographic records that contain complementary and sometimes critical information not explicitly described in text. This PhD builds upon the foundations established in TETRA by extending the extraction paradigm toward a unified multimodal framework. The central hypothesis is that integrating textual and visual understanding through advanced Vision-Language Models (VLMs) can substantially improve the completeness, semantic consistency, and interpretability of structured environmental knowledge graphs.

Sujet :
The FUSION-KG PhD aims to design a unified multimodal semantic extraction framework capable of transforming heterogeneous environmental documentation into structured, interpretable, and queryable knowledge graphs. The ambition is not only to extract information from text and images, but to develop a coherent framework in which multimodal understanding and structured external knowledge
jointly contribute to reliable and semantically consistent knowledge graph construction.
The work involves the systematic modeling and characterization of heterogeneous documentary sources, including technical reports, maps, engineering drawings, aerial and satellite imagery, and photographic
records of restoration interventions. These materials provide complementary yet often fragmented accounts of intervention types, spatial configurations, temporal phases, environmental parameters, constraints, and outcomes. A major challenge lies in ensuring that information extracted from visual and textual modalities is semantically aligned and represented within a shared conceptual framework.

Profil du candidat :
The doctoral contract is awarded by the doctoral school’s selection committee through a competitive process in which the candidates’ merit is a key factor

Formation et compétences requises :
Education: Student about to graduate a Master or Engineer (Bac + 5) with a specialization in Computer Science.

Specific knowledge: Knowledge on data science methods, knowledge representation and reasoning, knowledge graphs.
Languages: Python, java, owl/sparql.
Ability to work with experts who are not computer scientists. Interest in the application domain would be appreciated.

Adresse d’emploi :
ICube laboratory (CNRS UMR 7357),
300 boulevard Sebastien Brant
BP 10413
67412 ILLKIRCH cedex

Document attaché : 202603151916_Sujet_These_ED_VLM.pdf

Détection d’Anomalies dans l’Environnement (DAE) : Un Atelier Interdisciplinaire – 2e édition

Annonce en lien avec l’Action/le Réseau : DAE

Thème :

Détection d\’anomalies, IA symbolique, apprentissage automatique

Présentation :

Cet atelier fait suite à une première édition organisée lors du congrès INFORSID 2025 à Pau. Il vise à rassembler chercheurs, industriels et décideurs afin de promouvoir l’intégration de méthodologies d\’IA symbolique et d\’apprentissage automatique afin de relever les défis environnementaux actuels grâce à une meilleure exploitation des masses de données disponibles.

En mettant l\’accent sur la détection et l\’analyse des anomalies environnementales (pollution, catastrophes naturelles et d\’origine anthropique, etc.), l\’atelier cherche à mettre en lumière de nouvelles approches innovantes pour caractériser ces phénomènes atypiques, identifier leurs causes, prédire leur évolution et évaluer leurs impacts sur la santé humaine et les écosystèmes.

L\’atelier DAE se veut avant tout un espace d\’échange. Son objectif principal est de favoriser l\’émergence de collaborations interdisciplinaires visant à proposer des solutions impactantes basées sur l\’exploitation de jeux de données complexes et hétérogènes. En complément des présentations scientifiques, l’atelier encouragera des discussions et des échanges autour de solutions concrètes pour l’analyse des systèmes d’information environnementaux. Des exemples pratiques et des retours d\’expérience seront partagés.

Du : 2026-05-26

Au : 2026-05-26

Lieu : Toulouse

Site Web : https://inforsid2026.sciencesconf.org/resource/page/id/44

AISSAI/GAP 2026

Date : 2026-06-17 => 2026-06-19
Lieu : Grenoble

Dear colleagues,

(Apologies for cross-posting)

We are pleased to invite you to the AISSAI/GAP 2026 Workshop – Artificial Intelligence for Science, which will take place in Grenoble, France, from 17 to 19 June, 2026.

https://indico.math.cnrs.fr/event/15724/

Building on the GAP 2024 workshop held in Grenoble, AISSAI/GAP 2026 will explore the intersections between machine learning, artificial intelligence, and scientific modeling, with a particular emphasis on inverse problems for physical systems, differentiable physics, and simulation-based approaches. This workshop is part of the AISSAI thematic trimester on “HPC and AI convergence at the exascale era.”

The workshop aims to bring together researchers from machine learning, applied mathematics, computational physics, and related application domains, in order to foster interdisciplinary exchanges, stimulate new collaborations, and strengthen connections within the scientific community, particularly across the Alpine research ecosystem.

We are delighted to announce a strong lineup of invited speakers, who will deliver in-depth lectures covering both methodological advances and applications at the interface of AI and the sciences:

— Linus Bleinstein, EPFL (foundation models for life sciences)
— Patrick Galinari, Sorbonne Université (foundational models for scientific applications)
— Samuel Hurault, CNRS, Université Gustave Eiffel (diffusion models and flow matching: theory and applications)
— Ching-Yao Lai, Stanford University (physics-informed deep learning for inverse problems)
— Fanny Lehmann, ETH Zurich (foundational models for geophysical sciences)
— Jakob Macke, University of Tuebingen (simulation-based inference)
— Julien Mairal, Inria (machine learning for scientific Imaging)
— Laurence Perrault-Levasseur, Université de Montréal (bayesian methods for astronomy)
— Nelly Pustelnik, CNRS, ENS Lyon (model-based neural networks)
— Gabrielle Steidl, TU Berlin (generative flows)

In addition to the invited talks, the workshop will include an informal poster session (i.e. not peer reviewed, without proceedings), offering participants the opportunity to present recent work and ongoing research at the frontier of AI-driven scientific discovery.

Registration will be free but mandatory (limited to 200 participants).

Practical information, program updates, and registration details are available on the workshop website:
https://indico.math.cnrs.fr/event/15724/

We very much hope to welcome you in Grenoble for AISSAI/GAP 2026.

Best regards,
Pedro Rodrigues for the AISSAI/GAP 2026 organising committee

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Appel à communication Atelier INTERACT @plateforme PFIA à Arras, le 29 juin /deadline 15 avril

Date : 2026-06-29
Lieu : Plateforme PFIA, à Arras

Lundi 29 juin à Arras
Dans le cadre de la Plate-Forme Intelligence Artificielle (PFIA) : (https://pfia26.cril.fr/)
Atelier INTERACT
 
Avec le soutien du GDR MADICS (atelier GRASP )
 

——————————————————————————————
Ces dernières années, la recherche sur les réseaux sociaux a conduit au développement de techniques sophistiquées issues de la théorie des graphes, des techniques d’apprentissage automatique, de fouille de données et d’économétrie pour l’analyse des réseaux et la prédiction de comportements individuels. La compréhension et l’analyse des relations sociales dans les réseaux grâce à l’analyse des réseaux ouvrent de nombreuses perspectives de recherche en sociologie, littérature, médias, biologie, informatique, sport, etc.
En particulier, pour fournir des recommandations de politiques publiques (santé, environnement, éducation, travail), il est important d’identifier des effets de réseaux. En effet, de nombreuses études montrent que les comportements individuels s’inscrivent dans un ensemble d’interactions sociales. Les individus interagissent de multiples façons et tendent à imiter et à apprendre des autres, en particulier de ceux appartenant à leur environnement proche, tels que leurs familles, amis, collègues ou voisins. L’influence de ces interactions sur le comportement individuel est appelée “effets de pairs”. Cette définition est intuitive, mais l’identification empirique des effets de pairs reste difficile à démontrer, et des communautés variées se sont penchées sur cette problématique. L’analyse des effets de pairs et plus généralement des comportements des individus dans un réseau représentent un défi scientifique notamment lié (a) à la nature potentiellement volumineuse, et complexe des données issues de graphes de données sociales (e.g. liens sociaux multiples, incomplétude des liens observés ou déclarés, choix des variables caractérisant des individus, données d’enquêtes ou issues d’essais randomisés contrôlés), et (b) à la difficulté de définir des modèles permettant de dégager des hypothèses causales et des explications sur le comportement des individus ou de sous-ensemble d’individus.
L’analyse des réseaux sociaux peut répondre à différentes problématiques multi- disciplinaires, notamment l’identification des experts ou des communautés d’expertise dans un domaine particulier, la cartographie des sujets sur lesquels portent les interactions, la manière dont les infections et les opinions se propagent, ou encore l’effet d’un traitement dans une population (i.e vaccin, message).
L’atelier aura pour objectif de favoriser les échanges interdisciplinaires sur la problématique de l’analyse des réseaux sociaux et de mieux comprendre les avantages et les limites des approches de chacun, et leurs possibles complémentarités.

Liste des thématiques (non exhaustive) :
• Apprentissage supervisé et non supervisé dans des données graphes
• Apprentissage de règles, GNN, Clustering de Graphes, Fouille de graphes
• Identification de sous-populations, de profils, de communautés dans des graphes d’interactions
• Analyse et Fouille de Réseaux sociaux : détection de communautés, recherche de motifs fréquents dans des graphes, évolution de réseaux, prévision de liens, modèles de diffusion
• Econométrie des réseaux, économie comportementale et expérimentale, modèles statistiques, causalité, …
• Systèmes d’aide à la décision, prédiction de comportement, effet de pair, …

Soumissions
Les soumissions se feront sous format pdf via le site Easychair (https://easychair.org/conferences/?conf=interactpfia26). Les soumissions prendront la forme d’un résumé de 2 pages à 6 pages, en suivant le style PFIA 2026. Elles peuvent être rédigées en français ou en anglais. Chaque soumission fera l’objet d’une évaluation par plusieurs membres du comité de programme. Les articles sélectionnés donneront lieu à des présentations orales en français, sauf impossibilité majeure. Les actes de la journée seront regroupés dans un document pdf publié en ligne.

Dates importantes
• Date limite de soumission des articles : 15 avril 2026
• Notification aux auteurs : 6 mai 2026
• Date de la journée : 29 juin 2026

Comité de programme (en cours de construction)
• Hadhami El Ouni, LIPN, Université Sorbonne Paris Nord
• Mathieu Lambotte, CREM, Université de Rennes
• Maria Rifqi, LEMMA University Paris-Panthéon-Assas
• Thibaut Soulard, LISN, Université Paris Saclay
• Danai Symeonidou, INRAE Montpellier

Comité d’organisation de l’atelier
• Noémi Berlin, EconomiX, Université de Nanterre
• Nathalie Pernelle, LIPN, Université Sorbonne Paris Nord
• Céline Rouveirol, LIPN, Université Sorbonne Paris Nord
• Carole Treibich, Laboratoire d’Economie Appliquée de Grenoble

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

First International Workshop on Agents, Things and Lightweight AI for Sustainability (ATLAS)

Date : 2026-06-09
Lieu : Lyon, France

First International Workshop on Agents, Things and Lightweight AI for Sustainability (ATLAS)

https://atlas.liris.cnrs.fr/

Colocated with ICWE’2026 (https://icwe2026.webengineering.org/)

About the workshop:
——————-

As IoT proliferates, the environmental and technical impact of billions of connected devices demands urgent attention. This workshop examines how AI-augmented agents should be designed, managed and coordinated while optimizing resource consumption and operating under frugal conditions and infrastructures. It also aims to review existing implementations of the Web of Things (WoT) standards with respect to long-term maintainability.

The primary goals of ATLAS are to:
– Present cutting-edge research at the intersection of agent-based systems, IoT, and sustainability
– Identify open research challenges and future directions for frugal, standards-compliant agentic systems
– Build a community around sustainable WoT technologies

The workshop topics include but are not limited to:
– Federated learning for edge intelligence
– Embedding intensive inference algorithms into constrained devices
– Predictive maintenance to reduce e-waste
– Frugal hardware-related concerns
– Ethical frameworks for sustainable AI deployment
– Resource-aware agentic LLM-based systems
– Complexity of embedded semantic Web processes
– Energy, network and/or memory management in decentralized Web-based architectures
– Deployment of IoT / WoT platforms on Constrained devices
– Lifecycle and maintenability of Cyber-Physical Systems
– Robust and resilient distributed agentic systems
– Environmental footprint of sensor and actuator-based infrastructures
– Observability and governance of agents in decentralized architectures
– Coordination architectures for agents with distributed knowledge
– Application areas such as product passports and carbon footprint tracking

The workshop format will include a keynote talk and oral presentations of long and short accepted contributions, based on peer-review.

Important dates:
—————-

– Paper Submission: March 29, 2026
– Author Notifications: April 23, 2026
– Workshop presentations: June 9th, 2026
– Camera-ready Version: June 30, 2026

Submission information:
———————–

We expect contributions in the form of either:
– Long papers max: 12 pages
– Short papers max: 6 pages

Kindly follow the detailed instructions on the workshop website: https://atlas.liris.cnrs.fr/#submission

Organizing committee:
———————

– Lionel Medini, LIRIS lab. / Lyon 1 Univ., France
– Nadia Yacoubi Ayadi, LIRIS lab. / Lyon 1 Univ., France
– Lionel Tailhardat, Orange, France
– Raphael Troncy, Eurecom, France
– Andreas Harth, Friedrich-Alexander-Universität Erlangen-Nürnberg / Fraunhofer IIS, Germany

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Nested Modeling and Sensitivity Analysis for Robust Control of Large-Scale Membrane Bioreactors under Uncertainty

Offre en lien avec l’Action/le Réseau : EXMIA/Doctorants

Laboratoire/Entreprise : Laboratoire de Génie Chimique (LGC)
Durée : 3 ans
Contact : rachid.ouaret@toulouse-inp.fr
Date limite de publication : 2026-04-10

Contexte :
In France, more than 22,000 wastewater treatment plants collect and treat approximately 8.4 billion
m3 of wastewater annually, but less than 1% of this treated water is currently reused. In response
to recent drought episodes and the increasing scarcity of water resources, the “Water plan (Plan
Eau)” was introduced in 2023 to promote a more resilient and concerted management of water
resources, including the valorization of treated wastewater reuse (REUT) [1]. Membrane bioreactors (MBRs) are recognized wastewater treatment processes known for their excellent purification
performance and are now deployed in large-scale installations. However, these systems consume
at least twice the energy of conventional activated sludge systems (CAS), primarily due to their
high aeration requirements [3, 4]. This energy demand is further influenced by the concentration
of Total Suspended Solids (TSS), which directly affects reactor volume and design. Addressing
these issues requires advanced mathematical models capable of optimizing MBR performance while
accounting for uncertainties in influent characteristics, operational conditions, effluent quality, and
energy efficiency.
The scientific complexity of this issue lies in the intrinsically nested nature of MBR models. Unlike
traditional approaches that consider systems as “single-block” entities, large-scale MBRs involve
a deeply nested structure where the output of one sub-model (biological, physical, or energetic)
becomes the input of another [2]. This specific architecture generates complex multi-scale and
multi-frequency dynamics. Biological phenomena directly influence the production of suspended
solids and EPS (Extracellular Polymeric Substances), which condition membrane fouling, creating
a strongly coupled physico-biological system with multiple feedback loops. This nested structure
is essential for faithfully capturing the real behavior of industrial installations, but it considerably
complicates the analysis and management of uncertainties.
The uncertainties present in these systems are multiple and dependent: they concern the influent
(flow rate, COD, NH+
4
, TSS), operational conditions (control parameters), and membrane fouling.
These uncertainties evolve over time, are described by heterogeneous data often asynchronous or
incomplete, and exhibit complex structural dependencies that cannot be captured by classical statistical methods. In particular, dependencies between variables (linear or nonlinear, symmetric or
asymmetric) require specific tools such as copulas for precise modeling [5]. This complexity of uncertainties is exacerbated by the nature of the collected data: wastewater treatment plants generate
time series at different temporal scales (from seconds to weeks), with distinct time steps between
online sensors, laboratory analyses, and operational histories.
Sensitivity analysis represents an essential lever for understanding and optimizing these systems, but
it faces major challenges in the context of nested models. Traditional sensitivity analysis methods,
developed for single-block models, do not allow for fine analysis of sub-model contributions nor
correct quantification of sensitivities in a nested structure [6]. A specific approach is therefore
necessary to evaluate how variations in input parameters affect final outputs through the entire
modeling chain. This sensitivity analysis must also integrate symbolic data representation (intervals,
histograms, empirical distributions) to capture uncertainty without resorting to temporal smoothing
that would lose critical information [7].

Sujet :
The heart of this PhD lies in the development of an innovative methodology articulating nested
modeling, sensitivity analysis, and artificial intelligence for large-scale membrane bioreactors. This
approach builds upon preliminary work conducted at LGC on integrated MBR modeling [8, 9] and
leverages promising results recently obtained in the field of sensitivity analysis of hybrid models
[10, 11].
Nested modeling constitutes the foundation of this PhD. Unlike traditional single-block approaches, we will develop a graphical representation of interdependencies between biological (ASM-SMP),
physical (RIS), and energetic sub-models, following an approach similar to that proposed by Touboul
[12]. This nested structure will enable faithful capture of multiple feedback loops between different MBR system components, particularly between biological pollutant degradation processes and
physical membrane filtration phenomena. The use of probabilistic tools such as copulas [13] will
allow rigorous modeling of stochastic dependencies between influential variables, while a variant of
the Total Interaction Index (TII) [14] will be implemented to assess stochastic dependencies within
the nested framework.
Sensitivity analysis occupies a central position in this PhD, with the objective of developing sensitivity measures specifically adapted to nested and multi-scale structures. We will deploy classical
tools well-documented in specialized literature (derivative-based, distribution-based, or variogrambased approaches) [15], while conducting an in-depth reflection on the specificity of nested model
structures to tailor these tools to our specific context. The Shapley effect for sensitivity analysis
with dependent inputs [16, 13] will also be considered within the framework of this project, offering an innovative perspective for quantifying individual and joint contributions of parameters in a
dependency context.
Artificial intelligence will play a complementary and essential role in this PhD, particularly through
the development of Physics-Informed Neural Networks (PINN) and machine learning model interpretability techniques. This hybrid approach, which combines the advantages of mechanistic models
and data-driven methods, has already proven its worth in the field of process engineering [18] and
specifically for wastewater treatment [19]. Recent work by Danesh et al. [17, 11] has demonstrated
the effectiveness of model-agnostic methods (Accumulated Local Effects, Partial Dependence Plots)
for making neural network predictions interpretable, a fundamental requirement for the adoption
of these tools by industrial operators.
Reinforcement learning (RL) will constitute the third pillar of this PhD, with the objective of developing a real-time control framework for optimizing MBR operations. Building upon the nested
models developed and sensitivity analyses performed, this RL framework will dynamically adjust
operational parameters based on process variability. State estimation techniques, such as the Extended Kalman Filter (EKF), will be implemented to enhance RL decision-making by mitigating
measurement noise and handling system uncertainties [20, 21]. The integration of RL with mechanistic models will ensure that the control strategy remains explainable and applicable to real-world
operations

Profil du candidat :
Education: Master’s degree or equivalent (5 years) in applied mathematics, statistics, process engineering, control engineering, data science, or related field.

Formation et compétences requises :
Technical skills:
– Probability and statistics (sensitivity analysis, stochastic processes)
– Dynamical systems modeling and differential equations
– Optimization and optimal control
– Machine learning and reinforcement learning
– Scientific programming (Python, R, MATLAB, Julia)
• Assets: Knowledge in process engineering or water treatment would be a plus
• Personal qualities: Autonomy, scientific rigor, taste for interdisciplinary research
• Languages: Scientific English (reading, writing, oral communication)

Adresse d’emploi :
4 allée Emile Monso
CS 84234
31 432 Toulouse cedex 4

Document attaché : 202603101043_ANR_FlexMIEE_Offre_these_fr_en.pdf

Premier webinaire — IN/data : INdex à l’INverse de l’INformatique ?

Date : 2026-03-16
Lieu : https://visio.numerique.gouv.fr/hco-kkoj-itr

L’atelier CODA-MADICS a pour objectif de construire un espace où les données, les algorithmes et la création deviennent des instruments pour imaginer des futurs plus justes, pluralistes et responsables. Dans cette perspective :

⁃ l’art devient un laboratoire critique pour interroger les infrastructures algorithmiques ;
⁃ la science des données devient un espace d’expérimentation collective et inclusive ;
⁃ les algorithmes sont pensés comme des objets culturels et sociaux, et non comme de simples objets techniques.

Notre ambition est de développer des pratiques en matière de données et d’IA qui soient responsables, inclusives, transparentes, soutenables et ouvertes à la diversité des savoirs et des cultures.

Premier webinaire CODA-MADICS
Programme

12:00 – 12:05 : Introduction à CODA-MADICS (5 minutes)

12:05 – 12:35 : Webinaire IN/data : INdex à l’INverse de l’INformatique ?
Lilyana V. Petrova, ETIS

12:35 – 13:15 : Discussion et questions-réponses

Titre : Webinaire IN/data : INdex à l’INverse de l’INformatique ?

Résumé
Féminisme, équité, environnement, care, art, gouvernance, éthique, extractivisme, interdisciplinarité, altérité… autant de ‘mots’ qui, alignés les uns après les autres, renvoient à une multitude de domaines et de problématiques. Les sciences humaines et sociales ont longuement réfléchi à l’application de ces mêmes notions, développant une pensée critique et articulant les paradoxes inhérents à toute création intellectuelle. À l’inverse, appliqués aux sciences des données, ces mots se retrouvent en débat avec d’autres, tout aussi insignes : optimisation, efficacité, précision, expertise, objectivité, probabilité… Ce lexique « INverse » n’a rien d’anodin. Il constitue les fondements d’une démarche dialectique, permettant de faire avancer la pensée et par là-même la science. Comment ces concepts font-ils écho à des réalités concrètes ? Comment, analysés conjointement, peuvent-ils prendre corps dans une construction théorique et scientifique cohérente ? Comment peuvent-ils générer de nouveaux paradigmes interdisciplinaires ? Ici, nous essaierons d’avancer sur la construction d’un vocable conceptuel qui permettra de nouer le dialogue entre les différentes cultures scientifiques, dont les intérêts, souvent antinomiques, peuvent poser question. En mobilisant le néologisme IN/data, concept inverse à celui de la donnée, nous proposons une discussion qui vise à questionner ce que constitue l’INformatique par son INverse

Intervenante
Lilyana V. Petrova est maîtresse de conférences à ETIS (ENSEA / CNRS / CY Université Cergy Paris Université).
Elle est enseignante-chercheuse dans le champ interdisciplinaire des Arts, des Sciences et des Techniques en Société.

Contact
coda-madics-pi@groupes.renater.fr

Porteur·euses de l’Atelier CODA-MADICS
Genoveva Vargas-Solar, LIRIS
Frédérique Bevilacqua, IRCAM, STMS
Baptiste Caramiaux, ISIR

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Post navigation

← Older posts

Newer posts →

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

Synthèse de la parole multilingue appliquée aux langues régionales

AI4EO spring school 2026

SI-DH @ INFORSID 2026 : Appel à communication

FUSION-KG: Framework for Unified multimodal Semantic extractION for Knowledge Graphs construction

Détection d’Anomalies dans l’Environnement (DAE) : Un Atelier Interdisciplinaire – 2e édition

AISSAI/GAP 2026

Appel à communication Atelier INTERACT @plateforme PFIA à Arras, le 29 juin /deadline 15 avril

First International Workshop on Agents, Things and Lightweight AI for Sustainability (ATLAS)

Nested Modeling and Sensitivity Analysis for Robust Control of Large-Scale Membrane Bioreactors under Uncertainty

Premier webinaire — IN/data : INdex à l’INverse de l’INformatique ?