Demi-journée scientifique : explicabilité des modèles d’apprentissage automatique pour les signaux 2D/3D

Date : 2023-07-13
Lieu : Amphithéâtre Laura Bassi, INSA, Campus de la Doua, Lyon

Ou en virtuel :
https://cnrs.zoom.us/j/91931962448?pwd=eC9xTkNaeTlkN2Npd29zd2t4YnJNdz09

Les thèmes “Images et Informatique Graphique” et “Intelligence Artificielle et Apprentissage Automatique” (I3A) de la Fédération Informatique de Lyon (FIL) organisent une demi-journée d’échanges scientifiques sur l’explicabilité des modèles d’apprentissage automatique pour les signaux 2D/3D.

Programme :
Céline Hudelot (Professeur à CentralSupélec Paris, laboratoire MICS)
“Techniques d’explications visuelles pour comprendre les décisions de modèles de classification en imagerie médicale”

Sylvia Tulli (Maître de Conférences, Sorbonne Université, Paris, laboratoire ISIR)
“Explainable AI for Sequential Decision Making and Robotics”

Valentine Wargnier Dauchelle (Doctorante, laboratoire Creatis, Lyon)
“A Weakly Supervised Gradient Attribution Constraint for Interpretable Classification and Anomaly Detection”

Martin Blanchard (Doctorant, LHC, Saint-Étienne)
“Réseaux de neurones explicables: application à l’imagerie cellulaire avec ProtoPNet”

Sébastien Valette (Chargé de Recherche, laboratoire Creatis, Lyon)
“Disentangled representations: towards interpretation of sex determination from hip bone”

inscription : https://evento.renater.fr/survey/demi-journee-fil-xai-hyu9etrx


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Ecole d’été “Graphes et leurs applications au traitement de données”

Date : 2024-06-24 => 2024-07-01
Lieu : INSA de Rouen (76)

Les graphes sont au cœur de nombreuses thématiques de recherche ou apparaissent spontanément dans des projets où on ne les attendaient pas. Le traitement de ces objets peut mobiliser plusieurs domaines de recherche tels que la théorie des graphes, la modélisation de données sémantiques ou dynamiques, le traitement de données définies sur des graphes ou l’apprentissage de données définies sur ou par des graphes. Cette apparente disparité d’approches cache toutefois une utilisation de nombreux outils communs (e.g. plus grand sous graphe commun, pattern de graphes, métrique sur graphe…). L’objectif de la formation est de fournir une vue d’ensemble des approches détaillées ci-dessous pour fournir une vue d’ensemble du traitement de données sur graphes et permettre des échanges fructueux entre communautés scientifiques.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Open PhD position on NLP at Sorbonne University jointly with ISIR (Paris, France) and IRL – ILLS (Montreal, Canada)

Offre en lien avec l’Action/le Réseau : SimpleText/Doctorants

Laboratoire/Entreprise : ISIR (Paris, France) and IRL – ILLS (Montreal, Ca
Durée : 3 ans
Contact : pablo.piantanida@centralesupelec.fr
Date limite de publication : 2023-08-31

Contexte :
Large Language Models (LLMs) a.k.a foundation models have greatly im- proved the fluency and diversity of machine-generated text. Indeed, the release of ChatGPT and GPT-4 by OpenAI has sparked global discussions on the effec- tive use of AI-based writing assistants. However, this progress has also introduced considerable threats such as fake news, and the potential for harmful outputs such as toxic or dishonest speech, among others. As it seems, the research on methods aimed at detecting the origin of a given text to mitigate the dissemination of forged contents and to prevent technology-aided plagiarism lags behind the rapid advancement of AI itself. For tasks like question-answering, it is essential to know when we can trust the natural language outputs of foundation models. Likewise, for tasks like machine translation, it becomes important to detect hallucinations or omissions, i.e., translations that either contain information completely unrelated to the input or that do not include some of the input information.
Recent works have indeed focused on tools that are able to spot such AI- generated outputs to identify and address these underlying risks. However, many of the existing approaches rely on pre-existing classifiers for specific undesired out- puts, which restricts their applicability to situations where the harmful behavior is precisely known in advance.
Statistical analysis of lexical distributions is a valuable approach for anomaly detection in natural texts. By examining the frequency distributions of words and phrases in a given text or dataset, statistical methods can help identify unusual or anomalous patterns that deviate from the norm and these anomalies may indi- cate potentially harmful outputs, may reveal the origin of a given text, or detect hallucinations, stylistic inconsistencies, or even malicious intent in the text. By leveraging statistical methods to analyze lexical distributions, this thesis will fo- cus on the automatic uncovering of deviations and anomalies that may indicate irregularities or unexpected patterns in natural language texts.

Sujet :
Forged texts and misinformation are ongoing issues and are in existence all around us in biased software that amplifies only our opinions for a “better”, more seamless user experience. On social media platforms, such software is used by rogue states, businesses, and individuals to create misinformation, amplify doubts about fac- tual data or tarnish their competitors or adversaries, thereby enhancing their own strategic or economic positions. This spread may be the result of different factors and incentives; however, each poses the same fundamental issue to humanity: the misunderstanding of what is true and what is false.

Leveraging deep learning models for large-scale text generation such as GPT-3 and GPT-4 has seen widespread use in recent years due to superior performance over traditional generation methods, demonstrating an ability to produce texts of great quality, with a coherence and relevance that is sometimes hard to distinguish from human productions. These models generate text via an auto-regressive procedure that samples from a distribution learned to mimic the ”true” distribution of human written texts. Malicious uses of these technologies thus constitute a major threat to truthful information.

Artificial text detection can be viewed as a special case of anomaly detection, broadly defined as the task of identifying examples that deviate from regular ones to a degree that arouses suspicion. Current research in anomaly detection largely focuses either on deep classifiers (e.g., out-of-distribution detection, adversarial attack) or relies on the output of large language models when labeled data is unavailable. Although these lines of research are appealing, they do not scale without requiring a large amount of computing. Additionally, these methods make the fundamental assumptions that (1) the statistical information needed to iden- tify anomalies is available in the trained model, (2) the model uncertainty can be trusted, which is typically not the case as illustrated in the presence of a small shift in the input distribution. LLM-based approaches do not perform well when used on large text fragments, as may be needed in practical applications (e.g., novel, story, or news generation), because of the fixed length context used when training the language model.

This Ph.D. thesis focuses on developing hybrid anomaly detection methods using deep neural network-based techniques and word frequency distributions that are linguistically inspired. Most of the research on language models to date fo- cuses on sentence-level processing and fails to capture long-range dependencies at the discourse level. Instead, we will leverage word frequency distributions and information measures to characterize long documents, incorporating a very large number of rare words, which often leads to strange statistical phenomena such as mean frequencies that systematically keep changing as the number of observations is increased. Advanced concepts from statistics and information measures are nec- essary to understand the analysis of word frequency distributions and to capture document-level information. We are expected to design and develop novel statistical models and algorithms specifically tailored for analyzing lexical distributions in natural texts. Extensive experiments on real-world data sets will be executed to showcase the viability of our approach, benchmark its performance, and analyze its advantages, limitations, and areas for improvement.

*Research questions*
Some potential research questions for our consideration are:

• How can lexical distributions be effectively modeled and represented in natural language texts?

• What information (statistical) measures and techniques can be derived to identify anomalies in lexical distributions?

• How can contextual information and linguistic features be integrated into anomaly detection models based on lexical distributions?

• Can unsupervised learning techniques be leveraged to detect anomalies without the need for labeled anomaly data?

• How can domain-specific knowledge and expert (or mechanical) feedback be incorporated into the anomaly detection process to improve performance?

This research will provide a deeper understanding of statistical analysis techniques for anomaly detection in natural texts and contribute to the development of more accurate and reliable methods for identifying unusual patterns in language usage.

*Team supervision*
Institut des Systèmes Intelligents et de Robotique (ISIR) and the International Laboratory on Learning Systems (ILLS) are looking for a student with a background in AI and Data Science, who gets inspired by sciences and the opportunities of data and AI to solve complex NLP problems. You have strong programming skills and a very good understanding of data science, statistics, and Machine Learning.

*An international and stimulating environment for research*
ILLS will promote international mobility between France and Canada to facilitate collaborations with Ph.D students and professors in Canada. The university partners in Canada are: McGill University and École de Technologie Supérieure (ÉTS), and the Quebec Artificial Intelligence Institute (Mila), which are major players in AI at the inter- national. They are involved in many research, industrial and academic projects. François Yvon, who will supervise this thesis at ISIR (Sorbonne Université), is a senior researcher at CNRS and a recognized expert in Automatic language pro- cessing, Machine translation, Speech recognition, Statistical language modeling, Document mining, Learning by analogy. Prof. Pablo Piantanida, who will super- vise this thesis on the ILLS (McGill – ETS – Mila) side, is a recognized expert in information theory and Machine Learning. One of the strengths of the partners, is first the high level of the international within the recently created International Research Laboratory ILLS of the CNRS in Montreal, allowing a highly dynamic and rich research environment in AI at large.

Profil du candidat :
• Very good understanding of Machine Learning theory and techniques.
• Good programming skills in Python (PyTorch).
• Applications/ domain-knowledge in natural language processing is a plus.
• Good communication skills in written and spoken English.
• Creativity and ability to formulate problems and solve them independently.

Formation et compétences requises :
• MSc program in Computer Science, Machine Learning, Computer Engi- neering, Mathematics, or related field (e.g. applied mathematics/statistics).

Adresse d’emploi :
https://emploi.cnrs.fr/Offres/Doctorant/UMR7222-YVEGER-002/Default.aspx?lang=EN

Document attaché : 202307091401_PhD_Topic_CNRS_ISIR_ILLS.pdf

STABLENET: From link streams to stable dynamic networks

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIRIS
Durée : 2 years
Contact : remy.cazabet@univ-lyon1.fr
Date limite de publication : 2023-08-31

Contexte :
http://cazabetremy.fr/resources/Stablenet-postdoc%20position.pdf

Sujet :
http://cazabetremy.fr/resources/Stablenet-postdoc%20position.pdf

Profil du candidat :
Doctorat en Science des réseaux, informatique ou autre domaine pertinent

Formation et compétences requises :
Data Mining, Machine Learning, Données dynamiques…

Adresse d’emploi :
Université Lyon 1, Lyon, France

Document attaché : 202307081419_stablenet-postdoc position.pdf

Ecole d’été du GDR RSD et journées thématiques sur l’apprentissage fédéré

Date : 2023-09-19 => 2023-09-22
Lieu : Ces deux événements auront lieu du 19-22/09 à Lyon (Amphithéâtre de la délégation CNRS, 1 avenue Albert Einstein, 69100, Villeurbanne).

Nous sommes heureux d’annoncer l’organisation de deux événements susceptibles d’intéresser la communauté du GDR MADICS.

Ces deux événements seront autour des multiples facettes de l’apprentissage distribué (efficacité, sécurité, enjeux autour de la protection de la vie privée, etc.).
Il s’agit de l’école d’été du GDR RSD (réseaux et systèmes distribués) et de deux journées thématiques sur les enjeux scientifiques, éthiques, socio-économiques de l’apprentissage distribué.
Les journées thématiques seront co-organisées avec la Société Informatique de France (SIF).

Les inscriptions sont désormais ouvertes mais la date limite d’inscription est le 15/07 !

Vous pouvez vous inscrire: soit à l’école (2 jours du 19-20/09); soit aux journées thématiques (2 jours du 21-22/09); soit à la totalité de l’événement école + journées (4 jours du 19-22/09). Une réduction de 50% s’applique pour les adhérents SIF qui souhaitent s’inscrire seulement aux journées thématiques.

Plus d’informations sur l’école:
https://rsd-summer-school-distribued-learning.conf.citi-lab.fr

Les journées thématiques:
https://distribued-learning-days.conf.citi-lab.fr

Lien pour s’inscrire: https://www.azur-colloque.fr/DR07/inscription/inscription/314/fr

Au plaisir de vous retrouver nombreuses et nombreux à Lyon !
Sonia pour le comité d’organisation

Comité d’organisation

Sonia Ben Mokhtar (Laboratoire LIRIS)
Laurent Réveillère (VP Société Informatique de France)
Antoine Boutet (Laboratoire CITI)
Carole Frindel (Laboratoire Creatis)
Eddy Caron (Laboratoire LIP)

————————————————————————————————

Vous trouverez un résumé du programme ci-dessous:

Ecole d’été du GDR RSD sur l’apprentissage (distribué) pour les systèmes et les réseaux : 19-20 Septembre 2023

Nous avons la chance d’accueillir des orateurs d’exception lors de cette école:

Francis Bach (https://www.di.ens.fr/~fbach/): membre de l’Académie des sciences et expert en apprentissage statistique et optimisation.
Giovanni Neglia (http://www-sop.inria.fr/members/Giovanni.Neglia/) : porteur de la chaire IA: PERUSALS (Pervasive Sustainable Learning Systems).
Denis Trystram (https://datamove.imag.fr/denis.trystram/): porteur de la chaire IA: Edge intelligence.
Catuscia Palamidessi (http://www.lix.polytechnique.fr/~catuscia/) : porteuse d’une bourse ERC sur la sécurisation des données personnelles.
Nirupam Gupta (https://nirupam115.github.io) & Rafael Pinot (https://rpinot.github.io): chercheurs associés EPFL et experts en apprentissage distribué résilient.
Owkin : une entreprise en AI biotech qui utilise l’apprentissage distribué pour trouver des traitements personnalisés à chaque patient. Une session “hands on” sera organisée par Owkin.
Rachid Guerraoui (en remote): professeur à l’EPFL fera un exposé sur “How to Write a Bad Research Paper”.

Une session poster suivie d’un buffet dînatoire permettra aux doctorants d’échanger autour de leurs travaux.

Jeudi 21 Septembre: Journées thématiques sur l’apprentissage distribué: enjeux scientifiques
Cette journée co-organisée avec la Société Informatique de France (SIF) vise à regrouper des chercheurs de disciplines différentes faisant partie de plusieurs GDRs. L’objectif est de permettre de faire ressortir les enjeux et défis scientifiques de l’apprentissage distribué tels qu’ils sont appréhendés par différentes communautés scientifiques.

Orateurs confirmés:
[Systèmes distribués] Sara Bouchenak, INSA Lyon (https://perso.liris.cnrs.fr/sara.bouchenak/)
[Systèmes mobiles]Tamara Tosic, Orange Labs (https://www.linkedin.com/in/tamara-tosic-0601a33/)
[Optimisation] Aymeric Dieuleveut , Ecole Polytechnique (http://www.cmap.polytechnique.fr/~aymeric.dieuleveut/)
[Réseaux] Chuan XU, INRIA (https://team.inria.fr/coati/new-team-member-chuan-xu/ )
[Machine Learning] Marc Tomassi, Université de Lille (http://researchers.lille.inria.fr/tommasi/ )
[Vision par ordinateur] Stefan Dufner, INSA Lyon (http://u0016403263.user.hosting-agency.de)
[Résilience aux Byzantins] Sara Tucci, CEA, (https://www.linkedin.com/in/sara-tucci-piergiovanni-1582672?originalSubdomain=fr )
[Protection de la vie privée] Antoine Boutet, INSA Lyon (https://sites.google.com/site/antoineboutet/)
[Optimisation]Kevin Scaman, Inria Paris (https://kscaman.github.io)

Un diner offert en ville (Brasseries Georges) permettra aux participer de poursuivre les échanges entamés pendant la journée.

Vendredi 22 Septembre: Journées thématiques sur l’apprentissage distribué: enjeux éthiques et socio/économiques
Cette journée co-organisée avec la Société Informatique de France (SIF) vise à adresser les enjeux éthiques et socio-économiques de l’apprentissage distribué. Lors de cette journée, des sociologues, des juristes, des personnels de la CNIL et des entreprises seront invités à confronter leurs points de vue sur les enjeux éthiques et socio-économiques de l’apprentissage distribué.

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Post-doc : 3D+t MRI and X-ray segmentation for grapevine trunk diseases diagnosis.

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CIRAD, Equipe Phenomen
Durée : 3 years
Contact : romain.fernandez@cirad.fr
Date limite de publication : 2023-09-07

Contexte :
Our research aims to develop imaging approaches for non-destructive detection and diagnosis of grapevine trunk diseases (Vitis vinifera L.). Protocols [1] and methods [2][3] for 3D imaging and analysis of trunks under controlled conditions (i.e., laboratory) have already been developed in our lab. We now aim to transfer this non-destructive diagnosis directly into the field, using a portable device that can be used to detect and quantify these diseases. This transfer involves the development of novel solutions for data analysis (project “Scan Me If You Can”, 2023-2026). For this purpose, we seek a highly motivated and initiative-taking candidate qualified to conceive innovative image analysis pipelines.

[1] R Fernandez, L Le Cunff, S Mérigeaud, et.al. Beyond the foliage: Using non-destructive multimodal 3D imaging and AI to phenotype and diagnose trunk diseases. BioRxiv preprint (2022)
https://doi.org/10.1101/2022.06.09.495457

[2] R Fernandez, and C Moisy, Fijiyama: a registration tool for 3D multimodal time-lapse imaging, Bioinformatics, Volume 37, Issue 10, 15 May 2021, Pages 1482–1484, https://doi.org/10.1093/bioinformatics/btaa846

[3] R Fernandez and C Moisy. FijiRelax: Fast and noise-corrected estimation of MRI relaxation maps in 3D+ t. Journal of Open Source Software. 2023 Jan 30;8(81):4981.

Sujet :
Your mission will be to scale up different approaches to work across two work streams.

* Whole plant 3D+t reconstruction and segmentation from multi-angle X-ray images: You will be in charge of retrofitting models to allow the deployment of these solutions in the field, on a larger scale, and for
temporal monitoring of tissue condition. To estimate the degradation present in the plant and their progression over time, you will design solutions for image analysis and 3D+t reconstruction applicable to
2D images collected in situ on living plants.

* 3D+t characterization of degradation by MRI monitoring under controlled conditions: You will build upon the developments of Fijiyama [1] and FijiRelax [3] plugins to analyze a large set of MRI data collected
during the dynamic monitoring of living vines inoculated with fungal pathogens. You will design pipelines to study the host-pathogen interaction in 3D+t; and develop tools for the comparison of grapevine varieties tolerance, and pathogen aggressiveness.

Profil du candidat :
– Interpersonal skills and ability to work with multiple stakeholders.
– Autonomy in programming and image processing.
– Organizational skills and rigor.
– Adaptability and reactivity.
– Ability to synthesize and pedagogy (interactions with non-specialists in image processing).
– Scientific English.
– Driving license.

Formation et compétences requises :
* Titles/Diplomas: PhD or M.Sc. in computer science, mathematical modeling, image analysis, with a demonstrated capacity for publication in image analysis and/or design of solutions.

* Advanced skills in:
– Image Analysis (3D reconstruction, segmentation).
– Programming (Java and Python).
– Machine Learning (scikit-learn, …) and Deep Learning (TF / Pytorch, …).
– 2D/3D image processing and visualization (Fiji, Napari, VTK, …).

* Optional:
– Basic knowledge in 3D imagery (X-rays tomography, MRI);
– plant biology and anatomy; and/or pathogens.
– French speaking.

Adresse d’emploi :
The selected candidate will work in interaction with two research teams located in Montpellier, France (at
Campus Lavalette, 389 Av. Agropolis, 34980 Montferrier-sur-Lez, France). The team “GénoVigne”, IFV
(French Institute for Vine and wine, www.vignevin.com), is specialized in grapevine genetics and diseases.
The team “Phenomen”, CIRAD (French Agricultural Research Centre for International Development), is
specialized in mathematics and computer science for plant modeling. The candidate will also interact with
several scientific and technical partners, including INRAE, Montpellier University, CIVC Champagne and
BIVB Bourgogne, as well as imaging platforms.
Remuneration: between 2.4 and 2.6KEUR, raw, monthly, depending on qualification.
Advantages: meal vouchers, paid holidays, and Health Mutual.

Document attaché : 202307050732_2023-06_Offre CDD_projet_SMYIC – pour diffusion.pdf

APPEL A PROJETS DU FC3R : APPROCHES NUMERIQUES

Date : 2023-11-14

Nous avons le plaisir de vous annoncer que troisième appel à projets du GIS FC3R (Centre français pour les 3R, https://www.fc3r.com/) est désormais ouvert ! Vous trouverez ci-dessous toutes les informations le concernant.

Nom : « Approches numériques »

Description : Le FC3R lance un nouvel appel à projets pour promouvoir le développement et l’implémentation d’outils numériques
pour le Remplacement, la Réduction et le Raffinement de l’utilisation d’animaux à des fins scientifiques, au sein des instituts de recherche et de formation français.
Plus d’infos : https://www.fc3r.com/files/modalites-fc3r-aap3-juin2022-approchesnumeriques-final-fr-eng.pdf
Échéances : Ouverture : 3 juillet 2023 / Clôture : 14 novembre 2023
Dotation : jusqu’à 50 000 euros par projet
Pour postuler : https://www.fc3r.com/financement-de-projets.php

Lien direct


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Ingénieur(e) données et connaissances en bioinformatique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut du Thorax
Durée : 24
Contact : alban.gaignard@univ-nantes.fr
Date limite de publication : 2023-07-13

Contexte :
Le projet ABRomics est coordonné par l’IFB et l’Institut Pasteur et est constitué d’un consortium de 45 équipes appartenant aux principaux organismes de recherche français.

Le projet ABRomics vise à développer une plateforme en ligne intersectorielle sécurisée One Health pour rendre accessibles les données de (méta)génomique des maladies infectieuses bactériennes et leurs métadonnées associées à un méta-réseau de chercheurs comprenant des épidémiologistes, des microbiologistes cliniques et la communauté de recherche au sens large.
Cette plateforme répondra à deux objectifs principaux :
1. Établir un référentiel de données microbiologiques multi-omiques structurées, interopérables, normalisées et bien annotées.
2. Mettre en place une plateforme partagée pour faciliter la surveillance de l’antibiorésistance en médecine humaine et vétérinaire, y compris les isolats environnementaux et alimentaires, afin de permettre la surveillance de la transmission intersectorielle

Depuis de nombreuses années, la communauté scientifique développe des ontologies (vocabulaires contrôlés) pour de nombreux domaines. Elles permettent de représenter l’état des connaissances, mais également d’annoter, avec des termes ayant des définitions claires et partagées, des ressources scientifiques, par exemple des gènes d’antibiorésistance. Elles permettent également i) de définir les liens logiques entre des observations et des concepts formant ainsi des bases de connaissances ii) de rendre interopérables ces multiples bases de connaissances, iii) d’automatiser la recherche d’information et les déductions logiques.

Dans un contexte de sciences plus ouverte, l’enjeu pour ABRomics est donc de mettre à disposition de la communauté, via les standards du Web Sémantique (W3C) et les ontologies de référence (i.e., Antibiotic Resistance Ontology, ARO), des (méta)données initialement hétérogène, sous la forme d’un graphe de connaissances cohérent et interopérable avec des bases de données externes.

Sujet :
La personne recrutée aura pour mission de concevoir et développer un graphe de connaissances permettant d’intégrer, et d’exposer sur le web, des (méta)données non sensibles en s’appuyant sur les ontologies de référence pour les domaines de l’antibiorésistance et des approches “One Health” plus généralement. Ce graphe de connaissances permettra de lier des observations longitudinales multi-omiques, leur contexte environnemental ainsi que des phénotypes, facilitant ainsi les travaux de modélisation qui s’appuient sur des approches “Biologie des Systèmes”. Cette ressource permettra également d’améliorer l’interopérabilité des données (principes FAIR “Findable, Accessible, Interoperable and Reusable”) et d’inscrire la plateforme ABRomics dans une démarche de sciences plus ouvertes. Le/la candidat.e sera également chargé.e de développer un ensemble de ressources (requêtes, documentation) permettant à la communauté d’explorer et de réutiliser ces nouvelles connaissances sur l’antibiorésistance.

Profil du candidat :
Master 2 ou Ingénieur en informatique ou bioinformatique.

Formation et compétences requises :
Maîtrise de la modélisation de bases de données
Maîtrise du développement logiciel, dans un environnement Linux
Maîtrise d’un langage de requêtes (SQL, noSQL)
Maîtrise d’un langage de programmation parmi Python, Java
Une expérience d’un système noSQL serait un plus
Représentation des connaissances
Méthodologies de gestion de projet
Anglais technique
Intérêt pour la Biologie (génomique)

Adresse d’emploi :
Institut du Thorax, 8 quai Moncousu, 44000 Nantes.

Document attaché : 202306301550_2023_IE_E2C45_ABRomics.pdf

Optimisation du stock en entrepôt en temps réel

Offre en lien avec l’Action/le Réseau : – — –/Innovation

Laboratoire/Entreprise : L@bISEN / GENERIX
Durée : 12 months
Contact : benoit.lardeux@isen-ouest.yncrea.fr
Date limite de publication : 2023-08-31

Contexte :
Dans le cadre d’une chaire avec le groupe Generix, Yncréa Ouest est à la recherche d’un(e) post-doctorant(e)
dans le domaine de l’intelligence artificielle. Le(a) candidat(e) consolidera les actuelles compétences de
l’équipe de recherche multisite « UF : Usine du Futur » et sera amené(e) à développer les activités de
recherche en lien avec ces domaines sur le site de Nantes en collaboration étroite avec les autres sites de
l’Yncréa Ouest.

Sujet :
L’entreprise Generix est spécialisée dans la conception de solutions informatiques pour la gestion des entrepôts de leurs clients qui sont eux-mêmes des entreprises distribuant des quantités conséquentes de produits à vendre. L’une des fonctions principales de l’entrepôt est de stocker la quantité nécessaire de chacun des produits afin de pouvoir satisfaire les demandes des clients avec le volume suffisant de ces
produits. Le stockage a par ailleurs un coût pour l’entreprise qui gère l’entrepôt. Il y a le coût d’immobilisation d’actifs, le coût lié à l’espace utilisé par les stocks et le coût relatif au personnel employé pour gérer l’entreposage des produits. Il est donc nécessaire de minimiser les stocks tout en étant capable d’assurer les variations des demandes des clients. Grâce aux outils mis en place par Generix, la prévision de la demande
est automatisée. Cependant les contraintes du quotidien des entreprises de distribution produisent des
variations de la demande réelle observée par rapport à la demande prévue. Dans le cadre de cette activité de recherche, l’objectif est d’étudier et de mettre en place une solution informatique permettant de fournir des recommandations précises ajustées en temps réel des niveaux de stocks dans l’entrepôt.

La première étape de ce projet consiste en l’étude de la littérature scientifique récente sur le sujet présenté
ci-dessus. L’étape suivante concerne la modélisation du problème en termes de programme mathématique d’optimisation. Ce modèle doit prendre en considération l’ensemble des éléments importants du problème
permettant de calculer une solution implémentable au sein de l’entrepôt à moindre coût. Plusieurs approches de résolution de ce problème seront étudiées. Dans un premier temps, il sera nécessaire de définir une méthode exacte qui aura pour objectif de calculer la solution optimale sur de petites instances du
problème. A ce stade de l’étude, on peut imaginer l’utilisation de méthodes arborescentes de recherche de solutions (branch-and-cut par exemple) qui sont utilisées pour la résolution de problèmes combinatoires. Cette méthode exacte nous permettra d’évaluer la pertinence des méthodes approchées qui devront
également être proposées, programmées et évaluées dans le cadre de ce postdoc. Plusieurs axes de recherche peuvent être envisagés concernant les méthodes de résolution approchées. Il peut être intéressant d’investiguer la résolution par métaheuristique (algorithme génétique, recuit-simulé …) ou par
méthode de décomposition (Benders, Dantzig-Wolf). Cependant il nous semble particulièrement intéressant d’essayer les méthodes de résolution par apprentissage profond et/ou par renforcement qui permettraient de trouver des solutions de qualité malgré les incertitudes liées à l’évolution de l’environnement. Finalement, la conception d’un prototype pouvant être testé sur des instances de problèmes réelles est attendue, tout comme la ou les communications scientifiques de qualité en lien avec le sujet.

Dans le cadre de ce projet, le post-doctorant pourra utiliser l’infrastructure informatique du L@bISEN mise en place pour entraîner les réseaux de neurones profonds. Celle-ci est constituée de serveurs GPU et d’unités de stockage dédiées.

Profil du candidat :
Yncréa Ouest recherche un(e) post-doctorant(e) ayant une formation/expérience en recherche opérationnelle / intelligence artificielle avec un fort intérêt pour les problématiques de l’usine du futur.

Le poste est à pourvoir en contrat à durée déterminée (CDD) de 12 mois. Il est localisé à Nantes. Le salaire est à convenir selon expérience.

Formation et compétences requises :
Compétences requises :

– Modélisation et résolution de programmes linéaires en nombres entiers
– Maîtrise et pratique des méta-heuristiques et algorithmes d’apprentissages
– Maîtrise de python, avec connaissance des librairies de deep-learning (Pytorch, Tensorflow, …)
– Aptitude à travailler en équipe
– Autonomie et rigueur organisationnelle
– Anglais : lu et écrit

Adresse d’emploi :
ISEN YNCREA OUEST site de Nantes

33 Quater Avenue du Champ de Manoeuvre, 44470 CARQUEFOU

Document attaché : 202306260846_postdoc_ISEN_UF.pdf

ATER Physique Statistique de la matière active et Computer Sciences

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Institut Gulliver
Durée : 1 an
Contact : alexandre.allauzen@dauphine.psl.eu
Date limite de publication : 2023-06-26

Contexte :
L’École Supérieure de Physique et de Chimie Industrielles de la Ville de Paris est à la fois une Grande École d’ingénieurs et un institut de recherche (11 laboratoires) de réputation internationale jouissant d’une forte culture d’excellence scientifique (6 Prix Nobel). L’enseignement et la recherche se situent à la croisée du savoir et du savoir-faire en physique,chimie et biologie.

https://www.espci.psl.eu/fr/espci-paris-psl/emploi/2022/ater-physique-statistique-de-la-matiere-active-et

Sujet :
La personne recrutée aura pour mission de participer à l’enseignement informatique et numérique du cursus ingénieur de l’école. L’objectif est que les élèves maîtrisent dès le début de leur parcours les outils informatiques tels que la programmation en PYTHON, et l’analyse numérique avec MATLAB, afin qu’ils sachent les intégrer dans leur démarche scientifique. Ainsi, les méthodes numériques peuvent mises en pratique sur des problématiques de calculs efficaces, de résolutions numériques et de simulation. Enfin l’analyse de données complète cet enseignement avec un module de statistique appliquée et une introduction à l’apprentissage machine.

L’activité de recherche se déroulera au sein du laboratoire Gulliver, dont la spécificité est d’être composé pour moitié de théoriciens et pour moitiés d’expérimentateurs de la matière molle. Les recherches du laboratoire couvrent un large spectre de sujets allant de la physico-chimie moléculaire, à l’étude des interfaces, en passant par la physique des verres et gels colloïdaux, la physique de la matière active, de la matière programmable, ou encore topologique. Ces sujets sont le plus souvent abordés sous l’angle de la physique statistique. Dans le cas présent, le projet de recherche portera sur l’étude des systèmes actifs, plusieurs déclinaisons étant possibles, qu’il s’agisse de l’étude des solides actifs ou de celle d’un essaim de robots.

Profil du candidat :
Machine Learning, Statistical Physics, Active Matter

Formation et compétences requises :
Doctorat

Adresse d’emploi :
ESPCI, 10 rue Vauquelin, 75005 Paris