Atelier ROCED @ PFIA 2022

Annonce en lien avec l’Action/le Réseau : RoCED

Thème :

construire une cartographie de jeux de données disponibles pour les raisonneurs

Présentation :

Le but de cette nouvelle édition de l’atelier ROCED@PFIA 2022 est de réunir les chercheurs et chercheuses intéressé(e)s par présenter et discuter des jeux de données existants (ou en cours de construction) ainsi que des approches reposant sur du raisonnement pouvant être appliquées sur ce type de jeux de données. L’objectif général de cet atelier est de contribuer à la cartographie des jeux de données et des algorithmes de raisonnement existants dans la communauté scientifique en France. Nous ciblons des interventions présentant des jeux de données (e.g. graphes de connaissances, alignements d’ontologies, liens d’identité, des requêtes type, …) en cours de construction ainsi que des retours d’expérience sur l’utilisation de jeux de données existants. Ces interventions devront mettre en avant la pertinence et les limites de ces jeux de données pour l’évaluation des algorithmes de raisonnement.

Du : 2022-06-27

Au : 2022-06-27

Lieu : saint etienne

Site Web : https://ci.mines-stetienne.fr/pfia2022/Ateliers/ROCED/

Application of Reasoning on Complex and Evolving Data: Methods and Use-Cases

Annonce en lien avec l’Action/le Réseau : RoCED

Thème :

workshop associated to The Knowledge Graph Conference (KGC) 2022

Présentation :

In this workshop, we seek contributions describing methods and uses-cases that rely on the application of reasoning and machine learning on complex, uncertain and evolving knowledge graphs. These contributions can be applied to different domains such as smart cities, smart health, smart farming, digital humanities and automation of business processes.

Du : 2022-05-02

Au : 2022-05-02

Lieu : virtual workshop. The conference is located at new york, USA

Site Web : https://www.knowledgegraph.tech/kgc-2022-program/

LIUM (Le Mans) / Deep Learning / Chaire Professeur Junior – Tenure track

Offre en lien avec l’Action/le Réseau : HELP/– — –

Laboratoire/Entreprise : LIUM
Durée : 5
Contact : nicolas.dugue@univ-lemans.fr
Date limite de publication : 2022-05-02

Contexte :
L’université du Mans ouvre une Chaire professeur junior en traitement du langage multimodal. Le ou la candidat.e s’intégrera dans l’équipe de recherche LST du LIUM, et dispensera ses cours à l’UFR de Sciences et Techniques.

Le Mans University opens a Tenure track position in Multimodal language processin. The candidate will integrate in the LST research team of the LIUM, his/her teaching activities will take place within the Master of Computer Sciences and Artificial Intelligence from Le Mans University.

Sujet :
Chaire professeur junior en traitement du langage multimodal (Multimodal language processing)

Profil du candidat :

L’objectif principal est de développer une IA de traitement du langage multimodale et multilingue qui repose sur un espace de représentation commun pour les modalités parole et texte dans différentes langues. Le ou la candidat.e devra développer ses activités de recherche dans l’équipe LST du LIUM afin de renforcer le caractère transverse de ces représentations à travers une combinaison pertinente de modalités (par ex. : vidéo et texte ou texte et parole), de tâches (par ex. : caractérisation du locuteur et synthèse de la parole, compréhension de la parole et traduction automatique, reconnaissance de la parole et synthèse de résumé automatique) et de langues. Ses travaux de recherche tendront à développer des systèmes automatiques intégrant l’humain au cœur du traitement en utilisant des approches d’apprentissage actif et en explorant les problématiques d’expliquabilité et d’interpretabilité afin de permettre à l’utilisateur naïf d’enseigner au système automatique ou d’en extraire des éléments compréhensibles. Ce projet visera également le renforcement de collaborations existantes (Facebook, Orange, Airbus) ou la création de nouveaux partenariats (Oracle, HuggingFace…).

The research project should take place in the LST team goal that aims at developping a multimodal and multilingual representation space for speech and text modalities. The Junior Professor is expected to develop his/her own research diretions between the topics already existing in the LST team and to develop hybrid approaches by mixing for instance speaker characterization and speech synthesis or speech translation and speech understanding. He/She should also integrate the strategy of the team to involve the human in the loop for deep learning systems and work towards a better explainability/interpretability of speech processing algorithms.

Projet d’enseignement / Description of the teaching project

Le ou la candidat.e intégrera l’équipe pédagogique du Master en intelligence artificielle du département d’informatique de l’UFR Sciences et Techniques de l’Université  du Mans. Son implication aura pour but de renforcer les compétences en apprentissage profond (apprentissage auto-supervisé, GANs, Transfomer, méthodologies et protocoles pour l’IA…) mais également dans les infrastructures dédiées à l’apprentissage automatique et aux sciences des données (calcul distribué, SLURM, MPI), l’utilisation d’un cluster de calcul (ssh, temux, jupyter-lab, conda) ou le cloud computing. Fort de compétences reconnues en traitement automatique du langage et de la parole l’équipe pédagogique souhaite élargir son offre de formation en adaptant les contenus à d’autres types de données (images, séquences temporelles générées par différents types de capteurs, graphes…) afin de répondre aux besoins spécifiques du tissu industriel local et régional en apprentissage automatique. Cette action s’inscrira dans la volonté de l’équipe pédagogique de développer l’apprentissage et la formation continue en lien avec les partenaires industriels mais également à destination d’un public académique de chercheurs et enseignant chercheurs non-informaticiens souhaitant développer des compétences en apprentissage automatique.

Teaching activities will take place within the Master of Computer Sciences and Artificial Intelligence from Le Mans University. The candidate is expected to strengthen the teaching on deep learning (self-supervised training, GANs, Transformers, machine learning methodology and protocols…) but also teach tools for distributed learning (SLURM, MPI, ssh, temux, jupyter-lab, conda…) and cloud computing. In mid terms, the candidate will contribute to the development of a continuing learning in artificial intelligence adapted to the need of local companies and industry but also for researchers non-specialist in computer sciences.

Contact

Antoine LAURENT Antoine.laurent@univ-lemans.fr

Anthony LARCHER Anthony.larcher@univ-lemans.fr

Formation et compétences requises :
Conditions de candidature / Application requirements

être titulaire d’un doctorat / hold a PhD

Pour les candidats exerçant ou ayant cessé d’exercer depuis moins de dix-huit mois une fonction l’enseignant-chercheur, d’un niveau équivalent à celui de l’emploi à pourvoir, dans un établissement d’enseignement supérieur d’un État autre que la France: titres, travaux et tout élément permettant d’apprécier le niveau de fonction permettant d’accorder une dispense de doctorat.

For candidates exercising or having ceased to exercise for less than eighteen months a function of teacher- researcher, of a level equivalent to that of the position to be filled, in a higher education establishment of a State other than France: titles, works and any element allowing to appreciate the level of function allowing to grant a dispence of doctorate.

Adresse d’emploi :
Le Mans Université

Avenue Olivier Messiaen 72085 LE MANS CEDEX 9 – 02 43 83 30 00 www.univ-lemans.fr

Journées Calcul Données : Rencontres scientifiques et techniques autour du calcul et des données

Date : 2022-10-10 => 2022-10-12
Lieu : Maison des SCiences de l’Homme, Campusd e Dijon

Le GIS FRANCE GRILLES, Silecs/Grid’5000, le Groupe Calcul, le GDR RSD, GENCI et les mésocentres organisent ensemble les JCAD 2022, Journées Calcul Données : Rencontres scientifiques et techniques autour du calcul et des données.

Les JCAD sont dédiées à la fois aux utilisateurs et aux experts techniques des infrastructures et des services associés. Les objectifs de ces rencontres sont de présenter des travaux scientifiques, dans toutes les disciplines, réalisés grâce au soutien des infrastructures de grilles de calcul, de mésocentres ou de cloud, les travaux de la recherche en informatique associée et les évolutions techniques et travaux des administrateurs de ces infrastructures.

Ces journées associeront exposés pléniers, tables rondes et posters sur des sujets d’actualité.

Cette année, elles auront lieu du 10 au 12 octobre, à Dijon, Maison des Sciences de l’Homme (MSH) sur le campus de Dijon, en partenariat avec l’Université de Bourgogne (uB), l’Université de Franche-Comté (UFC), la Direction du Numérique uB (DNum) et le Mésocentre Bourgogne-Franche-Comté (MesoBFC).


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Gestion Collaborative et Contrôle Intelligent des Bâtiments Industriels

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : IRIMAS de l’université de Haute Alsace
Durée : 3 ans
Contact : a.abouaissa@uha.fr
Date limite de publication : 2022-04-15

Contexte :
Dans le cadre d’un contrat doctoral, L’équipe RT de l’institut IRIMAS propose une thèse sur l’application de l’apprentissage collaboratif dans le contexte de la gestion des bâtiments industriels.

Sujet :
L’objectif de ce projet est de proposer et de valider un modèle d’aide à la décision, capable de prendre conscience de ce qui se passe au niveau de l’environnement du bâtiment et de prédire les cas futurs en fonction des besoins des usagers/opérateurs. Ce modèle basé sur l’apprentissage fédéré et les techniques d’optimisation hybrides permet d’assurer un pilotage énergétique optimal.

Profil du candidat :
Le candidat a obtenu un master 2 recherche en informatique ou équivalent. Il doit avoir une bonne connaissance dans les domaines suivants : recherche opérationnelle, techniques d’IA, l’apprentissage fédéré, science des données. Des connaissances en BIM et IoT serait un plus.
 Langage de programmation : Python et Java.
 Le candidat doit avoir un bon niveau en anglais.

Formation et compétences requises :
Dans le cadre du processus de recrutement du (de la) doctorant(e) mis en place par l’université de Haute Alsace, voici ci-dessous les documents à préparer :
· une lettre de motivation adressée au responsable du pôle de formation SE (Sciences Exactes)
· un curriculum vitae à jour (mettez l’accent sur vos projets de fin d’études et les éventuelles publications soumises/acceptées)
· une copie de la carte d’identité ou du passeport
· une copie de tous les diplômes déjà validés (Licence, master, ingénieur)
· tous les relevés de notes portant le tampon de l’établissement (obligatoire)
· un avis (lettre de recommandation) du responsable de stage de fin d’études (ou un enseignant/responsable de formation de votre établissement)
Les dossiers sont à envoyer le plus rapidement possible (15/04/2022 au plus tard).
Les candidats sélectionnés seront contactés par l’équipe encadrante avant le 22/04/2022.
Des auditions sont à prévoir vers le 16/05 et les finaux résultats seront communiqués le 25 mai par mail.

Adresse d’emploi :
Université de Haute Alsace
Equipe RT/IRIMAS
34 Rue de Grillenbreit
68008 Colmar cedex

Document attaché : 202204031353_PhD_Call_IRIMAS_UHA.pdf

IA Frugale pour la segmentation d’images

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : GREYC UMR CNRS 6072
Durée : 3 ans
Contact : olivier.lezoray@unicaen.fr
Date limite de publication : 2022-05-31

Contexte :
IA Frugale pour la segmentation d’images

Sujet :
L’avènement de l’apprentissage profond a été un véritable tsunami dans la communauté de l’apprentissage automatique, conduisant à des résultats, notamment en vision par ordinateur, auxquels on ne se serait pas attendu quelques années auparavant. Pour de nombreuses tâches de vision, les performances des algorithmes d’apprentissage profond sont devenues équivalentes, voire supérieures, aux performances humaines.

Cependant, ces résultats ont été obtenus au prix d’une utilisation toujours plus importante de ressources telles que : la taille du modèle, le temps et l’énergie nécessaires à leur entraînement, avec des bases de données toujours plus grandes et des exigences d’annotation toujours plus élevées. Cette augmentation des besoins en ressources présente des inconvénients majeurs, liés à l’impact du ML sur l’environnement, à la difficulté d’implémenter des modèles sur des architectures embarquées, ou encore aux défis soulevés lorsque les modèles doivent être entraînés sur des tâches pour lesquelles peu de données d’entraînement sont disponibles.

Ces observations ont très récemment conduit certains auteurs [1, 2] à introduire le concept d’apprentissage automatique frugal et à définir ce que devrait être une méthodologie d’apprentissage automatique frugal, et comment évaluer la frugalité.

Dans cette thèse, nous étudierons la frugalité dans le contexte de l’IA pour la segmentation d’images [3]. L’objectif sera de proposer des modèles frugaux qui peuvent fournir des résultats efficaces tout en étant structurés pour fournir une complexité temporelle et spatiale réduite. Plus précisément, nous considérerons plusieurs aspects de la frugalité et nous nous inspirerons des travaux récents suivants : i) la conception de modèles légers par design [4, 5] ii) la compression de modèles existants [6] iii) l’élagage de modèles de segmentation existants [4, 7] iv) la frugalité sur les labels d’images et la segmentation d’images zero shot [8, 9].

[1] Lingjiao Chen, Matei Zaharia, and James Y. Zou, “FrugalML : How to use ML Prediction APIs more accurately and cheaply,” in Advances in Neural Information Processing Systems 33 : Annual Conference on Neural Information Processing Systems 2020, NeurIPS 2020, December 6-12, 2020, Virtual, Hugo Larochelle, Marc’Aurelio Ranzato, Raia Hadsell, Maria-Florina Balcan, and Hsuan-Tien Lin, Eds., 2020.
[2] Mikhail Evchenko, Joaquin Vanschoren, Holger H. Hoos, Marc Schoenauer, and Michèle Sebag, “Frugal Machine Learning,” arXiv :2111.03731 [cs, eess], Nov. 2021.
[3] Shervin Minaee, Yuri Y. Boykov, Fatih Porikli, Antonio J Plaza, Nasser Kehtarnavaz, and Demetri Terzopoulos, “Image segmentation using deep learning : A survey,” IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 1–1, 2021.
[4] Linjie Wang, Quan Zhou, Chenfeng Jiang, Xiaofu Wu, and Longin Jan Latecki, “DRBANET: A Lightweight Dual-Resolution Network for Semantic Segmentation with Boundary Auxiliary,” arXiv :2111.00509 [cs], Oct. 2021.
[5] Enze Xie, Wenhai Wang, Zhiding Yu, Anima Anandkumar, Jose M. Alvarez, and Ping Luo, “Segformer : Simple and efficient design for semantic segmentation with transformers,” CoRR, vol. abs/2105.15203, 2021.
[6] Moonjung Eo, Suhyun Kang, and Wonjong Rhee, “A Highly Effective Low-Rank Compression of Deep Neural Networks with Modified Beam-Search and Modified Stable Rank,” arXiv :2111.15179 [cs], Nov. 2021.
[7] Wei He, Meiqing Wu, Mingfu Liang, and Siew-Kei Lam, “Cap : Context-aware pruning for semantic segmentation,” in 2021 IEEE Winter Conference on Applications of Computer Vision (WACV), 2021, pp. 959–968.
[8] Mengde Xu, Zheng Zhang, Fangyun Wei, Yutong Lin, Yue Cao, Han Hu, and Xiang Bai, “A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained Vision-language Model,” arXiv :2112.14757 [cs], Dec. 2021.
[9] Maxime Bucher, Tuan-Hung Vu, Matthieu Cord, and Patrick Pérez, “Zero-shot semantic segmentation,” in Advances in Neural Information Processing Systems 32 : Annual Conference on Neural Information Processing Systems 2019, NeurIPS 2019, December 8-14, 2019, Vancouver, BC, Canada, Hanna M. Wallach, Hugo Larochelle, Alina Beygelzimer, Florence d’Alché-Buc, Emily B. Fox, and Roman Garnett, Eds., 2019, pp. 466–477.

Profil du candidat :
Les candidats doivent être titulaires d’une maîtrise ou d’un diplôme d’ingénieur dans un domaine lié à l’informatique, au génie électrique ou aux mathématiques appliquées, et posséder de solides compétences en programmation (en particulier avec des cadres d’apprentissage profond). Une expérience en traitement d’images sera un plus. Les candidats doivent avoir des capacités à rédiger des rapports scientifiques et à communiquer des résultats de recherche lors de conférences en anglais.

Formation et compétences requises :
Les candidatures doivent inclure les documents suivants au format électronique : i) Une courte lettre de motivation expliquant pourquoi vous êtes intéressé(e) par ce projet, ii) Un CV détaillé décrivant vos antécédents de recherche en rapport avec le poste iii) Les relevés de notes des diplômes de master. iv) Les coordonnées de trois références (ne joignez pas les lettres de référence à votre candidature car nous ne les demanderons qu’aux candidats présélectionnés).

Veuillez envoyer votre dossier de candidature à frederic.jurie@unicaen.fr et olivier.lezoray@unicaen.fr.

Adresse d’emploi :
Le poste est à pourvoir dès que possible avec un salaire de 32 kEuros brut, et sera situé à Caen, France.

Idéalement située au cœur de la Normandie, à deux heures de Paris et à seulement 10 minutes des plages, Caen, ville natale de Guillaume le Conquérant, est une ville vivante et dynamique.

Document attaché : 202204031020_PhD_FrugalAI.pdf

CDI LRU- niveau Maître de Conférences en IA, NLP, Analyse de documents, au MICS, CentraleSupélec

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : MIVS – CentraleSupélec – Université Paris-Saclay
Durée : CDI
Contact : celine.hudelot@centralesupelec.fr
Date limite de publication : 2022-05-31

Contexte :
Enseignant-chercheur en Informatique dans le domaine de l’Intelligence Artificielle, le traitement automatique des langues naturelles et l’analyse de documents.
Département Informatique de CentraleSupélec, campus de Paris-Saclay
Laboratoire MICS
(CDI de droit public niveau Maître de Conférences)

Sujet :
CentraleSupélec est un Grand Établissement sous l’autorité du ministère de l’Enseignement Supérieur et de la Recherche et de celui de l’Industrie et des Technologies de l’Information. Ces principales missions incluent : la formation d’ingénieurs généralistes ayant un haut niveau scientifique, la recherche en ingénierie et en science des systèmes, et la formation continue.

Le département d’Informatique a pour vocation éducative de couvrir un large champ de l’informatique sur la durée des 3 ans du cursus d’ingénieur CentraleSupélec. Il participe aussi des MSc internationaux comme le «MSc in Data Science and Business Analytics » (classé 3ème mondial dans le domaine) et le « MSc in Artificial Intelligence ».

Le laboratoire de Mathématiques et Informatique pour la Complexité et les Systèmes (MICS, EA4037) de CentraleSupélec s’intéresse à l’analyse mathématique et informatique des systèmes et données complexes, qu’ils proviennent du vivant, de
l’industrie, des sciences sociales, de l’information ou des réseaux.

Profil d’enseignement :

Le/La candidat(e) retenu(e) fera ses enseignements dans le département d’informatique notamment pour des activités pédagogiques de base du cursus ingénieur CentraleSupélec (algorithmique, programmation, coding weeks). Il/Elle participera aux enseignements de la dominante Informatique & Numérique et à des cours de spécialisation en Intelligence Artificielle sur les 3 années du cursus (dans les mentions SDI, IA et les différents MSc comme le MSc AI ou le DSBA), notamment les cours portant sur l’apprentissage pour le traitement du langage naturel.

Le/La candidat(e) pourra aussi prendre part à différentes activités pédagogiques du cursus en lien avec ses travaux de recherche (proposition d’un projet dans le parcours Recherche, projets dans les pôles IA & Sciences des données, études de cas dans la Filière Métiers de la Recherche), proposition de projets dans le cadre des coding weeks.

La capacité à dispenser les enseignements en anglais est nécessaire.

Profil de recherche :

Le laboratoire recrute un/une maître de conférences en Intelligence Artificielle pour renforcer son activité de recherche dans ce domaine et notamment pour renforcer son expertise en traitement du langage naturel et analyse de documents textuels.

Les thématiques prioritaires sont le traitement du langage naturel, l’apprentissage profond de représentations notamment de textes et de documents, l’analyse de documents et pourrait aussi comprendre des problématiques relatives à l’explicabilité et l’interprétabilité des modèles ainsi que l’intégration de données multi-modales (par exemple textuelles et visuelles).

Le/La candidat(e) devra avoir fait preuve de contributions pertinentes et originales en recherche dans ces domaines, en ayant démontré à la fois des capacités de recherche sur les modèles et un intérêt fort pour les applications. Il lui sera aussi demandé
d’être à l’initiative de projets de recherche collaborative au sens large avec le souci d’appliquer les résultats sur des données du monde socio-économique.

La/le maître de conférence recruté(e) effectuera ses recherches au sein de l’équipe
LOGIMICS dans laquelle elle/il renforcera l’axe concernant l’analyse et l’interprétation sémantique de données non-structurées et notamment visuelles ainsi que l’axe systèmes d’aide à la décision dont les travaux s’intéressent aux systèmes de recommandation et de préférences, à la décision collective et argumentée ainsi qu’à leur explicabilité. Elle/il fera aussi partie de l’axe transverse IA du laboratoire MICS. Ces axes ont de nombreuses interactions avec d’autres équipes et
laboratoires de CentraleSupélec, en particulier l’équipe ITA du L2S, le CVN, le LISN ou encore le LGI

Profil du candidat :
La/Le candidat(e) doit être titulaire d’un doctorat en intelligence artificielle et posséder une très bonne expertise en traitement du langage naturel. ElleIl devra avoir fait ses preuves en recherche et avoir un excellent dossier de publication et démontré ses qualités pédagogiques au travers d’une bonne activité d’enseignement.

Formation et compétences requises :
Mise en situation professionnelle :
Pour les candidats retenus pour l’audition, celle-ci se déroulera en trois temps :
– Une présentation du parcours et votre projet d’intégration du candidat ;
– Une illustration de cours de 5 minutes, donnée en anglais, sur une problématique dont le sujet identique pour tous les candidats sera précisé sur la convocation ;
– Un échange avec les membres du comité.
La durée des trois séquences de l’audition sera précisée sur la convocation.

Candidatures :
Un dossier au format pdf comportant :
– Une lettre de motivation ;
– Un CV détaillé (expérience d’enseignement, recherche, mobilités, publications…) ;
– Un projet d’intégration ;
– Une copie de la carte d’identité ou du passeport ;
– Une copie du diplôme de doctorat ;
– Tous document permettant d’attester de l’expérience
devra être adressé par courriel uniquement aux deux contacts ci-dessous le 15 mai 2022 minuit (heure de Paris) au plus tard en rappelant la référence GMCFCDIMICS2202 :
Lorraine Maret, ressources humaines : lorraine.maret@centralesupelec.fr
Elodie Ledoux, ressources humaines : elodie.ledoux@centralesupelec.fr
Contacts scientifiques :
Céline Hudelot, directeur du laboratoire MICS : celine.hudelot@centralesupelec.fr
Frédéric Boulanger, directeur du département Informatique : frederic.boulanger@centralesupelec.fr

Adresse d’emploi :
CentraleSupélec, 3 Rue Joliot Curie, 91190 Gif-sur-Yvette

Document attaché : 202204012128_Profil LRU CDI MCF_MICS Informatique_FR_ANG.pdf

Machine learning and data mining with imperfect and incomplete relational data

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire Hubert Curien (LabHC UMR CNRS 5516), U
Durée : 3 years
Contact : baptiste.jeudy@univ-st-etienne.fr
Date limite de publication : 2022-05-31

Contexte :
In many applications, the data to be studied is relational, modeled in the form
of a network represented by graphs. This representation allows capturing not
only the information about entities (using attributes or properties) but also
the relationships between them.
While the ability to discover knowledge from such network data is gaining in
importance, the quality became a central issue in their exploitation.

Sujet :
The aim
of this PhD is first to study the impact of the lack of quality of relational
data on the data mining and machine learning algorithms and, second to design
robust methods to deal with imperfect and incomplete relational data and able
to provide explainable results.

Profil du candidat :
The candidate should have a master degree or equivalent in Computer Science.
The subject is at the intersection of several domains: graph theory,
statistics, data mining and machine learning. Thus the candidate should have
strong backgrounds in several of these topics.
Other required skills:
• Good abilities in algorithm design and programming.
• Good technical skills regarding data mining, machine learning and data
management
• A very good level (written and oral) in English.
• Good communication skills (oral and written).
• Ability to work in a team with colleagues,
• Autonomy and motivation for research.

Formation et compétences requises :
Applicants are invited to contact as soon as possible.
The application file should contain the following documents:
1. a curriculum vitæ (CV);
2. the official academic transcripts of all the candidate’s higher education
degrees (BSc, License, MSc, Master’s degree, Engineer degree, etc.). If the
candidate is currently finishing a Master’s degree, s/he must send the
transcript of the grades obtained so far, with the rank among her/his peers,
and the list of classes taken during the last year;
3. some recommendation letters (quality is more important than quantity,
there);
4. and a motivation letter written specifically for this position.
Send all of these documents by email to all the advisors:
• Baptiste Jeudy baptiste.jeudy@univ-st-etienne.fr
• Charlotte Laclau charlotte.laclau@univ-st-etienne.fr
• Christine Largeron christine.largeron@univ-st-etienne.fr
Interviews will be conducted as they arise and the position will be filled as
soon as possible.

Adresse d’emploi :
The PhD candidate will work at the Laboratoire Hubert Curien (UMR 5516) under
the supervision of Baptiste Jeudy, Charlotte Laclau and Christine Largeron,
(LabHC – Université Jean Monnet, Saint-Etienne, France).

Post-doctoral position in Lille – Mapping of pollutant concentrations by deep learning

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IMT Nord Europe
Durée : 18 months
Contact : christelle.garnier@imt-nord-europe.fr
Date limite de publication : 2022-04-24

Contexte :
As part of the recovery plan aimed at preserving employment in Research and Development in France, IMT Nord Europe and TERA Group recruit to meet the challenges of a collaborative project whose objective is to develop a real size demonstrator of the potential for measuring air quality in a given geographical area. The demonstrator must combine optimized deployment of sensors and real-time data processing to visualize the temporal dynamics at very fine resolution (less than one minute) and at high spatial resolution (less than 50 meters) of concentrations in PM (Particulate Matter) on the area.

Sujet :
The post-doc position aims to produce a map representing the near real-time spatialization of pollution at the scale of an agglomeration. The main tasks are as follows:

– Define a methodology to establish a deployment strategy (definition of the spatial and temporal dynamics of the sensors) according to the objective, the scale and the quality level of the mapping. This work will help to optimize the number of sensors / measurement points and their spatial distribution. If necessary, reference point(s) will be integrated in the delimited geographical area (via one or more high-performance measurement stations).

– Develop reconstruction methods based on the state of the art (kriging with Gaussian processes) and more recent tools, such as deep learning using neural network architectures. It will be necessary to take into account the quality of the information (uncertainties depending on the sensors) and the integration of exogenous data (weather, topology, etc.) to improve the quality of the mapping.

Profil du candidat :
PhD in data science, signal / image processing, artificial intelligence, computer science, applied mathematics or atmospheric science (with experience in data processing) obtained in 2019, 2020, 2021 or 2022.

Formation et compétences requises :
– First experience with spatio-temporal interpolation methods (kriging) or/and machine learning methods, in particular deep learning,

– Use of data science tools: Python language and deep learning framework (such as PyTorch, TensorFlow or Keras).

Adresse d’emploi :
Cité scientifique,
Rue Guglielmo Marconi,
59650 Villeneuve-d’Ascq

Document attaché : 202204011425_2022_Annonce_Postdoc_Cartographie_Polluants_18_mois.pdf

Quatrième édition du Symposium MaDICS

Présentation

La quatrième édition du Symposium MaDICS aura lieu en présentiel à Lyon sur le Campus de la Doua les 11 et 12 juillet 2022. Il a pour objectif de réunir la communauté MaDICS à l’occasion de conférences scientifiques invitées (Sihem Amer-Yahia et Anne-Cécile Orgerie, toutes deux médaillées du CNRS), de sessions dédiées aux Actions et Ateliers du GDR, mais également d’une demi-journée plus spécialement à destination des doctorants et jeunes chercheurs (cf Appel à posters)… et bien sûr de nombreux moments de convivialité !

Pour vous inscrire au Symposium vous devez vous inscrire à au moins une session (Action, Atelier ou Posters). Pour des raisons d’organisation, veuillez vous inscrire à toutes les actions et ateliers auxquelles vous souhaitez participer.

En espérant que vous serez nombreux pour partager ce moment ensemble.

Du : 2022-07-11
Au : 2022-07-12
Lieu : Lyon, Campus de la Doua (Comment venir, Plan du site)

Programme

Lundi 11 juillet 2022
10h00  Accueil
[Salles C1 et C2 – RdC]
10h30  Session d’ouverture
Introduction, présentation du GDR et questions
[Amphi Ampère – bâtiment Lippmann]
11h00  Keynote Sihem Amer-Yahia (LIG, médaille d’argent du CNRS)
Should we store or retrain ML models for data exploration?
[Amphi Ampère – bâtiment Lippmann]
12h00  Pause repas
14h00  Session Actions et Ateliers 1
Action DOING
Programme détaillé
[Salle C4 – RdC]
Action BigData4Astro
Programme détaillé
[Salle C5 – RdC]
Atelier FedSed
Programme détaillé
[Salle TD10 – 1er étage]
Atelier Musiscale

SESSION ANNULEE

16h00  Pause
[Salles C1 et C2 – RdC]
16h15  Présentations de doctorants primés
[Amphi Ampère – bâtiment Lippmann]
Christina Khnaisser (Prix de cotutelle France-Québec)
Modéliser les connaissances cliniques et concevoir des bases de données pour les systèmes de santé apprenants

Pierre Monnin (Prix de thèse EGC 2022)
Appariement et fouille dans les graphes de connaissances du web de données : applications en pharmacogénomique

17h15  Gong Show
Flash talks possiblement enregistrés
[Amphi Ampère – bâtiment Lippmann]
18h00  Session posters avec cocktail
Liste des posters
[Salles C1 et C2 – RdC]
19h00  Fin de la journée
 
Mardi 12 juillet 2022
9h00  Keynote Anne-Cécile Orgerie (IRISA, médaille de bronze du CNRS)
Réduire la consommation énergétique des centres de données
[Amphi Ampère – bâtiment Lippmann]
10h00  Pause
[Amphi Ampère – bâtiment Lippmann]
10h15  Session Acttions et Ateliers 2
Action HELP
Programme détaillé
[Salle C4 – RdC]
Action MACLEAN
Programme détaillé
[Salle TD11 – 1er étage]
Atelier DSChem
Programme détaillé
[Salle TD10 – 1er étage]
Action MADONA
Programme détaillé
[Salle C5 – RdC]
12h15  Pause repas
14h00  Session Actions et Ateliers 3
Action MADONA
Programme détaillé
[Salle C5 – RdC]
Action SimpleText
Programme détaillé
[Salle TD10 – 1er étage]
Action RoCED
Programme détaillé
[Salle TD11 – 1er étage]
16h00  Fin du Symposium

Programme de l’Action DOING

[Salle C4 – RdC]

Lundi 11 juillet – 14h00-16h00
14h00 Présentation de la demi journée, Genoveva Vargas-Solar (CNRS – LIRIS)
14h10 Keynote : Aperçu général des langages de requêtes pour graphes à propriétés
Victor Marsault (CNRS, LIGM)
14h55 Traitement de textes par des requêtes data science: verrous et carte d’expertise
Mirian Halfeld Ferrari Alves (U. Orléans, LIFO) & Genoveva Vargas-Solar (CNRS, LIRIS)
15h10 Panel : Représentation du contenu et extraction de connaissances à partir des textes : les systèmes de gestion de graphes, l’intelligence artificielle et les approches sémantiques
Donatello Conte (Polytech Tours, LIFAT)
Agata Savary (Université Paris-Saclay, LISN)
Nathalie Hernandez (Université de Toulouse, IRIT)
Nicolas TRavers (ELSIV, Centre de Recharche Da Vinci)
16h00 Fin

Programme de l’Action BigData4Astro

[Salle C5 – RdC]

Lundi 11 juillet – 14h00-16h00
14h00 Présentation de la demi-journée
Karine Zeitouni (DAVID) et André Schaaff (CDS)
14h10 Future prospect in spectroscopic survey and data challenges
Roland Bacon (CRAL)
14h40 Exploration non supervisée des données : application aux données issues des véhicules autonomes
Mustapha Lebbah (LIPN)
15h10 Discussion, Besoins en formation (ANR CMA, Ecole AstroInfo, …)
15h25 Table ronde Data Lakes en astronomie ?
15h55 Prochains évènements
16h00 Fin

Programme de l’Atelier FedSed

[Salle TD10 – 1er étage]

Lundi 11 juillet – 14h00-16h00
14h00 Introduction, Marco Lorenzi
14h15 Privacy preserving machine learning, Melek Önen (EURECOM)
14h45 Blockchain-based federated learning for medecine, Imen Megdiche (IRIT, ISIS)
15h15 Fed-BioMed workshop
16h00 Fin

Programme de l’Action HELP

[Salle C4 – RdC]

L’atelier HELP vise à proposer une vision trans-disciplinaire informatique / SHS de la problématique de l’explicabilité. Nous nous intéressons à une vision de bout-en-bout du problème d’explicabilité en ne se focalisant pas uniquement sur les modèles mais à l’impact de tous les éléments de la chaîne de traitement de données, partant de la qualité des données jusqu’à l’interaction avec l’utilisateur qui reçoit l’explication. Un point intéressant peut aussi considérer la propagation des biais d’explication d’une étape à une autre de la chaîne de traitement. L’atelier a pour vocation à devenir une plateforme d’échange pour la communauté autour de ces questions scientifiques et de favoriser l’émergence de projets communs.

Mardi 12 juillet – 10h15-12h15
10h15 Real use cases for XAI in insurance companies
Xavier Renard et Thibault Laugel
11h00 Lien entre qualité des données et explicabilité
Nikos Myrtakis et Vassilidis Christophides
11h20 XAI et médecine
Paul Monsarrat
11h40 Table ronde et clôture
12h15 Fin

Programme de l’Action MACLEAN

[Salle TD11 – 1er étage]

Mardi 12 juillet – 10h15-12h15
10h15 Ouverture de la session
10h25 Applications of deep learning in natural hazards and solid earth science using remote sensing
Sophie Giffard-Roisin (Laboratoire ISTerre, IRD)

Abstract: Solid earth has recently (finally!) gained benefit from the recent advances of machine learning such as in automatic detection of earthquake events in seismic recordings. Moreover, the use of remote sensing data (such as satellite optical and radar) as well as seismology and geodesy, have been important in solid earth sciences in the last decades, for example for estimating the ground motion during an earthquake, for estimating the ground state change after a volcanic eruption or landslide, or even for mapping active faults. This talk will focus on some new research works which aim to develop new data-based methods in order to improve, automatize and create new techniques for solid earth applications based on remote sensing. In particular, the goal is to see the variety of applied problems and how to develop a specific solution for each.

11h15 Explainable AI for Earth Observation
Alexandre Benoît (Laboratoire LISTIC)

Abstract: Earth Observation (EO), as for other domains, is subject to impressive advances thanks to the availability of abundant data and modern AI methods and more specifically deep neural networks. However, most of the available EO data is generally unlabelled, generally illustrates very local context with specific orientation, climate… such that the generalization behaviours of machine learning models can be limited. In addition, the implication of model inference applied to EO may lead to costly decisions (infrastructure design, modification, agricultural spreading…) such that automatic decisions should be justified or explained. In the era of deep learning-based models, opening those black boxes is a challenge in itself. In this presentation, we will present a variety of activities related to EO at LISTIC Lab with classical and AI-based models. This will lead to a focus on contributions related to explainable AI relying on 3 complementary directions : black box explanation, explanation by model design and redescription mining.

12h15 Fin

Programme de l’Atelier DSChem

[Salle TD10 – 1er étage]

Mardi 12 juillet – 10h15-12h15
10h15 Premiers pas de l’atelier Data Science for Chemistry
Dominique Douguet, Matthieu Montès, Nicolas Blanchard et Bertrand Cuissart
10h55 Application of the Generative Topographic Mapping approach to Big Chemical Data analysis
Gilles Marcou (Laboratoire de Chémoinformatique)
The Generative Topographic Mapping (GTM) is density-based model of a dataset. It optimizes the shape of a manifold to maximize the likelihood of a training set, according to a normal distribution centered on that manifold. Each instance of the dataset is therefore embedded as a density distribution over the manifold called responsibilities. As a corollary, a full dataset is represented summing the corresponding responsibilities. This concept allows for the generation of activity and property landscapes that are predictive classification and regression models, respectively, emerging from the GTM analysis.
Several use cases to answer big chemical data analysis tasks will be presented. First, the concept of ChemAtlas will be presented: a compendium of multi-scale maps covering over 700 biological properties from the ChEMBL database. Second, the use of kernel GTM for genomic data where the challenge is to manage data of very large dimensionality. Third, the use of GTM to sample the chemical space efficiently coupling the method with an auto-encoder.
11h35 Toward the discovery of the hidden features built by a GNN
Marc Plantevit (LRDE, LIRIS)
Dans cette présentation, nous considérerons l’explication de GNNs qui sont appliqués avec succès sur de nombreux problèmes de classification de graphes, notamment en chimie. Alors que les travaux existants expliquent la décision du modèle en s’appuyant sur la couche de sortie, nous verrons comment analyser les couches cachées pour identifier les attributs construits par le GNN.
Les règles d’activation ainsi construites permettent d’identifier des neurones co-activés pour une classe. Ces règles définissent ainsi des représentations internes ayant un impact fort sur la classification. Aussi intéressantes soient-elles, elles ne sont pas interprétables. Nous aborderons donc comment générer un graphe représentatif pour chaque règle. Nous présenterons quelques résultats expérimentaux sur des jeux de données bien connus (e.g., Mutagen, Aids). Enfin, nous discuterons les perspectives de ce travail
12h15 Fin

Programme de l’Action MADONA

[Salle C5 – RdC]

NADA 22 : 1er atelier pluridisciplinaire : narration de données, datajournalisme et engagement(s)

Mardi 12 juillet – 10h15-12h15
datajournalisme et engagement
10h15 Présentation de l’action MADONA
Marie Chagnoux (CEMTI) et Patrick Marcel (LIFAT)
10h30 Les données dans une formation en journalisme : retour d’une expérience
Olivier Trédan (ARENES)
11h00 Notebooks, l’engagement par la documentation
Raphaël Da Silva (journaliste free-lance et formateur)
11h15 Datajournalisme, feuilletonnage et engagement
Bertrand Enjalbal (Rue 89 Lyon)
11h30 L’engagement éditorial dans la constitution d’une base de données : deux exemples de réaffirmation de la responsabilité sociale du journalisme
Mélanie Lecha (UPHF)
11h45 Global turn de l’investigation journalistique et engagement collaboratif grâce aux technologies numériques : le cas de l’ICIJ
Angelina Toursel (UPHF) et Philippe Useille (UPHF)
12h15 Pause déjeuner
Mardi 12 juillet – 14h00-17h00
Narration et engagement
14h00 Observatoire du discours parlementaire
Lucas Piessat (ERIC), Julien Velcin (ERIC) et Gauthier Bravais (ERIC)
14h30 Expérimentations d’innovation sociales et mise en récit, présentation du laboratoire citoyen la Myne
Julien Beutter (La Myne)
14h45 Generating personalized data narrations from EDA notebooks
Patrick Marcel (LIFAT)
15h00 Les dispositifs d’engagement du lecteur dans la narration de données
Marie Chagnoux (CEMTI)
15h15 Discussion
16h00 Les suites de l’Action MADONA
17h00 Fin

Programme de l’Action SimpleText

[Salle TD10 – 1er étage]

Mardi 12 juillet – 14h00-16h00
14h00 Ouverture
Liana Ermakova (HCTI, UBO)
14h10 Text complexity & eye tracking (visio)
Olivier Augereau (Lab-STICC, ENIB)
14h30 Some experience on Incident Triaging with NLP Techniques in an Industrial Environment
Youcef REMIL (LIRIS, INSA Lyon / Infologic)
15h00 Beyond Just Words: Utilizing Additional Information in Document Readability Assessment (visio)
Adam Jatowt (University of Innsbruck, Austria)
15h40 Vocabulometer: a recommender system for learning language (visio)
Nicholas Journet (LaBRI, Université de Bordeaux)
16h00 Fin

Programme de l’Action RoCED

[Salle TD11 – 1er étage]

Mardi 12 juillet – 14h00-16h00
14h00 Ouverture
14h10 Raisonnement sur des requêtes avec agrégats temporels
Marie-Christine Rousset (LIG)
15h00 Règles pour le droit d’accès à des données pour la sécurité de la personne
Pierre-Yves Gicquel (IRIT)
15h20 Construction de graphes de connaissance à partir de textes avec une IA centrée-utilisateur
Hugo Ayats (IRISA)
15h40 Hybridation des méthodes d’apprentissage et Web sémantique pour l’optimisation et la planification de cultures maraîchères en agro-écologie
Baptise Darnala (LIRMM)
16h00 Fin

Liste des posters

[Salles C1 et C2 – RdC]

Exposant Laboratoire Titre
Pierre Andrieu LMO, LISN Obtenir des informations sur les gènes les plus associés à une maladie donnée
Nelly Barret INRIA, LIX Abstra: Data Descriptions out of Any Model
Alexis Blandin IRISA Représentation de newsletters en graphes
Lisa Chabrier INRIA, LIRIS Regulatory interactions between genes and Gene Regulatory Networks (GRNs)
Marzieh Derakhshannia LIRMM Gestion et optimisation de l’architecture logistique de lacs de données
Faten El Outa LIFAT Un cadre pour façonner la narration de données
Pierre Faure-Giovagnoli LIRIS Évaluez l’Existence d’une Fonction dans votre Jeu de Donnée
Quentin Gabot Léonard de Vinci Tourists Profiling by Interest Analysis
Nicolas Hiot LIFO Base de données graphes avec informations incomplètes
Gabriel Kasmi OIE Prévision de production d’energie renouvelable
Bilal Koteich IRENav Knowledge-Based Recommendation for On-Demand Mapping : Application to Nautical Charts
Tanguy Lefort IMAG Ambiguïté des étiquettes en classification et retours d’expert
Jules Leguy Leria Recherche combinatoire guidée par apprentissage artificiel en chimie moléculaire
Etienne Lehembre GREYC Selecting Outstanding Patterns Based on Their Neighbourhood
Madhulika Mohanty INRIA Scalable exhaustive connectivity search within graph queries
Hassan Noureddine IRENav Modélisation, gestion et traitement des données de trajectoires sémantiques en indoor et outdoor
Audrey Onfroy INSERM, IBENS Deciphering molecular mechanisms governing malignant transformation in Neurofibromatosis Type 1 (NF1) from single cell transcriptomic
Mélanie Piot LIST3N CANCER DU SEIN: Représentation du savoir : experts vs données
Arijus Pleska CRISTAL Neural language processing and federated learning under data privacy or fairness
Mina Rafla GREYC, Orange Labs Correction des biais dans le cadre de la modélisation de l’effet de traitement
Sébastien Rivault LIFO Parallélisme, équilibrage de charges et extensibilité dans le traitement des mégadonnées sur des systèmes à grande échelle
Antoine Saget iCube Apprentissage collaboratif multiparadigme pour l’analyse d’images de télédétection
Hugo Thimonier LISN Apprentissage Automatique et Interpretabilité : Application à la détection de fraude aux paiement par carte bancaire
Foutse Yuhgoh DRRC, CEDIRC A Technology Intelligence Recommendation System based on Multiplex Networks
Eduardo Brandao LHC Physics-guided Machine Learning
Hussein El Amouri iCube Interactive collaborative constrained clustering for remote sensing time series analysis
Loujain Liekah LIRIS Prediction Models on Medical Data
Alexis Mortelier GREYC analyse de données de e-sport