Les réseaux profonds pour les données temporelles multivariées.Application « Jumeau Numériques » sur

Offre en lien avec l’Action/le Réseau : MACLEAN/– — –

Laboratoire/Entreprise : LIPN, UMR CNRS 7030
Durée : 6 mois
Contact : mustapha.lebbah@univ-paris13.fr
Date limite de publication : 2021-11-01

Contexte :
Possibilité de poursuivre en thèse CIFRE avec SAFRAN.
Ce sujet de stage de recherche a pour objectif de mener à un projet CIFRE avec SAFRAN en informatique scientifique et algorithmique qui aura pour but d’intégrer de nouveaux algorithmes sous la méthodologie développée précédemment [4,5].

Sujet :
A travers ce sujet de stage de recherche niveau M2, nous souhaitons tester la viabilité d’une méthodologie neuronale moderne basée sur les architectures profondes (Deep learning), les réseaux récurrents et appliquée aujourd’hui avec succès sur le traitement de textes (traduction, chat-bots, etc.) et l’analyse de signaux audio (sous-titrage automatique). Deux approches sont possibles, une approche anticipative qui identifie un état latent se superposant à l’observation et qui permettrait d’estimer la transition d’une observation à l’autre (de type LSTM ou GRU) [1,2,3]. Une autre proposition est de construire un auto-encodeur récurrent capable de reproduire à l’inverse une série d’observations de manière analogue aux outils utilisés pour l’interprétation des séquences de mots (réseaux transformers utilisant des couches d’attention). Ces deux approches nécessitent d’explorer simultanément plusieurs ensembles de séquences multivariées. Il va falloir apprendre à traiter efficacement les signaux temporels multivariés issus des données de vol.

Le stage de recherche se déroulera en 3 phases :
-Étudier l’état actuel de l’art sur l’apprentissage profonds et données temporelles multi-variés,
-Examiner l’état actuel de l’art des outils logiciels et des architectures pour traiter de grande masses de données temporelles multi-variées. Cela comprend les progiciels et les bibliothèques utiles pour construire, former et déployer des modèles sur des données réelles. Cette phase sera réalisée en étroite collaboration avec la Start-up HephIA.
-Sur la base des études précédentes, implémenter un ou plusieurs algorithmes/architecture. Les résultats obtenus pendant le stage peuvent conduire à des contributions à des logiciels libres, voire à une publication scientifique, en fonction des compétences et de la motivation du/de la stagiaire.

Profil du candidat :
Fin de cycle d’Ingénieur d’une grande école, M2 de data science, statistique et/ou intelligence artificielle.

Formation et compétences requises :
Bonne expérience en programmation, et en particulier du framework PyTorch/deeplearning4j.
Comment déposer sa candidature : le dossier de candidature en PDF comportera les éléments suivants :
-CV ; Relevés de notes ; Lettre de motivation
Le dossier de candidature est à envoyer par mail à Hanene.Azzag@lipn.univ-paris13.fr, Mustapha.lebbah@univ-Paris13.fr, (objet du mail [Stage-LIPN-SAFRAN-22])

Adresse d’emploi :
Laboratoire d’Informatique de Paris-Nord (LIPN),
CNRS(UMR 7030),
99, av. J-B Clément
F-93430, Villetaneuse

Document attaché : 202111010827_Sujet-stage-recherche-LIPN-SAFRAN.pdf

TAL pour la détection du discours de haine

Date : 2021-11-16
Lieu : Institut de Recherche en informatique de Toulouse (IRIT)-Salle des thèses, mais également sur zoom sur le lien suivant : https://univ-tlse3-fr.zoom.us/j/99806869715?pwd=S29mbklLR0hRS1dyMnB1Rm5zRWpMdz09

L’action Lemon (https://www.madics.fr/actions/lemon/) organise un séminaire sur les approches de traitement automatique du langage pour la détection de dicsours de haine. Le sémniare aura lieu en mode hybride de 9h30-12h le mardi 16 novembre 2021.

Le programme est comme suit :

9h25. Farah Benamara et Véronique Moriceau (Assistant Professor at Toulouse University). Introduction.

9h30-10h15. Roy Ka-Wei. Assistant Professor at the Information Systems Technology and Design Pillar (ISTD), Singapore University of Technology and Design. Title: Perils and Promises of Automated Hate Speech Detection.

10h15-11h00. Leon Derczynski. Assistant Professor at the IT University of Copenhagen. Title: Corpus Construction for Absuive Language Detection

11h00-11h45. Viviana Patti. Assistant Professor at the University of Turin. Title: Abusive Language Detection on Social Media: Are We Far from the Shallow Now?

En espérant vous y voir nombreux!

Cordialement,
Farah Benamara


Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

Extraction et catégorisation automatique de contenu de manuels scolaires

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire interdisciplinaire des sciences du num
Durée : 6 mois
Contact : guinaudeau@limsi.fr
Date limite de publication : 2021-12-31

Contexte :
Le projet ANR MALIN a pour objectif de rendre utilisables les manuels scolaires numériques par les enfants en situation de handicap dont l’inclusion dans les établissements scolaires ordinaires a été posée par la loi du 11 février 2005. En France, le manuel scolaire est un support pédagogique emblématique quasi systématiquement utilisé en classe afin d’accompagner de manière progressive et structurée l’acquisition des connaissances et compétences définies dans les programmes scolaires officiels de l’Éducation Nationale. Les manuels numériques actuellement disponibles nécessitent d’être adaptés pour être utilisés par les enfants en situation de handicap. Ces adaptations concernent aussi bien les aspects techniques que pédagogiques. Dans la plupart des cas, des parties seulement des manuels sont adaptées et les délais de livraison peuvent être de plusieurs mois. Ces contraintes ne permettent pas de rendre efficiente l’inclusion scolaire des enfants en situation de handicap. L’objectif du projet ANR MALIN est donc de développer des solutions techniques afin d’aboutir à l’automatisation de l’adaptation des manuels scolaires numériques pour les rendre accessibles (accès, traitement et interaction avec les contenus) aux élèves en situation de handicap.

Sujet :
Dans ce contexte, le/la stagiaire travaillera sur l’extraction des consignes des exercices ainsi que sur leur identification / catégorisation. L’objectif du stage consiste notamment à identifier les consignes de type “choix proposés” dans les différents exercices. Ces choix proposés pouvant prendre plusieurs formes, le/la stagiaire développera, à partir d’une chaîne d’extraction déjà existante et de données annotées manuellement, des techniques génériques, fondées sur des approches de traitement automatique des langues et tirant partie de l’efficacité des technologies d’apprentissage profond.

Ce stage s’inscrit dans le cadre d’un projet ANR et pourra se poursuivre par un doctorat de 3 ans. Le projet ANR repose sur une collaboration entre quatre laboratoires : LISN (Université Paris Saclay), MISC (Ecole CentraleSupelec), CEDRIC (CNAM), Inserm 1284 (CRI, Université de Paris). Le stagiaire travaillera en interaction avec deux autres stagiaires associés au projet.

Profil du candidat :
master et/ou ingénieur en informatique avec une spécialisation dans au moins un des domaines suivant:
traitement automatique des langues
apprentissage automatique

Formation et compétences requises :
maîtrise de Python (langage de prédilection du projet)
maîtrise de l’anglais (écrit et oral)
La connaissance de librairies d’apprentissage sera appréciée.

Adresse d’emploi :
Laboratoire interdisciplinaire des sciences du numérique – LISN
Campus Universitaire bâtiment 507
Rue du Belvédère
91400 Orsay

Document attaché : 202110291051_Sujet de stage ANR MALIN – LISN.pdf

Atelier Apprentissage Profond: Théorie et Applications (APTA)

Date : 2022-01-25
Lieu : Blois, France

DESCRIPTIF

L’apprentissage profond (deep learning) révolutionne depuis plusieurs années l’apprentissage automatique. Alors que les premiers résultats marquants ont été obtenus principalement en analyse d’images, les travaux actuels en apprentissage profond s’intéressent à présent à tous les types de données (images, vidéos, son, séries temporelles, textes, etc.). De plus, l’utilisation des réseaux profonds s’est également étendue à presque tous les types de traitements (classification, clustering, génération, augmentation de données, détection d’anomalies, prédiction, segmentation, etc.). Ainsi, l’impact de l’apprentissage profond dans le domaine de la science des données et l’extraction de connaissances est considérable.

Suite au succès des éditions précédentes de l’atelier APTA, nous souhaitons à nouveau proposer, dans le cadre de la conférence EGC, un espace d’échanges autour de ce domaine. Celui-ci permettra d’aborder les défis théoriques et les possibilités applicatives qu’il offre à notre discipline de l’extraction et de la gestion des connaissances. Dans le cadre de cet atelier, nous souhaitons nous focaliser sur les applications de l’apprentissage profond dans différents domaines (analyse ou génération d’images, classification de données temporelles, extraction d’informations à partir de données hétérogènes, etc.) mais également permettre la présentation de travaux plus théoriques (nouvelles architectures, nouvelles fonctions de coût, interprétabilité des modèles, etc).

THÈMES DE L’ATELIER (LISTE NON EXHAUSTIVE)

  • Applications de l’apprentissage profond
    • Extraction d’informations à partir d’images, de vidéos, de sons
    • Analyse de séquences temporelles
    • Text-mining
    • Analyse du langage naturel, de la parole
    • Données géographiques
    • Données financières
    • Données de mouvements humains
    • Données médicales, biologiques, bio-informatiques
    • Recommandation et publicité ciblée
    • Jeu et résolution de problèmes
  • Nouvelles approches pour l’apprentissage profond
    • Réseaux récurrents
    • Réseaux siamois
    • Apprentissage par renforcement
    • Réseaux antagonistes génératifs (GAN)
    • Convolutions et graphes
    • Apprentissage auto-supervisé (self-supervised learning)
    • Apprentissage profond collaboratif
    • Modèles prédictifs

DATES IMPORTANTES

  • Soumission des papiers : 23/11/2021
  • Notification aux auteurs : 13/12/2021
  • Réception des versions finales : 17/12/2021
  • Mise en ligne du programme : 03/01/2022
  • Date de l’atelier : 25/01/2022
  • INSTRUCTIONS AUX AUTEURS

    Les auteurs sont invités à soumettre électroniquement leur proposition en utilisant la plateforme de l’atelier :
    https://apta2022.sciencesconf.org/submission/submit

    La taille des soumissions sera de 10 pages au maximum. Elle pourra être beaucoup plus courte, en particulier pour les articles présentant un travail qui débute ou la présentation de projet de recherche. Le format LaTex à utiliser est celui de la revue « Revue des Nouvelles Technologie de l’Information » (RNTI) disponible à l’adresse suivante : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

    ORGANISATEURS

    • Maxime Devanne, MCF, Université de Haute-Alsace, IRIMAS
    • Camille Kurtz, MCF, Université de Paris, LIPADE

    Lien direct


    Notre site web : www.madics.fr
    Suivez-nous sur Tweeter : @GDR_MADICS
    Pour vous désabonner de la liste, suivre ce lien.

    PhD position in Deep Learning methods for long non-coding RNA prediction in cancer

    Offre en lien avec l’Action/le Réseau : – — –/– — –

    Laboratoire/Entreprise : IBISC, UEVE, Université de Paris-Saclay
    Durée : 3 ans
    Contact : fariza.tahi@univ-evry.fr
    Date limite de publication : 2021-12-27

    Contexte :
    RNAs, and more precisely non-coding RNAs (ncRNAs, RNA untranslated into proteins), have aroused growing interest in the international scientific community in recent years, due to their proven involvement in many biological processes and the important role they can play in pathological processes such as cancer. They are thus increasingly considered as potential therapeutic targets or biomarkers (diagnostic and prognostic markers).

    Recently, many long ncRNAs (lncRNAs), larger than 200 nucleotides, have been identified as potential regulators. But unlike small ncRNAs, their characterization by structure and function is far from established. The determination of the structure, 2D or 3D, of an lncRNA by experimental methods (crystallography, NMR) or bioinformatics methods is a major challenge, since it helps to elucidate its function. RNAs from the same family indeed share the same structure, giving them the same function, the structure guiding in particular the interactions of this RNA with proteins or other RNAs.

    Sujet :
    In this project, we propose to develop computational methods based on Deep Learning to predict and characterize lncRNAs by integrating different data: sequence, 2D and 3D structure, interaction with coding or non-coding genes. and genetic and epigenetic alterations. The development of methods to predict the 3D structure of RNAs, such as those developed by DeepMind (the AI subsidiary of Google), could also be considered.

    The methods developed will be applied to cancer and will provide a better understanding of the involvement of RNAs in this pathology. Cancer in a given tissue is a heterogeneous disease; several cancer subtypes can be identified. Treatments and diagnosis should be tailored to each subtype. In this project, we will be interested in lncRNAs in a frequent cancer, bladder cancer (4th cancer in terms of incidence in men) as well as in pediatric cancer, retinoblastoma. A small number of lncRNAs predicted to be potentially involved will be functionally validated by the team of biologists. We hope ultimately to be able to offer clinicians new diagnostic or prognostic markers and enable them to better understand the biological causes of the disease in order to optimize treatments.

    The final objective of the project will be to implement generic methods and tools for the prediction of lncRNAs. The tools developed will be made available to the scientific community via our EvryRNA platform:
    http://EvryRNA.ibisc.univ-evry.

    Profil du candidat :
    Students with background in computer science and data sciences, in particular in machine learning and deep-learning. Knowledge of bioinformatics and biology will be highly appreciated.

    Formation et compétences requises :
    Master 2 in Data Sciences, Bioinformatics/Computational Biology or Computer Sciences (or equivalent).

    Adresse d’emploi :
    IBGBI, IBISC, 23 b. de France, 91000 Evry

    Document attaché : 202110271212_Phd-Offer-FR-EN.pdf

    Architecture logicielle pour l’analyse de données dans l’Usine 4.0

    Offre en lien avec l’Action/le Réseau : – — –/– — –

    Laboratoire/Entreprise : L@abIsen – entreprise ACOME
    Durée : 15 mois
    Contact : benoit.lardeux@isen-ouest.yncrea.fr
    Date limite de publication : 2021-11-15

    Contexte :
    Type d’offre : Ingénieur de recherche, post-doc

    Contexte : Chaire industrielle « Architecture de données pour l’Usine 4.0 ».

    • Enterprise : ACOME
    • Unité de recherche : L@bISEN Isen Yncrea Ouest .

    Contrat : CDD – 15 mois

    Salaire : 2700€ net/mois

    Lieu de travail : Nantes

    Spécialité : Architecture logicielle, manipulation de bases de données, infrastructure réseau, big data, analyse de données
    Date limite de candidature souhaitée : avant 15/11/2021

    Avantages :
    • Possibilité d’embauche en CDI
    • Déplacements pris en charge pour les missions entre ISEN et ACOME
    • Mutuelle ( Possibilité d’ajouter des membres de la famille sans surcoût)
    • Prévoyance
    • Carte Tickets Restaurant
    • Avantages CSE (Comité Social et Economique)
    • Aide au déménagement (Aide plafonnée à 1 500 € + aide à trouver un logement par notre prestataire)

    Contexte :

    Ce contrat se déroule dans le cadre d’une chaire industrielle entre l’entreprise ACOME, leader européen dans la création des câbles, et le L@bIsen le laboratoire de l’Ecole Supérieure de l’Electronique et du Numérique.

    ACOME – Mortain
    A la fois leader et spécialiste sur les marchés des réseaux télécoms et infrastructures, des réseaux du bâtiment, de l’automobile et de l’embarqué, ACOME est aujourd’hui le 1er Groupe industriel coopératif Français produisant des câbles, des tubes et de la fibre optique sur le territoire national depuis 1932 et la 1ère SCOP de France (Société Coopérative et Participative) avec une forte dynamique internationale et des implantations en Chine, en Afrique du Nord et au Brésil.
    www.acome.fr

    L@bISEN site de Nantes
    Yncréa Ouest est un Établissement d’Enseignement Supérieur Privé d’Intérêt Général (EESPIG) sous contrat avec le ministère de l’Enseignement Supérieur et de la Recherche. L’Association Yncréa Ouest est membre d’Yncréa, premier pôle privé associatif d’écoles d’ingénieurs en France. Yncréa Ouest gère l’école d’ingénieurs ISEN Yncréa Ouest, implantée sur les villes de Brest, Caen, Nantes et de Rennes. L’école forme des élèves ingénieurs dans les technologies du numérique et notamment les systèmes numériques embarqués, la robotique, l’énergie, les objets connectés (IoT), l’intelligence artificielle, le big data, l’environnement, le développement durable, les technologies marines et la cybersécurité.
    Les activités de recherche de l’équipe d’accueil (L@bISEN de l’Yncréa Ouest, évaluée par la HCERES en 2021) sont centrées essentiellement sur le numérique et ses applications notamment celles dans l’Usine 4.0, le campus connecté, le traitement des données et l’Intelligence Artificielle.
    https://isen-nantes.fr/recherche-4/

    Sujet :
    Dans le secteur industriel, les entreprises sont soumises à des demandes toujours plus fréquentes de nouvelles versions de leurs produits pour répondre aux besoins en perpétuel évolution du marché. L’industrie de la fabrication des câbles est particulièrement impactée par cette tendance de fond qui pousse les laboratoires de conception des nouveaux produits à fournir toujours plus de recettes des nouvelles fabrications en un temps réduit, en prenant en compte les normes imposées par les clients. Afin d’améliorer le temps de mise sur marché, un enjeu important est de minimiser le nombre de tentatives pour fabriquer un nouveau produit afin de minimiser le temps de conception ainsi que les déchets générés par un nombre trop important d’essais infructueux. Pour cela, le bureau d’étude de l’entreprise peut utiliser l’expérience et les informations acquises lors des multiples tentatives déjà enregistrées pour obtenir les produits actuellement commercialisés.

    Des masses importantes de données sont donc à disposition pour permettre l’étude des paramètres qui influent sur la qualité et les particularités des nouveaux câbles générés. La difficulté consiste à organiser les données et à les rendre à la demande dans les différents départements de l’Usine. Par conséquent, une plateforme de gestion de données est nécessaire pour mise à disposition des données. Plusieurs modèles de bases de données sont à mettre en place pour suivre l’évolution des données et les préparer à la phase d’analyse qui permettra l’identification des paramètres de conception qui ont un impact sur les indicateurs qu’il est nécessaire d’améliorer.

    Le livrable principal de ce post doc sera de mettre en place l’architecture logicielle permettant de collecter les données pour les traiter et les analyser. Si l’avancement des travaux le permet, le candidat pourra proposer de nouveaux modèles d’optimisation pour généraliser la prise en compte des indicateurs principaux dans la production de nouveaux câbles.

    Profil du candidat :
    – Connaissances dans le déploiement d’outils de manipulation de données (Kafka, Kubernetes, etc.)
    – Eventuellement, maîtrise des outils logiciels nécessaires à la collecte et le traitement des données massives (Spark, Scalla, Hadoop, etc.)
    – Manipulation des bases de données (SQL, NoSQL)
    – Appétence pour les techniques de l’IA, prise de décision et les problématiques dans l’industrie 4.0

    Formation et compétences requises :
    Diplôme équivalent Master, école d’Ingénieur ou Doctorat

    Le contrat à durée déterminé de 15 mois est à pourvoir dès que possible, avec une opportunité intéressante de poursuivre en CDI.

    Les candidats doivent fournir une lettre de motivation manuscrite, un curriculum vitae (2 pages max) et une notice individuelle ou un CV détaillé. Les 3 ou 4 meilleurs profils seront invités à faire un exposé de 20 à 30 minutes qui sera suivi d’une séance de questions devant la commission de spécialistes.

    Adresse d’emploi :
    33 avenue du Champ de Manoeuvre
    44300 CARQUEFOU, FRANCE

    Document attaché : 202110271055_postdoc_acomeisen_v2.pdf

    Recalage d’Images Médicales par Apprentissage profond

    Offre en lien avec l’Action/le Réseau : – — –/– — –

    Laboratoire/Entreprise : CREATIS
    Durée : 6 mois
    Contact : michael.sdika@creatis.insa-lyon.fr
    Date limite de publication : 2021-11-15

    Contexte :
    Le recalage d’image est un outil permettant d’aligner des images entre elles. C’est souvent une étape préliminaire essentielle pour l’ ́etude de pathologie cérébrale basée sur l’imagerie, permettant de positionner, orienter voire de déformer les cerveaux de différent sujets pour les replacer dans un système de coordonnées commun.
    Lorsque la transformation recherchée est affine, les outils actuels de recalage donnent des résultats souvent satisfaisant mais échouent notamment lorsque:
    •l’initialisation est mauvaise
    •il y a de forts artefacts d’imagerie
    •une pathologie implique un changement important de l’apparence du cerveau
    •seule une partie du cerveau est présente dans l’image (image rognée)

    Les outils classique de recalage sont souvent basée sur des approches itérative d’optimisation mathématique de mais de plus en plus de méthodes actuelles se basent sur des approches par pprentissage profond [Boveiri].

    Sujet :

    L’objectif du stage est de mettre en place et d’entraı̂ner un réseau de neurones permettant faire le recalage linéaire d’une image de cerveau sur un espace de référence standard. L’objectif principale sera que l’estimation soit la plus robuste possible mais aussi que le réseau soit léger. On pourra par exemple s’intéresser à une bonne façon de paramétrer la transformation mais aussi à aux couches équivariantes dans un réseau de neurones [Finzi], au réseau à capsules [Sabour, Lensen, Gu]. Le réseau de recalage linéaire sera intégré au pipeline de pré-traitement du cerveau de l’équipe MYRIAD de CREATIS.
    Données: plusieurs jeux de données d’imagerie cérébrales publiques impliquant différentes pathologies, protocoles d’acquisition et modalités sont déjà utilisés dans l’équipe et seront utilisés pour le stage. Une solide procédure d’augmentation de données permettra d’améliorer encore la robustesse de notre méthode.

    Profil du candidat :

    Formation et compétences requises :
    Le candidat recruté devra avoir une formation dans un des domaines suivants et de bonnes connaissances dans les deux autres:
    • Machine learning (deep learning)
    • Traitement d’images
    • Mathématiques appliquées
    Il devra aussi avoir de solides compétences en développement logiciel et être en mesure d’implémenter les méthodes proposées.

    Adresse d’emploi :
    Le stage se déroulera au laboratoire CREATIS à Lyon sur le campus de la Doua.

    Les documents à joindre à la candidature sont :
    • curriculum vitae
    • lettre de motivation
    • résultats académiques récents

    Document attaché : 202110270849_internship-registration-2022.pdf

    Stage de Master : Deep Learning pour l’analyse de sentiment dans des témoignages textuels

    Offre en lien avec l’Action/le Réseau : – — –/– — –

    Laboratoire/Entreprise : LITIS lab., University of Rouen Normandy, Rouen, F
    Durée : 6 mois
    Contact : simon.bernard@univ-rouen.fr
    Date limite de publication : 2021-12-31

    Contexte :
    L’équipe Apprentissage du laboratoire LITIS, le laboratoire d’informatique et d’intelligence artificielle de l’Université de Rouen Normandie, propose un stage de 6 mois de fin de Master ou de fin de cursus Ingénieur, à débuter en février/mars 2022. Ce stage est financé par le projet ANR CATCH (Compréhension Automatique de Témoignage de Capteurs Humains) qui implique le centre Recherche et Développement de l’entreprise Saagie, une entreprise spécialisée dans les solutions DataOp B2B, Atmo Normandie, l’association de surveillance de la qualité de l’air en Normandie, et le LITIS.

    L’ambition du projet CATCH est de proposer des outils d’intelligence artificielle et de deep learning pour identifier et analyser automatiquement la multitude de témoignages humains liés à un accident industriel et à ses conséquences sur l’environnement et la santé. En impliquant la population dans la collecte et l’analyse des données, notamment via les réseaux sociaux, et en fournissant des moyens efficaces d’interprétation de ces données, la solution proposée devrait contribuer à apporter des réponses à la problématique préoccupante des accidents industriels et de leurs conséquences. Pour cela, l’objectif du projet est double :
    1. Dresser une cartographie des nuisances dues à l’incident, afin de suivre la propagation et l’évolution des phénomènes dans le temps.
    2. Analyser et caractériser le ressenti de la population et son évolution tout au long de la crise.
    Pour ce faire, nous pouvons exploiter les témoignages recueillis sur la plateforme ODO d’Atmo Normandie, qui combine ces témoignages avec des informations géographiques, ainsi que des données extraites de la plateforme de micro-blogging Twitter.

    Sujet :
    Ce stage vise à contribuer à ces deux objectifs via l’analyse des sentiments exprimés dans les témoignages de ces données, déjà disponibles et annotées en ce qui concerne les données ODO, ou à annoter automatiquement pour les données Twitter. Les méthodes à l’état de l’art pour ce type de tâches en traitement automatique de la langue (TAL ou NLP pour Natural Language Processing) sont des méthodes d’apprentissage profond de type Transformers, notamment basées sur des principes d’apprentissage auto-supervisés (self-supervised learning) et des mécanismes d’attention. Donc, la première tâche de ce stage consistera à sélectionner, implémenter et appliquer une ou plusieurs de ces approches pour l’analyse de sentiment dans les données ODO. Il s’agira ensuite d’exploiter le ou les modèles les plus performants pour la génération de la cartographie, par exemple pour déterminer les zones géographiques les plus impactées par les retombées de l’indicent, et pour la caractérisation du ressenti de la population, par exemple pour détecter des sentiments pré-identifiés dans tous les témoignages à disposition.

    Profil du candidat :

    Formation et compétences requises :
    – Étudiant en Master 2 ou en dernière année d’école d’ingénieurs, dans une spécialité de l’informatique ou des mathématiques appliquées
    – Compétences requises en apprentissage automatique et en programmation (Python de préférence)

    Adresse d’emploi :
    LITIS,
    UFR Sciences et Techniques,
    Technopôle du Madrillet
    Avenue de l’université
    76801 Saint-Étienne-du-Rouvray

    Les documents à joindre à la candidature sont :
    • curriculum vitae
    • lettre de motivation
    • résultats académiques récents
    • noms et coordonnées d’un ou de plusieurs enseignants référents

    Document attaché : 202110261524_StageM2_ ANRCATCH_LITIS.pdf

    CDD Ingénieur d’étude dev 6 mois / Toulouse – python / web sémantique

    Offre en lien avec l’Action/le Réseau : – — –/– — –

    Laboratoire/Entreprise : IRIT
    Durée : 6 mois
    Contact : pascal.dayre@irit.fr
    Date limite de publication : 2022-02-01

    Contexte :
    le projet ANR SO-DRIIHM [1] recrute un ingénieur d’étude pour 6 mois à partir du 1er décembre.

    Dans la continuité de l’opendata, le courant de la science ouverte a pour objectif de faciliter le partage des ressources et des productions scientifiques afin de rendre la science plus éthique. Une science plus transparente, plus reproductible et plus additionnelle.

    Cet emploi se fera dans un contexte riche de plusieurs projets autour de la science ouverte, des données et de l’IA. Des échanges avec la communauté d’usage du labex DRIIHM et avec un partenaire industriel auront lieu. Les développements se feront selon l’état de l’art des développements internet et des standards liés aux données ouvertes.

    Sujet :
    CDD Ingénieur d’étude développement 6 mois / Toulouse – python / backend Django / OpenAPI / web sémantique / sparQL

    Il s’agit de travailler sur le développement du serveur d’une plateforme internet pour la science ouverte.

    La partie serveur de la plateforme s’appuient sur le framework python Django et ses déclinaisons. La persistance des données est assurée par un système de gestion de bases de données sémantiques (triplestore RDF/RDFS). Le langage de requêtage sparQL, extension du SQL est utilisé. La plateforme est en interaction avec un ensemble de services de l’éco-système numérique de la science ouverte.

    Pour plus d’information, vous pouvez consulter l’offre d’emploi
    https://emploi.cnrs.fr/Offres/CDD/UMR5602-EMILER-004/Default.aspx

    Profil du candidat :
    Bac + 5 ans et première expérience souhaités.

    Ingénieur en informtique

    Formation et compétences requises :
    Développement informatique.

    – Bonne connaissance de python et de Django
    – Bonne connaissance de l’algorithmique
    – Connaissance du développement orienté objet
    – Connaître Gitlab, Github voire Docker
    – Connaissance de l’environnement de développement python et d’un framework (Django)
    – Connaissance de l’IDE Visual code studio
    – Connaissance des architectures des systèmes d’information sur internet
    – Rédiger et mettre à jour la documentation fonctionnelle et technique (wiki, Markdown voire latex)
    – Connaissance d’UML pour mettre à jour la documentation technique
    – Travailler en équipe
    – Élaborer et mettre en œuvre un plan de test
    – Connaissance système et linux : connaissance d’administration d’un système linux bienvenue (ubuntu 20.04)
    – Connaissance des outils et standards du web sémantique : RDF et les bases de graphe, langage de requête SPARQL, XML, RDF, OWL, Triplestore, DCAT
    – Connaissance du web des données, des bases de données sémantiques et de sparQL. Construire et administrer des bases de données graphes (triplestore graphDB sparQL)
    – Connaissance d’un framework javascript est un plus pour bien comprendre le besoin et potentiellement intervenir ponctuellement sur le code du client

    Adresse d’emploi :
    Le lieu du CDD est l’IRIT (Institut de Recherche en Informatique de Toulouse – site UPS)

    Deep Learning et modélisations numériques de pathologies de l’aorte thoracique

    Offre en lien avec l’Action/le Réseau : – — –/– — –

    Laboratoire/Entreprise : nstitut de Mathématiques de Marseille, I2M, UMR 73
    Durée : 6 mois
    Contact : badihghattas@gmail.com
    Date limite de publication : 2022-03-31

    Contexte :
    Différentes pathologies peuvent affecter l’aorte que ce soit au niveau thoracique ou abdominal. Deux pathologies nous interesse plus particulièrement : la formation d’anévrisme qui peut être défini
    comme une dilatation du rayon de l’aorte excédant 1.5 son rayon initial et la dissection aortique qui consiste en une déchirure de la paroi vasculaire au niveau de la couche intimale. Afin de prédire les évolutions de ces pathologies le plus précocement possible l’équipe de biomécanique d’IRPHE réalise notamment des modélisations numériques complexes. Grâce à des données [géométries et conditions aux limites] provenant d’imageries médicales, l’objectif est de mettre en œuvre des modèles 3D
    patient-spécifique tenant compte des interactions fluide-structure pour différents types d’évolution -favorable et défavorable- ainsi que pour plusieurs temps post opératoires. Ceci permet d’associer des
    grandeurs physiques liées aux dynamiques de l’écoulement et des structures à certaines évolutions cliniques défavorables et, par suite, à prédire précocement certains échecs thérapeutiques. Toutefois,
    le temps de calcul associé à ces modélisations complexes constitue un obstacle à leur utilisation en pratique clinique.

    Sujet :
    Deep Learning et modélisations numériques de pathologies de l’aorte thoracique

    Profil du candidat :
    Etudiant en M2 mathématiques appliquées (Statistiques, Data Science) ou en sernière année d’école d’ingénieur issu de filière statistiques/informatique.

    Formation et compétences requises :
    Le(la) candidat(e) devra avoir des connaissances académiques dans les champs disciplinaires relatifs au sujet: Deep learning en priorité et modélisations numériques. Il(elle) devra avoir une appétence
    avérée pour l’interdisciplinarité. Une expérience en programmation python est indispensable, en particulier, tensorflow, keras, pandas et numpy.

    Adresse d’emploi :
    Institut de Mathématiques de Marseille, 163 avenue de Luminy, 13009 Marseille. Accesoissoirement aussi le site nord de chateau Gombert.

    Document attaché : 202110221459_M2_deep_learning_2021_22.pdf