Extraction et catégorisation automatique de contenu de manuels scolaires

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : Laboratoire interdisciplinaire des sciences du num
Durée : 6 mois
Contact : guinaudeau@limsi.fr
Date limite de publication : 2021-12-31

Contexte :
Le projet ANR MALIN a pour objectif de rendre utilisables les manuels scolaires numériques par les enfants en situation de handicap dont l’inclusion dans les établissements scolaires ordinaires a été posée par la loi du 11 février 2005. En France, le manuel scolaire est un support pédagogique emblématique quasi systématiquement utilisé en classe afin d’accompagner de manière progressive et structurée l’acquisition des connaissances et compétences définies dans les programmes scolaires officiels de l’Éducation Nationale. Les manuels numériques actuellement disponibles nécessitent d’être adaptés pour être utilisés par les enfants en situation de handicap. Ces adaptations concernent aussi bien les aspects techniques que pédagogiques. Dans la plupart des cas, des parties seulement des manuels sont adaptées et les délais de livraison peuvent être de plusieurs mois. Ces contraintes ne permettent pas de rendre efficiente l’inclusion scolaire des enfants en situation de handicap. L’objectif du projet ANR MALIN est donc de développer des solutions techniques afin d’aboutir à l’automatisation de l’adaptation des manuels scolaires numériques pour les rendre accessibles (accès, traitement et interaction avec les contenus) aux élèves en situation de handicap.

Sujet :
Dans ce contexte, le/la stagiaire travaillera sur l’extraction des consignes des exercices ainsi que sur leur identification / catégorisation. L’objectif du stage consiste notamment à identifier les consignes de type “choix proposés” dans les différents exercices. Ces choix proposés pouvant prendre plusieurs formes, le/la stagiaire développera, à partir d’une chaîne d’extraction déjà existante et de données annotées manuellement, des techniques génériques, fondées sur des approches de traitement automatique des langues et tirant partie de l’efficacité des technologies d’apprentissage profond.

Ce stage s’inscrit dans le cadre d’un projet ANR et pourra se poursuivre par un doctorat de 3 ans. Le projet ANR repose sur une collaboration entre quatre laboratoires : LISN (Université Paris Saclay), MISC (Ecole CentraleSupelec), CEDRIC (CNAM), Inserm 1284 (CRI, Université de Paris). Le stagiaire travaillera en interaction avec deux autres stagiaires associés au projet.

Profil du candidat :
master et/ou ingénieur en informatique avec une spécialisation dans au moins un des domaines suivant:
traitement automatique des langues
apprentissage automatique

Formation et compétences requises :
maîtrise de Python (langage de prédilection du projet)
maîtrise de l’anglais (écrit et oral)
La connaissance de librairies d’apprentissage sera appréciée.

Adresse d’emploi :
Laboratoire interdisciplinaire des sciences du numérique – LISN
Campus Universitaire bâtiment 507
Rue du Belvédère
91400 Orsay

Document attaché : 202110291051_Sujet de stage ANR MALIN – LISN.pdf

Atelier Apprentissage Profond: Théorie et Applications (APTA)

Date : 2022-01-25
Lieu : Blois, France

DESCRIPTIF

L’apprentissage profond (deep learning) révolutionne depuis plusieurs années l’apprentissage automatique. Alors que les premiers résultats marquants ont été obtenus principalement en analyse d’images, les travaux actuels en apprentissage profond s’intéressent à présent à tous les types de données (images, vidéos, son, séries temporelles, textes, etc.). De plus, l’utilisation des réseaux profonds s’est également étendue à presque tous les types de traitements (classification, clustering, génération, augmentation de données, détection d’anomalies, prédiction, segmentation, etc.). Ainsi, l’impact de l’apprentissage profond dans le domaine de la science des données et l’extraction de connaissances est considérable.

Suite au succès des éditions précédentes de l’atelier APTA, nous souhaitons à nouveau proposer, dans le cadre de la conférence EGC, un espace d’échanges autour de ce domaine. Celui-ci permettra d’aborder les défis théoriques et les possibilités applicatives qu’il offre à notre discipline de l’extraction et de la gestion des connaissances. Dans le cadre de cet atelier, nous souhaitons nous focaliser sur les applications de l’apprentissage profond dans différents domaines (analyse ou génération d’images, classification de données temporelles, extraction d’informations à partir de données hétérogènes, etc.) mais également permettre la présentation de travaux plus théoriques (nouvelles architectures, nouvelles fonctions de coût, interprétabilité des modèles, etc).

THÈMES DE L’ATELIER (LISTE NON EXHAUSTIVE)

Applications de l’apprentissage profond

Extraction d’informations à partir d’images, de vidéos, de sons
Analyse de séquences temporelles
Text-mining
Analyse du langage naturel, de la parole
Données géographiques
Données financières
Données de mouvements humains
Données médicales, biologiques, bio-informatiques
Recommandation et publicité ciblée
Jeu et résolution de problèmes

Nouvelles approches pour l’apprentissage profond

Réseaux récurrents
Réseaux siamois
Apprentissage par renforcement
Réseaux antagonistes génératifs (GAN)
Convolutions et graphes
Apprentissage auto-supervisé (self-supervised learning)
Apprentissage profond collaboratif
Modèles prédictifs

DATES IMPORTANTES

Soumission des papiers : 23/11/2021

Notification aux auteurs : 13/12/2021

Réception des versions finales : 17/12/2021

Mise en ligne du programme : 03/01/2022

Date de l’atelier : 25/01/2022

INSTRUCTIONS AUX AUTEURS

Les auteurs sont invités à soumettre électroniquement leur proposition en utilisant la plateforme de l’atelier :
https://apta2022.sciencesconf.org/submission/submit

La taille des soumissions sera de 10 pages au maximum. Elle pourra être beaucoup plus courte, en particulier pour les articles présentant un travail qui débute ou la présentation de projet de recherche. Le format LaTex à utiliser est celui de la revue « Revue des Nouvelles Technologie de l’Information » (RNTI) disponible à l’adresse suivante : http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip

ORGANISATEURS

Maxime Devanne, MCF, Université de Haute-Alsace, IRIMAS
Camille Kurtz, MCF, Université de Paris, LIPADE

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

PhD position in Deep Learning methods for long non-coding RNA prediction in cancer

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IBISC, UEVE, Université de Paris-Saclay
Durée : 3 ans
Contact : fariza.tahi@univ-evry.fr
Date limite de publication : 2021-12-27

Contexte :
RNAs, and more precisely non-coding RNAs (ncRNAs, RNA untranslated into proteins), have aroused growing interest in the international scientific community in recent years, due to their proven involvement in many biological processes and the important role they can play in pathological processes such as cancer. They are thus increasingly considered as potential therapeutic targets or biomarkers (diagnostic and prognostic markers).

Recently, many long ncRNAs (lncRNAs), larger than 200 nucleotides, have been identified as potential regulators. But unlike small ncRNAs, their characterization by structure and function is far from established. The determination of the structure, 2D or 3D, of an lncRNA by experimental methods (crystallography, NMR) or bioinformatics methods is a major challenge, since it helps to elucidate its function. RNAs from the same family indeed share the same structure, giving them the same function, the structure guiding in particular the interactions of this RNA with proteins or other RNAs.

Sujet :
In this project, we propose to develop computational methods based on Deep Learning to predict and characterize lncRNAs by integrating different data: sequence, 2D and 3D structure, interaction with coding or non-coding genes. and genetic and epigenetic alterations. The development of methods to predict the 3D structure of RNAs, such as those developed by DeepMind (the AI subsidiary of Google), could also be considered.

The methods developed will be applied to cancer and will provide a better understanding of the involvement of RNAs in this pathology. Cancer in a given tissue is a heterogeneous disease; several cancer subtypes can be identified. Treatments and diagnosis should be tailored to each subtype. In this project, we will be interested in lncRNAs in a frequent cancer, bladder cancer (4th cancer in terms of incidence in men) as well as in pediatric cancer, retinoblastoma. A small number of lncRNAs predicted to be potentially involved will be functionally validated by the team of biologists. We hope ultimately to be able to offer clinicians new diagnostic or prognostic markers and enable them to better understand the biological causes of the disease in order to optimize treatments.

The final objective of the project will be to implement generic methods and tools for the prediction of lncRNAs. The tools developed will be made available to the scientific community via our EvryRNA platform:
http://EvryRNA.ibisc.univ-evry.

Profil du candidat :
Students with background in computer science and data sciences, in particular in machine learning and deep-learning. Knowledge of bioinformatics and biology will be highly appreciated.

Formation et compétences requises :
Master 2 in Data Sciences, Bioinformatics/Computational Biology or Computer Sciences (or equivalent).

Adresse d’emploi :
IBGBI, IBISC, 23 b. de France, 91000 Evry

Document attaché : 202110271212_Phd-Offer-FR-EN.pdf

Architecture logicielle pour l’analyse de données dans l’Usine 4.0

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : L@abIsen – entreprise ACOME
Durée : 15 mois
Contact : benoit.lardeux@isen-ouest.yncrea.fr
Date limite de publication : 2021-11-15

Contexte :
Type d’offre : Ingénieur de recherche, post-doc

Contexte : Chaire industrielle « Architecture de données pour l’Usine 4.0 ».

• Enterprise : ACOME
• Unité de recherche : L@bISEN Isen Yncrea Ouest .

Contrat : CDD – 15 mois

Salaire : 2700€ net/mois

Lieu de travail : Nantes

Spécialité : Architecture logicielle, manipulation de bases de données, infrastructure réseau, big data, analyse de données
Date limite de candidature souhaitée : avant 15/11/2021

Avantages :
• Possibilité d’embauche en CDI
• Déplacements pris en charge pour les missions entre ISEN et ACOME
• Mutuelle ( Possibilité d’ajouter des membres de la famille sans surcoût)
• Prévoyance
• Carte Tickets Restaurant
• Avantages CSE (Comité Social et Economique)
• Aide au déménagement (Aide plafonnée à 1 500 € + aide à trouver un logement par notre prestataire)

Contexte :

Ce contrat se déroule dans le cadre d’une chaire industrielle entre l’entreprise ACOME, leader européen dans la création des câbles, et le L@bIsen le laboratoire de l’Ecole Supérieure de l’Electronique et du Numérique.

ACOME – Mortain
A la fois leader et spécialiste sur les marchés des réseaux télécoms et infrastructures, des réseaux du bâtiment, de l’automobile et de l’embarqué, ACOME est aujourd’hui le 1er Groupe industriel coopératif Français produisant des câbles, des tubes et de la fibre optique sur le territoire national depuis 1932 et la 1ère SCOP de France (Société Coopérative et Participative) avec une forte dynamique internationale et des implantations en Chine, en Afrique du Nord et au Brésil.
www.acome.fr

L@bISEN site de Nantes
Yncréa Ouest est un Établissement d’Enseignement Supérieur Privé d’Intérêt Général (EESPIG) sous contrat avec le ministère de l’Enseignement Supérieur et de la Recherche. L’Association Yncréa Ouest est membre d’Yncréa, premier pôle privé associatif d’écoles d’ingénieurs en France. Yncréa Ouest gère l’école d’ingénieurs ISEN Yncréa Ouest, implantée sur les villes de Brest, Caen, Nantes et de Rennes. L’école forme des élèves ingénieurs dans les technologies du numérique et notamment les systèmes numériques embarqués, la robotique, l’énergie, les objets connectés (IoT), l’intelligence artificielle, le big data, l’environnement, le développement durable, les technologies marines et la cybersécurité.
Les activités de recherche de l’équipe d’accueil (L@bISEN de l’Yncréa Ouest, évaluée par la HCERES en 2021) sont centrées essentiellement sur le numérique et ses applications notamment celles dans l’Usine 4.0, le campus connecté, le traitement des données et l’Intelligence Artificielle.
https://isen-nantes.fr/recherche-4/

Sujet :
Dans le secteur industriel, les entreprises sont soumises à des demandes toujours plus fréquentes de nouvelles versions de leurs produits pour répondre aux besoins en perpétuel évolution du marché. L’industrie de la fabrication des câbles est particulièrement impactée par cette tendance de fond qui pousse les laboratoires de conception des nouveaux produits à fournir toujours plus de recettes des nouvelles fabrications en un temps réduit, en prenant en compte les normes imposées par les clients. Afin d’améliorer le temps de mise sur marché, un enjeu important est de minimiser le nombre de tentatives pour fabriquer un nouveau produit afin de minimiser le temps de conception ainsi que les déchets générés par un nombre trop important d’essais infructueux. Pour cela, le bureau d’étude de l’entreprise peut utiliser l’expérience et les informations acquises lors des multiples tentatives déjà enregistrées pour obtenir les produits actuellement commercialisés.

Des masses importantes de données sont donc à disposition pour permettre l’étude des paramètres qui influent sur la qualité et les particularités des nouveaux câbles générés. La difficulté consiste à organiser les données et à les rendre à la demande dans les différents départements de l’Usine. Par conséquent, une plateforme de gestion de données est nécessaire pour mise à disposition des données. Plusieurs modèles de bases de données sont à mettre en place pour suivre l’évolution des données et les préparer à la phase d’analyse qui permettra l’identification des paramètres de conception qui ont un impact sur les indicateurs qu’il est nécessaire d’améliorer.

Le livrable principal de ce post doc sera de mettre en place l’architecture logicielle permettant de collecter les données pour les traiter et les analyser. Si l’avancement des travaux le permet, le candidat pourra proposer de nouveaux modèles d’optimisation pour généraliser la prise en compte des indicateurs principaux dans la production de nouveaux câbles.

Profil du candidat :
– Connaissances dans le déploiement d’outils de manipulation de données (Kafka, Kubernetes, etc.)
– Eventuellement, maîtrise des outils logiciels nécessaires à la collecte et le traitement des données massives (Spark, Scalla, Hadoop, etc.)
– Manipulation des bases de données (SQL, NoSQL)
– Appétence pour les techniques de l’IA, prise de décision et les problématiques dans l’industrie 4.0

Formation et compétences requises :
Diplôme équivalent Master, école d’Ingénieur ou Doctorat

Le contrat à durée déterminé de 15 mois est à pourvoir dès que possible, avec une opportunité intéressante de poursuivre en CDI.

Les candidats doivent fournir une lettre de motivation manuscrite, un curriculum vitae (2 pages max) et une notice individuelle ou un CV détaillé. Les 3 ou 4 meilleurs profils seront invités à faire un exposé de 20 à 30 minutes qui sera suivi d’une séance de questions devant la commission de spécialistes.

Adresse d’emploi :
33 avenue du Champ de Manoeuvre
44300 CARQUEFOU, FRANCE

Document attaché : 202110271055_postdoc_acomeisen_v2.pdf

Recalage d’Images Médicales par Apprentissage profond

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CREATIS
Durée : 6 mois
Contact : michael.sdika@creatis.insa-lyon.fr
Date limite de publication : 2021-11-15

Contexte :
Le recalage d’image est un outil permettant d’aligner des images entre elles. C’est souvent une étape préliminaire essentielle pour l’ ́etude de pathologie cérébrale basée sur l’imagerie, permettant de positionner, orienter voire de déformer les cerveaux de différent sujets pour les replacer dans un système de coordonnées commun.
Lorsque la transformation recherchée est affine, les outils actuels de recalage donnent des résultats souvent satisfaisant mais échouent notamment lorsque:
•l’initialisation est mauvaise
•il y a de forts artefacts d’imagerie
•une pathologie implique un changement important de l’apparence du cerveau
•seule une partie du cerveau est présente dans l’image (image rognée)

Les outils classique de recalage sont souvent basée sur des approches itérative d’optimisation mathématique de mais de plus en plus de méthodes actuelles se basent sur des approches par pprentissage profond [Boveiri].

Sujet :

L’objectif du stage est de mettre en place et d’entraı̂ner un réseau de neurones permettant faire le recalage linéaire d’une image de cerveau sur un espace de référence standard. L’objectif principale sera que l’estimation soit la plus robuste possible mais aussi que le réseau soit léger. On pourra par exemple s’intéresser à une bonne façon de paramétrer la transformation mais aussi à aux couches équivariantes dans un réseau de neurones [Finzi], au réseau à capsules [Sabour, Lensen, Gu]. Le réseau de recalage linéaire sera intégré au pipeline de pré-traitement du cerveau de l’équipe MYRIAD de CREATIS.
Données: plusieurs jeux de données d’imagerie cérébrales publiques impliquant différentes pathologies, protocoles d’acquisition et modalités sont déjà utilisés dans l’équipe et seront utilisés pour le stage. Une solide procédure d’augmentation de données permettra d’améliorer encore la robustesse de notre méthode.

Profil du candidat :
—

Formation et compétences requises :
Le candidat recruté devra avoir une formation dans un des domaines suivants et de bonnes connaissances dans les deux autres:
• Machine learning (deep learning)
• Traitement d’images
• Mathématiques appliquées
Il devra aussi avoir de solides compétences en développement logiciel et être en mesure d’implémenter les méthodes proposées.

Adresse d’emploi :
Le stage se déroulera au laboratoire CREATIS à Lyon sur le campus de la Doua.

Les documents à joindre à la candidature sont :
• curriculum vitae
• lettre de motivation
• résultats académiques récents

Document attaché : 202110270849_internship-registration-2022.pdf

Stage de Master : Deep Learning pour l’analyse de sentiment dans des témoignages textuels

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LITIS lab., University of Rouen Normandy, Rouen, F
Durée : 6 mois
Contact : simon.bernard@univ-rouen.fr
Date limite de publication : 2021-12-31

Contexte :
L’équipe Apprentissage du laboratoire LITIS, le laboratoire d’informatique et d’intelligence artificielle de l’Université de Rouen Normandie, propose un stage de 6 mois de fin de Master ou de fin de cursus Ingénieur, à débuter en février/mars 2022. Ce stage est financé par le projet ANR CATCH (Compréhension Automatique de Témoignage de Capteurs Humains) qui implique le centre Recherche et Développement de l’entreprise Saagie, une entreprise spécialisée dans les solutions DataOp B2B, Atmo Normandie, l’association de surveillance de la qualité de l’air en Normandie, et le LITIS.

L’ambition du projet CATCH est de proposer des outils d’intelligence artificielle et de deep learning pour identifier et analyser automatiquement la multitude de témoignages humains liés à un accident industriel et à ses conséquences sur l’environnement et la santé. En impliquant la population dans la collecte et l’analyse des données, notamment via les réseaux sociaux, et en fournissant des moyens efficaces d’interprétation de ces données, la solution proposée devrait contribuer à apporter des réponses à la problématique préoccupante des accidents industriels et de leurs conséquences. Pour cela, l’objectif du projet est double :
1. Dresser une cartographie des nuisances dues à l’incident, afin de suivre la propagation et l’évolution des phénomènes dans le temps.
2. Analyser et caractériser le ressenti de la population et son évolution tout au long de la crise.
Pour ce faire, nous pouvons exploiter les témoignages recueillis sur la plateforme ODO d’Atmo Normandie, qui combine ces témoignages avec des informations géographiques, ainsi que des données extraites de la plateforme de micro-blogging Twitter.

Sujet :
Ce stage vise à contribuer à ces deux objectifs via l’analyse des sentiments exprimés dans les témoignages de ces données, déjà disponibles et annotées en ce qui concerne les données ODO, ou à annoter automatiquement pour les données Twitter. Les méthodes à l’état de l’art pour ce type de tâches en traitement automatique de la langue (TAL ou NLP pour Natural Language Processing) sont des méthodes d’apprentissage profond de type Transformers, notamment basées sur des principes d’apprentissage auto-supervisés (self-supervised learning) et des mécanismes d’attention. Donc, la première tâche de ce stage consistera à sélectionner, implémenter et appliquer une ou plusieurs de ces approches pour l’analyse de sentiment dans les données ODO. Il s’agira ensuite d’exploiter le ou les modèles les plus performants pour la génération de la cartographie, par exemple pour déterminer les zones géographiques les plus impactées par les retombées de l’indicent, et pour la caractérisation du ressenti de la population, par exemple pour détecter des sentiments pré-identifiés dans tous les témoignages à disposition.

Profil du candidat :
—

Formation et compétences requises :
– Étudiant en Master 2 ou en dernière année d’école d’ingénieurs, dans une spécialité de l’informatique ou des mathématiques appliquées
– Compétences requises en apprentissage automatique et en programmation (Python de préférence)

Adresse d’emploi :
LITIS,
UFR Sciences et Techniques,
Technopôle du Madrillet
Avenue de l’université
76801 Saint-Étienne-du-Rouvray

Les documents à joindre à la candidature sont :
• curriculum vitae
• lettre de motivation
• résultats académiques récents
• noms et coordonnées d’un ou de plusieurs enseignants référents

Document attaché : 202110261524_StageM2_ ANRCATCH_LITIS.pdf

CDD Ingénieur d’étude dev 6 mois / Toulouse – python / web sémantique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : IRIT
Durée : 6 mois
Contact : pascal.dayre@irit.fr
Date limite de publication : 2022-02-01

Contexte :
le projet ANR SO-DRIIHM [1] recrute un ingénieur d’étude pour 6 mois à partir du 1er décembre.

Dans la continuité de l’opendata, le courant de la science ouverte a pour objectif de faciliter le partage des ressources et des productions scientifiques afin de rendre la science plus éthique. Une science plus transparente, plus reproductible et plus additionnelle.

Cet emploi se fera dans un contexte riche de plusieurs projets autour de la science ouverte, des données et de l’IA. Des échanges avec la communauté d’usage du labex DRIIHM et avec un partenaire industriel auront lieu. Les développements se feront selon l’état de l’art des développements internet et des standards liés aux données ouvertes.

Sujet :
CDD Ingénieur d’étude développement 6 mois / Toulouse – python / backend Django / OpenAPI / web sémantique / sparQL

Il s’agit de travailler sur le développement du serveur d’une plateforme internet pour la science ouverte.

La partie serveur de la plateforme s’appuient sur le framework python Django et ses déclinaisons. La persistance des données est assurée par un système de gestion de bases de données sémantiques (triplestore RDF/RDFS). Le langage de requêtage sparQL, extension du SQL est utilisé. La plateforme est en interaction avec un ensemble de services de l’éco-système numérique de la science ouverte.

Pour plus d’information, vous pouvez consulter l’offre d’emploi
https://emploi.cnrs.fr/Offres/CDD/UMR5602-EMILER-004/Default.aspx

Profil du candidat :
Bac + 5 ans et première expérience souhaités.

Ingénieur en informtique

Formation et compétences requises :
Développement informatique.

– Bonne connaissance de python et de Django
– Bonne connaissance de l’algorithmique
– Connaissance du développement orienté objet
– Connaître Gitlab, Github voire Docker
– Connaissance de l’environnement de développement python et d’un framework (Django)
– Connaissance de l’IDE Visual code studio
– Connaissance des architectures des systèmes d’information sur internet
– Rédiger et mettre à jour la documentation fonctionnelle et technique (wiki, Markdown voire latex)
– Connaissance d’UML pour mettre à jour la documentation technique
– Travailler en équipe
– Élaborer et mettre en œuvre un plan de test
– Connaissance système et linux : connaissance d’administration d’un système linux bienvenue (ubuntu 20.04)
– Connaissance des outils et standards du web sémantique : RDF et les bases de graphe, langage de requête SPARQL, XML, RDF, OWL, Triplestore, DCAT
– Connaissance du web des données, des bases de données sémantiques et de sparQL. Construire et administrer des bases de données graphes (triplestore graphDB sparQL)
– Connaissance d’un framework javascript est un plus pour bien comprendre le besoin et potentiellement intervenir ponctuellement sur le code du client

Adresse d’emploi :
Le lieu du CDD est l’IRIT (Institut de Recherche en Informatique de Toulouse – site UPS)

Deep Learning et modélisations numériques de pathologies de l’aorte thoracique

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : nstitut de Mathématiques de Marseille, I2M, UMR 73
Durée : 6 mois
Contact : badihghattas@gmail.com
Date limite de publication : 2022-03-31

Contexte :
Différentes pathologies peuvent affecter l’aorte que ce soit au niveau thoracique ou abdominal. Deux pathologies nous interesse plus particulièrement : la formation d’anévrisme qui peut être défini
comme une dilatation du rayon de l’aorte excédant 1.5 son rayon initial et la dissection aortique qui consiste en une déchirure de la paroi vasculaire au niveau de la couche intimale. Afin de prédire les évolutions de ces pathologies le plus précocement possible l’équipe de biomécanique d’IRPHE réalise notamment des modélisations numériques complexes. Grâce à des données [géométries et conditions aux limites] provenant d’imageries médicales, l’objectif est de mettre en œuvre des modèles 3D
patient-spécifique tenant compte des interactions fluide-structure pour différents types d’évolution -favorable et défavorable- ainsi que pour plusieurs temps post opératoires. Ceci permet d’associer des
grandeurs physiques liées aux dynamiques de l’écoulement et des structures à certaines évolutions cliniques défavorables et, par suite, à prédire précocement certains échecs thérapeutiques. Toutefois,
le temps de calcul associé à ces modélisations complexes constitue un obstacle à leur utilisation en pratique clinique.

Sujet :
Deep Learning et modélisations numériques de pathologies de l’aorte thoracique

Profil du candidat :
Etudiant en M2 mathématiques appliquées (Statistiques, Data Science) ou en sernière année d’école d’ingénieur issu de filière statistiques/informatique.

Formation et compétences requises :
Le(la) candidat(e) devra avoir des connaissances académiques dans les champs disciplinaires relatifs au sujet: Deep learning en priorité et modélisations numériques. Il(elle) devra avoir une appétence
avérée pour l’interdisciplinarité. Une expérience en programmation python est indispensable, en particulier, tensorflow, keras, pandas et numpy.

Adresse d’emploi :
Institut de Mathématiques de Marseille, 163 avenue de Luminy, 13009 Marseille. Accesoissoirement aussi le site nord de chateau Gombert.

Document attaché : 202110221459_M2_deep_learning_2021_22.pdf

Conception et mise en œuvre de l’interface d’analyse d’un lac de données web

Offre en lien avec l’Action/le Réseau : DOING/– — –

Laboratoire/Entreprise : ERIC
Durée : 5-6 mois
Contact : jerome.darmont@univ-lyon2.fr
Date limite de publication : 2021-11-16

Contexte :
Le projet LIFRANUM (LIttératures FRAncophones NUMériques), porté par le laboratoire MARGE, vise à identifier, indexer et analyser des productions littéraires nativement numériques dans l’aire francophone. Pour cela, l’outil de référence de l’archivage web Heritrix a en premier lieu permis de constituer un corpus sous forme de fichiers de conservation au format Web ARChive (WARC). Des métadonnées des pages HTML ont ensuite été extraites des fichiers WARC (contenu textuel, fichier PDF, images, vidéo, etc.) et indexées dans Solr.

Par ailleurs, en s’appuyant sur des blogs appartenant à des auteurs identifiés, un deuxième corpus (fichiers JSON) a été constitué via les API de WordPress et Blogger. Des informations, pages, posts et commentaires ont été extraits et constituent la série de métadonnées, métadonnées stockées et indexées dans MongoDB.

Sujet :
L’objectif de ce stage est de concevoir et mettre en œuvre une interface web commune aux deux types de sources de métadonnées (celles issues des WARC et celles provenant des API de blogs) pour permettre aux chercheur·es du laboratoire MARGE de requêter et d’analyser les données sous-jacentes. Il faudra pour cela :
• étudier l’architecture de données déjà en place ;
• concevoir un schéma d’alignement des métadonnées des WARC et des API ;
• concevoir et mettre en œuvre une interface graphique permettant de rechercher, via les métadonnées consolidées, les données (à la manière d’un moteur de recherche) ;
• proposer des visualisations « toutes faites » (mais paramétrables) ou ad-hoc, en lien avec les chercheur·es du laboratoire MARGE.

Profil du candidat :
Technologies big data, programmation web, gestion de données, data visualization, rigueur.

Formation et compétences requises :
Master informatique

Adresse d’emploi :
Université Lyon 2
Laboratoire ERIC
5 avenue Pierre Mendès France
69676 Bron Cedex

Document attaché : 202110220934_stage-lifranum-interface-warc.pdf

IFCS 2022 -17th Conference of the International Federation of Classification Societies

Date : 2022-07-19 => 2022-07-23
Lieu : Porto, Portugal

17th Conference of the International Federation of Classification Societies

Conference topics

Big Data • Biplots • Clustering, Classification and Discrimination • Compositional Data Analysis • Computer Graphics and Visualization • Data Science • Data Streams • Databases and Data Management • Deep Learning • Dependence Modelling and Copulas • Dimension Reduction • Formal Concept Analysis • Functional Data Analysis • Generalized Linear Models • Image Analysis and Computer Vision • Information-theoretic Statistical Modelling and Model Selection • Knowledge Representation and Discovery • Machine Learning • Mathematical Foundations of Data Science • Matrix Factorization • Meta-learning • Missing Data Handling • Model-based Clustering • Modelling High-Dimensional and Complex Data • Natural Language Processing • Optimization in Classification and Clustering • Robust Methods • Social Network Analysis • Spatial Data Analysis • Statistical and Econometric Methods • Statistical Learning and Data Mining • Symbolic Data Analysis • Text Mining • Time Series Analysis • Web Mining
with Applications on
Archaeology • Biology • Business and Management • Economics • Education • Engineering • Finance • Geosciences • Industry • Linguistics • Marketing • Medicine and Health Care • Musicology • Psychology • Risk Management • Social Sciences

Lien direct

Notre site web : www.madics.fr
Suivez-nous sur Tweeter : @GDR_MADICS
Pour vous désabonner de la liste, suivre ce lien.

MaDICS

Masses de Données, Informations et Connaissances en Sciences

Big Data - Data Science

Archives

Extraction et catégorisation automatique de contenu de manuels scolaires

Atelier Apprentissage Profond: Théorie et Applications (APTA)

DESCRIPTIF

THÈMES DE L’ATELIER (LISTE NON EXHAUSTIVE)

DATES IMPORTANTES

INSTRUCTIONS AUX AUTEURS

ORGANISATEURS

PhD position in Deep Learning methods for long non-coding RNA prediction in cancer

Architecture logicielle pour l’analyse de données dans l’Usine 4.0

Recalage d’Images Médicales par Apprentissage profond

Stage de Master : Deep Learning pour l’analyse de sentiment dans des témoignages textuels

CDD Ingénieur d’étude dev 6 mois / Toulouse – python / web sémantique

Deep Learning et modélisations numériques de pathologies de l’aorte thoracique

Conception et mise en œuvre de l’interface d’analyse d’un lac de données web

IFCS 2022 -17th Conference of the International Federation of Classification Societies