
MaDICS est un Groupement de Recherche (GDR) du CNRS créé en 2015. Il propose un écosystème pour promouvoir et animer des activités de recherche interdisciplinaires en Sciences des Données. Il est un forum d’échanges et d’accompagnement pour les acteurs scientifiques et non-scientifiques (industriels, médiatiques, culturels,…) confrontés aux problèmes du Big Data et des Sciences des données.
Pour en savoir plus…
Les activités de MaDICS sont structurées à travers des Actions et Ateliers. Les Actions rassemblent les acteurs d’une thématique précise pendant une durée limitée (entre deux et quatre ans). La création d’une Action est précédée par un ou plusieurs Ateliers qui permettent de consolider les thématiques et les objectifs de l’action à venir.
Le site de MaDICS propose plusieurs outils de support et de communication ouverts à la communauté concernée par les Sciences des Données:
- Manifestations MaDICS : Le GDR MaDICS labellise des Manifestations comme des conférences, workshops ou écoles d’été. Toute demande de labellisation est évaluée par le Comité de Direction du GDR. Une labellisation rend possible un soutien financier pour les jeunes chercheuses et chercheurs. Une labellisation peut aussi être accompagnée d’une demande de soutien financier pour des missions d’intervenants ou de participants à la manifestation.
Pour en savoir plus… - Réseaux MaDICS : pour mieux cibler les activités d’animation de la recherche liées à la formation et à l’innovation, le GDR MaDICS a mis en place un Réseau Formation destiné à divers publics (jeunes chercheurs, formation continue,…), un Réseau Innovation pour faciliter et intensifier la diffusion des recherches en Big Data, Sciences des Données aux acteurs industriels et un Club de Partenaires qui soutiennent et participent aux activités du GDR.
Pour en savoir plus… - Espace des Doctorants : Les doctorants et les jeunes chercheurs représentent un moteur essentiel de la recherche et le GDR propose des aides à la mobilité et pour la participation à des manifestations MaDICS.
Pour en savoir plus… - Outils de communication : Le site MaDICS permet de diffuser des informations diverses (évènements, offres d’emplois, proposition de thèses, …) liées aux thématiques de recherche du GDR. Ces informations sont envoyées à tous les abonnés de la liste de diffusion MaDICS et publiés dans un Calendrier public (évènements) et une page d’offres d’emplois.
Adhésion au GDR MaDICS : L’adhésion au GDR MaDICS est gratuite pour les membres des laboratoires ou des établissements de recherche publics. Les autres personnes peuvent adhérer au nom de l’entreprise ou à titre individuel en payant une cotisation annuelle.
Pour en savoir plus…
Manifestations à venir
Journées Ecoles Conférences et Séminaires
Actions, Ateliers et Groupes de Travail :
CODA DAE DatAstro DSChem EXMIA GINO GRASP RECAST SaD-2HN SIMDAC SimpleText TIDS
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : LIS UMR CNRS 7220, Aix-Marseille Université (AMU)
Durée : 5 mois/Months
Contact : bernard.espinasse@lis-lab.fr
Date limite de publication : 1 juin 2020
Contexte :
La fouille de textes (Text-Mining) utilise de plus en plus de techniques issues de l’apprentissage profond pour des tâches de traitement automatique des langues (TAL) de très bas niveau comme l’extraction d’information (entités nommées ou relations) ou des tâches de plus haut niveau comme la simplification de textes, le résumé automatique.
Ces techniques d’apprentissage profond utilisant diverses architectures de réseaux de neurones (CNN, RCC, LSTM, …) permettent d’atteindre des performances intéressantes. Ces performances peuvent être améliorées par l’intégration de caractéristiques linguistiques comme les dépendances syntaxiques (Espinasse et al., 2019). Cependant les performances de ces techniques relevant de l’apprentissage profond semblent plafonner. D’autres techniques de TAL, symboliques tirent mieux partie de la linguistique, de ressources sémantiques externes (ontologies), avec notamment l’usage d’un apprentissage relationnel comme dans (Lima et al., 2019) (Verbeke et al., 2014). Pour outrepasser les limites des techniques par apprentissage profond, leur combinaison avec ces techniques symboliques s’avère judicieuse.
Sujet :
Fouille de textes par Machines Relationnelles Profondes /
Text Mining with Deep Relational Machines
cf document attaché / cf attached document
Profil du candidat :
Master 2 en informatique
Formation et compétences requises :
Bases du traitement automatique des langues, Python, apprentissage,
Adresse d’emploi :
Marseille, Campus de St Jérôme, LIS UMR CNRS
Document attaché : Sujet-Master-2-MRD-7fev20.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : BEA (le Bourget) ou LISIC (Calais)
Durée : 6 mois
Contact : matthieu.puigt@univ-littoral.fr
Date limite de publication : 2020-04-01
Contexte :
Ce stage s’intègre dans les activités de R&D du Laboratoire Audio CVR du Département Technique du Bureau d’Enquêtes et d’Analyses (BEA) [1]. Le BEA est l’organisme officiel en charge de la conduite des enquêtes de sécurité à la suite d’accidents ou d’incidents aériens. De renommée internationale le BEA et en particulier son département technique, a la responsabilité d’analyser les données issues des enregistreurs phoniques ou CVR (pour Cockpit Voice Recorder) plus communément appelées les “boîtes noires” contenant les échanges vocaux et les alarmes émises dans le poste de pilotage.
Sujet :
Enjeux :
Les CVR sont des équipements renforcés protégeant une information importante pour la détermination des facteurs contributifs à la survenue d’un accident ou d’un incident aérien. Pour cette raison la qualité audio des enregistrements, l’audibilité des alarmes du cockpit et l’intelligibilité des échanges vocaux sont cruciales pour les enquêteurs du BEA.
Les limitations de conception des CVR contraignent les constructeurs d’avion à mélanger les sources sonores audibles dans le cockpit et dans les casques des pilotes (émissions et réceptions radio, échanges sur l’intercom, annonces aux passagers, alarmes sonores, etc) en un unique canal audio envoyé vers le CVR [2], qui en fait une acquisition numérique et protège cette donnée en cas d’accident. Ainsi l’activation simultanée de plusieurs sources sonores peut conduire à une réduction significative de l’intelligibilité des échanges vocaux, voire un masquage complet d’une ou de plusieurs sources audio.
L’extraction d’informations dans les données CVR s’appuie sur l’expérience des analystes audio du BEA et sur leur capacité à détecter des sources sonores enfouies dans des mélanges audio difficiles [3]. Le laboratoire audio du BEA souhaite dans un futur proche explorer les approches de Séparation Aveugle de Sources pour supporter ces travaux très complexes.
Structure et objectifs du stage :
1. Réaliser une étude bibliographique des méthodes de Séparation Aveugle de Sources applicable à des mélanges audio;
2. Développer ou acquérir les licences et les codes informatiques des méthodes les plus pertinentes et prometteuses;
3. Évaluer ces méthodes sur un corpus d’enregistrements audio non-sensibles;
4. Analyser les résultats obtenus, critiquer les méthodes disponibles et caractériser le fossé technologique;
5. Communiquer sur les résultats obtenus et rédiger la documentation finale du stage.
Encadrement du stage et points de contact :
Ce stage sera encadré conjointement par un enquêteur du Laboratoire audio CVR du BEA et par un enseignant-chercheur de l’équipe SPeciFI du LISIC de l’ULCO, spécialiste du domaine. Le stagiaire travaillera avec ces deux équipes, depuis le site de son choix, i.e. dans les locaux du BEA au Bourget, ou ceux du LISIC à Calais.
Les candidats exprimeront dans un premier temps leur intérêt pour ce stage par un courriel auquel ils annexeront les documents pouvant supporter leur candidature (lettre(s) de recommandation, relevés de notes, rapport de projet).
Contact BEA :
Dr. Benjamin Bigot
Enquêteur de sécurité – Analyste CVR
benjamin.bigot [at] bea.aero
Contact ULCO :
Dr. Matthieu Puigt
Maître de Conférences
matthieu.puigt [at] univ-littoral.fr
Références :
[1] Aeronews.tv, Comment le BEA répare les boîtes noires, https://www.youtube.com/watch?v=SIejrcrQboQ
[2] Captain Joe, BLACK BOX/Flight Data Recorder/COCKPIT VOICE RECORDER explained by Captain Joe, https://youtu.be/lPiWlBG16Wo
[3] Guide sur la vérification des enregistrements CVR, https://www.bea.aero/fileadmin/user_upload/Guidance_on_CVR_recording_Inspection__1_.pdf
Profil du candidat :
Curieux et très à l’aise en programmation (Matlab, Python), vous êtes inscrits en deuxième année de Master ou troisième année d’école d’ingénieurs en sciences de données (traitement du signal et des images, machine learning, intelligence artificielle), informatique ou mathématiques appliquées.
Formation et compétences requises :
Curieux et très à l’aise en programmation (Matlab, Python), vous êtes inscrits en deuxième année de Master ou troisième année d’école d’ingénieurs en sciences de données (traitement du signal et des images, machine learning, intelligence artificielle), informatique ou mathématiques appliquées.
Adresse d’emploi :
BEA, 10 Rue de Paris Bâtiment 153, 93350 Le Bourget
OU
LISIC, 50 rue F. Buisson, BP 719, 62228 Calais Cedex
Annonce en lien avec l’Action/le Réseau : Formation
Laboratoire/Entreprise : GEOPS
Durée : 6 months max
Contact : frederic.schmidt@u-psud.fr
Date limite de publication : 2020-04-01
Contexte :
This study takes place in the data deluge from the numerous space missions across the Solar System. The project proposes to develop a tool to automatically detect and characterize the most ubiquitous feature on planetary body : craters.
Sujet :
The aim is to developed a tool to define precise size and position of all craters in the scene, whatever the illumination conditions, the type of sensor and the scale. As a second goal, the project will have to determine the crater characteristics, such primary / secondary (ejecta from a previous impact, not from a direct impactor), presence / absence of rays, erosion level…
This study will take advantage of the machine learning and deep learning libraries available as open source to propose the most versatile and robust detection method. We propose to develop a new tool dedicated to this task. In addition, we propose to organize a worldwide challenge for any researcher/students as an open source strategy, in a framework called RAMP. This platform is designed for collaborative work and gives access to the source code of the participants (not only the results).
Such software pipeline is required to tackle fundamental questions in planetary science to study the surface processes across the Solar System. It will be a crucial tool to precisely date the surface and open a new era for onboard decisions on landing or targeting, to maximize the science return of future deep space missions.
Profil du candidat :
Last year engineer or M2 master student.
Formation et compétences requises :
The candidate must have a engineer or master grade in machine learning/data mining or in planetary science. Double competence in both fields will be encouraged. An excellent level of programming skills is required (Python, linux). We expect the candidate to have a good level of communication in English (written and oral).
Adresse d’emploi :
UMR8148 GEOPS
Bât 509, Université Paris Saclay
91405 ORSAY, FRANCE
Document attaché : ACDC.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : IMT Mines Ales
Durée : 6 mois
Contact : patrice.guyot@mines-ales.fr
Date limite de publication : 2020-04-01
Contexte :
Dans le domaine de l’écologie, il est primordial d’obtenir des mesures objectives sur le nombre d’individus des espèces menacées. Dans ce cadre, afin d’assurer le suivi de la population de poissons migrateurs, l’Association Migrateurs Rhône-Méditerranée met en place un suivi qui utilise la particularité l’acte de reproduction de l’Alose qui permet, in fine, de suivre l’évolution de la population de cette espèce menacée. Lors de la fraie (reproduction), les aloses se manifestent en surface en effectuant des déplacements circulaires et en frappant l’eau de leur nageoire caudale afin de créer un tourbillon qui favorisera la fécondation des œufs. Cette phase appelée « bull » peut être particulièrement bruyante (jusqu’à 50dB) et peut durer jusqu’à dix secondes ce qui permet sa détection à distance par une méthode acoustique.
Sujet :
Le but du stage est d’optimiser des méthodes de détection de sons d’aloses à la surface de l’eau. Le stagiaire pourra s’appuyer sur des méthodes existantes de détection de l’association (incluant des approches basées sur l’étude du signal, et de l’apprentissage profond). Il pourra également s’appuyer sur des techniques d’augmentation artificielle des données audio.
L’objectif final est de comparer les résultats obtenus par différents types de techniques, afin d’identifier une technique robuste qui pourra être embarquée pour une utilisation effective.
Profil du candidat :
Étudiant en dernier année d’école d’ingénieur ou en Master 2 Informatique.
Formation et compétences requises :
Bonnes connaissances en apprentissage profond et en traitement du signal audio.
Intérêt pour l’écologie.
Adresse d’emploi :
Centre de recherche LGI2P, 7 rue Jules Renard. IMT Mines Alès – Site de Croupillac. 30100 Alès.
Document attaché : Stage_2020_MRM_P.guyot_.pdf
Annonce en lien avec l’Action/le Réseau : MAESTRO
Laboratoire/Entreprise : Laboratoire Univers et Théories, Observatoire de Meudon
Durée : 3 Mois ou plus
Contact : jean-michel.alimi@obspm.fr
Date limite de publication : 2020/04/1
Contexte :
Formation des grandes structures de l’Univers et Nature de l’Energie Noire. Traitement de données massives et modélisation numériques grâce aux technologies d’apprentissage profond (deep learning) avec Prior Physique.
Sujet :
Le projet HPC en cosmologie “Dark Energy Universe Simulation” (www.deus-consortium.org) a permis de réaliser un ensemble de simulations numériques de formation des structures cosmiques dans différents modèles cosmologiques. L’objectif scientifique de ce projet est d’étudier de façon croisée les signatures éventuelles de l’énergie noire (composante accélératrice de l’expansion de l’Univers) sur la formation des grande structures et/ou réciproquement comment le processus de formation des grandes structures est modifiée du fait de la présence d’une composante spécifique accélératrice d’énergie noire dans l’Univers. Les modèles cosmologiques étudiés sont dits réalistes au sens où ils sont indistinguables statistiquement sur les données observationnelles disponibles à grandes échelles (Fond de rayonnement cosmologique (CMB) et Supernovae). Cependant l’évolution non-linéaire de structuration gravitationnelle dans ces modèles montre des différences fines et subtiles. L’objectif de ce stage est de tenter de discriminer ces modèles cosmologiques ainsi que d’étudier la possibilité de prédire les paramètres cosmologiques en utilisant les technologies de l’apprentissage statistique profond (deep learning) appliquées aux cartes de densité et de champ de vitesses des halos de matière noire formées dans ces simulations. La capacité (sous certaines conditions) de discriminer entre les modèles cosmologiques à partir des attributs physiques, géométriques ou morphologique (Masse, taille, vitesse, moment cinétique, ellipticité, distribution de masse ou de densité à l’intérieur du halo …) des halos de matière noire formées dans les simulations, et calculées préalablement a déjà été démontrée. Le rôle respectif de chaque attribut lors du processus de discrimination des modèles cosmologiques ou lors de la prédiction des paramètres cosmologique a été étudié. Ainsi on peut dire que l’utilisation des technologies de machine learning est double, elle est à la fois opérationnelle en terme de « classificateur » ou de « regresseur » supervisés sur les données de cosmologie et en particulier sur les données du projet DEUS mais elle montre également et spécialement que ces technologies sont un nouveau moyen de mieux comprendre la physique en jeu lors de la formation des structure cosmiques. En ce sens, on peut considérer le machine learning avec « Prior Physique » sur les données, comme un nouvel outil heuristique pour la cosmologie. Les développements réalisés durant ce stage pourront ensuite être appliqués aux données observationelles issues des grands projets actuels et futurs de la cosmologie (SDSS, XMM, Euclid,LSST). Un sujet de thèse prolongeant ce stage où l’utilisation des technologies évoluées de Machine Learning avec Prior Physique plus récente seront utilisés pour construire à partir de la distribution de matière cosmique les théories étendues de la gravitation compatibles avec notre connaissance actuelle de l’Univers.
Profil du candidat :
Niveau Master 1 ou préférentiellement 2 en Computing Science (avec un intérêt pour la physique et plus particulièrement pour la cosmologie) ou en Physique avec une affinité avec l’outil numérique (Simulations numériques haute performance et traitement massif de données) et notamment l’apprentissage automatique.
Formation et compétences requises :
Maitrise d’un langage de programmation par exemple Fortran, C, C++, Python
Le candidat doit avoir une affinité avec l’outil numérique et notamment l’apprentissage automatique.
Une composante importante du stage réside dans l’exploration de données et le développement d’outils innovants mais les motivations scientifiques sont préférentiellement théoriques.
Autonomie et Capacité de travail soutenue.
Curiosité et approfondissement intellectuelles
Adresse d’emploi :
UMR-8102 LUTH
Laboratoire de l’univers et de ses théories
5, place Jules Janssen
92195 Meudon
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : CRIStAL équipe ORKAD
Durée : 4 à 6 mois
Contact : julie.jacques@univ-catholille.fr
Date limite de publication : 2020-04-01
Contexte :
Les réseaux de neurones profonds (Deep Learning), qui sont efficaces en classification (prédiction des achats clients, classification des activités d’une société,…), bénéficient de moyens de calculs de plus en plus importants (Nvidia Tensor Core). La conception d’un réseau de neurones requiert de nombreux hyperparamètres qu’il faut adapter soigneusement au problème traité : nombre de noeuds, type de connexion entre les noeuds, fonction d’activation,… Actuellement, une recherche croissante est dirigée vers l’automatisation du paramétrage de ces algorithmes afin d’obtenir la meilleure efficacité. De plus, les réseaux de neurones adoptent une approche de type « boîte noire » difficile à interpréter. Ceci les rend difficilement compatibles avec une utilisation médicale selon le rapport du CCNE (Comité consultatif national d’éthique pour les sciences de la vie et de la santé) et pose un vrai défi d’explicabilité. Dans ce contexte, l’XAI (eXplainable Artificial Intelligence) s’intéresse à la création d’outils pour améliorer la compréhension de ce type d’approches.
Sujet :
Dans ce stage, nous nous intéresserons à 2 aspects.
1/ Le premier aspect concerne l’ hyper- paramétrage automatique de réseaux de neurones profonds . Nous proposons d’utiliser des méthodes de configuration automatique d’algorithmes tels
que paramILS [Hutter2009] pour déterminer la configuration d’hyperparamètres idéale. Il s’agira de générer des réseaux de neurones dont les caractéristiques sont adaptées au problème et à son environnement.
2/ Le second aspect concerne l’i nterprétabilité de l’intelligence artificielle . Dans un premier temps l’objectif est d’étudier les approches émergentes telles que BreakDown [Staniak2019] qui permettent d’augmenter l’interprétabilité des réseaux de neurones. Dans un deuxième temps, en étudiant grâce à l’approche proposée précédemment comment les hyper-paramètres influent sur la qualité de l’interprétation. Cela permettra d’élaborer une nouvelle version de l’approche proposée, qui maximise à la fois la qualité de l’interprétation et la performance du réseau.
Profil du candidat :
Etudiant en fin de BAC+5 en informatique
Poursuite en thèse possible
Formation et compétences requises :
Etudiant en fin de BAC+5 en informatique
Une expérience de programmation C++ et/ou Python (Tensorflow, Scikit Learn) est un plus.
Adresse d’emploi :
UMR CRIStAL
Université de Lille – Campus scientifique
Bâtiment ESPRIT
Avenue Henri Poincaré
Document attaché : stage_ORKAD_2020_MO-AAC_NN_XAI.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : CREATIS
Durée : 4 mois – 6 mois
Contact : sorina.pop@creatis.insa-lyon.fr
Date limite de publication : 2020-04-01
Contexte :
Ce stage traitera de problématiques de stockage et de traitement FAIR (localisable, accessible, interopérable et retrouvable) des données de recherche issues de la plateforme PILoT.
Pour cela, nous proposons de mettre en place une base de données de type Girder, qui permettra d’accueillir les données issues de PILoT et de gérer leurs droits d’accès conformément au souhait de leur propriétaires. Nous proposons d’extraire et publier les métadonnées pertinentes permettant de rendre ces données localisables et retrouvables. Enfin, pour faire le lien avec les traitements qui peuvent être lancés sur ces données, la base de données sera interconnectée avec la plateforme VIP.
Sujet :
Ce stage traitera de problématiques de stockage et de traitement FAIR (localisable,
accessible, interopérable et retrouvable) des données de recherche issues de la
plateforme PILoT.
Pour cela, nous proposons de mettre en place une base de données de type Girder,
qui permettra d’accueillir les données issues de PILoT et de gérer leurs droits
d’accès conformément au souhait de leur propriétaires. Nous proposons d’extraire et
publier les métadonnées pertinentes permettant de rendre ces données localisables
et retrouvables. Enfin, pour faire le lien avec les traitements qui peuvent être lancés
sur ces données, la base de données sera interconnectée avec la plateforme VIP.
Plus précisément, l’étudiant recruté devra travailler sur :
– La prise en main d’une instance de BD Girder
– L’étude des données disponibles sur PILoT afin de proposer une structure
adéquate pour leur intégration dans la BD
– Définition des métadonnées à extraire et publier
– Automatisation de l’extraction de ces métadonnées
– Mise en place et test d’un pipeline complet de l’import des données dans la
BD, l’extraction des métadonnées et l’exécution de traitements avec VIP
Profil du candidat :
Informatique, niveau Master ou 5ème année ingénieur
Formation et compétences requises :
– Bonnes compétences en informatique, programmation et systèmes Linux
– Connaissances en bases de données et/ou traitement de données
– Rigueur, esprit critique, intérêt pour la recherche
Adresse d’emploi :
CREATIS – INSA LYON
Bâtiment Blaise Pascal (4ème étage)
7 Avenue Jean Capelle
69621 Villeurbanne Cedex
Document attaché : sujet_stage_vip_pilot_0.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : IRISA/OBELIX
Durée : 6 mois
Contact : minh-tan.pham@irisa.fr
Date limite de publication : 2020-04-01
Contexte :
Ce stage s’intègre dans le cadre d’un projet de recherche de l’équipe d’accueil qui a pour objectif de développer des méthodes de détection d’objets de petite taille dans des images de télédétection (aériennes et satellite) à l’aide de réseaux de neurones profonds (par approche de Deep Learning). Ce projet évolue dans un contexte applicatif varié, par ex. la détection de mammifères marins ou bien de véhicules terrestres, à partir d’images satellites/aériennes. Un algorithme a été proposé dans une première partie du projet pour réaliser cette tâche de détection. L’objectif du stage est d’étudier les performances de cet algorithme, en considérant différents scénarios pour les données d’entraînement et de test, en particulier variabilité des données d’entraînement, apparition de nouveaux fonds dans les données de test, ressemblance des données tests, méta-données disponibles, etc.
Le-a futur-e stagiaire rejoindra l’équipe OBELIX (OBsErvation de L’environnement par Imagerie compleXe) de l’IRISA (Institut de recherche en informatique et systèmes aléatoires) à Vannes (Université de Bretagne-Sud, Campus de Tohannic).
Sujet :
Missions/Programme de travail:
• Etude bibliographique de l’évaluation d’algorithme d’apprentissage, en particulier d’apprentissage profond
• Prise en main de la solution développée pour la détection de petits objets (code en C++ et Python/pytorch) pour la détection de mammifères marins/de véhicules terrestres dans des images satellitaires/aériennes
• Éventuellement, annotation de données manuelle, non-supervisée ou par transfert
• Étude extensive des performances de l’algorithme par simulations numériques
Profil du candidat :
• Traitement d’image, Machine Learning (expérience en Deep Learning appréciée)
• Programmation Python et/ou C++ (expérience avec Tensorflow et/ou Pytorch appréciée)
Formation et compétences requises :
• Formation Master 2 ou Ecole d’Ingénieur
Adresse d’emploi :
Lieu: Université Bretagne Sud – IRISA (équipe OBELIX), Vannes 56000, France
Document attaché : stageM2_evaluation_detection_2.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Laboratoire I3S
Durée : 4-6 mois
Contact : lionel.fillatre@i3s.unice.fr
Date limite de publication : 2020-04-06
Contexte :
Le Deep Learning (ou apprentissage profond) est une technique d’analyse de données qui permet d’obtenir des résultats de classification très performants quel que soit le domaine applicatif. L’apprentissage profond est classiquement décomposé en deux étapes : le calcul des descripteurs profonds et la classification de ces descripteurs. Plus précisément, le réseau de neurones profonds transforme les données d’entrées (signaux, sons, images,…) en descripteurs complexes puis ces descripteurs sont exploités par un algorithme de classification (généralement un classifieur « softmax ») qui affecte une classe aux données traitées en fonction des descripteurs profonds calculés.
Ce sujet de stage s’intéresse à l’utilisation du Deep Learning pour l’analyse des données médicales. Il s’agit plus particulièrement de décider si un patient a développé ou non certaines maladies du foie en exploitant des données cliniques et des données biologiques. La stéato-hépatite non alcoolique du foie (connue du grand public sous le nom « maladie du foie gras » [1]) est la maladie dont la détection sera privilégiée pendant le stage. Dans ce but, nous disposons d’un jeu de données réelles étiquetées qui contient de nombreux attributs médicaux et plusieurs centaines de patients. Les étiquettes décrivent l’état du foie du patient. Le but du stage est d’utiliser un algorithme de Deep Learning supervisé [2] pour estimer l’état du foie du patient. Il s’agit en particulier de rechercher les transformations mathématiques non-linéaires induites par le réseau de neurones profond (« Deep Neural Network » [3]) qui favoriseraient cette estimation. Le stagiaire devra identifier les forces et les faiblesses, tant théoriques que pratiques, de cette approche pour le problème de classification considéré.
L’équipe MediaCoding du laboratoire I3S collabore sur ce sujet avec le Centre Hospitalier Universitaire (CHU) de Nice. Le stagiaire disposera donc de données médicales et cliniques de grande qualité. Il pourra également bénéficier de l’expertise d’un professeur gastro-entérologue et hépatologue.
Sujet :
Travail à réaliser :
L’étudiant aura différents travaux à réaliser :
1. Étudier les possibilités d’une architecture « Deep Learning » pour modéliser des relations non-linéaires entre les données médicales et l’état du foie.
2. Proposer un algorithme d’apprentissage supervisé qui exploite l’architecture analysée dans l’étape précédente.
3. Étudier l’efficacité de l’algorithme sur des données simulées qui reposent sur un modèle non-linéaire connu.
4. Tester l’efficacité de l’algorithme sur le jeu de données réelles.
Les développements informatiques seront réalisés en Python avec les librairies Scikit-Learn [4] (pour utiliser des algorithmes de machine learning) et Pytorch [5] (pour le Deep Learning).
Bibliographie :
[1] https://www.the-nash-education-program.com/fr/quest-ce-que-la-nash/
[2] https://see.stanford.edu/Course/CS229/47
[3] http://www.deeplearningbook.org
[4] https://scikit-learn.org/stable/
[5] https://pytorch.org
Profil du candidat :
Mathématiques appliquées, informatique
Formation et compétences requises :
Ces travaux requièrent les compétences suivantes :
• Programmation informatique (connaître préalablement Python n’est pas nécessaire mais souhaitable)
• Notions de bases en machine learning (réseau de neurones, SVM, arbre de décision, etc.)
Adresse d’emploi :
Laboratoire I3S
UMR7271 – UNS CNRS
Bâtiment Euclide B
2000 Route des Lucioles
06900 Sophia Antipolis
Document attaché : Offre_de_stage_NiveauM2_DeepLearning.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Praditus
Durée : 4 à 6 mois
Contact : kbelhajj@googlemail.com
Date limite de publication : 2020-04-15
Contexte :
Le contexte du projet est une plateforme pour de développement des talents appelés Praditus. Praditus exploite les techniques du numérique, en particulier les techniques de gestion de données et de machine learning afin de proposer aux individus les formations qui leur correspondent le plus. Ce faisant, Praditus capitalise sur les connaissances de ces experts en psychométrie, une science qui concerne la mesure objective des compétences et des connaissances, des capacités, des attitudes, des traits de personnalité et des résultats scolaires.
La gestion et l’analyse de données dans Praditus sont réalisées par un pipeline qui comprend des étapes qui vont de la capture des données (qui prennent la forme de réponses aux questions posées à des utilisateurs), de leur stockage dans un système de gestion de données Nosql, de traitement, nettoyage et transformation de ces données en une forme tabulaire stockées dans une base de données relationnelle, jusqu’à l’exploitation et l’analyse de données en utilisant des outils statistiques et prédictifs. Les résultats de l’analyse de ces données sont utilisées pour recommander aux utilisateurs les formations en ligne qui leur conviennent le plus. Les résultats de l’analyse sont également exploités par les scientifiques dans le domaine de psychométrie afin d’apprendre et vérifier de nouvelles hypothèses et d’améliorer les services proposés aux utilisateurs.
Sujet :
Objetifs du Stage
– Revisiter le workflow de collecte, gestion et analyse de données effectuées par la platform Praditus, avec l’objectif de les optimiser.
– Concevoir et implémenter de nouvelles fonctionnalités qui assistent les experts de domaines dans leurs analyses. En particulier, il sera impliqué dans la mise en place et le test de modèles prédictifs et de croiser un nombre important de données psychométriques, démographiques et d’utilisation.
– Contribuer à l’amélioration de la qualité psychométrique des outils Praditus et à la mise en place de modélisations statistiques variés.
Profil du candidat :
Un étudiant de M2 avec une expérience avec l’un ou plusieurs de ces outils:
● Gestion de données (Bases de données SQL et systèmes NOSQL)
● Machine learning (R)
Formation et compétences requises :
Un étudiant de M2 avec une expérience avec l’un ou plusieurs de ces outils:
● Gestion de données (Bases de données SQL et systèmes NOSQL)
● Machine learning (R)
Adresse d’emploi :
Praditus
33 Rue Raffet
75016 Paris
Document attaché : Internship-Proposal-1.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : LISIC – Université du Littoral Côte d’Opale
Durée : 5 mois
Contact : matthieu.puigt@univ-littoral.fr
Date limite de publication : 2020-04-15
Contexte :
Les techniques de factorisation matricielle sont de populaires outils d’apprentissage statistique, une famille d’approches d’intelligence artificielle. Ces factorisations trouvent de nombreuses applications en traitement du signal et des images (séparation de sources, apprentissage de dictionnaire et approximations parcimonieuses, etc) mais aussi en informatique (systèmes de recommandation). Nous nous intéressons dans ce stage à une application environnementale pour laquelle un développement méthodologique est attendu
Sujet :
Le mobile crowdsensing consiste à acquérir une grande quantité de données à partir d’une foule de capteurs issus de (ou connectés à des) smartphones. Un capteur transforme une grandeur physique en tension ou intensité électrique. Retrouver la grandeur physique à partir de la grandeur électrique en sortie du capteur n’est possible que si le modèle et les paramètres d’étalonnage du capteur sont connus. Ceux-ci sont généralement estimés en laboratoire, par régression de sorties de capteur dans un environnement contrôlé.
Dans le cadre du mobile crowd-sensing, il n’est pas possible d’étalonner en laboratoire le grand nombre de capteurs utilisés. Réaliser ‘étalonnage à distance, sans environnement contrôlé, s’appelle “l’auto-étalonnage”, l’étalonnage “aveugle” ou encore “in situ” de capteurs [1,2].
Nous avons récemment proposé des approches d’étalonnage aveugle d’un réseau homogène de capteurs mobiles en réécrivant le problème d’étalonnage sous la forme d’une factorisation informée d’une matrice de données à valeurs manquantes [3]. En particulier, dans notre formalisme, les facteurs matriciels contiennent la structure de la fonction d’étalonnage considérée (c.-à-d. le modèle d’étalonnage supposé identique pour tout le réseau) et les paramètres d’étalonnage propres à chaque capteur, respectivement.
Plus récemment, nous avons proposé d’accélérer fortement les méthodes de factorisation matricielle à données manquantes, dans un cadre générique (c.-à-d. sans ajout d’information) [4].
Dans le cadre de ce stage, nous proposons (i) d’accélérer les travaux de factorisation informée [3] en utilisant le formalisme de [4] et (ii) d’étendre ces méthodes pour réaliser l’étalonnage d’un réseau hétérogène de capteurs.
Le stage pourra être poursuivi par la préparation d’une thèse dans le domaine de la factorisation matricielle (sous réserve d’obtention d’un financement : ce point sera défini durant le stage).
Références :
[1] B. Maag, Z. Zhou, and L. Thiele. A survey on sensor calibration in air pollution monitoring deployments. IEEE Internet of Things Journal, 5(6) :4857–4870, Dec 2018.
[2] F. Delaine, B. Lebental, and H. Rivano. In situ calibration algorithms for environmental sensor networks : A review. IEEE Sensors Journal, 19(15) :5968–5978, Aug 2019.
[3] C. Dorffer, M. Puigt, G. Delmaire, and G. Roussel. Informed nonnegative matrix factorization methods for mobile sensor network calibration. IEEE Transactions on Signal and Information Processing over Networks, 4(4) :667–682, Dec 2018.
[4] F. Yahaya, M. Puigt, G. Delmaire, and G. Roussel. How to apply random projections to nonnegative matrix factorization with missing entries ? In Proc. of the 27th European Signal Processing Conference (EUSIPCO), 2019.
Profil du candidat :
Curieux et très à l’aise en programmation (Matlab, Python), vous êtes inscrits en deuxième année de Master ou troisième année d’école d’ingénieurs en sciences de données (traitement du signal et des images, machine learning, intelligence artificielle), informatique ou mathématiques appliquées.
Pour candidater, merci de nous envoyer votre CV, une lettre de motivation, deux lettres de recommandation (ou au moins les noms et adresses e-mail de deux référents) et vos relevés de notes de Licence et Master à :
– Matthieu PUIGT (matthieu.puigt [at] univ-littoral.fr)
– Farouk YAHAYA (farouk.yahaya [at] univ-littoral.fr)
– GIlles DELMAIRE (gilles.delmaire [at] univ-littoral.fr)
– Gilles ROUSSEL (gilles.roussel [at] univ-littoral.fr)
Formation et compétences requises :
Curieux et très à l’aise en programmation (Matlab, Python), vous êtes inscrits en deuxième année de Master ou troisième année d’école d’ingénieurs en sciences de données (traitement du signal et des images, machine learning, intelligence artificielle), informatique ou mathématiques appliquées.
Adresse d’emploi :
LISIC, 50 rue F. Buisson, BP 719, 62228 Calais Cedex
le LISIC est situé en plein coeur de la côte d’Opale, renommée pour ses activités de plein air (randonnées, VTT, windsurf, kitesurf, équitation) et sa proximité avec Lille (30 min en TER GV), Londres (1h) et le Nord de l’Europe.
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Laboratoire SYMME – Polytech – Université Savoie Mont Blanc
Durée : 3 à 5 mois
Contact : laurence.vignollet@univ-smb.fr
Date limite de publication : 2020-04-30
Contexte :
Certaines formations de l’université Savoie Mont Blanc (USMB) proposent des activités d’apprentissage en ligne, généralement en complément des formations en présentiel. C’est par exemple le cas pour le master “Advanced Mechatronics” dont les étudiantes et étudiants suivent certains cours uniquement en ligne ou pour les cours d’anglais pour non spécialistes où les étudiantes et étudiants complètent les heures en présentiel par de l’auto-formation en ligne.
Les enseignantes et enseignants impliqués souhaitent aujourd’hui se doter d’outils d’aide au suivi de leurs étudiantes et étudiants afin, notamment, de repérer le plus tôt possible celles et ceux qui sont en difficulté.
Sujet :
Ce stage s’intègre dans le cadre d’une thèse CIFRE, menée en collaboration entre le laboratoire SYMME de l’université Savoie Mont Blanc et l’entreprise Logipro, éditrice de logiciels dans le domaine de la formation ouverte à distance.
L’objectif est d’évaluer l’approche développée dans le cadre de la thèse CIFRE pour l’entreprise Logipro en la transposant dans le contexte de l’USMB.
Il s’agit notamment d’évaluer la méthode utilisée dans ce travail de recherche pour adapter des algorithmes de machine learning de type “forêts aléatoires” dans le contexte de la formation professionnelle en ligne en la transposant dans le contexte de l’USMB où le scénario pédagogique et la durée des activités diffèrent et où la plate-forme pédagogique n’est pas la même.
Missions
• Analyser le format des traces d’activités disponibles dans la plate-forme Moodle et les modéliser ;
• Etudier les travaux du doctorant Logipro/Symme, Mohamed Mouaici, et notamment la démarche utilisée pour adapter les algorithmes de machine learning qu’il utilise dans ses travaux de thèse ;
• À partir de l’application des algorithmes standards aux traces d’activité des trois dernières promotions du master Advanced Mechatronics, suivre la démarche d’adaptation de ces algorithmes afin d’obtenir les meilleures prédictions possibles dans ce nouveau contexte ;
• Etudier les types de tableaux de bord s’interfaçant avec Moodle, notamment ceux qui intègrent un serveur de stockage dédié de type LRS (Learning Record Store) et qui permettent de stocker les traces de son utilisation, ceci pour permettre d’analyser les usages du tableau de bord ;
• Développer un premier tableau de bord, à partir d’une des solutions existantes a priori,
• Respecter les contraintes du RGPD tout au long du processus.
Profil du candidat :
En école d’ingénieur ou en master, la candidate ou le candidat doit avoir un bon niveau en programmation et connaître des méthodes d’apprentissage automatique.
Formation et compétences requises :
Niveau de formation souhaitée : master ou école d’ingénieur, filière informatique – sciences des données
Compétences souhaitées :
* Méthodes d’apprentissage automatique (machine learning)
* Développement front et back office
* Gestion de bases de données
Adresse d’emploi :
Le campus du Bourget-du-Lac (73) ou d’Annecy-le-Vieux (74).
Un hébergement en résidence universitaire peut être envisagé.
Document attaché : Offre_de_Stage-Tableau-de-bord.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : ICube – Université de Strasbourg
Durée : 3 à 6 mois
Contact : pierre.parrend@unistra.fr
Date limite de publication : 2020-04-30
Contexte :
L’exploitation des outils d’analyse de données pour le suivi de la qualité de l’environnement, des bâtiments et des infrastructures nécessite de traiter les données en flux, avec un temps de latence très court des évènements d’intérêt. Ce suivi doit être continu et robuste, et en particulier ne pas dépendre de la qualité des données reçues.
Les algorithmes d’analyse mis en œuvre doivent donc être choisis spécifique pour assurer cette robustesse. Ils doivent également supporter la mise en œuvre de réponses automatiques, et donc être fiables, c’est-à-dire avoir une très bonne précision (taux de faux positifs très faible) et fournir des bases solides pour mener des investigations complémentaires, et donc être explicables.
Les équipes CSTB et réseaux d’ICube propose donc un projet afin de réaliser une ‘Chaine de traitement de données en flux pour la supervision de bâtiments intelligents’.
La mission aura lieu sur 3 à 6 mois, entre février et août 2020, et se déroulera au sein de la plate-forme BICS du laboratoire ICube, en partenariat avec la plate-forme Inet Lab.
Sujet :
L’objectif du projet est d’identifier et de détecter des cas d’anomalies typiques des environnements ‘Industrie du Futur’, avec 2 cas d’utilisation : lignes de production industrielles et smart buildings.
Les principales étapes du projet sont :
• Mise en place du transfert de données entre INetLab et BICS
• Caractérisation des évènements d’intérêt typique pour un bâtiment intelligent : au niveau fonctionnel (données de capteurs) ; au niveau technique (données réseaux)
• Mise en place de la chaine de traitement des données en temps réel
• Mise en place de 2 briques d’analyse de données : 1) mécanisme de règles pour l’identification de cas problématiques connus ; 2) Machine Learning pour la détection d’anomalies en N dimensions
• Proposition de réactions typiques pour chaque type d’évènement, avec évaluation par l’administrateur en vue d’apprentissage et d’automatisation
Le projet doit préparer le déploiement d’une solution de reconfiguration automatique des nœuds réseaux et l’évaluation de la performance de cette reconfiguration.
Le livrable comprend :
• Une démonstration impliquant les organisations partenaires du projet
• Un document de conception ‘Data flow analysis for smart building (en anglais)
• Module spécifique BICS-Data ‘2-step-analysis’
• Rapport de Master/Fin d’étude
• Soutenance.
Il pourra être adapté selon l’évolution du projet.
Profil du candidat :
L’offre s’adresse à un étudiant en M1, M2, ou en 2ème ou 3ème année d’école d’ingénieur.
Si le projet donne lieu à des résultats particulièrement solides dans le cadre d’un stage de fin d’études, il pourra mener à une candidature à une thèse de doctorat en informatique.
Formation et compétences requises :
L’offre s’adresse à un étudiant en M1, M2, ou en 2ème ou 3ème année d’école d’ingénieur.
Si le projet donne lieu à des résultats particulièrement solides dans le cadre d’un stage de fin d’études, il pourra mener à une candidature à une thèse de doctorat en informatique.
Adresse d’emploi :
Laboratoire ICube, 11, Rue Humann, 67000 Strasbourg
Document attaché : Sujet-stage-FlowControl_Master1_2-Recherche.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Institut de Neurosciences de la Timone (INT), Marseille
Durée : 4-6 mois
Contact : sylvain.takerkart@univ-amu.fr
Date limite de publication : 2020-04-30
Contexte :
Aujourd’hui la prise en charge des patients admis en réanimation après un traumatisme crânien sévère est soumise à la grande incertitude sur la récupération à long terme. Dans ce contexte, l’accès à des outils diagnostiques et pronostiques fiables et performants est un progrès majeur qu’accompagne la start-up BrainTale (http://www.braintale.fr/) en collaboration avec le groupe COMA, groupe de recherche associant le département d’anesthésie-réanimation de l’Hôpital de la Pitié-Salpêtrière (APHP, Paris) et le Laboratoire d’Imagerie Biomédicale (Sorbonnes Université, Paris), et avec l’équipe MECA de l’Institut de Neurosciences de la Timone (INT, Marseille; http://www.meca-brain.org/). L’approche innovante proposée aujourd’hui se base sur un traitement calibré des données d’IRM permettant des mesures robustes d’altérations microstructurelles cérébrales à partir de descripteurs définis a priori et de solutions d’apprentissage statistique adaptées se nourrissant d’une base de données de patients cérébrolésés unique au monde.
Sujet :
Dans la continuité de ces travaux, ce stage s’inscrit dans une collaboration entre l’équipe MECA et BrainTale qui vise à améliorer ces outils de diagnostic et pronostic en combinant des connaissances en neurosciences avec des méthodes d’intelligence artificielle innovantes. Le projet du / de la stagiaire consistera à améliorer le modèle pronostic existant en développant un nouveau pipeline basé sur une extraction de caractéristiques aléatoire et une stratégie ensembliste d’apprentissage. Le stage se déroulera à Marseille au sein de l’INT.
Profil du candidat :
dernière année d’école d’ingénieur ou M2
Formation et compétences requises :
Les trois compétences principales mise en oeuvres seront:
– apprentissage statistique, classification (par ex. Support Vector Machines, deep learning…)
– traitement d’image et/ou d’imagerie médicale
– très bon niveau en programmation (python ou autre langage)
De plus, on bon niveau en anglais et un intérêt pour les neurosciences seraient des plus.
Adresse d’emploi :
Institut de Neurosciences de la Timone
Campus Santé Timone
27 boulevard Jean Moulin
13005 Marseille
http://www.int.univ-amu.fr
Document attaché : 2020_sujet_stage_INT_BrainTale.pdf
Offre en lien avec l’Action/le Réseau : – — –/– — –
Laboratoire/Entreprise : INP ENSIACET Toulous
Durée : dès que possible
Contact : rachid.ouaret@toulouse-inp.fr
Date limite de publication : 2020-04-30
Contexte :
The performance of an industrial site is greatly dependent of process variations and its ability to satisfy the operational specifications under exogenous disturbances. The Internship subject is about Heat Exchanger Network (HEN) sensibility and flexibility modeling and analysis. Flexibility of the HEN is one of factors which affect the operability of the system. Sensibility analysis investigates how the variation in the output of a model can be attributed to variations of its input factors. Numerous works are dedicated to the design of HEN for nominal operating systems. However, the operability aspects of such networks have not been extensively studied.
Sujet :
The performance of an industrial site is greatly dependent of process variations and its ability to satisfy the operational specifications under exogenous disturbances. The Internship subject is about Heat Exchanger Network (HEN) sensibility and flexibility modeling and analysis. Flexibility of the HEN is one of factors which affect the operability of the system. Sensibility analysis investigates how the variation in the output of a model can be attributed to variations of its input factors. Numerous works are dedicated to the design of HEN for nominal operating systems. However, the operability aspects of such networks have not been extensively studied.
The robustness of such systems is determined by its ability to absorb disturbances without changing the flow rates of utilities. Since the early 80’s, studies were carried out on the flexibility aspect of HEN to solve the operability issue with works such as Saboo et al. (1985) [#Saboo1985] and Swaney and Grossmann (1985) [#swaney1985index] that use non-linear programming (NLP) to optimize flexible HEN.
Using linear programming, Floquet et al. (2016) [#floquet2016analysis] introduced a methodology based on interval arithmetic concepts for modeling impacts of process parameters fluctuations on the behavior of the HEN. Assuming that some parameters can vary on an interval [min, max], a linear system can be solved where the left term involves interval matrices (fluctuations of the HEN characteristics, except topology) and right hand side involves fluctuations of input temperature of the HEN. Following the same idea, the project aims is the use symbolic data analysis (SDA) to study how uncertainty in the output of a model can be apportioned to different sources of uncertainty in the model input factors. The choice of SDA is that it can offer an efficient and effective way of knowledge extraction from correlated sources of uncertainty.
The main objective of the internship is to acquire a mechanistic understanding of Robustness aspects of HEN using symbolic data analysis. Targeted student will work towards a tool that in the long term would ease a lot the conversion of Mathematical real algorithm description into Python/Julia/R, or Matlab fix point computations.
[1] Pascal Floquet, Gilles Hétreux, Raphaele Hétreux, and Lucille Payet. Analysis of operational heat exchanger network robustness via interval arithmetic. In Computer
Aided Chemical Engineering, volume 38, pages 1401–1406. Elsevier, 2016.
[2] Alok K Saboo, Manfred Morari, and Duncan C Woodcock. Design of resilient processing plants viii. a resilience index for heat exchanger networks. Chemical Engineering Science, 40(8):1553–1565, 1985.
[3] Ross E Swaney and Ignacio E Grossmann. An index for operational flexibility in chemical process design. part ii: Computational algorithms. AIChE Journal, 31(4):631– 641, 1985.
Profil du candidat :
1. Currently, enrolled in Master-level degree program
2. Student with a strong interest in data analysis
3. Some knowledge of Symbolic Analysis techniques and/or arithmetic will be appreciated
4. Demonstrates effective written and oral communication, integrity, critical thinking/analytical skills, agility/flexibility, a continuous learning mindset and teamwork and collaboration
Formation et compétences requises :
Currently, enrolled in Master-level degree program
Adresse d’emploi :
INP ENSIACET Toulouse
http://www.ensiacet.fr/en/index.html
Document attaché : 202003120902_Internship_ProposalsData.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Research center LGI2P, 7 rue Jules Renard. IMT Mines Alès. 30100 Alès.
Durée : 6 months
Contact : patrice.guyot@mines-ales.fr
Date limite de publication : 2020-05-01
Contexte :
This internship is funded by the LGI2P through the context of the creation of a new research unit, named EuroMov DHM, that will include researchers from Euromov, Montpellier (http://euromov.eu/home) and LGI2P, IMT Mines Ales (http://www.mines-ales.fr). Works will be mainly conducted in the LGI2P at Alès. Visits to Euromov, Montpellier, will also be considered.
Sujet :
Synchronization of temporal events is a key feature for audio-visual perception, motor coordination and social interactions. For example, speech comprehension is enhanced through synchronized perception of visual signals like lip movements [Stev10], and motor coordination relies partly on the ability of coupling movement with audio-visual events [Ald17].
This project will focus on deep learning approaches to reveal temporal synchronization of heterogeneous data, through supervised and unsupervised tasks. Different kind of recurrent networks will be considered, as for example phased lstm [Nei16]. Moreover, we will also evaluate the potential application of spiking neural network [Tav18] on these temporal data.
For applications, we will consider data of different natures and complexities. Firstly, synchrony among groups will be studied through sets of temporal signals. This data originate from experiments on social interaction through the monitoring of oscillatory hand motion. The second application lies in the analysis of rhythmic patterns in audio data. In that scope, we aims at highlighting structural rhythms in music, for example tempo, or finer characterization such as musical groove. Perceptive are automatic drum transcription, and clinically oriented musical recommendation for the treatment of Parkinson’s disease [Coc18].
Thirdly, we aim at analysis of movement from Mocap data and or video. In particular, we will focus on walking, in the scope of diagnostic assistance and movement signature.
The main tasks of this internship are:
• State of art in deep learning for temporal data
• Data collection and annotation
• Application of unsupervised and supervised learning methods
• Evaluation and comparison of approaches
References
[Ald17] Alderisio, F., Fiore, G., Salesse, R. N., Bardy, B. G., & di Bernardo, M. (2017). Interaction patterns and individual dynamics shape the way we move in synchrony. Scientific reports, 7(1), 6846.
[Coc18] Cochen De Cock, V., Dotov, D.G., Ihalainen, P. et al. Rhythmic abilities and musical training in Parkinson’s disease: do they help?. npj Parkinson’s Disease 4, 8 (2018)
[Nei16] Neil, D., Pfeiffer, M., & Liu, S. C. (2016). Phased lstm: Accelerating recurrent network training for long or event-based sequences. In Advances in neural information processing systems (pp. 3882-3890).
[Stev10] Stevenson, R. A., Altieri, N. A., Kim, S., Pisoni, D. B., & James, T. W. (2010). Neural processing of asynchronous audiovisual speech perception. Neuroimage, 49(4), 3308-3318.
[Tav18] Tavanaei, A., Ghodrati, M., Kheradpisheh, S. R., Masquelier, T., & Maida, A. (2018). Deep learning in spiking neural networks. Neural Networks.
Profil du candidat :
Masters in Computer Science, Applied Mathematics, or Signal processing
Formation et compétences requises :
Knowledge in Deep Learning is highly appreciated
Programming skills in Python (and libraries such as pytorch, numpy, scikit-learn or keras)
Knowledge in motion or music analysis is appreciated
Adresse d’emploi :
Research center LGI2P, 7 rue Jules Renard. IMT Mines Alès. 30100 Alès.
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Huawei France Research Center
Durée : 6 months
Contact : jeremie.leguay@huawei.com
Date limite de publication : 2020-05-01
Contexte :
The Network and Traffic Optimization research team of the Mathematical and Algorithmic Sciences Lab, Huawei France Research Center, located in the Paris area, is looking for internship candidates. The research will focus on developing machine learning algorithms to drive research and innovation in the context of traffic engineering.
Sujet :
The Software Defined Networks (SDN) paradigm has gained a lot of popularity in the recent years. It shifts the control plane of the network from the devices to a powerful centralized controller with a global view of the network. The controller can update policies and distribute them to routers in an online fashion based on its real-time perception of the network status. Current approaches for SDN routing relies on offline optimization tools relying on Operations Research algorithms but are not efficient to deal with variations of traffic. Online decision-making tools such as Reinforcement Learning (RL) are promising approaches to address this issue.
The main objectives of this internship are the following:
1. Study the state of the art of reinforcement learning methods for intelligent routing.
2. Evaluate the potential applicability of RL solutions on a specific routing problem.
3. Implement and compare the selected approaches on an emulated network.
Profil du candidat :
1. Good programming and scripting skills (C/C++/Java, Python)
2. Good knowledge of ML/RL techniques
3. Knowledge of networking is a plus
Formation et compétences requises :
Required Level: Msc in Computer science / Applied mathematics.
Adresse d’emploi :
Boulogne-Billancourt, Paris Area
Document attaché : 2020-Demande-de-stagiaire-Huawei_France_Research_Center_RL_ResourceAllocation.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : CentraleSupelec/INRIA Saclay
Durée : 4-6 mois
Contact : laurent.duval@ifpen.fr
Date limite de publication : 2020-06-01
Contexte :
This subject is in close connection with Arthur Marmin’s PhD thesis (Rational models optimized exactly for chemical processes improvement), co-supervised by Marc Castella, Jean-Christophe Pesquet and Laurent Duval. The context of the subject is modeling of experimental data with a parametric family of functions.
Sujet :
For a long time, polynomial and rational functions have been playing a key role in that respect (calibration, saturation, system modeling, interpolation, signal reconstruction..) Their use is classically confined to least-square or least-absolute value regression. However, it is highly desirable in real-world applications to incorporate:
data-based penalties (positivity, interval bounds)
model and noise priors, such as power laws or variance stabilizing transforms,
statistical priors, such as robustness or sparsity.
Basically, from the modeling perspective, any cost function of practical interest can be approximated as accurately as desired by a polynomial. Nonetheless, optimizing multivariate rational function under polynomial constraints is a difficult problem when no convexity property holds. Recent mathematical breakthroughs have made it possible to solve problems of this kind in an exact manner by building a hierarchy of convex relaxations. The objective of this internship is to pursue the developments applied so far to signal restoration. We address here the quest for best model selection in experimental data fitting. We minimize a criterion composed of two terms. The first one is a fit measure between the model and recorded measurements. The second terms are sparsity-promoting (approximating the l0 count measure) and interval bound penalizations, weighted by positive parameters We choose terms as rational functions. The latter will be dealt with by subclasses (e.g. polynomials, homographic functions). The proposed methodology will be evaluated on the many models and experimental data available at IFP Energies nouvelles. A particular attention will be paid to the usability to data practitioners, by embedding the algorithms into an user-friendly interface, with help in choosing hyperparameters.
Details:
http://laurent-duval.eu/job-2020-internship-data-science-rational-models.html
Profil du candidat :
Engineering school, Master of science
Formation et compétences requises :
Optimization, statistics, computing
Adresse d’emploi :
CentraleSupelec/INRIA Saclay
Document attaché : IFPEN_2020_SUBJ_Rational-Function-Models-DATAIA-Internship-Data-Science.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Lamsade, Université Paris-Dauphine
Durée : 4 à 6 mois
Contact : kbelhajj@googlemail.com
Date limite de publication : 2020-06-01
Contexte :
Knowledge graphs can be viewed as large collections of interconnected entities enriched with semantic annotations. They have become powerful assets for enhancing search and are now widely used in both academia and industry. Well-known knowledge graphs include Google’s Knowledge Graph, Facebook’s Graph Search and Yago (see (Pan et al. 2017)). In the context of this internship, the focus will be on knowledge graphs that are available or can be exported as RDF datasets (Manola and Miller 2004) enhanced with RDF Schema (Guha and Brickley 2014) statements that capture relevant domain background knowledge.
Sujet :
By and large, available knowledge graphs lack provenance support (Cheney, Chiticariu, and Tan 2009). Provenance information informs on the how-about of entity, i.e., how they come to be, and can be used in a range of applications, e.g., to explain the results of a query or search, to propagate annotations among the enti- ties that constitute the knowledge graph, to learn attribution information, to name a few. The main objective of the internship will be to investigate how RDF knowledge graphs can be enhanced with provenance support. In doing so, the candidate will examine the different kinds of provenance information that can be collected and recorded and the computational complexity incurred by each, design an algorithmic solution, and implement it. For validation purposes, we will be using real knowledge graphs that are freely available under the aegis of the open linked data initiative.
Profil du candidat :
A master or Engineer student in computer science.
Formation et compétences requises :
– Semantic Web (RDF, RDFS)
– Python
Adresse d’emploi :
Université Paris-Dauphine, Place du Maréchal de Lattre de Tassigny, 75016 Paris
Document attaché : Master-Internship-1.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Institut de Neurosciences de la Timone, Marseille
Durée : 3-5 mois
Contact : sylvain.takerkart@univ-amu.fr
Date limite de publication : 2020-06-30
Contexte :
En imagerie cérébrale, exploiter la complémentarité offerte par différentes modalités d’images doit permettre de s’affranchir des limitations de chacune des modalités. Dans cette optique, nous avons développé une méthode d’apprentissage de représentation multi-modales qui fusionne les informations offertes par différents types d’IRM (imagerie par résonance magnétique). Cette méthode est basée sur l’apprentissage profond, et nous avons démontré qu’une telle fusion permet de mieux cartographier les différences inter-individuelles observées dans des tâches de perception auditive, à partir de deux modalités (IRM fonctionnelle de repos et IRM fonctionnelle de tâche).
Ce projet est issu d’une collaboration inter-disciplinaire entre l’Institut de Neurosciences de la Timone et l’équipe d’Apprentissage du Laboratoire d’Informatique et des Systèmes, tous deux situés à Marseille.
http://www.int.univ-amu.fr
Sujet :
Ce stage s’inscrit dans la continuation de ce projet et vise à poursuivre ces travaux à la fois au niveau applicatif et méthodologique.
Dans un premier temps, l’étudiant.e procédera au traitement de données d’IRM cérébrales pour construire les caractéristiques données en entrée à cet algorithme sur une grande base de données ouverte, de type Human Connectome Project. Il.elle appliquera la méthode existante sur cette base de données afin d’évaluer quantitativement ses performances.
Dans un deuxième temps, l’étudiant.e travaillera sur des dévelopements méthodologiques visant à améliorer l’algorithme. Un des objectifs visera à généraliser l’algorithme pour qu’il fonctionne sur plus de deux modalités en ajoutant de nouveaux types d’images (IRM anatomique, IRM de diffusion).
Profil du candidat :
En école d’ingénieur ou en master.
Formation traitement d’images, imagerie médicale, apprentissage machine, sciences des données.
Formation et compétences requises :
– Très bon niveau en programmation python.
– Très bon niveau en apprentissage automatique (dont apprentissage profond).
– Connaissances en traitement d’image médicales
– Bon niveau en anglais.
Adresse d’emploi :
Institut de Neurosciences de la Timone,
27 boulevard Jean Moulin
13005 Marseille
