Liste des Ecoles

Liste des Ecoles Thématiques liées au GdR MaDICS

Ecoles labellisées/soutenues par MaDICS

May
1
Mon
2017
Une approche graphe/r ́eseaux complexes pour mod ́eliser la nouveaut ́e dans des corpus textuels
May 1 – May 2 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LIUM, équipe LST
Durée : 6 mois
Contact : nicolas.dugue@univ-lemans.fr
Date limite de publication : 2017-05-01

Contexte :
Le projet #neo s’intéresse à la détection automatique de néologismes en exploitant de grands corpus textuels. En particulier, il s’agit de détecter des mots qui changent de sens ou dont un nouveau sens apparaît. Dans ce stage, nous souhaitons fournir à ce projet un moyen d’évaluer les méthodes de détection automatique en créant des emph{modèles} de corpus artificiellement générés. Ces modèles devront ressembler le plus possible à des corpus réels. Par ailleurs, ils devront nous permettre d’introduire nous mêmes des changements de sens, de façon à tester les méthodes de détection.

Sujet :
Les objectifs du stage sont ainsi :
• de confirmer les propriétés des réseaux sur les corpus du projet #neo ;
• de modéliser les changements dans ces réseaux dans le temps ;
• de se baser sur l’état de l’art et les modèles de génération de graphe pour proposer et développer une approche de génération artificielle de modèles de corpus.

Une version plus détaillée du sujet est accessible sur le PDF.

Profil du candidat :
Master 2 :
– Programmation Python (ou Java) ;
– Intérêt pour les graphes ;
– Intérêt pour le Traitement de la langue.

Formation et compétences requises :
Master 2 :
– Programmation Python (ou Java) ;
– Intérêt pour les graphes ;
– Intérêt pour le Traitement de la langue.

Adresse d’emploi :
Le Mans, LIUM, équipe LST

Document attaché : stage-une-approche.pdf

Apr
10
Mon
2017
Classification de signaux et d’images par descripteurs invariants/Signal and image classification with invariant descriptors (scattering transforms)
Apr 10 – Apr 11 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : IFP ENERGIES NOUVELLES
Durée : 5 mois
Contact : laurent.duval@ifpen.fr
Date limite de publication : 2017-04-10

Contexte :
Le domaine de l’analyse de données complexes (science des données) s’intéresse notamment à l’extraction d’indicateurs pertinents, pour la réduction de dimension, la comparaison, la classification des données. Initialement basées sur des descripteurs (features) relativement physiques, spécifiques à l’application, de nouvelles méthodes apparaissent, basées sur des descripteurs numériques plus génériques et potentiellement multiéchelle, et des bases d’information pouvant servir à l’apprentissage ou la classification. Des exemples se trouvent dans les techniques de type SIFT (scale-invariant feature transform) et analogues (ORB, SURF), dans l’apprentissage non-supervisé de descripteurs, en apprentissage profond (deep learning). Ce stage s’intéresse spécifiquement à la gamme de techniques dites scattering transform (S. Mallat et al.) et aux techniques de classification associées. Elle permet d’obtenir des représentations de signaux, d’images ou de graphes présentant des propriétés d’invariance relatives à certaines transformations affectant les données : translation, rotation, échelle… Ses performances sont bien étudiées sur des données classiques (signaux audio, bases d’images, reconnaissance de chiffres manuscrits).

Sujet :
Ce stage s’intéresse à la mise en œuvre de ces méthodes sur des types de données moins étudiés : identification de la correspondance la plus proche d’une « image candidate » dans une base de données d’images modélisées du sous-sol et extraction d’empreintes pertinentes de signaux spectrométriques 1D issus de composés chimiques complexes pour l’apprentissage de propriétés physico-chimiques macroscopiques. Dans le premier cas, le défi réside dans l’échelle et la nature distincte des images candidates et modélisées, les secondes correspondant à une vision simplifiée des premières (proches de « sketches » ou cartoons »). Dans le second cas, la nature des signaux, formés d’une superposition de plusieurs centaines de pics (positifs), est de nature différente des informations traitées classiquement par les transformées en scattering. Une focalisation sur une des deux applications est envisagée, en fonction des succès ou difficultés rencontrés.

Profil du candidat :
Niveau 3e année élève ingénieur et/ou master

Formation et compétences requises :
Informatique/algorithmique, traitement de signal/image, statistiques, apprentissage automatique, mathématiques appliquées

Adresse d’emploi :
Rueil-Malmaison (92)

Document attaché : ifpen_stage-internship-2017-master-data-science-scattering-transform-english.pdf

Mar
1
Wed
2017
stage recherche M2 Informatique
Mar 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : Inria Lille, CRIStAL
Durée : 6 mois
Contact : philippe.preux@univ-lille.fr
Date limite de publication : 2017-03-01

Contexte :
Le sujet se situe à l’interface entre deux domaines de l’informatique : génie logiciel et apprentissage automatique.
Cette problématique est étudiée depuis plusieurs années dans une collaboration entre les équipes Spirals et SequeL de Inria Lille / CRIStAL, par Martin Monperrus et Philippe Preux.
La réalisation du sujet demande à la fois un travail de recherche fondamental et de développement logiciel.
Elle demande la manipulation de concepts de théorie des graphes, développement logiciel et de statistiques.

Sujet :
Modélisation de l’évolution de logiciels

voir http://www.grappa.univ-lille3.fr/~ppreux/prje/m2info-a.php

Profil du candidat :
M1 d’informatique acquis, M2 en cours.

– fort attrait pour la théorie des graphes, l’algorithmique en général.
– curiosité, autonomie, capacité à écouter et à travailler en équipe.

Formation et compétences requises :
– capable de développer sans difficulté du code (java, C++, C, R, python)
– lecture de l’anglais.
– des notions (le plus possible) de statistiques, voire de mathématiques appliquées (en plus de la formation en informatique)

Adresse d’emploi :
Centre Inria
Villeneuve d’Ascq

Document attaché :

stage master en Big Data Warehouse
Mar 1 – Mar 2 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : irstea
Durée : 5 mois
Contact : sandro.bimonte@irstea.fr
Date limite de publication : 2017-03

Contexte :
Data Warehouse, Big Data et données agro-climatiques

Sujet :
Etude et implémentation d’une solution Spatial Big Data
Warehouse : Application aux données agro-climatologiques

Profil du candidat :
formation Big Data

Formation et compétences requises :
Les compétences en informatique recherchées sont :
– Entrepôts de données, et OLAP (i.e Mondrian)
-Technologies Big Data (bases de données – ex : Cassandra, MongoDB, etc. – plateformes –ex :
Hadoop)
-Java
-Les compétences en Systèmes d’Information Géographique seront considérées comme un plus

Adresse d’emploi :
9 av blaise pascal, Aubiere (clermont ferrand)

Document attaché : Offre-de-Stage-20183.pdf

Feb
15
Wed
2017
Automatisation du requêtage des API de Twitter pour une collecte à large spectre
Feb 15 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : UMR 6281- Université de Technologie de Troyes
Durée : 6 mois
Contact : babiga.birregah@utt.fr
Date limite de publication : 2017-02-15

Contexte :
L’analyse des réseaux sociaux pour la gestion de crise est souvent limitée par la prise en compte les limitations des API. Par exemple dans le cadre d’une stratégie de collecte à large spectre lors d’une crise généralisée il est souvent difficile de suivre simultanément toutes les thématiques tout en maîtrisant l’évolution des groupes de mots clés et thématiques dans les échanges. De plus l’émergence de nouvelles thématiques peut influencer la richesse et la pertinence des messages collectés.

Il est donc important de construire un moteur qui automatise (i) non seulement le suivi au fil de l’eau (et en ligne) de l’évolution des mots clés, (ii) mais aussi la détection de thématiques émergentes pour garantir la pertinence des paramètres de la collecte en cours.

Sujet :
Le ou la candidat(e) retenu(e) doit proposer une moteur de collecte large spectre de tweets capable de tourner sur une longue période sans interruption tout en adaptant les mots clés selon la trajectoire que prend l’événement en cours. Pour cela il ou elle devra mettre en place un algorithme de détection de thématiques d’intérêt qui permet de suggérer automatiquement des termes émergents pour adapter la collecte.

Profil du candidat :
Profil: Mathématiques/Inforatiques

Dossier de candidature : Le dossier de candidature doit être transmis uniquement par mail, à l’adresse suivante : babiga.birregah@utt.fr, en ajoutant dans l’objet la référence DL04- 1617.

Il doit contenir les pièces suivantes, sous format PDF:

– Une lettre de motivation indiquant clairement les expériences (stages, projets, etc.) en relation avec le stage

– Un CV contenant la liste des publications et autres réalisations (projets, logiciels, etc.)

Formation et compétences requises :
Compétences :
Gestion de base de données : PostgreSQL
Langages : Python / des connaissances en Java seraient un plus.

Bon relationnel et travail en équipe. Vous aurez à travailler avec les équipes du BRGM qui travaillent sur le suivi des catastrophes naturelles.

Poste à pourvoir : Stage Ingénieur/Master 2/Mastère Spécialisé

Adresse d’emploi :
Affectation structurelle : Université de Technologie de Troyes/ Equipe LM2S (UMR 6281)

Durée : 6 mois
Date de prise de fonction : Février 2017

Document attaché :

Feb
10
Fri
2017
Chargé de mission en Modélisation et conception d’outil pour le diagnostic data de territoires
Feb 10 – Feb 11 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : ForumPHP, 27 rue de la Rochefoucauld 75009 PARIS (2è étage)
Durée : 6 mois
Contact : veronique[ dot ]guillaumin[ @ ]forumhabitatprive[ dot ]org
Date limite de publication : 2017-02-10

Contexte :
Le Forum des Politiques de l’habitat privé (Forum PHP) est une association nationale créée en 2012. C’est un réseau de réseaux, un centre de ressources et une communauté de professionnels de l’habitat privé à destination principalement des collectivités territoriales.
De nombreuses collectivités territoriales sont en plein questionnement sur les opportunités (voire les limites) de notions telles que l’open-data, le big-data, le self-data et la constitution d’entrepôt de données et de data lakes. En matière de politique locale de l’habitat (compétence intercommunale), le rapport d’Etalab 2015 rend compte des données habituellement utilisées et sources mobilisées pour élaborer un diagnostic ou un observatoire de l’habitat (données relatives au parc, aux habitants, au marché de l’habitat, …).
Dans votre travail vous aurez des interactions avec des acteurs tels que les représentants des réseaux membres de l’association lors des réunions (mensuelles à trimestrielles) des 5 groupes de travail thématiques, du comité technique trimestriel, du conseil d’administration trimestriel

Sujet :
Vous travaillerez sur la modélisation des données et sur la conception d’un outil pour le diagnostic data d’un territoire afin de proposer une vision 360° pour l’aide à la décision pour les acteurs des politiques de l’habitat. Ce travail reposera spécifiquement sur la construction d’indicateurs pertinents, de leur présentation sous forme de tableau de bord et de la valorisation au travers de modules de visualisation sur des preuves de concepts (POC) répondant à la problématique d’enrichissement des politiques locales de l’habitat.
Il est donc proposé de partir d’une politique publique, l’habitat, compétence intercommunale, pour montrer le champ des possibles.
1- Proposer et valider une approche méthodologique pour dresser l’inventaire des données présentes sur un territoire, urbain ou rural, tous canaux confondus.
2- Etablir une cartographie producteurs/consommateurs de ces données mettant en lumière le cycle qui peut s’établir de la donnée brute à la valeur en passant éventuellement par une étape d’enrichissement et/ou augmentation.
3- Construire des cartes de maturité data pour la mesure du potentiel d’innovation orientée sur les données dans un territoire.

Profil du candidat :
Science de l’information
Gestion des connaissances
Traitement de données

Formation et compétences requises :
Informatique, Système d’information

Adresse d’emploi :
Affectation structurelle : ForumPHP, 27 rue de la Rochefoucauld 75009 PARIS (2è étage)
Contact : Mme Véronique GUILLAUMIN veronique[ dot ]guillaumin[ @ ]forumhabitatprive[ dot ]org

Document attaché : sujet_stage_diagnostic_data_fphp.pdf

Jul
3
Sun
2016
Ecole d’été Peyresq 2016 de Traitement du signal et des images
Jul 3 – Jul 9 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Modèles probabilistes et inférence en signal et image

Présentation :

Le GRETSI et le GdR ISIS organisent depuis 2006 une École d’Été annuelle en traitement du signal et des images. Ouverte à toute personne intéressée (académique ou industrielle), elle a pour but de présenter une synthèse ainsi que les avancées les plus récentes dans un thème de recherche d’actualité. Il s’agit de 5 journées de cours donnés en français par des spécialistes renommés.

Du : 2016-07-03

Au : 2016-07-09

Lieu : Cette École d’Été a pour cadre le magnifique village de Peyresq, perché à 1500 mètres d’altitude sur un éperon rocheux des Alpes de Haute Provence (http://www.peiresc.org)

Site Web : http://www.gretsi.fr/peyresq16/

Sixth European Business Intelligence Summer School (eBISS 2016)
Jul 3 – Jul 8 all-day

Annonce en lien avec l’Action/le Réseau : Formation

Thème :

Informatique décisionnelle

Présentation :

Cette école d’été est destinée à des étudiants et des chercheurs. Elle fait intervenir des chercheurs ou industriels leaders dans le domaine de l’informatique décisionnelle et représente une occasion unique pour les participants d’échanger autour des thèmes théoriques et pratiques ayant trait au développement d’applications décisionnelles. Cette école comprend des cours et des présentations, mais constitue également un lieu privilégié pour des rencontres entre chercheurs confirmés et jeunes chercheurs. A cette fin, il est demandé aux participants de préparer et de présenter un poster décrivant leurs activités de recherche. Les supports des cours dispensés sont visibles sur le site internet de l’école, et un numéro spécial de revue contenant les cours de l’école sera publié dans la série Lecture Notes in Business Information Processing (LNBIP) chez Springer.

Il s’agit de la sixième édition de cette école d’été (les éditions précédentes peuvent être consultées sur le site : http://cs.ulb.ac.be/conferences/ebiss.html). Cette école est associée au programme de Master Erasmus Mundus IT4BI dont l’université de Tours est partenaire. En plus des orateurs, une cinquantaine de participants payants sont attendus, dont les étudiants de première année du Master IT4BI, la participation à l’école étant obligatoire car partie intégrante du programme.

Du : 2016-07-03

Au : 2016-07-08

Lieu : Tours, campus de Grandmont

Site Web :http://cs.ulb.ac.be/conferences/ebiss2016/

Jun
5
Sun
2016
Masses de données distribuées (MDD)
Jun 5 – Jun 9 all-day

Annonce en lien avec l’Action/le Réseau : Formation et doctorant

Thème :

Gestion et analyse de données massives, protection de la vie privée

Présentation :

L’objectif de l’école thématique MDD est de former les chercheurs de notre communauté, en particulier nos doctorant(e)s, aux défis spécifiques liés aux méga-données, en particulier scientifiques. Ces défis sont l’interrogation et l’analyse de données à grande échelle (analyse exacte ou approchée), la gestion, le suivi et la reproductibilité de processus de calculs complexes (workflows), et la protection de la vie privée en présence de traces massives.

Du : 2016-06-05

Au : 2016-06-10

Lieu : Urrugne (Pyrénées-Atlantiques)

Site Web :http://cedric.cnam.fr/summer-school/MDD2016/

Apr
30
Sat
2016
A data flux comparison among different Distributed Frequents Itemset Mining Algorithms over MapReduce platform
Apr 30 – May 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : ETIS – ENSEA / Université de Cergy-Pontoise / CNRS
Durée : 6 mois
Contact : Tao-Yuan.Jen@u-cergy.fr
Date limite de publication : 2016-04-30

Contexte :
Object: Internship Master / Engineer

Place: Paris Area, Université de Cergy-Pontoise, Cergy-Pontoise, France

Subject: A data flux comparison among different Distributed Frequents Itemset Mining Algorithms over MapReduce platform

Period: 6 months internship from April/May to September/October 2015 – approx. 508€/month

For further information on the internship subject please contact:
Tao Yuan Jen

Sujet :
Description: This internship subject deals with two research fields: Data Mining and Cloud Computing.

The objective of the internship is
(1) to implement or find the source code for the following Distributed Frequents Itemset Mining Algorithms over MapReduce platform :
MRApriori algorithm, IMRApriori algorithm, SPC and DPC algorithms, DPFPM algorithm, Mreclat algorithm, and Apriori-V algorithm.
(2) to compare the mining performance, the quantity of data distributed in each data node before the mining work and the quantity of data communicated among each node in the mining work among these algorithms.
(3) to develop or find the source code for a vertical data layout bitmap converter, if it is necessary, for the preparation of data sets in different experiences.
(4) to study and implement, if it’s possible with the time constraint, some improvements for Apriori-V algorithm.

This internship will contribute in order to:
1. understand different waysof working of the main types of Distributed Frequents Itemset Mining Algorithms over MapReduce platform;
2. clarify the utilisations and the flux of different data types in Distributed Frequents Itemset Mining Algorithms over MapReduce platform;
3. plan our future development and improvements for our ongoing studies related to Apriori-V algorithm in this domain.

The internship is available immediately, will take place at the ETIS Lab (ENSEA / UCP / CNRS UMR 8051) located at Cergy Pontoise in the Paris area and will last for 6 months.

For further information on the internship subject please contact:
Tao Yuan Jen

Profil du candidat :
Engineer/Master2

Formation et compétences requises :
The candidate should be familiar to data mining techniques and the MapReduce platform.

Adresse d’emploi :
2 avenue Adolphe-Chauvin
BP 222, Pontoise
95302 Cergy-Pontoise cedex

Document attaché :

Stage Master2R : Privacy in mining of semantic trajectories among moving objects
Apr 30 – May 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : ETIS – ENSEA / Université de Cergy-Pontoise / CNRS
Durée : 6 mois
Contact : claudia.marinica@u-cergy.fr
Date limite de publication : 2016-04-30

Contexte :
Object: Internship Master / Engineer

Place: Paris Area, ETIS Lab, Université de Cergy-Pontoise, Cergy-Pontoise, France (http://www-etis.ensea.fr/)

Subject: Privacy in mining of semantic trajectories among moving objects

Period: 6 months internship from April/May to September/October 2015 – approx. 508€/month

Supervision:
– Dimitris Kotzinos, PU, UCP, Dimitrios.Kotzinos@u-cergy.fr
– Claudia Marinica, MCF, UCP, Claudia.Marinica@u-cergy.fr

Applications (with CV and motivation letter) should be sent to Claudia.Marinica@u-cergy.fr .

Sujet :
Description: Trajectory pattern mining proposes to extract from location-like data frequent movement/mobility behaviour that characterise the individuals. Significant advances have been made with regard to knowledge discovery starting with the pioneer work of Giannotti et al. in 2009 [2], so lately the main interest in this research area went from efficient trajectory pattern mining to the possible risks that the discovered movement behaviour can bring to individual privacy (e.g. GeoKDD project [1]).
On the other side, the semantic web is a research area aiming to provide an easy way to find, share, reuse, etc information. To this end, it proposed a set of languages for knowledge representation, but also defines important notion such as “ontologies” permitting to represent domain semantics.
First works combining semantic web and trajectory analysis propose either to use ontologies in order to understand user’s behaviour [3] or to use taxonomies in order to improve user’s privacy [4]. Moreover, we would like to assess the threats that the addition of semantics will bring to the users’ privacy through the provision of more detailed information for the movements.
The goal of this internship is:
(1) first to study the existing methods combining semantic web and trajectory analysis in order to (mainly) improve user’s privacy;
(2) second to propose a new approach for using semantic information on available trajectories so as to improve the overall understanding of the trajectories themselves, while offering enhanced privacy considerations.

Applications (with CV and motivation letter) should be sent to Claudia.Marinica@u-cergy.fr .

[1] Mirco Nanni, Roberto Trasarti, Chiara Renso, Fosca Giannotti, and Dino Pedreschi (2010) Advanced knowledge discovery on movement data with the GeoPKDD system. EDBT, ACM International Conference Proceeding Series, page 693-696. ACM.
[2] Fosca Giannotti, Mirco Nanni, Fabio Pinelli, and Dino Pedreschi. 2007. Trajectory pattern mining. In Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD ’07). ACM, New York, NY, USA, 330-339.
[2] C. Renso, M. Baglioni, J. A. F. de Macˆedo, R. Trasarti, and M. Wachowicz. How you move reveals who you are: understanding human behavior by analyzing trajectory data. Knowl. Inf. Syst., 37(2):331–362, 2013.
[2] Anna Monreale, Roberto Trasarti, Chiara Renso, Dino Pedreschi, and Vania Bogorny. 2010. Preserving privacy in semantic-rich trajectories of human mobility. 3rd ACM SIGSPATIAL International Workshop on Security and Privacy in GIS and LBS. 47-54.

Profil du candidat :
Knowledge in data mining techniques and programming skills are required.

Formation et compétences requises :
Knowledge in data mining techniques and programming skills are required.

Adresse d’emploi :
Laboratoire ETIS, UCP, 2 Avenue Adolphe Chauvin, 95300, Cergy-Pontoise

Document attaché :

Apr
1
Fri
2016
Offre de stage – Master 2 : conception de profil utilisateur à partir de traces de navigation
Apr 1 – Apr 2 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LINA/POLYTECHNANTES
Durée : 6 mois
Contact : antoine.pigeau@univ-nantes.fr
Date limite de publication : 2016-04-01

Contexte :
The Open Class Room website provides online courses in various area, from art and culture to computer science. A course is composed of text, video or ebook that users browse/read/download after a registration process. The validation of a course is carried out thanks to exercises and quizzes.
A validation of a course may result in a certificate if the user chooses a premium registration.

The success of Open Class Room enables the availability of many user profiles with their associated traces on the courses:
• the personal information are provided on the registration process. Each user provides his name, his gender, his skills, his grade, his job and the courses taken;
• the traces contain all the actions carried out by the users on both the client and server sides.

Accesses to each course, parts of a course or a chapter, quiz and exercise are then recorded for each user. The goal of the project is to study the reasons for the failure or the success of the students.
Providing such an answer is of much interest for both the course designers and the managers of the Open Class Room website. The objective of such a study is to improve the design of the courses
and to be capable of anticipating the failure of a student

Sujet :
Le détail du sujet est disponible sur la page “positions>Master Topics” du site de l’équipe Duke:
http://duke.univ-nantes.fr/wp-content/uploads/2015/12/StageHubble-DUKe.pdf

The objective of the internship is the modelling of user profiles based on their personal information and on the way they browse/learn a course.

Our input data are the personal information of the user and his traces, and the output is a set of user’s profiles. Such a profile will summarize the background, the interests and the learning
methods of a user (or a group of users).

The following research area will be studied to generate the profiles:
• process modelling : a set of user traces on a same course is summarized to emphasized
the main step to learn a course, from the beginning to the validation exercises;
• pattern mining and sequential pattern mining : search for sequence similarities on a specific course, or a set of courses. For instance, a pattern obtained from users with high marks could be pertinent to motivate a good practice;
• user clustering: search for groups of users with similar backgrounds and a similar way to browse/learn the courses. The clustering could be obtained from the two previous points.
Group of users would be defined with a similar process or similar frequent patterns.

Each data mining process can be applied on a subset of users, defined with specific values of the personal user’s information, the skills and grades for example. The objective here will be to
study the correlations between set of users with different properties.

Profil du candidat :
Les seules contraintes concernent la formation et les compétences.

Formation et compétences requises :
Niveau de formation demandé : Master 2

Le candidat doit avoir des compétences dans les domaines suivants:
– Clustering
– pattern mining
– process modelling

Adresse d’emploi :
PolytechNantes

Document attaché : stagehubble-duke.pdf

Mar
31
Thu
2016
Repairing SQL queries to retrieve missing answers
Mar 31 – Apr 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : ETIS
Durée : 6 mois
Contact : Dimitrios.Kotzinos@u-cergy.fr
Date limite de publication : 2016-03-31

Contexte :
The internship will take place in the MIDI team of the ETIS Lab (ENSEA / UCP / CNRS UMR 8051) based in the area of Cergy Pontoise, just outside Paris.

The internship will have a net salary of around 508 euros/month and a duration of up to 6 months, starting on March or April 2017.

Interested candidates are requested to send a detailed CV, one recommendation letter and university/master transcripts to Katerina Tzompanaki at atzompan@u-cergy.fr.

Sujet :
Repairing SQL queries to retrieve missing answers.

The increasing load of data produced nowadays is coupled with an increasing need for complex data transformations that developers design in order to process or integrate these data. These transformations, commonly specified declaratively in the form of queries, may fail to produce all the expected results leading to what we call missing data. Understanding the reasons why missing data occur, and how the original query can be modified in order to overcome these reasons, can be tricky if manually performed. In the context of relational databases, [1] proposed a novel way (Why-Not polynomials) to explain missing data given a certain query. Consequently, [3] described a first approach of utilizing Why-Not polynomials in order to effectively repair the query, while [2] shows a prototype implementing these algorithms. As the query repairing phase of the framework heavily depends on the size of the database and the complexity of the Why-Not polynomial, a more efficient solution needs to be devised, either by improving the existing algorithm or by proposing a new one. This will be the focus of the master internship.

More specifically, the candidate is expected to

1) Verify/Identify the bottlenecks of the existing solution, algorithmically and experimentally.
2) Propose improvements of the algorithm.
3) Implement the new improved algorithm and experimentally prove its efficiency.

References

[1] Bidoit, Nicole, Melanie Herschel, and Aikaterini Tzompanaki. “Efficient computation of polynomial explanations of why-not questions.” Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. ACM, 2015.
[2] Bidoit, Nicole, Melanie Herschel, and Katerina Tzompanaki. “EFQ: Why-not answer polynomials in action.” Proceedings of the VLDB Endowment 8.12, 2015.
[3] Bidoit, Nicole, Melanie Herschel, and Katerina Tzompanaki. “Refining SQL Queries based on Why-Not Polynomials.” 8th USENIX Workshop on the Theory and Practice of Provenance (TaPP 2016). 2016.

Profil du candidat :
The candidate shoukd be an M2 level student.

Formation et compétences requises :
The candidate will have solid knowledge of the Java programming language. Familiarity with SQL query language and relational databases is desired.

Adresse d’emploi :
MIDI team
ETIS Lab (ENSEA / UCP / CNRS UMR 8051)
Site St. Martin
2 Av. Adolph Chauvin
95000 Pontoise

Document attaché :

Mar
1
Tue
2016
Stage de Master 2 ou Ecole d\’ingénieur Bases de données distribuées sur architecture Big Data.
Mar 1 – Feb 29 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : CEA LIST (DM2I/LADIS)
Durée : 6 mois
Contact : lorene.allano@cea.fr
Date limite de publication : 2016-03-01

Contexte :
Le CEA LIST (http://www-list.cea.fr/) est un centre d’innovation et de recherche technologique atour aux nouvelles technologies de l’information et de la communication. Le CEA LIST est basé sur le plateau de Saclay et appartient à l’université Paris Saclay. Au sein du CEA LIST notre laboratoire est dédié aux Data Analytics et au Big Data.

Sujet :
Bases de données distribuées sur architecture Big Data.

Pour ce stage de Master 2, nous recherchons un candidat ingénieur R&D autonome et motivé par les nouvelles technologies et les architectures Big Data pour développer un environnement de base de données distribuées dans le cadre d’un projet de recherche translationelle. L’objectif de ce stage sera dans un premier de faire un benchmark des systèmes de gestion de bases de données distribuées et NoSQL et ensuite de mettre en œuvre le système adapté au cahier des charges du projet sur notre architecture Big Data. Le développement sera de préférence réalisé en Python.

Profil du candidat :
étudiant en master 2 ou dernière année d’école d’ingénieur profil Big Data.

Formation et compétences requises :
Python, Spark, Hadoop, NoSQL

Adresse d’emploi :
centre de Saclay – Digiteo Labs
DM2I / LADIS – PC 192
91191 Gif sur Yvette Cedex
http://www-list.cea.fr/

Document attaché :

Feb
7
Sun
2016
Appel à sujets de stage L3 ENS de Lyon
Feb 7 – Feb 6 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : laboratoire d’informatique
Durée : 6 semaines
Contact : colin.riba@ens-lyon.fr
Date limite de publication : 2016-02-07

Contexte :
À l’issue de leur première année de cours (L3), les élèves en
informatique de l’École Normale Supérieure de Lyon doivent
effectuer un stage de six semaines (quelque part entre
juin et fin août) dans une équipe de recherche universitaire ou
associée. Nous vous sollicitons pour proposer un sujet de stage et/ou
diffuser cette demande autour de vous.

Sujet :
Les informations concernant ces stages sont disponibles en ligne :
http://www.ens-lyon.fr/DI/stageL3/

La soumission de propositions de stages s’effectue également en ligne :
http://www.ens-lyon.fr/DI/stageL3/submit.php

– Ouverture : 15 décembre 2015
– Fermeture : 7 février 2016

Profil du candidat :
N’hésitez pas à faire suivre cette information à des collègues qui
peuvent être intéressés.

En vous remerciant de l’aide que vous pouvez apporter à l’organisation de ces stages,

Bien cordialement,

Colin Riba

Formation et compétences requises :
NA

Adresse d’emploi :
NA

Document attaché :

Oct
18
Sun
2015
Biophysique: Mesure et modélisation en biologie
Oct 18 – Oct 23 all-day

Annonce en lien avec l’Action/le Réseau : à l’initiative de la SFB et de la SFµ

Thème :

biophysique, traitement de données

Présentation :

Recent progress in instruments used in modern biology (microscopies, spectroscopies, …), have deeply impacted our vision of life. Current instruments enable the observation of complex systems in larger time and space scales. These observations generate very large datasets, whose analysis involves new algorithms and modelling approaches. In this context, elaborating novel models and hypothesis to explain fundamental biological mechanisms requires to reconsider our current way to design experimental setups, including most recent sampling schemes or efficient noise reduction procedures.

The objective of the school is to provide attendants with tools on multimodal and multi-scale data acquisition, quantification, analysis, and modelling, to elaborate novel approaches describing living systems. To this purpose, the school will gather researchers and teachers from different fields (measurements in biophysics, signal analysis and quantification and modeling of biological systems). The school will include introductory courses on spectroscopies and image acquisition methods together with conventional processing methods. They will be followed by advanced courses on recent data processing methods, such as compressed sensing, and the illustration of their applications in different fields such as mass-spectrometry, NMR or fluorescence imaging.

Du : 2015-10-18

Au : 2015-10-23

Lieu : Ecole de physique des Houches – Les Houches

Site Web :http://memobio2015.u-strasbg.fr/index.php

Oct
11
Sun
2015
School of Astrostatistics 2015: Clustering and Classification
Oct 11 – Oct 15 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Astrostatistique

Présentation :

This second session of the School of Statistics for Astrophysics is devoted to clustering and classification. This School is a Ecole Thématique du CNRS.

Grouping objects obtained from the astronomical observations into distinct categories has always been a necessity imposed by their vast diversity. This is the case for stars, galaxies, asteroids, supernova, active galactic nuclei, gamma-ray bursts and many others. This clustering by similarities (unsupervised classification) is a prerequisite to any physical modelisation, and (supervised) classification a requirement for observations and databases.

The objective of the School of Astrostatistics 2015 is to train astronomers to the use of a large range of statistical and algorithmic approaches of unsupervised and supervised classification, from the most basic to the state-of-the-art ones, including the spatial clustering, the clustering of variables and the graphical methods.

Du : 2015-10-11

Au : 2015-10-16

Lieu : Ecole de Physique des Houches (France)

Site Web :http://stat4astro2015.sciencesconf.org/

Sep
14
Mon
2015
Ecole d’été : Machine Learning
Sep 14 – Sep 17 all-day

Annonce en lien avec l’Action/le Réseau :

Thème :

machine learning: apprentissage par renforcement, optimisation, recherche d’information et apprentissage de dictionnaires

Présentation :

Cette école d’été s’inscrit dans le cadre du Trimestre Thématique dédié au Machine Learning du Labex CIMI. Ce projet commun aux laboratoires d’informatique et de mathématiques de l’Université Paul Sabatier vise à améliorer les compétences communes et à encourager les collaborations; les cours seront de niveau doctoral, mais ouvert et accessible tant aux étudiants de Master 2 qu’aux collègues désireux d’élargir leurs connaissances.

Du : 2015-09-14

Au : 2015-09-18

Lieu : Université Paul Sabatier Toulouse 3

Site Web : http://www.irit.fr/cimi-machine-learning/node/1

Aug
31
Mon
2015
EDBT summer school 2015
Aug 31 – Sep 4 all-day

Ecole en lien avec l’Action /le Réseau : Ecole européenne pluri-annuelle sur la Gestion des Masses de données

Thème :
Graph Data Management

Présentation :
The theme for the 12th EDBT Summer School is Graph Data Management.

The area of graph data management has recently seen many exciting and impressive developments. It addresses one of the great business trends of today: leveraging complex and dynamic relationships to generate insight and competitive advantage. It is crucial for such different goals as understanding relationships between users of social media, customers, elements in a telephone or data center network, entertainment producers and consumers, or genes and proteins. As part of the NoSQL movement it provides us with new powerful technologies and means for storing, processing and analyzing data. It also is a key technology for supporting the Semantic Web and Linked Open Data.

As a consequence there has been an impressive flurry of new systems for graph storage and graph processing, both in academia and industry, and covering a wide spectrum of use cases, from enterprise-scale datasets to web-scale datasets. Moreover, this has been accompanied by exciting new research, developing further the foundations of efficient graph processing, as well as exploring new application areas where these can be successfully applied. It is therefore an opportune moment to organize a summer school on this topic to present the current developments and allow PhD students and other scientists to benefit from these in their research.

Du : 2015-08-31
Au : 2015-09-04
Lieu : Palamos, Spain

Site web : http://edbt2015school.win.tue.nl

Jun
28
Sun
2015
FOCOLISE : FOUILLE COLLABORATIVE INCREMENTALE DE MASSES DE DONNEES MULTISOURCES MULTITEMPORELLES : APPLICATION EN SCIENCES DE L’ENVIRONNEMENT
Jun 28 – Jul 2 all-day

Annonce en lien avec l’Action /le Réseau : aucun

Thème :
FOUILLE DE DONNEES TEMPORELLES, CONNAISSANCES et ENVIRONNEMENT

Présentation :
L’École Thématique, centrée sur le thème de la fouille collaborative et incrémentale de masses de données spatio-temporelles se déclinera en 5 journées thématiques. Chaque thème sera abordé selon le point de vue de l’informatique et du traitement de données enrichi de celui des sciences de l’environnement afin de favoriser un maximum de discussions, et à terme des collaborations, entre les communautés présentes :
– Sensibilisation au domaine de la fouille de données. Sensibilisation à la problématique de l’analyse de données en sciences de l’environnement.
– Aspects temporels de la fouille de données.
– Approches collaboratives et incrémentalité en fouille de données.
– Prise en compte du domaine d’application dans les processus de fouille.
Les challenges de la fouille de données collaborative incrémentale et les besoins applicatifs en sciences de l’environnement.

Du : 28/06/2015
Au : 02/07/2015
Lieu : Strasbourg

Site web : http://focolise.sciencesconf.org/

 

 

Autres Ecoles

Dates Titre Lieu Site web