Liste des Ecoles Thématiques liées au GdR MaDICS
Ecoles labellisées/soutenues par MaDICS
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : LIUM, équipe LST
Durée : 6 mois
Contact : nicolas.dugue@univ-lemans.fr
Date limite de publication : 2017-05-01
Contexte :
Le projet #neo s’intéresse à la détection automatique de néologismes en exploitant de grands corpus textuels. En particulier, il s’agit de détecter des mots qui changent de sens ou dont un nouveau sens apparaît. Dans ce stage, nous souhaitons fournir à ce projet un moyen d’évaluer les méthodes de détection automatique en créant des emph{modèles} de corpus artificiellement générés. Ces modèles devront ressembler le plus possible à des corpus réels. Par ailleurs, ils devront nous permettre d’introduire nous mêmes des changements de sens, de façon à tester les méthodes de détection.
Sujet :
Les objectifs du stage sont ainsi :
• de confirmer les propriétés des réseaux sur les corpus du projet #neo ;
• de modéliser les changements dans ces réseaux dans le temps ;
• de se baser sur l’état de l’art et les modèles de génération de graphe pour proposer et développer une approche de génération artificielle de modèles de corpus.
Une version plus détaillée du sujet est accessible sur le PDF.
Profil du candidat :
Master 2 :
– Programmation Python (ou Java) ;
– Intérêt pour les graphes ;
– Intérêt pour le Traitement de la langue.
Formation et compétences requises :
Master 2 :
– Programmation Python (ou Java) ;
– Intérêt pour les graphes ;
– Intérêt pour le Traitement de la langue.
Adresse d’emploi :
Le Mans, LIUM, équipe LST
Document attaché : stage-une-approche.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : IFP ENERGIES NOUVELLES
Durée : 5 mois
Contact : laurent.duval@ifpen.fr
Date limite de publication : 2017-04-10
Contexte :
Le domaine de l’analyse de données complexes (science des données) s’intéresse notamment à l’extraction d’indicateurs pertinents, pour la réduction de dimension, la comparaison, la classification des données. Initialement basées sur des descripteurs (features) relativement physiques, spécifiques à l’application, de nouvelles méthodes apparaissent, basées sur des descripteurs numériques plus génériques et potentiellement multiéchelle, et des bases d’information pouvant servir à l’apprentissage ou la classification. Des exemples se trouvent dans les techniques de type SIFT (scale-invariant feature transform) et analogues (ORB, SURF), dans l’apprentissage non-supervisé de descripteurs, en apprentissage profond (deep learning). Ce stage s’intéresse spécifiquement à la gamme de techniques dites scattering transform (S. Mallat et al.) et aux techniques de classification associées. Elle permet d’obtenir des représentations de signaux, d’images ou de graphes présentant des propriétés d’invariance relatives à certaines transformations affectant les données : translation, rotation, échelle… Ses performances sont bien étudiées sur des données classiques (signaux audio, bases d’images, reconnaissance de chiffres manuscrits).
Sujet :
Ce stage s’intéresse à la mise en œuvre de ces méthodes sur des types de données moins étudiés : identification de la correspondance la plus proche d’une « image candidate » dans une base de données d’images modélisées du sous-sol et extraction d’empreintes pertinentes de signaux spectrométriques 1D issus de composés chimiques complexes pour l’apprentissage de propriétés physico-chimiques macroscopiques. Dans le premier cas, le défi réside dans l’échelle et la nature distincte des images candidates et modélisées, les secondes correspondant à une vision simplifiée des premières (proches de « sketches » ou cartoons »). Dans le second cas, la nature des signaux, formés d’une superposition de plusieurs centaines de pics (positifs), est de nature différente des informations traitées classiquement par les transformées en scattering. Une focalisation sur une des deux applications est envisagée, en fonction des succès ou difficultés rencontrés.
Profil du candidat :
Niveau 3e année élève ingénieur et/ou master
Formation et compétences requises :
Informatique/algorithmique, traitement de signal/image, statistiques, apprentissage automatique, mathématiques appliquées
Adresse d’emploi :
Rueil-Malmaison (92)
Document attaché : ifpen_stage-internship-2017-master-data-science-scattering-transform-english.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : Inria Lille, CRIStAL
Durée : 6 mois
Contact : philippe.preux@univ-lille.fr
Date limite de publication : 2017-03-01
Contexte :
Le sujet se situe à l’interface entre deux domaines de l’informatique : génie logiciel et apprentissage automatique.
Cette problématique est étudiée depuis plusieurs années dans une collaboration entre les équipes Spirals et SequeL de Inria Lille / CRIStAL, par Martin Monperrus et Philippe Preux.
La réalisation du sujet demande à la fois un travail de recherche fondamental et de développement logiciel.
Elle demande la manipulation de concepts de théorie des graphes, développement logiciel et de statistiques.
Sujet :
Modélisation de l’évolution de logiciels
voir http://www.grappa.univ-lille3.fr/~ppreux/prje/m2info-a.php
Profil du candidat :
M1 d’informatique acquis, M2 en cours.
– fort attrait pour la théorie des graphes, l’algorithmique en général.
– curiosité, autonomie, capacité à écouter et à travailler en équipe.
Formation et compétences requises :
– capable de développer sans difficulté du code (java, C++, C, R, python)
– lecture de l’anglais.
– des notions (le plus possible) de statistiques, voire de mathématiques appliquées (en plus de la formation en informatique)
Adresse d’emploi :
Centre Inria
Villeneuve d’Ascq
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : irstea
Durée : 5 mois
Contact : sandro.bimonte@irstea.fr
Date limite de publication : 2017-03
Contexte :
Data Warehouse, Big Data et données agro-climatiques
Sujet :
Etude et implémentation d’une solution Spatial Big Data
Warehouse : Application aux données agro-climatologiques
Profil du candidat :
formation Big Data
Formation et compétences requises :
Les compétences en informatique recherchées sont :
– Entrepôts de données, et OLAP (i.e Mondrian)
-Technologies Big Data (bases de données – ex : Cassandra, MongoDB, etc. – plateformes –ex :
Hadoop)
-Java
-Les compétences en Systèmes d’Information Géographique seront considérées comme un plus
Adresse d’emploi :
9 av blaise pascal, Aubiere (clermont ferrand)
Document attaché : Offre-de-Stage-20183.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : UMR 6281- Université de Technologie de Troyes
Durée : 6 mois
Contact : babiga.birregah@utt.fr
Date limite de publication : 2017-02-15
Contexte :
L’analyse des réseaux sociaux pour la gestion de crise est souvent limitée par la prise en compte les limitations des API. Par exemple dans le cadre d’une stratégie de collecte à large spectre lors d’une crise généralisée il est souvent difficile de suivre simultanément toutes les thématiques tout en maîtrisant l’évolution des groupes de mots clés et thématiques dans les échanges. De plus l’émergence de nouvelles thématiques peut influencer la richesse et la pertinence des messages collectés.
Il est donc important de construire un moteur qui automatise (i) non seulement le suivi au fil de l’eau (et en ligne) de l’évolution des mots clés, (ii) mais aussi la détection de thématiques émergentes pour garantir la pertinence des paramètres de la collecte en cours.
Sujet :
Le ou la candidat(e) retenu(e) doit proposer une moteur de collecte large spectre de tweets capable de tourner sur une longue période sans interruption tout en adaptant les mots clés selon la trajectoire que prend l’événement en cours. Pour cela il ou elle devra mettre en place un algorithme de détection de thématiques d’intérêt qui permet de suggérer automatiquement des termes émergents pour adapter la collecte.
Profil du candidat :
Profil: Mathématiques/Inforatiques
Dossier de candidature : Le dossier de candidature doit être transmis uniquement par mail, à l’adresse suivante : babiga.birregah@utt.fr, en ajoutant dans l’objet la référence DL04- 1617.
Il doit contenir les pièces suivantes, sous format PDF:
– Une lettre de motivation indiquant clairement les expériences (stages, projets, etc.) en relation avec le stage
– Un CV contenant la liste des publications et autres réalisations (projets, logiciels, etc.)
Formation et compétences requises :
Compétences :
Gestion de base de données : PostgreSQL
Langages : Python / des connaissances en Java seraient un plus.
Bon relationnel et travail en équipe. Vous aurez à travailler avec les équipes du BRGM qui travaillent sur le suivi des catastrophes naturelles.
Poste à pourvoir : Stage Ingénieur/Master 2/Mastère Spécialisé
Adresse d’emploi :
Affectation structurelle : Université de Technologie de Troyes/ Equipe LM2S (UMR 6281)
Durée : 6 mois
Date de prise de fonction : Février 2017
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : ForumPHP, 27 rue de la Rochefoucauld 75009 PARIS (2è étage)
Durée : 6 mois
Contact : veronique[ dot ]guillaumin[ @ ]forumhabitatprive[ dot ]org
Date limite de publication : 2017-02-10
Contexte :
Le Forum des Politiques de l’habitat privé (Forum PHP) est une association nationale créée en 2012. C’est un réseau de réseaux, un centre de ressources et une communauté de professionnels de l’habitat privé à destination principalement des collectivités territoriales.
De nombreuses collectivités territoriales sont en plein questionnement sur les opportunités (voire les limites) de notions telles que l’open-data, le big-data, le self-data et la constitution d’entrepôt de données et de data lakes. En matière de politique locale de l’habitat (compétence intercommunale), le rapport d’Etalab 2015 rend compte des données habituellement utilisées et sources mobilisées pour élaborer un diagnostic ou un observatoire de l’habitat (données relatives au parc, aux habitants, au marché de l’habitat, …).
Dans votre travail vous aurez des interactions avec des acteurs tels que les représentants des réseaux membres de l’association lors des réunions (mensuelles à trimestrielles) des 5 groupes de travail thématiques, du comité technique trimestriel, du conseil d’administration trimestriel
Sujet :
Vous travaillerez sur la modélisation des données et sur la conception d’un outil pour le diagnostic data d’un territoire afin de proposer une vision 360° pour l’aide à la décision pour les acteurs des politiques de l’habitat. Ce travail reposera spécifiquement sur la construction d’indicateurs pertinents, de leur présentation sous forme de tableau de bord et de la valorisation au travers de modules de visualisation sur des preuves de concepts (POC) répondant à la problématique d’enrichissement des politiques locales de l’habitat.
Il est donc proposé de partir d’une politique publique, l’habitat, compétence intercommunale, pour montrer le champ des possibles.
1- Proposer et valider une approche méthodologique pour dresser l’inventaire des données présentes sur un territoire, urbain ou rural, tous canaux confondus.
2- Etablir une cartographie producteurs/consommateurs de ces données mettant en lumière le cycle qui peut s’établir de la donnée brute à la valeur en passant éventuellement par une étape d’enrichissement et/ou augmentation.
3- Construire des cartes de maturité data pour la mesure du potentiel d’innovation orientée sur les données dans un territoire.
Profil du candidat :
Science de l’information
Gestion des connaissances
Traitement de données
Formation et compétences requises :
Informatique, Système d’information
Adresse d’emploi :
Affectation structurelle : ForumPHP, 27 rue de la Rochefoucauld 75009 PARIS (2è étage)
Contact : Mme Véronique GUILLAUMIN veronique[ dot ]guillaumin[ @ ]forumhabitatprive[ dot ]org
Document attaché : sujet_stage_diagnostic_data_fphp.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Thème :
Modèles probabilistes et inférence en signal et image
Présentation :
Le GRETSI et le GdR ISIS organisent depuis 2006 une École d’Été annuelle en traitement du signal et des images. Ouverte à toute personne intéressée (académique ou industrielle), elle a pour but de présenter une synthèse ainsi que les avancées les plus récentes dans un thème de recherche d’actualité. Il s’agit de 5 journées de cours donnés en français par des spécialistes renommés.
Du : 2016-07-03
Au : 2016-07-09
Lieu : Cette École d’Été a pour cadre le magnifique village de Peyresq, perché à 1500 mètres d’altitude sur un éperon rocheux des Alpes de Haute Provence (http://www.peiresc.org)
Site Web : http://www.gretsi.fr/peyresq16/
Annonce en lien avec l’Action/le Réseau : Formation
Thème :
Informatique décisionnelle
Présentation :
Cette école d’été est destinée à des étudiants et des chercheurs. Elle fait intervenir des chercheurs ou industriels leaders dans le domaine de l’informatique décisionnelle et représente une occasion unique pour les participants d’échanger autour des thèmes théoriques et pratiques ayant trait au développement d’applications décisionnelles. Cette école comprend des cours et des présentations, mais constitue également un lieu privilégié pour des rencontres entre chercheurs confirmés et jeunes chercheurs. A cette fin, il est demandé aux participants de préparer et de présenter un poster décrivant leurs activités de recherche. Les supports des cours dispensés sont visibles sur le site internet de l’école, et un numéro spécial de revue contenant les cours de l’école sera publié dans la série Lecture Notes in Business Information Processing (LNBIP) chez Springer.
Il s’agit de la sixième édition de cette école d’été (les éditions précédentes peuvent être consultées sur le site : http://cs.ulb.ac.be/conferences/ebiss.html). Cette école est associée au programme de Master Erasmus Mundus IT4BI dont l’université de Tours est partenaire. En plus des orateurs, une cinquantaine de participants payants sont attendus, dont les étudiants de première année du Master IT4BI, la participation à l’école étant obligatoire car partie intégrante du programme.
Du : 2016-07-03
Au : 2016-07-08
Lieu : Tours, campus de Grandmont
Site Web :http://cs.ulb.ac.be/conferences/ebiss2016/
Annonce en lien avec l’Action/le Réseau : Formation et doctorant
Thème :
Gestion et analyse de données massives, protection de la vie privée
Présentation :
L’objectif de l’école thématique MDD est de former les chercheurs de notre communauté, en particulier nos doctorant(e)s, aux défis spécifiques liés aux méga-données, en particulier scientifiques. Ces défis sont l’interrogation et l’analyse de données à grande échelle (analyse exacte ou approchée), la gestion, le suivi et la reproductibilité de processus de calculs complexes (workflows), et la protection de la vie privée en présence de traces massives.
Du : 2016-06-05
Au : 2016-06-10
Lieu : Urrugne (Pyrénées-Atlantiques)
Site Web :http://cedric.cnam.fr/summer-school/MDD2016/
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : ETIS – ENSEA / Université de Cergy-Pontoise / CNRS
Durée : 6 mois
Contact : Tao-Yuan.Jen@u-cergy.fr
Date limite de publication : 2016-04-30
Contexte :
Object: Internship Master / Engineer
Place: Paris Area, Université de Cergy-Pontoise, Cergy-Pontoise, France
Subject: A data flux comparison among different Distributed Frequents Itemset Mining Algorithms over MapReduce platform
Period: 6 months internship from April/May to September/October 2015 – approx. 508€/month
For further information on the internship subject please contact:
Tao Yuan Jen
Sujet :
Description: This internship subject deals with two research fields: Data Mining and Cloud Computing.
The objective of the internship is
(1) to implement or find the source code for the following Distributed Frequents Itemset Mining Algorithms over MapReduce platform :
MRApriori algorithm, IMRApriori algorithm, SPC and DPC algorithms, DPFPM algorithm, Mreclat algorithm, and Apriori-V algorithm.
(2) to compare the mining performance, the quantity of data distributed in each data node before the mining work and the quantity of data communicated among each node in the mining work among these algorithms.
(3) to develop or find the source code for a vertical data layout bitmap converter, if it is necessary, for the preparation of data sets in different experiences.
(4) to study and implement, if it’s possible with the time constraint, some improvements for Apriori-V algorithm.
This internship will contribute in order to:
1. understand different waysof working of the main types of Distributed Frequents Itemset Mining Algorithms over MapReduce platform;
2. clarify the utilisations and the flux of different data types in Distributed Frequents Itemset Mining Algorithms over MapReduce platform;
3. plan our future development and improvements for our ongoing studies related to Apriori-V algorithm in this domain.
The internship is available immediately, will take place at the ETIS Lab (ENSEA / UCP / CNRS UMR 8051) located at Cergy Pontoise in the Paris area and will last for 6 months.
For further information on the internship subject please contact:
Tao Yuan Jen
Profil du candidat :
Engineer/Master2
Formation et compétences requises :
The candidate should be familiar to data mining techniques and the MapReduce platform.
Adresse d’emploi :
2 avenue Adolphe-Chauvin
BP 222, Pontoise
95302 Cergy-Pontoise cedex
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : ETIS – ENSEA / Université de Cergy-Pontoise / CNRS
Durée : 6 mois
Contact : claudia.marinica@u-cergy.fr
Date limite de publication : 2016-04-30
Contexte :
Object: Internship Master / Engineer
Place: Paris Area, ETIS Lab, Université de Cergy-Pontoise, Cergy-Pontoise, France (http://www-etis.ensea.fr/)
Subject: Privacy in mining of semantic trajectories among moving objects
Period: 6 months internship from April/May to September/October 2015 – approx. 508€/month
Supervision:
– Dimitris Kotzinos, PU, UCP, Dimitrios.Kotzinos@u-cergy.fr
– Claudia Marinica, MCF, UCP, Claudia.Marinica@u-cergy.fr
Applications (with CV and motivation letter) should be sent to Claudia.Marinica@u-cergy.fr .
Sujet :
Description: Trajectory pattern mining proposes to extract from location-like data frequent movement/mobility behaviour that characterise the individuals. Significant advances have been made with regard to knowledge discovery starting with the pioneer work of Giannotti et al. in 2009 [2], so lately the main interest in this research area went from efficient trajectory pattern mining to the possible risks that the discovered movement behaviour can bring to individual privacy (e.g. GeoKDD project [1]).
On the other side, the semantic web is a research area aiming to provide an easy way to find, share, reuse, etc information. To this end, it proposed a set of languages for knowledge representation, but also defines important notion such as “ontologies” permitting to represent domain semantics.
First works combining semantic web and trajectory analysis propose either to use ontologies in order to understand user’s behaviour [3] or to use taxonomies in order to improve user’s privacy [4]. Moreover, we would like to assess the threats that the addition of semantics will bring to the users’ privacy through the provision of more detailed information for the movements.
The goal of this internship is:
(1) first to study the existing methods combining semantic web and trajectory analysis in order to (mainly) improve user’s privacy;
(2) second to propose a new approach for using semantic information on available trajectories so as to improve the overall understanding of the trajectories themselves, while offering enhanced privacy considerations.
Applications (with CV and motivation letter) should be sent to Claudia.Marinica@u-cergy.fr .
[1] Mirco Nanni, Roberto Trasarti, Chiara Renso, Fosca Giannotti, and Dino Pedreschi (2010) Advanced knowledge discovery on movement data with the GeoPKDD system. EDBT, ACM International Conference Proceeding Series, page 693-696. ACM.
[2] Fosca Giannotti, Mirco Nanni, Fabio Pinelli, and Dino Pedreschi. 2007. Trajectory pattern mining. In Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD ’07). ACM, New York, NY, USA, 330-339.
[2] C. Renso, M. Baglioni, J. A. F. de Macˆedo, R. Trasarti, and M. Wachowicz. How you move reveals who you are: understanding human behavior by analyzing trajectory data. Knowl. Inf. Syst., 37(2):331–362, 2013.
[2] Anna Monreale, Roberto Trasarti, Chiara Renso, Dino Pedreschi, and Vania Bogorny. 2010. Preserving privacy in semantic-rich trajectories of human mobility. 3rd ACM SIGSPATIAL International Workshop on Security and Privacy in GIS and LBS. 47-54.
Profil du candidat :
Knowledge in data mining techniques and programming skills are required.
Formation et compétences requises :
Knowledge in data mining techniques and programming skills are required.
Adresse d’emploi :
Laboratoire ETIS, UCP, 2 Avenue Adolphe Chauvin, 95300, Cergy-Pontoise
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : LINA/POLYTECHNANTES
Durée : 6 mois
Contact : antoine.pigeau@univ-nantes.fr
Date limite de publication : 2016-04-01
Contexte :
The Open Class Room website provides online courses in various area, from art and culture to computer science. A course is composed of text, video or ebook that users browse/read/download after a registration process. The validation of a course is carried out thanks to exercises and quizzes.
A validation of a course may result in a certificate if the user chooses a premium registration.
The success of Open Class Room enables the availability of many user profiles with their associated traces on the courses:
• the personal information are provided on the registration process. Each user provides his name, his gender, his skills, his grade, his job and the courses taken;
• the traces contain all the actions carried out by the users on both the client and server sides.
Accesses to each course, parts of a course or a chapter, quiz and exercise are then recorded for each user. The goal of the project is to study the reasons for the failure or the success of the students.
Providing such an answer is of much interest for both the course designers and the managers of the Open Class Room website. The objective of such a study is to improve the design of the courses
and to be capable of anticipating the failure of a student
Sujet :
Le détail du sujet est disponible sur la page “positions>Master Topics” du site de l’équipe Duke:
http://duke.univ-nantes.fr/wp-content/uploads/2015/12/StageHubble-DUKe.pdf
The objective of the internship is the modelling of user profiles based on their personal information and on the way they browse/learn a course.
Our input data are the personal information of the user and his traces, and the output is a set of user’s profiles. Such a profile will summarize the background, the interests and the learning
methods of a user (or a group of users).
The following research area will be studied to generate the profiles:
• process modelling : a set of user traces on a same course is summarized to emphasized
the main step to learn a course, from the beginning to the validation exercises;
• pattern mining and sequential pattern mining : search for sequence similarities on a specific course, or a set of courses. For instance, a pattern obtained from users with high marks could be pertinent to motivate a good practice;
• user clustering: search for groups of users with similar backgrounds and a similar way to browse/learn the courses. The clustering could be obtained from the two previous points.
Group of users would be defined with a similar process or similar frequent patterns.
Each data mining process can be applied on a subset of users, defined with specific values of the personal user’s information, the skills and grades for example. The objective here will be to
study the correlations between set of users with different properties.
Profil du candidat :
Les seules contraintes concernent la formation et les compétences.
Formation et compétences requises :
Niveau de formation demandé : Master 2
Le candidat doit avoir des compétences dans les domaines suivants:
– Clustering
– pattern mining
– process modelling
Adresse d’emploi :
PolytechNantes
Document attaché : stagehubble-duke.pdf
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : ETIS
Durée : 6 mois
Contact : Dimitrios.Kotzinos@u-cergy.fr
Date limite de publication : 2016-03-31
Contexte :
The internship will take place in the MIDI team of the ETIS Lab (ENSEA / UCP / CNRS UMR 8051) based in the area of Cergy Pontoise, just outside Paris.
The internship will have a net salary of around 508 euros/month and a duration of up to 6 months, starting on March or April 2017.
Interested candidates are requested to send a detailed CV, one recommendation letter and university/master transcripts to Katerina Tzompanaki at atzompan@u-cergy.fr.
Sujet :
Repairing SQL queries to retrieve missing answers.
The increasing load of data produced nowadays is coupled with an increasing need for complex data transformations that developers design in order to process or integrate these data. These transformations, commonly specified declaratively in the form of queries, may fail to produce all the expected results leading to what we call missing data. Understanding the reasons why missing data occur, and how the original query can be modified in order to overcome these reasons, can be tricky if manually performed. In the context of relational databases, [1] proposed a novel way (Why-Not polynomials) to explain missing data given a certain query. Consequently, [3] described a first approach of utilizing Why-Not polynomials in order to effectively repair the query, while [2] shows a prototype implementing these algorithms. As the query repairing phase of the framework heavily depends on the size of the database and the complexity of the Why-Not polynomial, a more efficient solution needs to be devised, either by improving the existing algorithm or by proposing a new one. This will be the focus of the master internship.
More specifically, the candidate is expected to
1) Verify/Identify the bottlenecks of the existing solution, algorithmically and experimentally.
2) Propose improvements of the algorithm.
3) Implement the new improved algorithm and experimentally prove its efficiency.
References
[1] Bidoit, Nicole, Melanie Herschel, and Aikaterini Tzompanaki. “Efficient computation of polynomial explanations of why-not questions.” Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. ACM, 2015.
[2] Bidoit, Nicole, Melanie Herschel, and Katerina Tzompanaki. “EFQ: Why-not answer polynomials in action.” Proceedings of the VLDB Endowment 8.12, 2015.
[3] Bidoit, Nicole, Melanie Herschel, and Katerina Tzompanaki. “Refining SQL Queries based on Why-Not Polynomials.” 8th USENIX Workshop on the Theory and Practice of Provenance (TaPP 2016). 2016.
Profil du candidat :
The candidate shoukd be an M2 level student.
Formation et compétences requises :
The candidate will have solid knowledge of the Java programming language. Familiarity with SQL query language and relational databases is desired.
Adresse d’emploi :
MIDI team
ETIS Lab (ENSEA / UCP / CNRS UMR 8051)
Site St. Martin
2 Av. Adolph Chauvin
95000 Pontoise
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : CEA LIST (DM2I/LADIS)
Durée : 6 mois
Contact : lorene.allano@cea.fr
Date limite de publication : 2016-03-01
Contexte :
Le CEA LIST (http://www-list.cea.fr/) est un centre d’innovation et de recherche technologique atour aux nouvelles technologies de l’information et de la communication. Le CEA LIST est basé sur le plateau de Saclay et appartient à l’université Paris Saclay. Au sein du CEA LIST notre laboratoire est dédié aux Data Analytics et au Big Data.
Sujet :
Bases de données distribuées sur architecture Big Data.
Pour ce stage de Master 2, nous recherchons un candidat ingénieur R&D autonome et motivé par les nouvelles technologies et les architectures Big Data pour développer un environnement de base de données distribuées dans le cadre d’un projet de recherche translationelle. L’objectif de ce stage sera dans un premier de faire un benchmark des systèmes de gestion de bases de données distribuées et NoSQL et ensuite de mettre en œuvre le système adapté au cahier des charges du projet sur notre architecture Big Data. Le développement sera de préférence réalisé en Python.
Profil du candidat :
étudiant en master 2 ou dernière année d’école d’ingénieur profil Big Data.
Formation et compétences requises :
Python, Spark, Hadoop, NoSQL
Adresse d’emploi :
centre de Saclay – Digiteo Labs
DM2I / LADIS – PC 192
91191 Gif sur Yvette Cedex
http://www-list.cea.fr/
Document attaché :
Annonce en lien avec l’Action/le Réseau : aucun
Laboratoire/Entreprise : laboratoire d’informatique
Durée : 6 semaines
Contact : colin.riba@ens-lyon.fr
Date limite de publication : 2016-02-07
Contexte :
À l’issue de leur première année de cours (L3), les élèves en
informatique de l’École Normale Supérieure de Lyon doivent
effectuer un stage de six semaines (quelque part entre
juin et fin août) dans une équipe de recherche universitaire ou
associée. Nous vous sollicitons pour proposer un sujet de stage et/ou
diffuser cette demande autour de vous.
Sujet :
Les informations concernant ces stages sont disponibles en ligne :
http://www.ens-lyon.fr/DI/stageL3/
La soumission de propositions de stages s’effectue également en ligne :
http://www.ens-lyon.fr/DI/stageL3/submit.php
– Ouverture : 15 décembre 2015
– Fermeture : 7 février 2016
Profil du candidat :
N’hésitez pas à faire suivre cette information à des collègues qui
peuvent être intéressés.
En vous remerciant de l’aide que vous pouvez apporter à l’organisation de ces stages,
Bien cordialement,
Colin Riba
Formation et compétences requises :
NA
Adresse d’emploi :
NA
Document attaché :
Annonce en lien avec l’Action/le Réseau : à l’initiative de la SFB et de la SFµ
Thème :
biophysique, traitement de données
Présentation :
Recent progress in instruments used in modern biology (microscopies, spectroscopies, …), have deeply impacted our vision of life. Current instruments enable the observation of complex systems in larger time and space scales. These observations generate very large datasets, whose analysis involves new algorithms and modelling approaches. In this context, elaborating novel models and hypothesis to explain fundamental biological mechanisms requires to reconsider our current way to design experimental setups, including most recent sampling schemes or efficient noise reduction procedures.
The objective of the school is to provide attendants with tools on multimodal and multi-scale data acquisition, quantification, analysis, and modelling, to elaborate novel approaches describing living systems. To this purpose, the school will gather researchers and teachers from different fields (measurements in biophysics, signal analysis and quantification and modeling of biological systems). The school will include introductory courses on spectroscopies and image acquisition methods together with conventional processing methods. They will be followed by advanced courses on recent data processing methods, such as compressed sensing, and the illustration of their applications in different fields such as mass-spectrometry, NMR or fluorescence imaging.
Du : 2015-10-18
Au : 2015-10-23
Lieu : Ecole de physique des Houches – Les Houches
Site Web :http://memobio2015.u-strasbg.fr/index.php
Annonce en lien avec l’Action/le Réseau : aucun
Thème :
Astrostatistique
Présentation :
This second session of the School of Statistics for Astrophysics is devoted to clustering and classification. This School is a Ecole Thématique du CNRS.
Grouping objects obtained from the astronomical observations into distinct categories has always been a necessity imposed by their vast diversity. This is the case for stars, galaxies, asteroids, supernova, active galactic nuclei, gamma-ray bursts and many others. This clustering by similarities (unsupervised classification) is a prerequisite to any physical modelisation, and (supervised) classification a requirement for observations and databases.
The objective of the School of Astrostatistics 2015 is to train astronomers to the use of a large range of statistical and algorithmic approaches of unsupervised and supervised classification, from the most basic to the state-of-the-art ones, including the spatial clustering, the clustering of variables and the graphical methods.
Du : 2015-10-11
Au : 2015-10-16
Lieu : Ecole de Physique des Houches (France)
Site Web :http://stat4astro2015.sciencesconf.org/
Annonce en lien avec l’Action/le Réseau :
Thème :
machine learning: apprentissage par renforcement, optimisation, recherche d’information et apprentissage de dictionnaires
Présentation :
Cette école d’été s’inscrit dans le cadre du Trimestre Thématique dédié au Machine Learning du Labex CIMI. Ce projet commun aux laboratoires d’informatique et de mathématiques de l’Université Paul Sabatier vise à améliorer les compétences communes et à encourager les collaborations; les cours seront de niveau doctoral, mais ouvert et accessible tant aux étudiants de Master 2 qu’aux collègues désireux d’élargir leurs connaissances.
Du : 2015-09-14
Au : 2015-09-18
Lieu : Université Paul Sabatier Toulouse 3
Ecole en lien avec l’Action /le Réseau : Ecole européenne pluri-annuelle sur la Gestion des Masses de données
Thème :
Graph Data Management
Présentation :
The theme for the 12th EDBT Summer School is Graph Data Management.
The area of graph data management has recently seen many exciting and impressive developments. It addresses one of the great business trends of today: leveraging complex and dynamic relationships to generate insight and competitive advantage. It is crucial for such different goals as understanding relationships between users of social media, customers, elements in a telephone or data center network, entertainment producers and consumers, or genes and proteins. As part of the NoSQL movement it provides us with new powerful technologies and means for storing, processing and analyzing data. It also is a key technology for supporting the Semantic Web and Linked Open Data.
As a consequence there has been an impressive flurry of new systems for graph storage and graph processing, both in academia and industry, and covering a wide spectrum of use cases, from enterprise-scale datasets to web-scale datasets. Moreover, this has been accompanied by exciting new research, developing further the foundations of efficient graph processing, as well as exploring new application areas where these can be successfully applied. It is therefore an opportune moment to organize a summer school on this topic to present the current developments and allow PhD students and other scientists to benefit from these in their research.
Du : 2015-08-31
Au : 2015-09-04
Lieu : Palamos, Spain
Site web : http://edbt2015school.win.tue.nl
Annonce en lien avec l’Action /le Réseau : aucun
Thème :
FOUILLE DE DONNEES TEMPORELLES, CONNAISSANCES et ENVIRONNEMENT
Présentation :
L’École Thématique, centrée sur le thème de la fouille collaborative et incrémentale de masses de données spatio-temporelles se déclinera en 5 journées thématiques. Chaque thème sera abordé selon le point de vue de l’informatique et du traitement de données enrichi de celui des sciences de l’environnement afin de favoriser un maximum de discussions, et à terme des collaborations, entre les communautés présentes :
– Sensibilisation au domaine de la fouille de données. Sensibilisation à la problématique de l’analyse de données en sciences de l’environnement.
– Aspects temporels de la fouille de données.
– Approches collaboratives et incrémentalité en fouille de données.
– Prise en compte du domaine d’application dans les processus de fouille.
Les challenges de la fouille de données collaborative incrémentale et les besoins applicatifs en sciences de l’environnement.
Du : 28/06/2015
Au : 02/07/2015
Lieu : Strasbourg
Site web : http://focolise.sciencesconf.org/
Autres Ecoles
Dates | Titre | Lieu | Site web |
---|