Liste des Ecoles

Liste des Ecoles Thématiques liées au GdR MaDICS

Ecoles labellisées/soutenues par MaDICS

Jul
3
Sun
2016
Ecole d’été Peyresq 2016 de Traitement du signal et des images
Jul 3 – Jul 9 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Modèles probabilistes et inférence en signal et image

Présentation :

Le GRETSI et le GdR ISIS organisent depuis 2006 une École d’Été annuelle en traitement du signal et des images. Ouverte à toute personne intéressée (académique ou industrielle), elle a pour but de présenter une synthèse ainsi que les avancées les plus récentes dans un thème de recherche d’actualité. Il s’agit de 5 journées de cours donnés en français par des spécialistes renommés.

Du : 2016-07-03

Au : 2016-07-09

Lieu : Cette École d’Été a pour cadre le magnifique village de Peyresq, perché à 1500 mètres d’altitude sur un éperon rocheux des Alpes de Haute Provence (http://www.peiresc.org)

Site Web : http://www.gretsi.fr/peyresq16/

Sixth European Business Intelligence Summer School (eBISS 2016)
Jul 3 – Jul 8 all-day

Annonce en lien avec l’Action/le Réseau : Formation

Thème :

Informatique décisionnelle

Présentation :

Cette école d’été est destinée à des étudiants et des chercheurs. Elle fait intervenir des chercheurs ou industriels leaders dans le domaine de l’informatique décisionnelle et représente une occasion unique pour les participants d’échanger autour des thèmes théoriques et pratiques ayant trait au développement d’applications décisionnelles. Cette école comprend des cours et des présentations, mais constitue également un lieu privilégié pour des rencontres entre chercheurs confirmés et jeunes chercheurs. A cette fin, il est demandé aux participants de préparer et de présenter un poster décrivant leurs activités de recherche. Les supports des cours dispensés sont visibles sur le site internet de l’école, et un numéro spécial de revue contenant les cours de l’école sera publié dans la série Lecture Notes in Business Information Processing (LNBIP) chez Springer.

Il s’agit de la sixième édition de cette école d’été (les éditions précédentes peuvent être consultées sur le site : http://cs.ulb.ac.be/conferences/ebiss.html). Cette école est associée au programme de Master Erasmus Mundus IT4BI dont l’université de Tours est partenaire. En plus des orateurs, une cinquantaine de participants payants sont attendus, dont les étudiants de première année du Master IT4BI, la participation à l’école étant obligatoire car partie intégrante du programme.

Du : 2016-07-03

Au : 2016-07-08

Lieu : Tours, campus de Grandmont

Site Web :http://cs.ulb.ac.be/conferences/ebiss2016/

Jun
30
Thu
2016
PhD position at INRIA Lille: Privacy-friendly distributed machine learning
Jun 30 – Jul 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : MAGNET Project-Team, INRIA Lille
Durée : 3 years
Contact : aurelien.bellet@telecom-paristech.fr
Date limite de publication : 2016-06-30

Contexte :
The Inria Magnet team has an opening for a PhD position on privacy-friendly distributed machine learning. The topic of this Ph.D. project is the development of algorithms to perform tasks which are currently done with complete knowledge of the data in a much more distributed and privacy-friendly way. In particular, the problem of learning a model from the distributed data of many users who do not want to share their data will be considered.

Sujet :
The overall goal of this project is to get a better understanding of the potential of private distributed learning, to construct theory supporting this understanding and algorithms exploiting it. Several scenarios will be investigated, depending for instance on whether synchronization between users through a global server is possible. To guarantee privacy, we will study how to adapt methods from secure multi-party computation to statistical machine learning in order to develop efficient algorithms for which one can control the amount of disclosed sensitive information. Where possible, the potential of the obtained results will be demonstrated in real-world applications, such as ride sharing (predicting rides and matching between users without centralization of mobility logs) and crowdsourcing (task recommendation to users without compromising their personal data).

Profil du candidat :
– strong background in machine learning, statistics and algorithms
– additional knowledge on distributed distributed systems and cryptography would be appreciated
– some experience in implementation and experimentation is expected
– good writing and speaking English skills

Side information:
Salary: 1958€ the first two years and 2059€ the third year
Salary after taxes: around 1600€ the 1st two years and 1679,76 € the 3rd year (benefits included).
Possibility of French courses.

If interested, send to Jan Ramon (jan [dot] ramon [at] inria [dot] fr) and Aurélien Bellet (aurelien [dot] bellet [at] inria [dot] fr) as soon as possible: your CV, a statement of interest, and any supporting documents (e.g., recommendation letters) you may consider helpful.

Formation et compétences requises :
The candidate will work under the supervision of Jan Ramon and Aurélien Bellet. The PhD will begin in October 2016. In France, a PhD should be completed at the end of the 3rd year.

Adresse d’emploi :
The working environment is located at the Inria research center in Lille, France. Combining computer sciences with mathematics, Inria’s 3,400 researchers strive to invent the digital technologies of the future. Educated at leading international universities, they creatively integrate basic research with applied research and dedicate themselves to solving real problems, collaborating with the main players in public and private research in France and abroad and transferring the fruits of their work to innovative companies. The researchers at Inria published over 4000 articles a year. They are behind over 270 active patents and 105 start-ups. The 171 project teams are distributed in eight research centers located throughout France. Lille is the capital of the north of France, a metropolis with 1 million inhabitants, with excellent train connection to Brussels (34 min), Paris (1h) and London (1h30), and tons of opportunities for social life.

Document attaché :

Jun
26
Sun
2016
PhD: Federations of data consumers for querying linked data.
Jun 26 – Jun 27 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LINA – Nantes University
Durée : 3 ans
Contact : hala.skaf@univ-nantes.fr
Date limite de publication : 2016-06-26

Contexte :
The Distributed Data Management Group (GDD) at the University of Nantes (France) is inviting for 1 PhD student application:
– Federations of data consumers for querying linked data, more details at https://goo.gl/TUlRIv

Sujet :

– Federations of data consumers for querying linked data, more details at https://goo.gl/TUlRIv

Profil du candidat :
Expertise in distributed database systems, Semantic Web/Linked Data, distributed systems.

Formation et compétences requises :
Master degree in informatics, computer science, information systems with good ranking.

Adresse d’emploi :
GDD Team LINA, Nantes University

Document attaché : phdpositioninlinkeddatauniversityofnantes.pdf

Jun
5
Sun
2016
Masses de données distribuées (MDD)
Jun 5 – Jun 9 all-day

Annonce en lien avec l’Action/le Réseau : Formation et doctorant

Thème :

Gestion et analyse de données massives, protection de la vie privée

Présentation :

L’objectif de l’école thématique MDD est de former les chercheurs de notre communauté, en particulier nos doctorant(e)s, aux défis spécifiques liés aux méga-données, en particulier scientifiques. Ces défis sont l’interrogation et l’analyse de données à grande échelle (analyse exacte ou approchée), la gestion, le suivi et la reproductibilité de processus de calculs complexes (workflows), et la protection de la vie privée en présence de traces massives.

Du : 2016-06-05

Au : 2016-06-10

Lieu : Urrugne (Pyrénées-Atlantiques)

Site Web :http://cedric.cnam.fr/summer-school/MDD2016/

Jun
1
Wed
2016
3-year fully funded PhD position in the research area of Big Data in The MIDI team of the ETIS Lab (ENSEA / UCP / CNRS) UMR 8051, Paris, France
Jun 1 – Jun 2 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : ETIS Lab (ENSEA / UCP / CNRS) UMR 8051, Paris, France
Durée : 3 years
Contact : Dimitrios.Kotzinos@u-cergy.fr
Date limite de publication : 2016-06-01

Contexte :
The MIDI team of the ETIS Lab (ENSEA / UCP / CNRS) UMR 8051 (www-etis.ensea.fr) has available a 3-year fully funded PhD position in the research area of Big Data. The lab is located in the Cergy-Pontoise area in the greater area of Paris, France.

Sujet :
During this PhD we want to investigate crowd sourced Big Data, generated by users who do not follow a well-documented method that could ensure data quality. The quality of these data and their descriptions might vary depending on the source, the type of the metadata included (or the lack thereof) and the person who is referencing them. This problem becomes more evident when we talk about georeferenced crowd sourced data where we are facing problems of completeness of the information (since usually people provide online information that refers to their interests) and the coherence of the information (and thus its semantic quality), including ambiguity or conversion issues. Moreover, we can identify quality issues that can be attributed to the timeliness of the information (since several types information do not disappear over time e.g. social media posts) and of logical consistency (since we can find online conflicting descriptions on e.g. Points of Interest). There is also a heterogeneity in the level of detail of the crowd sourced information because the level of abstraction of the user capturing information is closely related to her interests. Another important question in this area is how the techniques of big data quality enhancement affect the privacy of the users.
Based on the above during this PhD we would like to work on how to:
1. Deal with incompleteness of information by combining information on entities from diverse sources through applying entity resolution (ER) techniques to a large scale, e.g. combining information from social networks, trajectory information on various platforms, crowd-sourced geographical information like Open Street Maps
2. Increase the quality of the data presented to the end user by understanding the repairs that can be introduced at the crowd-sourced platforms
3. Understand the level of information exposed by increasing the quality of information for the user.

Profil du candidat :
We expect the successful applicant to be one of the driving forces behind the group’s research efforts in the areas mentioned above. He/She will join our international research group and work with other groups in the lab as well as with a strong network of national and international collaborators. The successful applicant will work with Professor Dimitris Kotzinos and Assistant Professor Claudia Marinica and will join a group with 3 professors and 5 assistant professors. Knowledge of French is not a requirement.

Starting Date: October 2016

Application: If interested, please send your application (including a detailed CV, university transcripts, a copy of the master thesis or scientific papers if available, as well as a list of personal references and and a motivation letter) in PDF format to Professor Dimitris Kotzinos (Dimitrios.Kotzinos@u-cergy.fr). Further enquiries are also welcome.
Applications are welcome until 25/05/2016 or until the position is filled.

Formation et compétences requises :
The successful candidate should already have a Master or equivalent in Computer Science or related area and should be able to demonstrate the ability to conduct research.

Adresse d’emploi :
Lab. ETIS (ENSEA/UCP/CNRS UMR 8051)
& Dept. Sciences Informatiques, Université de Cergy-Pontoise
2 av. Adolphe Chauvin
Site Saint Martin
95000 Pontoise
France
phone: +33 13425 2855
e-mail: Dimitrios.Kotzinos@u-cergy.fr

Document attaché :

May
31
Tue
2016
Système d\’exploration et de recommandation pour les données de santé
May 31 – Jun 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : CReSTIC, Université de Reims
Durée : 3 ans
Contact : frederic.blanchard@univ-reims.fr
Date limite de publication : 2016-05-31

Contexte :
Cette thèse se déroulera au laboratoire CReSTIC de l’Université de Reims Champagne-Ardenne sous la direction de Michel Herbin (PR, CReSTIC, URCA) et sera co-encadrée par Frédéric Blanchard (MCF, CReSTIC, URCA). Le travail de thèse débutera en septembre 2016.

Dans le cadre de collaborations avec des réseaux et professionnels de santé, notre équipe a été amenée à travailler sur l’exploitation des données de santé ou de bien être. Ces données requièrent des développements méthodologiques spécifiques. Cette thèse s’inscrit dans ce contexte scientifique.

Sujet :
L’évolution des technologies du numérique engendre une explosion de masses de données disponibles, souvent hétérogènes et incomplètes, mais riches en informations. Dans certains domaines, les méthodes classiques de data mining et de machine learning ne sont pas en mesure de les exploiter efficacement.
Cette thèse propose de construire les briques méthodologiques et algorithmiques d’un système d’exploration et de recommandation, orienté-cas, destiné à l’exploration de données de santé.
L’approche proposée devra prendre en compte le caractère atypique ou inhabituel des données et favorisera l’émergence de nouvelles hypothèses, afin, par exemple, de faciliter la mise en œuvre de stratégies thérapeutiques personnalisées.
Les différentes contributions attendues prendront place dans un système de recommandation et permettront de :
– mettre en place des calculs spécifiques de similarités entre cas,
– caractériser la singularité et l’atypicité de différents cas,
– et visualiser les regroupements et les structurations qui guideront l’utilisateur dans l’exploration des données.

Le travail de développement se fera de préférence en R (et C/C++) sous forme de packages ouverts, afin de faciliter la reproductibilité des résultats et leur diffusion.

Profil du candidat :
Le candidat recherché doit être intéressé par la recherche en “data science” et disposer des compétences informatiques et mathématiques nécessaires.

Formation et compétences requises :
Le candidat sera issu d’une école d’ingénieur ou d’un master 2 (en mathématiques appliquées, statistiques ou informatique). De solides compétences en analyse de données et en machine learning sont nécessaires. La connaissance d’un langage pour le prototypage (R ou python) est requise, celle de C/C++ est un plus.

Adresse d’emploi :
CReSTIC/URCA
UFR Sciences Exactes et Naturelles
Moulin de la Housse – BP 1039
51687 REIMS Cedex 2

Document attaché :

Thèse de doctorat au LITIS (Rouen) : Reconstruction de graphes par apprentissage automatique
May 31 – Jun 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : LITIS (Rouen)
Durée : 36 mois
Contact : paul.honeine@univ-rouen.fr et benoit.gauzere@insa-rouen.fr
Date limite de publication : 2016-05-31

Contexte :
Mots-clés : Théorie des graphes, machine learning, méthodes d’apprentissage à noyaux, pré-image, noyaux sur graphes, reconnaissance de formes.

Sujet :
Les méthodes d’apprentissage automatique sont généralement définies dans des espaces euclidiens. Cependant, certains domaines, telles que la chémoinformatique ou la reconnaissance de formes, privilégient une représentation des données sous forme de graphes. L’utilisation des méthodes classiques d’apprentissage sur des graphes reposent sur des plongements de ces derniers dans des espaces euclidiens. Afin d’améliorer l’interprétabilité des résultats obtenus, il est intéressant de chercher à inverser ses fonctions de plongement et donc de reconstruire un graphe à partir de sa représentation vectorielle. Ce problème consiste alors à calculer la pré-image des vecteurs selon le plongement défini.

Depuis une dizaine d’années, le lien entre méthodes d’apprentissage automatique et graphes a bénéficié de l’astuce du noyau. La définition et l’utilisation de noyaux sur graphes a permis de se libérer des contraintes liées à une représentation explicite du plongement des graphes dans un espace euclidien. Cependant, le manque de représentation vectorielle explicite d’un graphe complique le calcul de la pré-image, c’est à dire la reconstruction d’un graphe à partir d’un point dans l’espace de Hilbert associé au noyau. De plus, la dimension de l’espace associé au noyau pouvant être infinie, la plupart des points de cet espace n’ont pas de pré-image exacte dans l’espace des graphes.

Le présent sujet de thèse concerne donc la résolution du problème du calcul de pré-image de noyaux sur graphes. Un premier aspect de ce projet consiste à étudier le calcul de pré-image à partir de noyaux sur graphes, dans la continuité des travaux effectués sur des noyaux conventionnels à représentation vectorielle [Honeine and Richard, 2011]. La principale difficulté de cette première problématique est liée au fait que les noyaux ne permettent généralement pas d’obtenir une représentation vectorielle explicite des données que l’on manipule. Toutefois, lorsque le plongement est basé sur une énumération d’un ensemble de sous-structures comme les noyaux basés sur des chemins [Ralaivola et al., 2005] ou sur des sous-arbres [Gaüzère et al., 2012], il peut être possible de reconstruire un graphe à partir d’une représentation vectorielle encodant le nombre d’occurrences de chaque sous-structure utilisée. Afin de reconstruire un graphe, il faut donc calculer une pré-image à partir d’un point dans l’espace du noyau [Honeine and Richard, 2011], cette pré-image encodant le nombre d’occurrences de chaque sous-structure. À partir de cette représentation, il faut ensuite s’intéresser à la reconstruction d’un graphe à partir d’un vecteur décrivant le nombre d’occurrences d’un ensemble de structures. La résolution de ces verrous scientifiques devrait améliorer la compréhension des résultats fournis par les algorithmes d’apprentissage automatique en permettant de sélectionner ou de générer des graphes représentatifs [Raveaux et al., 2011] à partir d’un grand ensemble de graphes initiaux.

Une des applications directes de ces travaux concerne la bio-informatique et la chémoinformatique. Les molécules sont naturellement représentées par des graphes, et cette représentation est souvent privilégiée dans le cadre de problèmes de prédiction de propriétés moléculaires. L’application des méthodes issues de cette thèse devrait permettre d’améliorer le retour donné à l’expert chimiste en reconstruisant des graphes moléculaires à partir de certains points clés utilisés par la méthode d’apprentissage. Cette représentation serait alors plus facilement interprétable par l’expert chimiste et contribuera à la compréhension du phénomène chimique sous-jacent.

Bibliographie :
[Gaüzère et al., 2012] Gaüzère, B., Brun, L., and Villemin, D. (2012). Two new graphs kernels in chemoinformatics. Pattern Recognition Letters, 33(15) :2038–2047.
[Honeine and Richard, 2011] Honeine, P. and Richard, C. (2011). Preimage problem in kernel- based machine learning. Signal Processing Magazine, IEEE, 28(2) :77–88.
[Ralaivola et al., 2005] Ralaivola, L., Swamidass, S. J., Saigo, H., and Baldi, P. (2005). Graph kernels for chemical informatics. Neural networks : the official journal of the International Neural Network Society, 18(8) :1093–110.
[Raveaux et al., 2011] Raveaux, R., Adam, S., Héroux, P., and Trupin, E. (2011). Learning graph prototypes for shape recognition. Computer Vision and Image Understanding, 115(7) :905 – 918. Special issue on Graph-Based Representations in Computer Vision.

Profil du candidat :
Master 2 en informatique, mathématiques appliquées, ou école d’ingénieur

Formation et compétences requises :
Formation : Master 2 en informatique, mathématiques appliquées, ou école d’ingénieur
Compétences recommandées : Théorie des graphes, Machine learning (méthodes à noyaux), Reconnaissance de formes.

Adresse d’emploi :
Equipe d’accueil : Equipe Apprentissage au laboratoire LITIS (Laboratoire d’Informatique, du Traitement de l’Information et des Systèmes), à Rouen.
http://www.litislab.fr/

Document attaché : litis_rouen.pdf

Apr
1
Fri
2016
Méthodes computationnelles pour le traitement de données de protéomiques haut-débit : application au démultiplexage de signaux de spectrométrie de masse
Apr 1 – Apr 2 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : CEA de Grenoble – Laboratoire EDyP
Durée : 3 ans
Contact : thomas.burger@cea.fr
Date limite de publication : 2016-04-01

Contexte :
Avec l’avènement des outils à haut débit d’analyse, de nombreux laboratoire de biologie se retrouvent confrontés à un déluge de données, dont le débit surpasse les capacités de traitement (problème du big data). Cela nécessite la mise en place d’algorithmes capable de passer à l’échelle (en termes de complexité, de parcimonie, et de stabilité numérique). Concrètement, de nombreux algorithmes classiques de débruitage, de projection (à des fins de visualisation), de partitionnement ou d’analyse statistique ne sont plus utilisables, et doivent être « réinventés » pour correspondre à ces nouveaux besoins.

Sujet :
L’étudiant(e) recruté(e) devra participer à la mise en place d’un algorithme de factorisation de matrice sous contrainte de parcimonie, de complexité linéaire, tout en garantissant une stabilité numérique suffisante. Ensuite, l’étudiant inclura cet algorithme dans un pipe-line de séquençage de protéines (avec l’aide d’ingénieurs protéomiciens), au sein duquel il permettra de résoudre de manière optimale un problème de séparation de sources aveugle. En effet, dans ce pipe-line expérimental, plusieurs protéines peuvent être co-analysées simultanément via un spectromètre de masse, le spectrogramme résultant devenant inexploitable. Grâce au travail de l’étudiant(e), il sera possible de reconstruire à la volée les différents spectrogrammes des différentes protéines à partir du seul spectre «multiplexé» (jusqu’à 20 000 spectres sont produits par heures), améliorant considérablement la qualité et la couverture du séquençage. Au-delà de ce cas d’étude, notre objectif et d’amener l’étudiant(e) à devenir un(e) chercheur(se) autonome dans le développement de méthodes d’analyse « biological big data », un domaine de recherche clefs (pour le monde industriel comme académique) de la décennie à venir.

Profil du candidat :
Le sujet étant interdisciplinaire, nous considérons les candidatures d’origines variées. L’étudiant(e) devra être en dernière année de master ou d’école d’ingénieur dans l’un des domaines suivants:
– Statistique (apprentissage automatique ou analyse de données)
– Mathématiques appliquées (analyse numérique)
– Physique (avec de bonnes compétences en algèbre linéaire)
– Traitement du signal
Une part importante du travail étant formelle, les candidats ayant suivi un cursus de biologie complété par une spécialisation en bioinformatique ou biostatistique ne seront pas considérées (aucune connaissance en protéomique ou en biologie n’est nécessaire pour candidater).

Formation et compétences requises :
Des compétences en programmation orientée objet, et un intérêt pour les applications biologiques ainsi que pour le travail interdisciplinaire sont nécessaires.

Adresse d’emploi :
Prendre contact avec les encadrants (ci-dessous) avant le 20 mars 2016
• Thomas Burger (thomas.burger@cea.fr; https://sites.google.com/site/thomasburgerswebpage/home), encadrant
• Thomas Fortin (thomas.fortin@cea.fr), co-encadrant
• Myriam Ferro (myriam.ferro@cea.fr; http://www.edyp.fr/), directrice du laboratoire et HDR
• http://www-instn.cea.fr/formations/formation-par-la-recherche/doctorat/liste-des-sujets-de-these.html

Document attaché : phd-cea-biologicalbigdata.pdf

Oct
18
Sun
2015
Biophysique: Mesure et modélisation en biologie
Oct 18 – Oct 23 all-day

Annonce en lien avec l’Action/le Réseau : à l’initiative de la SFB et de la SFµ

Thème :

biophysique, traitement de données

Présentation :

Recent progress in instruments used in modern biology (microscopies, spectroscopies, …), have deeply impacted our vision of life. Current instruments enable the observation of complex systems in larger time and space scales. These observations generate very large datasets, whose analysis involves new algorithms and modelling approaches. In this context, elaborating novel models and hypothesis to explain fundamental biological mechanisms requires to reconsider our current way to design experimental setups, including most recent sampling schemes or efficient noise reduction procedures.

The objective of the school is to provide attendants with tools on multimodal and multi-scale data acquisition, quantification, analysis, and modelling, to elaborate novel approaches describing living systems. To this purpose, the school will gather researchers and teachers from different fields (measurements in biophysics, signal analysis and quantification and modeling of biological systems). The school will include introductory courses on spectroscopies and image acquisition methods together with conventional processing methods. They will be followed by advanced courses on recent data processing methods, such as compressed sensing, and the illustration of their applications in different fields such as mass-spectrometry, NMR or fluorescence imaging.

Du : 2015-10-18

Au : 2015-10-23

Lieu : Ecole de physique des Houches – Les Houches

Site Web :http://memobio2015.u-strasbg.fr/index.php

Oct
11
Sun
2015
School of Astrostatistics 2015: Clustering and Classification
Oct 11 – Oct 15 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Thème :

Astrostatistique

Présentation :

This second session of the School of Statistics for Astrophysics is devoted to clustering and classification. This School is a Ecole Thématique du CNRS.

Grouping objects obtained from the astronomical observations into distinct categories has always been a necessity imposed by their vast diversity. This is the case for stars, galaxies, asteroids, supernova, active galactic nuclei, gamma-ray bursts and many others. This clustering by similarities (unsupervised classification) is a prerequisite to any physical modelisation, and (supervised) classification a requirement for observations and databases.

The objective of the School of Astrostatistics 2015 is to train astronomers to the use of a large range of statistical and algorithmic approaches of unsupervised and supervised classification, from the most basic to the state-of-the-art ones, including the spatial clustering, the clustering of variables and the graphical methods.

Du : 2015-10-11

Au : 2015-10-16

Lieu : Ecole de Physique des Houches (France)

Site Web :http://stat4astro2015.sciencesconf.org/

Oct
1
Thu
2015
Recherche d’Information Agrégative sur les Workflows, Lamsade-Université Paris-Dauphine
Oct 1 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : Lamsade
Durée : 3 ans
Contact : daniela.grigori@dauphine.fr
Date limite de publication : 2015-10-01

Contexte :
Projet ANR CAIR 2015-2017 (http://www.agence-nationale-recherche.fr/?Projet=ANR-14-CE23-0006)

Sujet :
Titre : Recherche d’Information Agrégative sur les Workflows

Contexte: Projet ANR CAIR 2014-2018

La recherche d’information agrégée [1] vise à évaluer des requêtes utilisateurs en assemblant des fragments d’information provenant de plusieurs sources. Ce nouveau type de requêtes agrégatives permet de créer des objets qui n’existent pas en tant que tels dans les sources interrogées, mais sont construits à partir de fragments issus de ces sources. La recherche d’information agrégée a le potentiel de révolutionner l’accès à l’information distribuée en permettant de produire, de façon dynamique, des associations entre fragments d’information publiés séparément et qui se rapportent à la même entité/événement/sujet. Les résultats ainsi produits sont des objets à forte valeur ajoutée qui pourront être utilisés dans l’aide à la décision, le data journalisme ou l’acquisition de connaissances sur des phénomènes ou processus particuliers. Dans le cadre de cette thèse, nous nous intéressons en particulier aux requêtes visant à récupérer (et à agréger) des informations sur des processus (métier [2] ou scientifique [3]).

Date de début : octobre 2015

Laboratoire d’accueil : Lamsade, Université Paris-Dauphine

Encadrants : Daniela Grigori (daniela.grigori@dauphine.fr), Khalid Belhajjame (khalid.belhajjame@dauphine.fr)

Références

[1] Lalmas, M. (2011). Aggregated search. In Advanced Topics in Information Retrieval (pp. 109-123). Springer Berlin Heidelberg.

[2] Van Der Aalst, W. M., Ter Hofstede, A. H., & Weske, M. (2003). Business process management: A survey. In Business process management (pp. 1-12). Springer Berlin Heidelberg.

[3] Ewa Deelman, Dennis Gannon, Matthew S. Shields, Ian Taylor: Workflows and e-Science: An overview of workflow system features and capabilities. Future Generation Comp. Syst. 25(5): 528-540 (2009)
Contact : Daniela Grigori (daniela.grigori@dauphine.fr), Khalid Belhajjame (khalid.belhajjame@dauphine.fr) (pour candidater, envoyer : cv, relevé de notes, recommandations)

Profil du candidat :
titulaire d’un Master 2 (recherche)

Formation et compétences requises :
Bases de données, Big data

Adresse d’emploi :
Laboratoire Lamsade (

Document attaché :

Sep
25
Fri
2015
Huawei Technolgies Maths and Algo Lab PhD studentships
Sep 25 all-day

Annonce en lien avec l’Action/le Réseau : Doctorants

Laboratoire/Entreprise : Huawei Technolgies Maths and Algo Lab, Paris
Durée : 3 years
Contact : moez.draief@huawei.com
Date limite de publication : 2015-09-25

Contexte :
Huawei Technologies’ Mathematical and Algorithmic Sciences Lab in Paris offers a number of PhD scholarships (at least 10). The ideal candidates will have an advanced degree (MEng, MSc or equivalent) in Applied Mathematics, Statistics, Electrical Engineering, Computer Science or Physics from a top university with a genuine interest in applying their expertise to develop disruptive technologies in areas such as cloud computing and data centers, wireless, cable and fiber communications and internet of things, with applications to 5G wireless communications and beyond, SDN and big data.

Sujet :
Our research covers a number of disciplines such as machine learning and compressed sensing, online algorithms, Bayesian inference, operations research and combinatorial optimization, network science, random matrix theory, signal processing.

Profil du candidat :
Huawei is a leading global information and communications technology (ICT) solutions provider whose business spans telecommunication infrastructure, consumer electronics and business IT solutions. We are seeking highly motivated and talented individuals to work on the theoretical underpinnings of the most challenging engineering problems in information and communication technologies. By joining, the Mathematical and Algorithmic Sciences Lab, you will have the opportunity to work with our outstanding research scientists, all of whom hold PhD degrees from prestigious institutions, and you will be supervised by one of our senior research scientists.

The successful candidates will receive a competitive salary and will be affiliated with one of our prestigious academic partners.

To apply for this scheme please send a complete CV together with a cover letter briefly explaining your expertise and research interests. You will also need to provide the name of two persons (at least one of them from academia) who will be later contacted to provide a reference.

Applications should be submitted by email to both hegaoning@huawei.com and sonia.rodriguez@huawei.com by 25 September 2015. Without notification from Huawei within 1 month, please consider that your application has not been selected.

Formation et compétences requises :
– an advanced degree (MEng, MSc or equivalent) in Applied Mathematics, Statistics, Electrical Engineering, Computer Science or Physics from a top university
– a genuine interest in applying their expertise to develop disruptive technologies in areas such as cloud computing and data centers, wireless, cable and fiber communications and internet of things, with applications to 5G wireless communications and beyond, SDN and big data.

Adresse d’emploi :
20, Quai du point du jour, Boulogne Billancourt.

Document attaché :

Sep
15
Tue
2015
Recommandation automatique, temps réel et adaptative d’emojis
Sep 15 all-day

Annonce en lien avec l’Action/le Réseau : Doctorants

Laboratoire/Entreprise : LSIS (Univ. Aix-Marseille-CNRS) / Calea Solutions
Durée : 3 ans
Contact : patrice.bellot@univ-amu.fr
Date limite de publication : 2015-09-15

Contexte :
sujet en partenariat entre
Caléa Solutions (www.caleasolutions.com et https://www.facebook.com/caleasolutions)
et le LSIS (Laboratoire des Sciences de l’Information et des Systèmes), équipe DIMAG , Université Aix-Marseille (http://www.lsis.org/spip.php?id_rubrique=290)

Mots clés :
————–
fouille de textes, affective computing, recherche d’information, analyse de sentiments, apprentissage automatique et traitement automatique des langues,

Sujet :
L’entreprise Caléa développe une plateforme de messagerie instantanée
pour smartphones. Pour enrichir la communication dans les messageries instantanées,
l’entreprise Caléa intègre dans sa plateforme l’utilisation d’icônes tel
que les Emojis. Dans ces messageries dites « sociales », les emojis (ou
émoticônes) constituent en effet une forme d’écriture à part entière,
plébiscitée par les utilisateurs pour sa capacité à exprimer certaines
émotions ou attitudes vis-à-vis du message texte. Aujourd’hui, les
utilisateurs naviguent dans des bibliothèques contenant parfois plus de
5000 emojis pour sélectionner l’icône correspondant au message
non-verbal qu’il souhaite transmettre.

Pour améliorer l’ergonomie des interfaces et ainsi faciliter cette
communication non-verbale, l’objectif de cette thèse est de proposer
des approches innovantes et efficaces en vue de réaliser un
système de recommandation automatique d’emojis. Cette recommandation
automatique sera générée suivant l’état affectif inféré de
l’utilisateur, le contexte conversationnel, le profil de l’utilisateur.
Il s’agira de mettre en place une
détection automatique et temp réel des émotions et des sentiments de
l’utilisateur. L’objectif est d’aller
au-delà d’un système à base de mots clés (« key word spotting »)
largement utilisé en analyse de sentiments. La méthodologie reposera sur
l’apprentissage automatique d’un modèle utilisateur pour déterminer à la
fois son profil (e.g. préférences, centres d’intérêt) et son usage habituel des
« émojis » (e.g. comment et dans quels contextes les emoji sont utilisées). Les
données utilisées seront à la fois les données générées par
l’utilisateur lui-même (e.g. dans les conversations instantanées), les
données fournies par le terminal (e.g. la géolocalisation), et d’autres
informations puisées sur le web et permettant de qualifier le contenu textuel.
Le corpus sera fourni par l’entreprise Caléa. La recommandation d’emojis sera réalisée
automatiquement et sera interactive,
i.e. l’utilisateur pourra corriger les emojis proposés, pour permettre
un apprentissage actif et ainsi une
adaptation des recommandations à chaque utilisateur et chaque contexte.

Profil du candidat :
Le profil souhaité est Bac+5, école d’ingénieur ou Master Recherche en informatique.

Formation et compétences requises :
Des compétences en apprentissage automatique seront un réel plus.
Des compétences en programmation en java sont nécessaires.
Une forte motivation, des capacités de synthèse, de rédaction et de présentation des travaux (anglais) et à s’intégrer dans une équipe sont
également demandées.

Adresse d’emploi :
magalie.ochs@lsis.org
patrice.bellot@univ-amu.fr

Sep
14
Mon
2015
Ecole d’été : Machine Learning
Sep 14 – Sep 17 all-day

Annonce en lien avec l’Action/le Réseau :

Thème :

machine learning: apprentissage par renforcement, optimisation, recherche d’information et apprentissage de dictionnaires

Présentation :

Cette école d’été s’inscrit dans le cadre du Trimestre Thématique dédié au Machine Learning du Labex CIMI. Ce projet commun aux laboratoires d’informatique et de mathématiques de l’Université Paul Sabatier vise à améliorer les compétences communes et à encourager les collaborations; les cours seront de niveau doctoral, mais ouvert et accessible tant aux étudiants de Master 2 qu’aux collègues désireux d’élargir leurs connaissances.

Du : 2015-09-14

Au : 2015-09-18

Lieu : Université Paul Sabatier Toulouse 3

Site Web : http://www.irit.fr/cimi-machine-learning/node/1

Sep
10
Thu
2015
Analyse et synthèse d’opinions sur le web et les réseaux sociaux : intégration de caractérisations fines des opinions, de leur contexte spatio-temporel et de l’importance sociale de l’émetteur pour la mise en évidence de tendances d’opinion
Sep 10 all-day

Annonce en lien avec l’Action/le Réseau : aucun

Laboratoire/Entreprise : Laboratoires : IRIT (Toulouse) et CEA Tech LIST/DIASI/LVIC
Durée : Durée : 36 mois; Début : 1 septembre 2015 ou 1 octobre 2015
Contact : bougha@irit.fr
Date limite de publication : 2015-09-10

Contexte :
Titre :

Analyse et synthèse d’opinions sur le web et les réseaux sociaux : intégration de caractérisations fines des opinions, de leur contexte spatio-temporel et de l’importance sociale de l’émetteur pour la mise en évidence de tendances d’opinion

Description :

Le web et les réseaux sociaux offrent une incroyable plate-forme d’échange d’information, largement plébiscitée par de nombreux utilisateurs. Cette quantité d’information est également une grande opportunité pour les systèmes automatiques de fouille de données et d’analyse de flux d’information, avec des applications dans le cadre, par exemple, de la cyber-sécurité ou du marketing. Le sujet de cette thèse concerne plus précisément le domaine de l’analyse d’opinion sur ces plateformes, pour détecter de façon automatique des tendances d’opinion sur des sujets donnés : dans le domaine de la cyber-sécurité, on s’intéressera par exemple aux réactions concernant des personnes ou des événements, avec une localisation spatiotemporelle ciblée, dans le domaine commerciale, aux opinions sur certaines marques ou produits.

Sujet :
L’analyse d’opinion est un domaine de recherche en plein essor et a fait l’objet de nombreuses études, intégrant à la fois des technologies de traitement automatique des langues pour la normalisation des textes, des techniques à base de lexiques d’opinion ou d’apprentissage automatique pour attribuer automatiquement une opinion à un texte [1]. Au delà de la simple attribution d’une polarité d’opinion à un segment de texte, une analyse plus fine est souvent nécessaire pour avoir une meilleure caractérisation de l’opinion (trouver sur quel objet ou sur quel trait précis de l’objet porte l’opinion). Même si plusieurs approches ont été testées avec des modèles à base de règles [2] ou statistiques [3], le sujet reste ouvert, en particulier pour les documents courts comme des messages ou des tweets.

De façon complémentaire, une autre caractéristique des réseaux sociaux est l’organisation structurée des relations entre les utilisateurs au sein des communautés (les « amis » sur Facebook, les « followers » et les « re-tweets » sur Twitter, les systèmes de commentaires sur différentes plate-formes). Cette structuration peut être exploitée pour trouver des informations sur l’importance sociale des émetteurs d’information, comme sa popularité ou sa réputation [4,5].

L’idée de cette thèse est de combiner des technologies d’analyse d’opinion sur les textes, en apportant des éléments innovants sur une analyse plus fine permettant de mieux caractériser l’opinion et des technologies spécifiques d’analyse des réseaux sociaux pour déterminer l’importance sociale de l’émetteur, de façon à produire un résumé (une synthèse) consolidé de tendances d’opinion sur des sujets ou personnes en fonction de leur contexte spatiotemporel.

Profil du candidat :
– Bonnes connaissances en programmation, notions TAL, mathématiques (statistiques)
– Compétences écrites et orales en anglais fortement souhaitées

Les candidats transmettront par email un CV, une lettre de motivation et le relevé de notes du Master ou de la dernière année d’école d’ingénieur à Mohand Boughanem (boughanem@irit.fr)

Formation et compétences requises :
Titulaire d’un diplôme de Master (ou titre équivalent) en sciences informatiques

Adresse d’emploi :
Laboratoire IRIT
Université Paul Sabatier-IRIT, 118 Route de Narbonne 31

Document attaché : these_irit_cea_2014-2.pdf

Sep
1
Tue
2015
Identification et caractérisation des trajectoires de l’information dans les médias sociaux
Sep 1 all-day

Annonce en lien avec l’Action /le Réseau : aucun

Laboratoire/Entreprise : Entreprise Bertin (AMI Software) / Laboratoire ERIC
Durée : 36 mois
Contact : julien.velcin@univ-lyon2.fr
Date limite de publication : 01/09/2015

Contexte :
Cette proposition se place dans le cadre d’une collaboration entre la société Bertin (anciennement AMI Software, Montpellier) et le laboratoire ERIC (Université de Lyon). Une première thèse CIFRE, entre les deux partenaires, portant sur l’analyse des opinions dans les médias sociaux vient d’être soutenue avec succès en juin 2015. Les deux partenaires collaborent par ailleurs dans le cadre du projet ANR ImagiWeb qui vise à analyser les opinions véhiculées sur Internet.

Sujet :
L’objectif de la thèse proposée est de travailler sur l’identification des trajectoires de l’information et de comprendre les mécanismes qui régissent ou influencent ces trajectoires. C’est également l’occasion de consolider les travaux déjà réalisés sur la problématique du « buzz » et de voir comment elle s’inscrit dans les trajectoires étudiées. La thèse est associée à un certain nombre de verrous scientifiques que nous souhaitons aborder ensemble, à savoir :
a) prendre en compte un nombre important de sites Web variés,
b) étudier la trajectoire d’un sujet (ex. : une thématique, un événement) à la fois dans le temps et dans l’espace, espace qu’il sera nécessaire de reconstruire,
c) étudier l’influence que le type de sujet, l’opinion qui est exprimée, la présence d’acteurs au rôle particulier (ex. : influenceurs) peuvent avoir sur les trajectoires.

Profil du candidat :
Fouille de données
Apprentissage automatique
Analyse de grands graphes

Formation et compétences requises :
Le candidat doit avoir validé (ou être en passe de valider) un Master en Informatique et/ou Mathématiques appliquées.
Le candidat doit posséder un solide profil en mathématiques et des compétences en programmation.

Adresse d’emploi :
Entreprise Bertin, département IT
Montpellier

Document attaché : thesecifreamieric2015.pdf

Aug
31
Mon
2015
Analyse des systèmes territoriaux et des réseaux d’alimentation par des approches de fouille de données hétérogènes et de représentation cartographique
Aug 31 all-day

Annonce en lien avec l’Action /le Réseau : aucun

Laboratoire/Entreprise : LIRIS / LYON
Durée : 36 mois
Contact : celine.robardet@insa-lyon.fr
Date limite de publication : 31/08/2015

Contexte :
Projet du Labex IMU : REseaux et Système ALImentaire (RESALI) : Systèmes d’information innovants et exploratoires pour plus de justice alimentaire dans les métropoles
Mots-clés : Systèmes alimentaires urbains, Justice alimentaire, Fouille de données, analyse spatiale et temporelle, Big Data, VGI / Twitter

Mieux nourrir les villes en quantité et en qualité, et en particulier les grandes agglomérations, constitue un défi pour les mondes urbains futurs, pensés notamment en termes de durabilité et de justice alimentaire. A l’échelle des systèmes alimentaires urbains, on a besoin de diagnostics et on manque d’outils pour appréhender de façon systématique les relations entre les bassins de consommation, l’offre et les comportements alimentaires. Le projet RESALI propose donc de tester des outils et des méthodes quantitatives pour analyser finement l’organisation des systèmes alimentaires urbains et saisir de façon systématique les connexions / déconnexions entre l’offre alimentaire et la demande ou entre les ressources alimentaires et certains bassins de consommation, même les plus relégués et les moins informés. A partir d’un collectif composé de géographes et d’informaticiens, associé à des praticiens acteurs des systèmes alimentaires l yonnais, il s’agit d’élaborer une démarche innovante s’appuyant sur différents types de données (recensement, commerces, consommations…), dont des données encore peu exploitées : les VGI (Volunteered Geographic Information). Organisé en quatre tâches principales, le projet repose sur le couplage de trois approches méthodologiques originales :
construire un système d’information opératoire sur l’offre et la consommation alimentaire
développer des méthodes de fouille de données spatiales pour extraire de l’information sur les comportements à partir de données individuelles et issues du web (en particulier Twitter)
initier une réflexion systémique en produisant un modèle formel du fonctionnement du système observé pour une question précise ainsi qu’un prototype de modèle informatique.

Sujet :
Le sujet de cette thèse s’inscrit dans l’analyse des systèmes territoriaux d’accès aux ressources alimentaires. L’enjeu est de mieux comprendre les pratiques spécifiques aux différents espaces urbains et périurbains relativement à leur accès aux produits alimentaires, notamment face aux circuits courts liés aux ressources agricoles urbaines et périurbaines. La disponibilité de nombreuses données géospatialisées via les médias sociaux permet d’envisager d’enrichir les données démographiques des territoires, telles que celles proposées par l’INSEE, et d’accéder en temps-réel aux intérêts sociaux et culturels d’un large public à partir des flux générés par les médias sociaux. La collecte et l’analyse de leurs contenus peuvent alors offrir une vision incomparable des structures socio-culturelles et de leurs dynamiques.

Sujet :
L’objectif de la thèse est de proposer une méthode originale d’extraction de connaissances permettant de traiter des données temporelles, hétérogènes et multi-sources afin d’identifier et de caractériser des comportements propres à une zone géographique. L’approche développée devra faire avancer l’état de l’art sur la fouille interactive de données sous contraintes et les modes de représentations cartographiques interactives. Il conviendra de choisir une modélisation des données appropriée afin de pouvoir construire un modèle global des pratiques alimentaires qui pourra ensuite être utilisé pour supporter des requêtes inductives visant à découvrir et expliquer des comportements anormaux/exceptionnels dans les données. Les méthodes seront testées sur différents types de données individuelles (VGI, web…) pouvant faire avancer sur la question des comportements en termes de consommation alimentaire.

Ce sujet de thèse s’inscrit donc dans le domaine de l’extraction de connaissances dans des grandes bases de données, mais également dans un contexte science des données, où plusieurs disciplines se côtoient. Les aspects interactifs seront fortement considérés afin de :
– Prendre en compte les connaissances des experts pour diriger la fouille et retourner des résultats de meilleure qualité pour l’utilisateur (retourner des motifs qui contredisent ces connaissances, retourner des motifs inattendus, ne pas considérer les motifs déjà connus)
– Explorer comment les modèles d’analyse spatiale peuvent aider la fouille de données
– Permettre à l’utilisateur d’interagir pleinement avec les données et résultats en lui recommandant/proposant de nouveaux motifs promouvant la diversité/richesse des résultats/de l’exploration
– Élaborer des visualisations et géovisualisations appropriées permettant de représenter les relations entre les caractéristiques des territoires et les pratiques alimentaires de leurs populations.
Le terrain privilégié sera celui de l’aire métropolitaine de Lyon-St-Etienne, pour lequel des bases de données ont déjà été constituées, et de premières études préliminaires réalisées.

Profil du candidat :
Profil / Compétences et formations requises :
– Titulaire d’un diplôme de Master (ou titre équivalent) en sciences informatiques avec une apétence pour le data mining et une sensibilité pour le traitement de données géographique
– solides connaissances de programmation
– motivation pour la recherche et pour le travail en équipe, esprit d’initiative, curiosité intellectuelle, capacité rédactionnelle
– compétences écrites et orales en anglais fortement souhaitées
– tout intérêt pour les questions du numérique et de l’alimentation constituent un plus

Formation et compétences requises :
Candidature :
* Pour le détail scientifique du projet de thèse, contacter Céline Robardet ( celine.robardet@insa-lyon.fr ) ou Luc Merchez (Luc.Merchez@ens-lyon.fr )
* Pour faire acte de candidature, vous devez envoyer par mail à Céline Robardet et Luc Merchez un dossier composé d’un CV, d’une lettre de motivation, du relevé de notes du Master ou de la dernière année d’école d’ingénieur et d’une ou plusieurs lettre de recommandation

Adresse d’emploi :
Accueil et encadrement :
Laboratoires de rattachement :
UMR 5205 « Laboratoire d’InfoRmatique en Image et Systèmes d’information » (Laboratoire LIRIS)
UMR 5600 « Environnement, Ville, Société » (Laboratoire EVS)
Co-Direction de thèse : Céline Robardet (LIRIS, dir.) / Luc Merchez (EVS)

Document attaché : offre_de_these_imu_resali_v3.pdf

EDBT summer school 2015
Aug 31 – Sep 4 all-day

Ecole en lien avec l’Action /le Réseau : Ecole européenne pluri-annuelle sur la Gestion des Masses de données

Thème :
Graph Data Management

Présentation :
The theme for the 12th EDBT Summer School is Graph Data Management.

The area of graph data management has recently seen many exciting and impressive developments. It addresses one of the great business trends of today: leveraging complex and dynamic relationships to generate insight and competitive advantage. It is crucial for such different goals as understanding relationships between users of social media, customers, elements in a telephone or data center network, entertainment producers and consumers, or genes and proteins. As part of the NoSQL movement it provides us with new powerful technologies and means for storing, processing and analyzing data. It also is a key technology for supporting the Semantic Web and Linked Open Data.

As a consequence there has been an impressive flurry of new systems for graph storage and graph processing, both in academia and industry, and covering a wide spectrum of use cases, from enterprise-scale datasets to web-scale datasets. Moreover, this has been accompanied by exciting new research, developing further the foundations of efficient graph processing, as well as exploring new application areas where these can be successfully applied. It is therefore an opportune moment to organize a summer school on this topic to present the current developments and allow PhD students and other scientists to benefit from these in their research.

Du : 2015-08-31
Au : 2015-09-04
Lieu : Palamos, Spain

Site web : http://edbt2015school.win.tue.nl

Jun
28
Sun
2015
FOCOLISE : FOUILLE COLLABORATIVE INCREMENTALE DE MASSES DE DONNEES MULTISOURCES MULTITEMPORELLES : APPLICATION EN SCIENCES DE L’ENVIRONNEMENT
Jun 28 – Jul 2 all-day

Annonce en lien avec l’Action /le Réseau : aucun

Thème :
FOUILLE DE DONNEES TEMPORELLES, CONNAISSANCES et ENVIRONNEMENT

Présentation :
L’École Thématique, centrée sur le thème de la fouille collaborative et incrémentale de masses de données spatio-temporelles se déclinera en 5 journées thématiques. Chaque thème sera abordé selon le point de vue de l’informatique et du traitement de données enrichi de celui des sciences de l’environnement afin de favoriser un maximum de discussions, et à terme des collaborations, entre les communautés présentes :
– Sensibilisation au domaine de la fouille de données. Sensibilisation à la problématique de l’analyse de données en sciences de l’environnement.
– Aspects temporels de la fouille de données.
– Approches collaboratives et incrémentalité en fouille de données.
– Prise en compte du domaine d’application dans les processus de fouille.
Les challenges de la fouille de données collaborative incrémentale et les besoins applicatifs en sciences de l’environnement.

Du : 28/06/2015
Au : 02/07/2015
Lieu : Strasbourg

Site web : http://focolise.sciencesconf.org/

 

 

Autres Ecoles

Dates Titre Lieu Site web