GraphologIA : Actionner les méga-graphes de données dans les dataflows d’apprentissage automatique

When:
30/05/2022 – 31/05/2022 all-day
2022-05-30T02:00:00+02:00
2022-05-31T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : LIP6 – Sorbonne Université
Durée : 3 ans
Contact : Hubert.Naacke@lip6.fr
Date limite de publication : 2022-05-30

Contexte :
Projet doctoral pré-sélectionné par l’institut SCAI de Sorbonne Université
https://www.sorbonne-universite.fr/projets-proposes-en-2022-programme-instituts-et-initiatives

Contexte :
Omniprésence des méga-graphes. Dans de nombreux domaines applicatifs les objets étudiés sont structurés en graphe car ce modèle apporte de la flexibilité et de l’extensibilité dans la représentation des données et leur gestion: graphe de connaissances, d’interaction entre molécules, réseaux sociaux, relations entre lieux et événements. D’après Gartner, ces graphes seront au cœur de 80% des analyses de données dès 2025. Dans un contexte big data, la capacité d’acquisition de données ne cesse de croître et entraîne une croissance des besoins pour manipuler des graphes toujours plus grands, complexes et variables dans le temps. Ces derniers sont qualifiés de méga-graphes de données (big data graphs).

Sujet :
Voir le sujet détaillé sur :
http://www.sorbonne-universite.fr/sites/default/files/media/2022-03/03257_172_prd-scai-2022-graphologia-v2.pdf

L’objectif de cette thèse est de concevoir un framework efficace pour construire et analyser de manière automatique des méga-graphes à partir de données hétérogènes et dynamiques. Cela permettra d’exécuter plus efficacement à la fois la préparation des données d’apprentissage et l’entraînement du modèle d’apprentissage.
Ce framework devra permettre d’accomplir les tâches suivantes dans l’analyse et la préparation des données pour les tâches d’apprentissage :
● Compréhension fine des données initiales et de leur dynamique
● Unification et alignement de données
● Exécution incrémentale efficace du processus d’alignement du graphe

La clé de l’approche est un langage déclaratif de haut niveau pour définir chaque étape du cycle dit dit d’ingénierie IA
● Définition d’un langage déclaratif de haut niveau pour décrire de manière logique et déclarative le processus qui transforme les données initiales vers un graphe
● Conception de nouvelles méthodes d’indexation pour accéder de manière aléatoire à diverses zones du graphe, tout en minimisant la latence, quelle que soit la taille du graphe.
● Validation expérimentale du bénéfice du framework.

Profil du candidat :
M2 ou bac+5 en informatique

Formation et compétences requises :
Nous recherchons un.e candidat.e motivé.e avec des bonnes compétences en bases de données (SQL, indexation), algorithmique et programmation (Python, Java).
Des connaissances en optimisation de requêtes, en algorithmique sur les graphes et en apprentissage automatique sont un plus.

Adresse d’emploi :
LIP6, Sorbonne Université, 5 place Jussieu, 75005 PARIS

Document attaché : 202204070955_PRD_SCAI_2022_graphologIA_v3.pdf