Offre en lien avec l’Action/le Réseau : SIMDAC/– — –
Laboratoire/Entreprise : LIFO
Durée : 5 mois
Contact : Patrick.Marcel@univ-orleans.fr
Date limite de publication : 2025-02-26
Contexte :
De nombreux domaines nécessitent l’analyse de gros volumes de séquences de diverses complexités (en termes de périodicité, complétude, multivariée ou non, etc.) et en particulier de leur similarité. On peut citer les domaines aussi variés que le médical (e.g. stratification de patients, alignements de gènes), le social (analyse de trajectoires sémantiques), la science des données (génération et recommandation de pipelines d’exploration), etc.
Par exemple, le groupement de patients suivis sur de longues périodes peut être vu comme un problème de recherche et calcul de similarité sur des séquences complexes : les séquences sont apériodiques (la fréquence des rendez-vous médicaux n’étant pas fixe), multivariées (plusieurs informations sont enregistrées à chaque rendez-vous), incomplètes (les informations enregistrées peuvent varier d’un patient à l’autre) .
Sujet :
Il est souvent nécessaire d’optimiser du calcul de similarités sur ces gros volumes de données de type séquences.
L’objectif de stage est d’étudier comment différentes approches proposées pour le calcul de similarité de séries temporelles peuvent s’appliquer au calcul de similarité de séquences complexes.
Notamment, on étudiera des techniques de réduction de dimensionalité et indexation.
Profil du candidat :
Le profil recherché est un stagiaire de Master ou école d’ingénieur en informatique, ou un niveau équivalent, possédant un bon niveau en programmation, base de données, parallélisme et mathématique.
Le stage pourra déboucher sur une thèse de doctorat financée.
Formation et compétences requises :
Adresse d’emploi :
LIFO, Université d’Orléans
Document attaché : 202502261523_Sujet_de_stage___adaptation_d_approches_de_s_ries_temporelles_au_calcul_de_similarit_s__de_s_quences_complexes.pdf