ADOC

Action ADOC

Entrepôts et analyse de documents


Responsables


Thématiques

Bases de données, Fouille de données, Recherche d’information, Web sémantique

Données concernées

Documents principalement textuels, mais pouvant inclure d’autres éléments comme des tableaux, des graphiques ou des images

Résumé

Depuis de nombreuses années, diverses disciplines des sciences humaines et sociales (SHS) produisent et mettent en valeur des corpora de documents variés et, pour certains, très volumineux. Au-delà de leur valorisation et de leur diffusion, diverses analyses (statistiques, de réseaux…) ouvrent de nombreuses perspectives scientifiques originales aux chercheurs en SHS. Les entrepôts de données et l’analyse en ligne, et notamment les entrepôts de données textuels et le textual-OLAP, sont susceptibles de répondre à ces besoins. L’objectif de cette action est de constituer un réseau pluridisciplinaire de laboratoires de SHS et d’informatique qui s’intéressent à cette problématique afin de partager données, verrous scientifiques, méthodologies et solutions.

Objectifs

Nous prévoyons une action se déroulant sur deux années, de 2016 à 2017, par l’organisation de 5 journées de rencontres, d’exposés et de discussions, avec un temps d’échange prépondérant. Chaque journée sera marquée par une thématique « données » particulière (par exemple, textes historiques modélisé à l’aide de la TEI et leurs métadonnées, édition ouverte et données bibliographiques…), les traitements déjà mis en œuvre par les laboratoires de SHS concernés ainsi que les perspectives et les problématiques scientifiques associées, et les solutions informatiques susceptibles de répondre à ces problématiques (très probablement pas complètement ni immédiatement).Les résultats attendus de l’action ADOC sont :
• la mise à disposition « à bas niveau » (facilement exploitable par les laboratoires d’informatique) de corpora SHS ;
• la mise à disposition de prototypes logiciels à destination des laboratoires de SHS (si immédiatement exploitables, ou via des projets étudiants coencadrés informatique-SHS) ;
• le dépôt de projets interdisciplinaires entre les membres de l’action, de type PEPS ou BQR à court terme, puis de type ANR à moyen terme.En conséquence, les indicateurs de succès seront :
• le nombre, le type et la taille des corpus traités dans le cadre de l’action ;
• l’utilisation des prototypes et le nombre de nouveaux logiciels développés ou adaptés ;
• le nombre et le type de projets déposés, les publications interdisciplinaires éventuelles.

Visitez le site web de l’Action ADOC


Évènements à venir