L’IA pour un meilleur accès au réseau de textes juridiques – Application à la législation française

When:
20/05/2022 – 21/05/2022 all-day
2022-05-20T02:00:00+02:00
2022-05-21T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CEDRIC – CNAM Paris
Durée : 3 ans
Contact : nada.mimouni@cnam.fr
Date limite de publication : 2022-05-20

Contexte :
Dans un cadre de transparence envers ses citoyens et afin de faciliter leur participation à la vie démocratique, plusieurs pays ont opté pour le partage de l’information publique et adopté des lois favorisant l’accès à cette information sous toutes ses formes.

En particulier, l’accès au droit est rendu possible via des outils en ligne comme Legifrance (https://www.legifrance.gouv.fr/), un service public de diffusion du droit créé en 2002 en France. Il propose une base très complète constituée des codes officiels et textes consolidés en vigueur, textes du journal officiel et de jurisprudence.

Cet accès doit permettre au citoyen de tracer le cadre de ces droits et devoirs face aux situations auxquelles il est confronté tous les jours. Or, tel qu’il est conçu le droit peut s’avérer complexe et inaccessible pour un simple citoyen.

En effet, malgré l’encadrement dont bénéficie l’utilisateur de Legifrance pour interroger son contenu, un usage optimal suppose de maîtriser le mode d’élaboration des textes, leurs structures et chainages dans le temps, la hiérarchie des normes ainsi que le langage utilisé.

D’autres sites publics offrent des versions explicatives du droit présenté sous sa forme brute sur Legifrance. Leurs consultation s’impose au spécialiste du secteur de droit, tout comme au simple utilisateur, lorsqu’il s’agit d’interpréter les règles de droit. Ils seront souvent amenés à naviguer parmi les pages de ces sites et à travers les différents corpus (législation, jurisprudence, etc.) pour pouvoir construire une réponse à un besoin spécifique.

Dans ce contexte, l’accès à l’information juridique est la première grande question dans l’accès au droit.
Les textes dans le domaine juridique possèdent des caractéristiques spécifiques qui sont importantes à prendre en compte pour améliorer l’accès à l’information.
D’un côté, le contenu sémantique de ces textes est souvent exprimé par un vocabulaire et sous des formes linguistiques complexes. D’un autre côté, les documents sont de différents types avec une structure particulière à chacun de ces types et ils contiennent des références de différentes natures vers d’autres textes qui définissent le contexte dans lequel ils doivent être interprétés.

Sujet :
Les récentes avancées dans les différents domaines de l’IA ont mis en avant de nouvelles approches et méthodes de traitement de données de différentes natures (brutes, formatées, etc.) et types (numériques, textuelles, etc.). En particulier, dans le contexte d’accès à l’information juridique, nous jugeons très pertinent la mise en place d’une approche pluridisciplinaire d’analyse et de fouille dans ces collections de textes pour la prise en compte de ces dimensions sémantique et intertextuelle. L’objectif à terme est de proposer un système qui utilise des méthodes d’IA (méthodes statistique, symboliques, de traitement automatique de textes) combinées avec des techniques d’analyse de graphes pour mieux répondre aux besoins des utilisateurs.

Le projet a un double objectif qui se décline en deux étapes :

* Explorer l’utilisation des nouvelles technologies de l’IA pour la fouille de gros volumes de textes juridiques disponibles en ligne (modélisation sémantique, résumé automatique, traduction automatique, classification, régression, etc.).
* Intégration des résultats de la première étape dans un modèle sémantique plus complet pour un système riche d’accès à l’information juridique.

Profil du candidat :
Le (la) candidat(e) devra avoir de très bonnes aptitudes en apprentissage automatique et traitement de données. Une connaissance en ingénierie de connaissances et techniques du web sémantique sera très appréciée. Le (la) candidat(e) devra avoir de très bonnes aptitudes linguistiques en français et en anglais (parlé et écrit).

Formation et compétences requises :
Master 2 ou équivalent en informatique.

Adresse d’emploi :
CNAM Paris, laboratoire CEDRIC.

Document attaché : 202205091416_2022-AI-for-legal-access-cnam.pdf