LEMON

Action LEMON (2018-2022)

anaLysE et dynaMique des messages et cONversations radicales sur Internet

Responsables

Correspondant ComDIR :

Thématiques

Fouille de données, apprentissage, deep learning, sociolinguistique, traitement du langage naturel, représentation des connaissances, ontologies, sociologie, sciences de l’éducation

Données concernées

Données issues de sources ouvertes : corpus de tweets collectés avec des mots-clés spécifiques, collections de blogs et forums en lien avec les idéologies extrêmes (extrême droite, white supremacy, etc…), données issues de réseaux sociaux (interaction, graphes de réseaux). L’action considère principalement des données textuelles, non structurées, en français et en anglais.

Mots clés

Emergence de contenus extrémistes ou haineux, propagation

Contexte et positionnement scientifique

LEMON réunit des chercheurs en sociologie, linguistique, TAL et intelligence artificielle autour de plusieurs défis sociétaux, scientifiques et techniques. La principale évolution dans cette seconde étape de l’action réside dans son orientation vers l’analyse de l’émergence et de la propagation des contenus extrémistes ainsi que leurs connexions avec les contenus haineux. Dans ce contexte, l’analyse des données en ligne permet de dépasser les limites des régions géographiques ou le cercle des liens sociaux pour se focaliser sur l’usage des plateformes sociales (tweets, retweets, likes, etc.). Nous visons des éclairages nouveaux complétant les résultats des méthodes utilisées traditionnellement par les sociologues, dont notamment les interviews et les questionnaires sur des sujets représentatifs.

Les défis scientifiques sont nombreux et impactent chaque thématique : pour le TAL, le défi est lié à la mise au point de méthodes capables de traiter des contenus hétérogènes (différents topics, structures et volumes diverses) et bruités (présence possible d’abréviations ou de textes en plusieurs langues). Pour les méthodes d’apprentissage, un défi majeur reste l’adaptation à un domaine en permanente évolution à la fois dans son contenu (exemple : topics émergents dans la rhétorique de la propagande) et sa forme. Un verrou transversal est la constitution d’un socle cohérent des connaissances soutenu par une model formel mettant en évidence à la fois les indices et facteurs de risque fournis par les modèles sociologiques ainsi que leur ancrage linguistique dans les données récupérées sur Internet.

Dans cette seconde étape de l’action, un défi majeur sera la mise en place de synergies interdisciplinaires supplémentaires. LEMON pourra notamment profiter de sa synchronisation avec FLYER, un projet ANR sélectionné dans le cadre du programme ASTRID 2019. FLYER aborde le développement des méthodes hybrides d’intelligence artificielle pour l’identification des contenus extrémistes sur Internet et prévoit plusieurs cas d’usage pour la validation des techniques. Ces cas d’usage s’inscrivent dans la thématique de l’action.

Tout en gardant son orientation dans le continuum « données, connaissances, interactions » adopté par le GDR MADICS, LEMON visera plus particulièrement :

  • L’analyse des contenus extrémiste dans la blogosphère française ;
  • La constitution de collections de données brutes et annotées pour mettre au point les algorithmes d’extraction ;
  • L’exploration de ces collections d’un point de vue linguistique et sociolinguistique afin de mettre en évidence des indices pertinents ;
  • L’exploitation de ces collections par les sociologues et experts du domaine afin de valider leurs hypothèses : associations de facteurs de risque, corrélation des indices, retour vers le corpus ;
  • • Le développement du dialogue avec la société civile, autours des aspects éthiques de l’exploration de l’Internet.

Pendant ses deux premières années, LEMON a réuni plusieurs partenaires académiques et industriels : le laboratoire de recherche Education, Formation, Travail, Savoirs (EFTS, Université Toulouse 2), représenté par Séraphin Alava, le laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles (LIDILEM , Université Stendhal, Grenoble 3) représenté par Claudine Moïse, le laboratoire Modèles, Dynamiques, Corpus, (MoDyCo, Université Paris Nanterre), représenté par Delphine Battistelli, le Centre d’Etudes des Sociétés Arabes et Musulmanes (CESAM, Université Paris 8), représenté par Mathieu Guidère, l’equipe de Recherche Textes, Informatique, de l’Institut National des Langues et Civilisations Orientales (INALCO, représenté par Mathieu Valette et le Département de Traitement de l’Information et Systèmes (DTIS, Office National d’Etudes et de Recherches Aérospatiales – ONERA), représenté par Claire Saurel, Romain Kervarc et Valentina Dragos.

Plusieurs changements interviennent dans le consortium de l’action pour cette seconde étape : le CESAM ne fera plus partie du consortium suite à la nouvelle affectation de Mathieu Guidère à l’INSERM. Deux nouvelles équipes seront ajoutées : DINO (Data Intensive and Knowledge Oriented Systems), une équipe du laboratoire LIPADE (Laboratoire d’Informatique de l’Université Paris) et MELODI (MEthodes et ingénierie des Langues, des Ontologies et du DIscours), une équipe de l’Institut de Recherche en Informatique de Toulouse (IRIT).

Positionnement dans le paysage de la recherche

Au sein du GDR MADICS, LEMON peut tisser des liens avec plusieurs actions en cours : RoCED , MADONA et également PLATFORM.

LEMON pourra également interagir avec le pré GDR TAL (Traitement Automatique de Langues), ainsi qu’avec le groupe de travail « Apprentissage et raisonnement » du GDR IA (Aspects formels et algorithmiques de l’Intelligence artificielle).

Au niveau international, l’action LEMON pourra continuer ses interactions avec le groupe de travail ETUR (Evaluation of Technologies for Uncertainty Reasoning), une initiative soutenue par ISIF (International Society for Infirmation Fusion) pour investiguer la propagation de l’incertitude dans la fusion des données et informations. ETUR adopte plusieurs cas d’usage pour illustrer l’analyse de l’incertitude, et récemment un cas d’usage autour de l’exploration des données sociales a été mis en place par Valentina Dragos et Claie Laudy (Thales TRT). La thématique commune de LEMON et ETUR concerne la caractérisation des données recueillies sur Internet et l’analyse de leur incertitude.

Site de l’Action LEMON en cours de construction…


Évènements à venir

Date : 2024-05-03Lieu : BnF – Paris(Avec toutes nos excuses en cas de réceptions multiples) Le vocable humanités numériques s’est aujourd’hui imposé pour désigner les travaux de recherche relevant tantôt de la création, la gestion[...]
May 6 – May 7 all-day
Date : 2024-05-06 => 2024-05-07Lieu : Bordeaux, FranceAnnouncement and Call for papers 1st Edition of Econom’IA Conference We are proud to announce the first Econom’IA conference that will take place in BSE (Bordeaux School of[...]
May 8 – May 14 all-day
Date : 2024-05-08 => 2024-05-14Lieu : Brasov, RoumanieEcole intelligence artificielle pour l’agriculture. L’école est gratuite, les étudiants logés. En revanche, les frais de déplacements ne sont pas pris en compte par l’école. Les financements sont[...]
May 27 – May 31 all-day
Date : 2024-05-27 => 2024-05-31Lieu : Nancy – France1er Appel à Communication INFORSID 2024 @Nancy (Date limite de réception des articles : 23 février 2024) Les organisations et le monde vivent actuellement de grandes transformations[...]
Date : 2024-05-28Lieu : Montpellier, FranceWorkshop on Complex Network Sparsification In conjunction with the French Regional Conference on Complex Systems (FRCCS 2024) May 28, 2024  Montpellier France The aim of this workshop is to bring[...]
Date : 2024-05-29 => 2024-05-31Lieu : Université Grenoble Alpes MACI 339 avenue Centrale Domaine Universitaire 38400 Saint-Martin-d’Hères Dear colleagues, We would like to invite you to the Grenoble Artificial Intelligence for Physical Sciences Workshop” (GAP2024)[...]
Date : 2024-05-31Lieu : Le séminaire des doctorants aura lieu sur plusieurs sites locaux, et en ligne.Séminaire des doctorantes et doctorants en informatique Le 31 mai 2024, se tiendra le séminaire des doctorantes et doctorants[...]
Date : 2024-06-06 => 2024-06-07Lieu : Université Savoie Mont Blanc=========================================================================== CALL FOR PARTICIPATION ONSITE & ONLINE TOTh 2024 – Terminology & Ontology: Theories and applications University Savoie Mont Blanc (France) Conference: 6 & 7 June[...]
Date : 2024-06-17 => 2024-06-20Lieu : Tampere, FinlandCall for Papers – ICWE 2024 24th International Conference on Web Engineering June 17-20, 2024 in Tampere, Finland https://icwe2024.webengineering.org ICWE 2024 – AT A GLANCE The International Conference[...]
Date : 2024-06-17 => 2023-09-21Lieu : LIASD, IUT de Montreuil, Université Paris8 Adresse : 140, rue de la nouvelle France 93100 MontreuilDear, You are invited to attend a presentation by Professor Tommie Meyer (University of[...]
Date : 2024-06-17 => 2024-02-19Lieu : Poitiers, FranceOverview ********* Welcome to ISMIS 2024 27th International Symposium on Methodologies for Intelligent Systems Website of the Conference: https://ismis2024.ensma.fr/ June 17 – 19, 2024 Poitiers, France ISMIS is[...]
Date : 2024-06-18 => 2024-06-20Lieu : Rennes, FranceSave the date! The ACM Conference on Reproducibility and Replicability will take place on: June 18-20, 2024 at INRIA, Rennes, France This will be a hybrid event –[...]
Jun 23 – Jun 27 all-day
Date : 2024-06-23 => 2024-06-27Lieu : Ceillac-en-QueyrasThe thematic school ‘Masses de Données’ (MDD) originates from the research community in databases. Its aim is to strengthen the educational component (tutorials) within an independent event, leading to[...]
Date : 2024-06-24 => 2024-07-01Lieu : INSA de Rouen (76)Les graphes sont au cœur de nombreuses thématiques de recherche ou apparaissent spontanément dans des projets où on ne les attendaient pas. Le traitement de ces[...]
Jul 30 – Aug 2 all-day
Date : 2024-07-30 => 2024-08-02Lieu : Vienne AutricheThe 5th International Workshop on Graph-based Approaches for CyberSecurity to be held in conjunction with the 19th International Conference on Availability, Reliability and Security Vienna, Austria July 30[...]
Date : 2024-08-05Lieu : Co-localisé avec la conférence IJCAI 2024, île de Jeju, Corée du SudCall For Papers The 3rd International Workshop on Spatio-Temporal Reasoning and Learning (STRL 2024) will take place in Jeju, South[...]
Aug 26 – Aug 30 all-day
Date : 2024-08-26 => 2024-08-30Lieu : Lyon, FranceConference EUSIPCO 2024, in Lyon (France) on August 26th-30th. https://eusipcolyon.sciencesconf.org Important dates: Special Session proposals: Jan 14, 2024 / Submission of Tutorial proposals: March 1, 2024 / Full[...]
Date : 2024-08-28Lieu : Bayonne, France**************************** CALL FOR PAPERS DOING 2024: 5th International Workshop on Intelligent Data – From Data to Knowledge **************************** August 28, 2024 Bayonne, France In conjunction with ADBIS 2024 https://www.univ-orleans.fr/lifo/evenements/doing/?page_id=1259 https://conferences.sigappfr.org/adbis2024/[...]
Date : 2024-10-22 => 2024-10-26Lieu : Sousse, Tunisia The ACS/IEEE 21st International Conference on Computer Systems and Applications (AICCSA 2024) 22-26 October 2024 Sousse, Tunisia https://aiccsa.net/AICCSA2024/call-for-papers/ The ACS/IEEE International Conference on Computer Systems and Applications[...]
Date : 2024-12-02 => 2024-12-05Lieu : Lyon, FranceDear Colleagues, We are thrilled to announce the opening of extended abstract submissions for the 15th edition of the Traffic & Granular Flow (TGF) Conference, a pivotal event[...]