LEMON

Action LEMON (2018-2022)

anaLysE et dynaMique des messages et cONversations radicales sur Internet

Responsables

Correspondant ComDIR : Bruno Cremilleux

Thématiques

Fouille de données, apprentissage, deep learning, sociolinguistique, traitement du langage naturel, représentation des connaissances, ontologies, sociologie, sciences de l’éducation

Données concernées

Données issues de sources ouvertes : corpus de tweets collectés avec des mots-clés spécifiques, collections de blogs et forums en lien avec les idéologies extrêmes (extrême droite, white supremacy, etc…), données issues de réseaux sociaux (interaction, graphes de réseaux). L’action considère principalement des données textuelles, non structurées, en français et en anglais.

Mots clés

Emergence de contenus extrémistes ou haineux, propagation

Contexte et positionnement scientifique

LEMON réunit des chercheurs en sociologie, linguistique, TAL et intelligence artificielle autour de plusieurs défis sociétaux, scientifiques et techniques. La principale évolution dans cette seconde étape de l’action réside dans son orientation vers l’analyse de l’émergence et de la propagation des contenus extrémistes ainsi que leurs connexions avec les contenus haineux. Dans ce contexte, l’analyse des données en ligne permet de dépasser les limites des régions géographiques ou le cercle des liens sociaux pour se focaliser sur l’usage des plateformes sociales (tweets, retweets, likes, etc.). Nous visons des éclairages nouveaux complétant les résultats des méthodes utilisées traditionnellement par les sociologues, dont notamment les interviews et les questionnaires sur des sujets représentatifs.

Les défis scientifiques sont nombreux et impactent chaque thématique : pour le TAL, le défi est lié à la mise au point de méthodes capables de traiter des contenus hétérogènes (différents topics, structures et volumes diverses) et bruités (présence possible d’abréviations ou de textes en plusieurs langues). Pour les méthodes d’apprentissage, un défi majeur reste l’adaptation à un domaine en permanente évolution à la fois dans son contenu (exemple : topics émergents dans la rhétorique de la propagande) et sa forme. Un verrou transversal est la constitution d’un socle cohérent des connaissances soutenu par une model formel mettant en évidence à la fois les indices et facteurs de risque fournis par les modèles sociologiques ainsi que leur ancrage linguistique dans les données récupérées sur Internet.

Dans cette seconde étape de l’action, un défi majeur sera la mise en place de synergies interdisciplinaires supplémentaires. LEMON pourra notamment profiter de sa synchronisation avec FLYER, un projet ANR sélectionné dans le cadre du programme ASTRID 2019. FLYER aborde le développement des méthodes hybrides d’intelligence artificielle pour l’identification des contenus extrémistes sur Internet et prévoit plusieurs cas d’usage pour la validation des techniques. Ces cas d’usage s’inscrivent dans la thématique de l’action.

Tout en gardant son orientation dans le continuum « données, connaissances, interactions » adopté par le GDR MADICS, LEMON visera plus particulièrement :

  • L’analyse des contenus extrémiste dans la blogosphère française ;
  • La constitution de collections de données brutes et annotées pour mettre au point les algorithmes d’extraction ;
  • L’exploration de ces collections d’un point de vue linguistique et sociolinguistique afin de mettre en évidence des indices pertinents ;
  • L’exploitation de ces collections par les sociologues et experts du domaine afin de valider leurs hypothèses : associations de facteurs de risque, corrélation des indices, retour vers le corpus ;
  • • Le développement du dialogue avec la société civile, autours des aspects éthiques de l’exploration de l’Internet.

Pendant ses deux premières années, LEMON a réuni plusieurs partenaires académiques et industriels : le laboratoire de recherche Education, Formation, Travail, Savoirs (EFTS, Université Toulouse 2), représenté par Séraphin Alava, le laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles (LIDILEM , Université Stendhal, Grenoble 3) représenté par Claudine Moïse, le laboratoire Modèles, Dynamiques, Corpus, (MoDyCo, Université Paris Nanterre), représenté par Delphine Battistelli, le Centre d’Etudes des Sociétés Arabes et Musulmanes (CESAM, Université Paris 8), représenté par Mathieu Guidère, l’equipe de Recherche Textes, Informatique, de l’Institut National des Langues et Civilisations Orientales (INALCO, représenté par Mathieu Valette et le Département de Traitement de l’Information et Systèmes (DTIS, Office National d’Etudes et de Recherches Aérospatiales – ONERA), représenté par Claire Saurel, Romain Kervarc et Valentina Dragos.

Plusieurs changements interviennent dans le consortium de l’action pour cette seconde étape : le CESAM ne fera plus partie du consortium suite à la nouvelle affectation de Mathieu Guidère à l’INSERM. Deux nouvelles équipes seront ajoutées : DINO (Data Intensive and Knowledge Oriented Systems), une équipe du laboratoire LIPADE (Laboratoire d’Informatique de l’Université Paris) et MELODI (MEthodes et ingénierie des Langues, des Ontologies et du DIscours), une équipe de l’Institut de Recherche en Informatique de Toulouse (IRIT).

Positionnement dans le paysage de la recherche

Au sein du GDR MADICS, LEMON peut tisser des liens avec plusieurs actions en cours : RoCED , MADONA et également PLATFORM.

LEMON pourra également interagir avec le pré GDR TAL (Traitement Automatique de Langues), ainsi qu’avec le groupe de travail « Apprentissage et raisonnement » du GDR IA (Aspects formels et algorithmiques de l’Intelligence artificielle).

Au niveau international, l’action LEMON pourra continuer ses interactions avec le groupe de travail ETUR (Evaluation of Technologies for Uncertainty Reasoning), une initiative soutenue par ISIF (International Society for Infirmation Fusion) pour investiguer la propagation de l’incertitude dans la fusion des données et informations. ETUR adopte plusieurs cas d’usage pour illustrer l’analyse de l’incertitude, et récemment un cas d’usage autour de l’exploration des données sociales a été mis en place par Valentina Dragos et Claie Laudy (Thales TRT). La thématique commune de LEMON et ETUR concerne la caractérisation des données recueillies sur Internet et l’analyse de leur incertitude.

Site de l’Action LEMON en cours de construction…


Évènements à venir

Date : 2022-05-18 => 2022-06-01Lieu : Grenoble, France Call For Papers: GRAPH-QUALITY Workshop Co-located with ECML-PKDD, 23 September 2022 https://graphquality.github.io/ ************************************************************* [Please accept our apologies if you receive multiple copies of this Call for Papers[...]
Date : 2022-05-27Submission site : https://easychair.org/conferences/?conf=clef2022 (track SimpleText) CEUR-WS templates (both Word and LaTex):
Date : 2022-05-30 => 2022-07-29Lieu : Online During the Inn’EO Summer School, attendees (PhD students and young researchers) will develop new skills both in excellence (modern EO applications using machine and deep learning techniques) and[...]
May 30 – Jun 3 all-day
Date : 2022-05-30 => 2022-06-03Lieu : OnlineThe Inn’EO Startech module aims at coaching PhD students and young researchers towards the spirit of innovation by putting them in a leadership position where they will have to[...]
Date : 2022-05-31Lieu : Conférence Inforsid, Dijon, France Atelier ” Evolution des SI : vers des SI Pervasifs ? ” 3ème édition De l’intelligence à la résilience https://evolution-si.sciencesconf.org Les Systèmes d’Informations sont constamment en train[...]
Date : 2022-05-31Lieu : La Rochelle, FranceDAS 2020 CALL FOR PAPERS: DAS 2022 is the 15th international IAPR-sponsored workshop dedicated towards system-level approaches and related challenges in document analysis and recognition domain. Typically, the workshop[...]
Date : 2022-05-31Lieu : Université de Paris, Paris, FranceDOCTORAL CONSORTIUM This year, the steering committee of ICPRAI 2022 proposes the first version of the Doctoral Consortium (DC) as a satelite event to the main conference[...]
Date : 2022-06-01 => 2022-06-03Lieu : ParisScope As the number of sensors increases due to the development of Internet of Things (body sensors, weather station, …) and the improvement of existing devices (satellite, chirurgical robot,[...]
Date : 2022-06-06 => 2022-06-09Lieu : Paphos, Cyprus **************************************************************************** C A L L F O R P A P E R S – R E S E A R C H T R A C[...]
Date : 2022-06-14 => 2022-06-16Lieu : Palermo, ItalyWe are in the era of Earth Observation and free geo big data generated periodically with high revisiting time. Just to cite some sources of remote sensing data,[...]
Jun 19 – Jun 23 all-day
Date : 2022-06-19 => 2022-06-19Lieu : Bastia, Corse, France, Centre IGESA, La Marana ÉCOLE THÉMATIQUE DU CNRS : BDA MDD 19 – 24 juin 2022, Bastia, Corse, France https://cedric.cnam.fr/lab/confs/mdd2022/ LES INSCRIPTIONS SONT OUVERTES Date limite[...]
Date : 2022-06-20 => 2022-06-24Lieu : Paris, Université Paris Cité (Paris 13).We are glad to announce that the second edition of a workshop on Bayesian Deep Learning for Cosmology and Time Domain Astrophysics 2022 is[...]
Date : 2022-06-27 => 2022-06-30Lieu : Université de Caen NormandieÉcole Thématique BigSportData « Analyse de données sportives massives » Caen du 27 au 30 juin 2022 https://big-sports-data.sciencesconf.org Date limite d’inscription : 15 mai 2022 Public[...]
Date : 2022-06-27 => 2022-06-30Lieu : ENSTA Bretagne, Brest, FranceLe workshop SERENADE 2022 (Surveillance, Etude et Reconnaissance de l’Environnement mariN par Acoustique DiscrètE http://serenade.ensta-bretagne.fr) se tiendra du 27 au 30 juin 2022 à Brest à[...]
Jun 29 all-day
Date : 2022-06-29Lieu : PFIA 2022, Saint Etienne Cette journée est organisée avec le soutien de la Région Auvergne Rhone-Alpes et le Collège Industriel de l’AFIA dans le cadre de la Plate-Forme Intelligence Artificielle (PFIA)[...]
Date : 2022-07-02Web site: https://www.frontiersin.org/research-topics/34050/text-complexity-and-simplification Submission Deadlines 02 July 2022 Manuscript Context Text complexity assessment is one of the urgent problems of our time. Many modern texts, including classroom books and legislative acts, prove to[...]
Date : 2022-07-04 => 2022-07-07Lieu : Samatan, Gers, France Call for Papers Call for Papers SCOPE The second edition of CIRCLE will take place on July 4-7, 2022 at Samatan, Gers, south of France (50[...]
Date : 2022-07-05Lieu : Grenoble, FranceAALTD 2022: CALL FOR PAPERS https://project.inria.fr/aaltd22/ ################################################################################   The 7th International Workshop on Advanced Analytics and Learning on Temporal Data (AALTD 2021) will be held on Friday, September 23, 2022,[...]
Date : 2022-07-07 => 2022-07-08Lieu : Marseille, Campus saint-CharlesComSciCon France, le workshop gratuit de formation à la communication scientifique à destination des doctorant·es de toutes disciplines, revient pour une 3ème édition les 7 et 8[...]
Date : 2022-07-19 => 2022-07-23Lieu : Porto, Portugal17th Conference of the International Federation of Classification Societies Conference topics Big Data • Biplots • Clustering, Classification and Discrimination • Compositional Data Analysis • Computer Graphics and[...]
Date : 2022-08-11 => 2022-08-13Lieu : Nanjing, ChinaThe Asia Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint International Conference on Web and Big Data (APWeb-WAIM) is aiming at attracting professionals of different communities related[...]
Aug 29 – Sep 2 all-day
Date : 2022-08-29 => 2022-09-02Lieu : SCAI, Sorbonne Université, Paris, France. Dear colleagues, We are pleased to announce the ML4Oceans Summer School 2022, to be held from August 29th to September 2nd 2022 at SCAI/Sorbonne[...]
Date : 2022-08-29 => 2022-09-02Lieu : Saarbrücken, Germany******************************************************************* Second Inria-DFKI European Summer School on AI (IDESSAI 2022) Trusted AI and Sustainable AI Saarbrücken, Germany August 29th – September 2nd, 2022 https://idessai.eu/ Registration deadline: May 9th,[...]
Sep 5 – Sep 8 all-day
Date : 2022-09-05 => 2022-09-08Lieu : Torino, Italy******************* IMPORTANT DATES ****************** Paper submission: May 3, 2022 at 5 a.m. CET Notification of acceptance: May 23, 2022 Camera-ready due: June 7, 2022 Workshop day: September 5,[...]
Sep 14 all-day
Date : 2022-09-14Lieu : Université Lumière Lyon 2Les 27èmes Rencontres de la Société Francophone de Classification (SFC) se tiendront du 14 au 16 septembre 2022 à Lyon. Après deux ans d’interruption, ces journées auront lieu[...]
Date : 2022-09-19Lieu : Online EventKEY DATES Paper submission deadline: 20 June 2022 Paper acceptance notification: 13 July 2022 Workshop date: Monday, Septembre 19th, 2022 (to be confirmed) CONTEXT After many years of decline, the[...]
Date : 2022-10-10 => 2022-10-12Lieu : Maison des SCiences de l’Homme, Campusd e DijonLe GIS FRANCE GRILLES, Silecs/Grid’5000, le Groupe Calcul, le GDR RSD, GENCI et les mésocentres organisent ensemble les JCAD 2022, Journées Calcul[...]
Date : 2022-10-10 => 2022-10-14Lieu : Lisbon, Portugal Hybrid mode attendance*** Call for Papers for SUMAC 2022 *** The 4th workshop on Structuring and Understanding of Multimedia heritAge Contents In conjunction with ACM Multimedia 2022[...]
Oct 24 – Oct 27 all-day
Date : 2022-10-24 => 2022-10-27Lieu : LIMOS, Clermont-Ferrand, UCALes 38èmes journées de la conférence BDA « Gestion de Données – Principes, Technologies et Applications » se dérouleront cette année à Clermont-Ferrand du 24 octobre au 27[...]
Date : 2022-11-08 => 2022-11-10Lieu : Palermo ItalyYou are cordially invited to submit your contribution until June 07, 2022. SPEAKERS • Luís A. Nunes Amaral Northwestern University USA • Manuel Cebrian Max Planck Institute for[...]