Détection de messages abusifs au moyen de réseaux conversationnels

Etienne Papegnies; Richard Dufour; Vincent Labatut; Georges Linarès

Communication Dans Un Congrès Année : 2017

Détection de messages abusifs au moyen de réseaux conversationnels

(1) , (1) , (1) , (1)

Etienne Papegnies

Fonction : Auteur

Laboratoire Informatique d'Avignon

Richard Dufour

Fonction : Auteur
PersonId : 178348
IdHAL : richard-dufour
ORCID : 0000-0003-1203-9108

Laboratoire Informatique d'Avignon

Vincent Labatut

Fonction : Auteur
PersonId : 482
IdHAL : vlabatut
ORCID : 0000-0002-2619-2835
IdRef : 076951375

Laboratoire Informatique d'Avignon

Georges Linarès

Fonction : Auteur
PersonId : 4977
IdHAL : georges-linares
IdRef : 079368794

Laboratoire Informatique d'Avignon

Résumé

While online communities have become increasingly important over the years, the moderation of user-generated content is still performed mostly manually. Automating this task is an important step in reducing the financial cost associated with moderation, but the majority of automated approaches strictly based on message content are highly vulnerable to intentional obfuscation. In this paper, we discuss methods for extracting conversational networks based on raw multi-participant chat logs, and we study the contribution of graph features to a classification system that aims to determine if a given message is abusive. The conversational graph-based system yields unexpectedly high performance, with results comparable to those previously obtained with a content-based approach. MOTS-CLÉS : Catégorisation de texte, Détection d'abus, Communautés en ligne, Modération

Le nombre et la taille des communautés en ligne ne cessent de s'accroître depuis l'ap-parition du Web. Cependant, la modération du contenu produit par leurs utilisateurs est toujours essentiellement réalisée manuellement. L'automatisation de cette tâche permettrait de réduire son coût financier, mais la majorité des approches utilisées en production s'appuient unique-ment sur le contenu des messages et apparaissent très sensibles aux méthodes d'obfuscation intentionnelles. Dans cet article, nous proposons une méthode pour l'extraction de réseaux conversationnels à partir des logs de conversations (chat), et nous étudions le pouvoir discri-minant d'un ensemble de mesures topologiques pour un problème de classification consistant à identifier les messages abusifs. Notre approche atteint un niveau de performance inattendu, comparable à celui obtenu précédemment sur les mêmes données avec une approche unique-ment basée sur le contenu.

Mots clés

Text categorisation Abuse detection Online communities Moderation

Domaines

Informatique et langage [cs.CL] Traitement du texte et du document Réseaux sociaux et d'information [cs.SI]

Fichier principal

marami17.pdf (777.86 Ko)

after-1.pdf (4.69 Ko)

all.pdf (495.04 Ko)

all_pr.pdf (157.41 Ko)

before-1.pdf (4.85 Ko)

full-1.pdf (5.07 Ko)

hermes-journal.bst (144.19 Ko)

presentation.pdf (2.59 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Vincent Labatut : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01614279

Soumis le : mardi 10 octobre 2017-16:26:29

Dernière modification le : vendredi 12 novembre 2021-11:18:05

Dates et versions

hal-01614279 , version 1 (10-10-2017)

Licence

Paternité - Pas d'utilisation commerciale - Pas de modification

Identifiants

HAL Id : hal-01614279 , version 1

Citer

Etienne Papegnies, Richard Dufour, Vincent Labatut, Georges Linarès. Détection de messages abusifs au moyen de réseaux conversationnels. 8ème Conférence Modèles et Analyse des Réseaux : Approches Mathématiques et Informatiques (MARAMI), Oct 2017, La Rochelle, France. ⟨hal-01614279⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-AVIGNON LIA

322 Consultations

1151 Téléchargements

Détection de messages abusifs au moyen de réseaux conversationnels

Résumé

Mots clés

Domaines

Dates et versions

Licence

Identifiants

Citer

Exporter

Collections

Partager