Détection de messages abusifs au moyen de réseaux conversationnels - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Détection de messages abusifs au moyen de réseaux conversationnels

Résumé

While online communities have become increasingly important over the years, the moderation of user-generated content is still performed mostly manually. Automating this task is an important step in reducing the financial cost associated with moderation, but the majority of automated approaches strictly based on message content are highly vulnerable to intentional obfuscation. In this paper, we discuss methods for extracting conversational networks based on raw multi-participant chat logs, and we study the contribution of graph features to a classification system that aims to determine if a given message is abusive. The conversational graph-based system yields unexpectedly high performance, with results comparable to those previously obtained with a content-based approach. MOTS-CLÉS : Catégorisation de texte, Détection d'abus, Communautés en ligne, Modération
Le nombre et la taille des communautés en ligne ne cessent de s'accroître depuis l'ap-parition du Web. Cependant, la modération du contenu produit par leurs utilisateurs est toujours essentiellement réalisée manuellement. L'automatisation de cette tâche permettrait de réduire son coût financier, mais la majorité des approches utilisées en production s'appuient unique-ment sur le contenu des messages et apparaissent très sensibles aux méthodes d'obfuscation intentionnelles. Dans cet article, nous proposons une méthode pour l'extraction de réseaux conversationnels à partir des logs de conversations (chat), et nous étudions le pouvoir discri-minant d'un ensemble de mesures topologiques pour un problème de classification consistant à identifier les messages abusifs. Notre approche atteint un niveau de performance inattendu, comparable à celui obtenu précédemment sur les mêmes données avec une approche unique-ment basée sur le contenu.
Fichier principal
Vignette du fichier
marami17.pdf (777.86 Ko) Télécharger le fichier
after-1.pdf (4.69 Ko) Télécharger le fichier
all.pdf (495.04 Ko) Télécharger le fichier
all_pr.pdf (157.41 Ko) Télécharger le fichier
before-1.pdf (4.85 Ko) Télécharger le fichier
full-1.pdf (5.07 Ko) Télécharger le fichier
hermes-journal.bst (144.19 Ko) Télécharger le fichier
presentation.pdf (2.59 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01614279 , version 1 (10-10-2017)

Licence

Paternité - Pas d'utilisation commerciale - Pas de modification

Identifiants

  • HAL Id : hal-01614279 , version 1

Citer

Etienne Papegnies, Richard Dufour, Vincent Labatut, Georges Linarès. Détection de messages abusifs au moyen de réseaux conversationnels. 8ème Conférence Modèles et Analyse des Réseaux : Approches Mathématiques et Informatiques (MARAMI), Oct 2017, La Rochelle, France. ⟨hal-01614279⟩

Collections

UNIV-AVIGNON LIA
322 Consultations
1151 Téléchargements

Partager

Gmail Facebook X LinkedIn More