Skip to Main content Skip to Navigation
Journal articles

Qualité de l'information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets

Mahdi Washha 1 Manel Mezghani 1 Florence Sèdes 1
1 IRIT-SIG - Systèmes d’Informations Généralisées
IRIT - Institut de recherche en informatique de Toulouse
Résumé : Détecter les actions des utilisateurs mal intentionnés dits "spammeurs" est un réel défi pour maintenir un haut niveau de performance dans les applications mises en œuvre dans les réseaux sociaux. Les méthodes conventionnelles de détection de spams imposent des délais de traitement importants et inévitables, allant jusqu’à des mois pour traiter de grandes collections de tweets. Ces méthodes entièrement dépendantes de l’approche d’apprentissage supervisé pour la classification, requièrent un ensemble de données vérité terrain qui n’est pas disponible pour ce type d’applications. Nous proposons donc une méthode basée sur un modèle linguistique non supervisé qui effectue une collaboration avec d’autres réseaux sociaux pour détecter les tweets spam à partir des hashtags utilisés. Notre méthode a été expérimentée sur plus de 6 millions de tweets postés dans 100 "thématiques tendances". Facebook est utilisé en parallèle comme vérité terrain permettant ainsi la collaboration de deux réseaux sociaux différents. Nos expérimentations démontrent une efficacité en ce qui concerne le temps de traitement et la performance de classification, par rapport aux méthodes classiques de détection de spam dans les tweets.
Document type :
Journal articles
Complete list of metadata

Cited literature [27 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02451040
Contributor : Open Archive Toulouse Archive Ouverte (oatao) <>
Submitted on : Thursday, January 23, 2020 - 10:54:25 AM
Last modification on : Thursday, June 10, 2021 - 3:48:44 AM
Long-term archiving on: : Friday, April 24, 2020 - 1:43:12 PM

File

washha_24936.pdf
Files produced by the author(s)

Identifiers

Citation

Mahdi Washha, Manel Mezghani, Florence Sèdes. Qualité de l'information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets. Document Numérique, Lavoisier, 2018, 21 (3), pp.33-53. ⟨10.3166/DN.21.3.33-53⟩. ⟨hal-02451040⟩

Share

Metrics

Record views

48

Files downloads

56