Qualité de l'information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets

Mahdi Washha; Manel Mezghani; Florence Sèdes

doi:10.3166/DN.21.3.33-53

Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2018

Qualité de l'information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets

(1) , (1) , (1)

Mahdi Washha

Fonction : Auteur

Systèmes d’Informations Généralisées

Manel Mezghani

Fonction : Auteur
PersonId : 1165320
IdRef : 195589572

Systèmes d’Informations Généralisées

Florence Sèdes

Fonction : Auteur
PersonId : 735498
IdHAL : florence-sedes
ORCID : 0000-0002-9273-302X
IdRef : 033232679

Systèmes d’Informations Généralisées

Résumé

Détecter les actions des utilisateurs mal intentionnés dits "spammeurs" est un réel défi pour maintenir un haut niveau de performance dans les applications mises en œuvre dans les réseaux sociaux. Les méthodes conventionnelles de détection de spams imposent des délais de traitement importants et inévitables, allant jusqu’à des mois pour traiter de grandes collections de tweets. Ces méthodes entièrement dépendantes de l’approche d’apprentissage supervisé pour la classification, requièrent un ensemble de données vérité terrain qui n’est pas disponible pour ce type d’applications. Nous proposons donc une méthode basée sur un modèle linguistique non supervisé qui effectue une collaboration avec d’autres réseaux sociaux pour détecter les tweets spam à partir des hashtags utilisés. Notre méthode a été expérimentée sur plus de 6 millions de tweets postés dans 100 "thématiques tendances". Facebook est utilisé en parallèle comme vérité terrain permettant ainsi la collaboration de deux réseaux sociaux différents. Nos expérimentations démontrent une efficacité en ce qui concerne le temps de traitement et la performance de classification, par rapport aux méthodes classiques de détection de spam dans les tweets.

Mots clés

Thématiques tendances Spam social Réseaux sociaux Collaboration

Domaines

Réseaux sociaux et d'information [cs.SI]

Fichier principal

washha_24936.pdf (604.18 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Open Archive Toulouse Archive Ouverte (OATAO) : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02451040

Soumis le : jeudi 23 janvier 2020-10:54:25

Dernière modification le : jeudi 8 février 2024-15:00:58

Archivage à long terme le : vendredi 24 avril 2020-13:43:12

Dates et versions

hal-02451040 , version 1 (23-01-2020)

Identifiants

HAL Id : hal-02451040 , version 1
DOI : 10.3166/DN.21.3.33-53
OATAO : 24936

Citer

Mahdi Washha, Manel Mezghani, Florence Sèdes. Qualité de l'information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2018, 21 (3), pp.33-53. ⟨10.3166/DN.21.3.33-53⟩. ⟨hal-02451040⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS SMS UT1-CAPITOLE IRIT IRIT-SIG IRIT-GD IRIT-UT3 TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

87 Consultations

149 Téléchargements

Qualité de l'information dans les réseaux sociaux : une méthode collaborative pour détecter les spams dans les tweets

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager