Retweeter ou ne pas retweeter - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2018

Retweeter ou ne pas retweeter

Résumé

The study of contextual features has been widely discussed in Information Retrieval (IR), but concrete applications on real data streams are not common. In this paper, we aim at doing retweet recommandation. Considering a user interest, we introduce a model to perform real-time online filtering of the Twitter stream using several contextual features. The model separates content and contextual aspects, achieving a very high velocity. Experiments were performed on the TREC Microblog 2015 and TREC 2016 Real-Time Summarization frameworks. Results show that our model is very efficient as well as effective on the 2015 collection. However, the results regarding effectiveness have not been confirmed on the 2016 framework. This led us to conduct a detailed analysis of the results with regard to our approach and the evaluation framework. This analysis showed an evaluation bias discussed at the end of the article.
L'étude des caractéristiques contextuelles a été largement traitée en Recherche d'Information (RI), mais les applications concrètes sur de vrais flux de données ne sont pas très répandues. Dans cet article, notre problématique concerne la décision automatique de retweeter un message. En considérant le centre d'intérêt d'un utilisateur, nous proposons un modèle pour effectuer un filtrage automatique en temps-réel du flux Twitter en utilisant de multiples caractéristiques contextuelles. Le modèle sépare l'aspect contextuel du contenu du message en lui-même, tout en conservant une très grande vitesse d'exécution. Notre modèle a été évalué dans le cadre des tâches TREC Microblog 2015 et TREC Real-Time Summarization 2016. Les résultats montrent la grande efficience (temps de retweet) de notre modèle, et son efficacité sur les mesures de 2015. Ces résultats en termes d'efficacité n'ont cependant pas été confirmés sur 2016. Ceci nous a conduit à une analyse plus en détail des résultats (approche et cadre d'évaluation). Cette analyse a notamment montré un biais dans l'évaluation, biais que nous discutons à la fin de l'article.
Fichier principal
Vignette du fichier
palmer_22738.pdf (467.04 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02064611 , version 1 (12-03-2019)

Identifiants

Citer

Thomas Palmer, Gilles Hubert, Karen Pinel-Sauvagnat. Retweeter ou ne pas retweeter : Le dilemme des portails de diffusion d’information temps-réel. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2018, 21 (3), pp.81-103. ⟨10.3166/DN.21.3.81-103⟩. ⟨hal-02064611⟩
54 Consultations
33 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More