De quoi parle ce Tweet? Résumer Wikipédia pour contextualiser des microblogs

Romain Deveaud 1, * Florian Boudin 2
* Auteur correspondant
2 TALN
LINA - Laboratoire d'Informatique de Nantes Atlantique
Résumé : Les réseaux sociaux sont au centre des communications sur internet et une grande partie des échanges communautaires se fait à travers eux. Parmi eux, l'apparition de Twitter a donné lieu à la création d'un nouveau type de partage d'informations où les messages sont limités à 140 caractères. Les utilisateurs de ce réseau s'expriment donc succinctement, souvent en temps réel à partir d'un smartphone, et la teneur des messages peut parfois être difficile à comprendre sans contexte. Nous proposons dans cet article une méthode permettant de contextualiser automatiquement des Tweets en utilisant des informations provenant directement de l'encyclopédie en ligne Wikipédia, avec comme but final de répondre à la question : De quoi parle ce Tweet?. Nous traitons ce problème comme une approche de résumé automatique où le texte à résumer est composé d'articles Wikipédia liés aux différentes informations exprimées dans un Tweet. Nous explorons l'influence de différentes méthodes de recherche d'articles liés aux Tweets, ainsi que de plusieurs caractéristiques utiles pour la sélection des phrases formant le contexte. Nous évaluons notre approche en utilisant la collection de la tâche Tweet Contextualization d'INEX 2012 et donnons un aperçu sur ce qui caractérise une phrase importante pour déterminer le contexte d'un Tweet.
Type de document :
Article dans une revue
Revue I3 - Information Interaction Intelligence, Cépaduès, 2014, pp.37-56
Liste complète des métadonnées

Littérature citée [21 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01096926
Contributeur : Florian Boudin <>
Soumis le : jeudi 18 décembre 2014 - 14:39:46
Dernière modification le : jeudi 5 avril 2018 - 10:37:00
Document(s) archivé(s) le : lundi 23 mars 2015 - 16:45:57

Fichier

RI3.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01096926, version 1

Collections

Citation

Romain Deveaud, Florian Boudin. De quoi parle ce Tweet? Résumer Wikipédia pour contextualiser des microblogs. Revue I3 - Information Interaction Intelligence, Cépaduès, 2014, pp.37-56. 〈hal-01096926〉

Partager

Métriques

Consultations de la notice

154

Téléchargements de fichiers

322