Contextualisation automatique de Tweets à partir de Wikipédia

Romain Deveaud 1 Florian Boudin 2
2 TALN
LINA - Laboratoire d'Informatique de Nantes Atlantique
Résumé : Les réseaux sociaux sont au centre des communications sur internet et une grande partie des échanges communautaires se fait à travers eux. Parmi eux, l'apparition de Twitter a donné lieu à la création d'un nouveau type de partage d'informations où les messages sont limités à 140 caractères. Les utilisateurs de ce réseau s'expriment donc succinctement, souvent en temps réel à partir d'un smartphone, et la teneur des messages peut parfois être difficile à comprendre sans contexte. Nous proposons dans cet article une méthode permettant de contextualiser automatiquement des Tweets en utilisant des informations provenant directement de l'encyclopédie en ligne Wikipédia, avec comme but final de répondre à la question : " De quoi parle ce Tweet ? ". Nous traitons ce problème comme une approche de résumé automatique où le texte à résumer est composé d'articles Wikipédia liés aux différentes informations exprimées dans un Tweet. Nous explorons l'influence de différentes méthodes de recherche d'articles liés aux Tweets, ainsi que de plusieurs caractéristiques utiles pour la sélection des phrases formant le contexte. Nous évaluons notre approche en utilisant la collection de la tâche Tweet Contextualization d'INEX 2012 et donnons un aperçu sur ce qui caractérise une phrase importante pour déterminer le contexte d'un Tweet.
Type de document :
Communication dans un congrès
Conférence en Recherche d'Information et Applications (CORIA), Apr 2013, Neuchatel, Suisse. 2013
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00816351
Contributeur : Florian Boudin <>
Soumis le : lundi 22 avril 2013 - 09:01:06
Dernière modification le : jeudi 5 avril 2018 - 10:37:00
Document(s) archivé(s) le : lundi 3 avril 2017 - 08:06:05

Fichier

coria2013_23.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00816351, version 1

Collections

Citation

Romain Deveaud, Florian Boudin. Contextualisation automatique de Tweets à partir de Wikipédia. Conférence en Recherche d'Information et Applications (CORIA), Apr 2013, Neuchatel, Suisse. 2013. 〈hal-00816351〉

Partager

Métriques

Consultations de la notice

352

Téléchargements de fichiers

629