| HAL : hal-00636285, version 1 |
| DOI : 10.1007/978-3-642-23091-2_15 |
| CEMOA : http://cemadoc.irstea.fr/cemoa/PUB00033719 |
| Fiche détaillée | Récupérer au format |
|
|
| Lecture notes in computer science 6861, 2 (2011) p. 154 - p. 161 |
|
|
|
|
| Towards an On-Line Analysis of Tweets Processing |
|
|
| S. Bringay 1Nicolas Béchet 2 |
|
|
| (2011) |
|
|
| Tweets exchanged over the Internet represent an important source of information, even if their characteristics make them dicult to analyze (a maximum of 140 characters, etc.). In this paper, we define a data warehouse model to analyze large volumes of tweets by proposing measures relevant in the context of knowledge discovery. The use of data warehouses as a tool for the storage and analysis of textual documents is not new but current measures are not well-suited to the specificities of the manipulated data. We also propose a new way for extracting the context of a concept in a hierarchy. Experiments carried out on real data underline the relevance of our proposal. |
|
|
|
|
|
|
|
|
|
|
| 1 : | Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM) |
| CNRS : UMR5506 – Université Montpellier II - Sciences et Techniques du Languedoc | |
| 2 : | AxIS (INRIA Rocquencourt / INRIA Sophia Antipolis) |
| INRIA | |
| 3 : | Territoires, Environnement, Télédétection et Information Spatiale (UMR TETIS) |
| CIRAD : UMR91 – CEMAGREF-UR LCMO – Ecole Nationale du Génie Rural des Eaux et Forêts | |
|
|
|
|
|
|
|
|
| Domaine | : | Sciences de l'environnement |
|
|
| INFORMATIQUE – ENTREPOT DE DONNEES – ANALYSE DE DONNEES – TWEET – DATA MINING |
|
|
| Liste des fichiers attachés à ce document : | |||||
|
|
|
| hal-00636285, version 1 | |
| http://hal.archives-ouvertes.fr/hal-00636285 | |
| oai:hal.archives-ouvertes.fr:hal-00636285 | |
| Contributeur : Import Ws Irstea | |
| Déposé pour le compte de : | |
| Soumis le : Jeudi 27 Octobre 2011, 10:41:54 | |
| Dernière modification le : Jeudi 3 Novembre 2011, 11:07:24 | |