| HAL : hal-00516045, version 1 |
| Fiche détaillée | Récupérer au format |
|
|
| 10ème Conférence Extraction et Gestion des Connaissances (EGC 2010), Hammamet, Tunisie, Hammamet : Tunisie (2010) |
|
|
|
|
| Regrouper les données textuelles et nommer les groupes à l'aide des classes recouvrantes |
|
|
Marian-Andrei Rizoiu 1Julien Velcin 1 |
|
|
| (2010) |
|
|
| Organiser les données textuelles et en tirer du sens est un défi majeur aujourd'hui. Ainsi, lorsque l'on souhaite analyser un débat en ligne ou un forum de discussion, on voudrait pouvoir rapidement voir quels sont les principaux thèmes abordés et la manière dont la discussion se structure autour d'eux. Pour cela, et parce que un même texte peut être associé à plusieurs thèmes, nous proposons une méthode originale pour regrouper les données textuelles en autorisant les chevauchements et pour nommer chaque groupe de manière lisible. La contribution principale de cet article est une méthode globale qui permet de réaliser toute la chaîne, partant des données textuelles brutes jusqu'à la caractérisation des groupes à un niveau sémantique qui dépasse le simple ensemble de mots. |
|
|
|
|
|
|
|
|
|
|
| 1 : | Equipe de Recherche en Ingénierie des Connaissances (ERIC) |
| Université Lumière - Lyon II : EA3083 | |
|
|
|
|
|
|
|
|
| Domaine | : | Statistiques/Machine Learning Informatique/Traitement du texte et du document |
|
|
| Liste des fichiers attachés à ce document : | |||||
|
|
|
| hal-00516045, version 1 | |
| http://hal.archives-ouvertes.fr/hal-00516045 | |
| oai:hal.archives-ouvertes.fr:hal-00516045 | |
| Contributeur : Fabien Rico | |
| Déposé pour le compte de : | |
| Soumis le : Mercredi 8 Septembre 2010, 15:55:33 | |
| Dernière modification le : Mardi 11 Janvier 2011, 16:03:40 | |