Utilisation de techniques de modélisation thématiques pour la détection de nouveauté dans des flux de données textuelles - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Utilisation de techniques de modélisation thématiques pour la détection de nouveauté dans des flux de données textuelles

Résumé

Avec l'avènement des réseaux sociaux et la multiplication des messages produits au sujet des entreprises, mieux comprendre les retours clients est devenu un enjeu primordial. Des techniques de classification automatique et de modélisation thématique permettent d'ors déjà d'observer les principales ten-dances observées dans ces données. Il est intéressant, dans une optique d'antici-pation, d'observer les thématiques émergentes et de les identifier avant qu'elles ne prennent de l'ampleur. Afin de résoudre cette problématique, nous avons étu-dié la piste de l'utilisation de modèles LDA pour détecter les documents relatifs à ces thématiques émergentes. Nous avons testé trois systèmes sur plusieurs scé-narios d'arrivées de la nouveauté dans le flux de données. Nous montrons que les modèles thématiques permettent de détecter cette nouveauté mais que cela dépend du scénario envisagé.
Fichier non déposé

Dates et versions

hal-01803649 , version 1 (30-05-2018)

Identifiants

  • HAL Id : hal-01803649 , version 1

Citer

Clément Christophe, Julien Velcin, Manel Boumghar. Utilisation de techniques de modélisation thématiques pour la détection de nouveauté dans des flux de données textuelles. Extraction et Gestion des connaissances (EGC2018), Jan 2018, Paris, France. ⟨hal-01803649⟩
106 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More