Utilisation de techniques de modélisation thématiques pour la détection de nouveauté dans des flux de données textuelles

Résumé : Avec l'avènement des réseaux sociaux et la multiplication des messages produits au sujet des entreprises, mieux comprendre les retours clients est devenu un enjeu primordial. Des techniques de classification automatique et de modélisation thématique permettent d'ors déjà d'observer les principales ten-dances observées dans ces données. Il est intéressant, dans une optique d'antici-pation, d'observer les thématiques émergentes et de les identifier avant qu'elles ne prennent de l'ampleur. Afin de résoudre cette problématique, nous avons étu-dié la piste de l'utilisation de modèles LDA pour détecter les documents relatifs à ces thématiques émergentes. Nous avons testé trois systèmes sur plusieurs scé-narios d'arrivées de la nouveauté dans le flux de données. Nous montrons que les modèles thématiques permettent de détecter cette nouveauté mais que cela dépend du scénario envisagé.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01803649
Contributor : Clément Christophe <>
Submitted on : Wednesday, May 30, 2018 - 4:20:50 PM
Last modification on : Saturday, March 30, 2019 - 1:07:43 AM

Identifiers

  • HAL Id : hal-01803649, version 1

Collections

Citation

Clément Christophe, Julien Velcin, Manel Boumghar. Utilisation de techniques de modélisation thématiques pour la détection de nouveauté dans des flux de données textuelles. Extraction et Gestion des connaissances (EGC2018), Jan 2018, Paris, France. ⟨hal-01803649⟩

Share

Metrics

Record views

39