Une extension du modèle sémantique latent probabiliste pour le partitionnement non-supervisé de documents textuels

Résumé : Dans cet article, nous proposons une extension du modèle sémantique latent probabiliste (PLSA) pour la tâche de partitionnement de documents (clustering). Nous montrons que ce modèle étendu est équivalent à une combinaison linéaire de modèles de factorisation matricielle non-négative au sens de la fonction objective KL-divergence. Nous validons notre modèle sur les trois collections de documents et, montrons empiriquement que notre approche est statistiquement plus performante que le modèle PLSA de base pour la tâche de clustering.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01294988
Contributor : Lip6 Publications <>
Submitted on : Wednesday, March 30, 2016 - 11:13:05 AM
Last modification on : Thursday, March 21, 2019 - 1:06:51 PM

Identifiers

  • HAL Id : hal-01294988, version 1

Citation

Young-Min Kim, Jean-François Pessiot, Massih-Reza Amini, Patrick Gallinari. Une extension du modèle sémantique latent probabiliste pour le partitionnement non-supervisé de documents textuels. Conférence d'apprentissage, CAP 2009, May 2009, Hammamet, Tunisie. ⟨hal-01294988⟩

Share

Metrics

Record views

52