Une extension du modèle sémantique latent probabiliste pour le partitionnement non-supervisé de documents textuels - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Une extension du modèle sémantique latent probabiliste pour le partitionnement non-supervisé de documents textuels

Résumé

Dans cet article, nous proposons une extension du modèle sémantique latent probabiliste (PLSA) pour la tâche de partitionnement de documents (clustering). Nous montrons que ce modèle étendu est équivalent à une combinaison linéaire de modèles de factorisation matricielle non-négative au sens de la fonction objective KL-divergence. Nous validons notre modèle sur les trois collections de documents et, montrons empiriquement que notre approche est statistiquement plus performante que le modèle PLSA de base pour la tâche de clustering.
Fichier non déposé

Dates et versions

hal-01294988 , version 1 (30-03-2016)

Identifiants

  • HAL Id : hal-01294988 , version 1

Citer

Young-Min Kim, Jean-François Pessiot, Massih-Reza Amini, Patrick Gallinari. Une extension du modèle sémantique latent probabiliste pour le partitionnement non-supervisé de documents textuels. Conférence d'apprentissage, CAP 2009, May 2009, Hammamet, Tunisie. ⟨hal-01294988⟩
40 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More