Classification de variables : le package ClustOfVar - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Classification de variables : le package ClustOfVar

Résumé

Le package R ClustOfVar a été développé spécifiquement pour répondre au problème de la classification de variables. Les variables considérées peuvent être toutes quantitatives, toutes qualitatives ou un mélange des deux. Le critère d'homogénéité d'une classe est la somme des carrés des corrélations (pour les variables quantitatives) et des rapports de corrélations (pour les variables qualitatives) à une variable synthétique (quantitative) résumant au mieux les variables de la classe. La variable synthétique qui maximise ce critère est la première composante principale calculée par la méthode PCAMIX. Deux algorithmes sont proposés : un algorithme de classification ascendante hiérarchique et un algorithme de partitionnement de type k-means. Une approche de type bootstrap est proposée pour l'aide au choix du nombre de classes. Les différentes méthodologies sont illustrées sur des données réelles.
Fichier principal
Vignette du fichier
BX2011-PUB00032067.pdf (174.51 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00601919 , version 1 (21-06-2011)

Identifiants

Citer

Marie Chavent, Vanessa Kuentz, Benoit Liquet, Jérôme Saracco. Classification de variables : le package ClustOfVar. 43èmes Journées de Statistique (SFdS), May 2011, Tunis, Tunisie. 6 p. ⟨hal-00601919⟩
408 Consultations
7013 Téléchargements

Partager

Gmail Facebook X LinkedIn More