Classification de variables : le package ClustOfVar
Résumé
Le package R ClustOfVar a été développé spécifiquement pour répondre au problème de la classification de variables. Les variables considérées peuvent être toutes quantitatives, toutes qualitatives ou un mélange des deux. Le critère d'homogénéité d'une classe est la somme des carrés des corrélations (pour les variables quantitatives) et des rapports de corrélations (pour les variables qualitatives) à une variable synthétique (quantitative) résumant au mieux les variables de la classe. La variable synthétique qui maximise ce critère est la première composante principale calculée par la méthode PCAMIX. Deux algorithmes sont proposés : un algorithme de classification ascendante hiérarchique et un algorithme de partitionnement de type k-means. Une approche de type bootstrap est proposée pour l'aide au choix du nombre de classes. Les différentes méthodologies sont illustrées sur des données réelles.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...