Un modèle de mélange pour la classification croisée d'un tableau de données continue
Résumé
Contrairement aux méthodes de classification automatique habituelles, les méthodes de classification croisée traitent l'ensemble des lignes et l'ensemble des colonnes d'un tableau de données simultanément en cherchant à obtenir des blocs homogènes. Dans cet article, nous abordons la classification croisée lorsque le tableau de données porte sur un ensemble d'individus décrits par des variables quantitatives et, pour tenir compte de cet objectif, nous proposons un modèle de mélange adapté à la classification croisée conduisant à des critères originaux permettant de prendre en compte des situations plus complexes que les critères habituellement utilisés dans ce contexte. Les paramètres sont alors estimés par un algorithme EM généralisé (GEM) maximisant la vraisemblance des données observées. Nous proposons en outre une nouvelle expression du critère bayésien de l'information, appelée BIC_B, adaptée à notre situation pour évaluer le nombre de blocs. Des expériences numériques portant sur des données synthétiques permettent d'évaluer les performances de GEM et de BIC_B et de montrer l'intérêt de cette approche.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...