UN CRITÈRE BASÉ SUR LA DISTANCE DE MAHALANOBIS POUR L'AFFECTATION D'OBJETS SUPPLÉMENTAIRES AUX CLASSES D'UNE CAH EUCLIDIENNE - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

UN CRITÈRE BASÉ SUR LA DISTANCE DE MAHALANOBIS POUR L'AFFECTATION D'OBJETS SUPPLÉMENTAIRES AUX CLASSES D'UNE CAH EUCLIDIENNE

Résumé

In a Euclidean hierarchical ascending clustering (HAC, Ward's method), the usual method for allocating a supplementary individual to a cluster is based on the geometric distance from the individual--point to the barycenter of the cluster. The main drawback of this method is that it does not take into consideration that clusters differ as regards weights, shapes and dispersions. Neither does it take into account successive dichotomies of the hierarchy of clustering. This is why we propose a new ranking rule adapted to geometric data analysis that takes the shape of clusters into account. From a set of supplementary individuals, we propose a strategy for assigning these individuals to clusters stemming from a HAC. The idea is to assign supplementary individuals at the local level of a node to one of its two successors until a cluster of the partition under study is reached. We define an allocation criterion based on the ratio of Mahalanobis distances from the individual--point to barycenters of the two clusters that make up the node. We first introduce the principle of the allocation method, and we apply it to several barometric surveys carried out by the CEVIPOF on various components of trust among French voters. We study the evolution of clusters of individuals between 2009 and 2013. To do so, we have written a program in R language.
Dans une classification ascendante hiérarchique euclidienne (méthode de Ward), la méthode usuelle d'affectation d'un individu supplémentaire à une classe est basée sur la distance géométrique du point-individu au centre de la classe. Cette méthode présente l'inconvénient de ne pas tenir compte de ce que les classes différent, quant aux poids, à leurs formes et à leurs dispersions ; elle ne tient pas compte également des dichotomies successives de la hiérarchie de parties issue de la classification. C'est pourquoi nous proposons une nouvelle règle de classement adaptée à l'analyse géométrique des données qui tient compte de la forme de chacune des classes. Partant d'un ensemble d'individus supplémentaires, nous proposons une stratégie d'affectation de ces individus aux classes issues d'une hiérarchie binaire de parties. L'idée est d'affecter les individus supplémentaires au niveau local d'un nœud à l'un de ses deux successeurs, jusqu'à parvenir à une classe de la partition étudiée. Nous définissons un critère qui repose sur le rapport des distances de Mahalanobis du point-individu au centre des deux classes constituant le nœud. Nous présentons d'abord le principe de la méthode, puis nous l'appliquons à des enquêtes barométriques initiées par le CEVIPOF qui portent sur la confiance des électeurs français. Nous étudions l'évolution des classes d'individus entre 2009 et 2013. Pour cela, nous avons écrit un programme en langage R qui s'exécute depuis le logiciel SPAD.
Fichier principal
Vignette du fichier
jds2014_cassor_leroux.pdf (55.31 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01214638 , version 1 (12-10-2015)

Identifiants

  • HAL Id : hal-01214638 , version 1

Citer

Frédérik Cassor, Brigitte Le Roux. UN CRITÈRE BASÉ SUR LA DISTANCE DE MAHALANOBIS POUR L'AFFECTATION D'OBJETS SUPPLÉMENTAIRES AUX CLASSES D'UNE CAH EUCLIDIENNE. 46èmes Journées de Statistique, Jun 2014, Rennes, France. ⟨hal-01214638⟩
467 Consultations
334 Téléchargements

Partager

Gmail Facebook X LinkedIn More