Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhône valley. The domestic consumption of the Canadian families - Archive ouverte HAL Accéder directement au contenu
Autre Publication Scientifique Cahiers de la Maison des Sciences Economiques Année : 1999

Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhône valley. The domestic consumption of the Canadian families

Résumé

The SOM algorithm is now extensively used for data mining, representation of multidimensional data and analysis of relations between variables. With respct to any other classification method, the main characteristic of the SOM classification is the conservation of the topology: after learning, "close" observations are associated to the same class or to "close" classes according to the definition of the neighborhood in the SOM network. This feature allows to consider the resulting classification as a good starting point for further developments as shown in what follows. But in fact its capabilities have not been fully exploited so far. In this chapter, we present some of the techniques that can be derived from the SOM algorithm: the representation of the classes contents, the visualization of the distances between classes, a rapid and robust two-level classification based on the quantitative variables, the computation of clustering indicators, the crossing of the classification with some qualitative variables to interpret the classification and give prominence to the most important explanatory variables. We also define two original algorithms (KORRESP and KACM) to analyze the relations between qualitative variables.
L'algorithme de KOHONEN (ou algorithme d'auto-organisation SOM) est maintenant largement utilisé pour l'analyse exploratoire des données, (le "data mining"), la visualisation et la représentation des données multi-dimensionnelles, l'analyse des relations entre variables quantitatives et/ou qualitatives. La principale caractéristique des classifications obtenues par cette méthode, et qui la distingue des autres méthodes de classification, est ce qu'on appelle la conservation de la topologie : après l'apprentissage, des observations "proches" se retrouvent dans la même classe (ce qui est le cas pour toute méthode de classification), ou dans des classes "proches", selon la définition des voisinages choisie. Cependant, les possibilités de cet algorithme n'ont pas été complètement exploitées jusqu'à présent. Dans ce papier, nous présentons un certain nombre de techniques qui peuvent être drivées de l'algorithme de Kohonen, telles que la représentation des contenus des classes, la visualisation des distances entre les classes, une rapide et robuste classification à deux niveaux emboîtés basés sur les variables quantitatives, le calcul d'indicateurs de classification, le croisement de la classification avec des variables qualitatives exogènes pour permettre la description de la classification obtenue et mettre en évidence les variables explicatives les plus importantes. Nous définissons ainsi deux algorithmes originaux (KORRESP et KACM) pour l'analyse des relations entre variables qualitatives (comme en analyse des correspondances).
Fichier principal
Vignette du fichier
R99009.pdf (447.26 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Licence : CC BY - Paternité

Dates et versions

halshs-03707207 , version 1 (28-06-2022)

Licence

Paternité

Identifiants

  • HAL Id : halshs-03707207 , version 1

Citer

Marie Cottrell, Patrice Gaubert, Patrick Letremy, Patrick Rousset. Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhône valley. The domestic consumption of the Canadian families. 1999. ⟨halshs-03707207⟩
30 Consultations
10 Téléchargements

Partager

Gmail Facebook X LinkedIn More