Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhône valley. The domestic consumption of the Canadian families

The SOM algorithm is now extensively used for data mining, representation of multidimensional data and analysis of relations between variables. With respct to any other classification method, the main characteristic of the SOM classification is the conservation of the topology: after learning, "close" observations are associated to the same class or to "close" classes according to the definition of the neighborhood in the SOM network. This feature allows to consider the resulting classification as a good starting point for further developments as shown in what follows. But in fact its capabilities have not been fully exploited so far. In this chapter, we present some of the techniques that can be derived from the SOM algorithm: the representation of the classes contents, the visualization of the distances between classes, a rapid and robust two-level classification based on the quantitative variables, the computation of clustering indicators, the crossing of the classification with some qualitative variables to interpret the classification and give prominence to the most important explanatory variables. We also define two original algorithms (KORRESP and KACM) to analyze the relations between qualitative variables.

L'algorithme de KOHONEN (ou algorithme d'auto-organisation SOM) est maintenant largement utilisé pour l'analyse exploratoire des données, (le "data mining"), la visualisation et la représentation des données multi-dimensionnelles, l'analyse des relations entre variables quantitatives et/ou qualitatives. La principale caractéristique des classifications obtenues par cette méthode, et qui la distingue des autres méthodes de classification, est ce qu'on appelle la conservation de la topologie : après l'apprentissage, des observations "proches" se retrouvent dans la même classe (ce qui est le cas pour toute méthode de classification), ou dans des classes "proches", selon la définition des voisinages choisie. Cependant, les possibilités de cet algorithme n'ont pas été complètement exploitées jusqu'à présent. Dans ce papier, nous présentons un certain nombre de techniques qui peuvent être drivées de l'algorithme de Kohonen, telles que la représentation des contenus des classes, la visualisation des distances entre les classes, une rapide et robuste classification à deux niveaux emboîtés basés sur les variables quantitatives, le calcul d'indicateurs de classification, le croisement de la classification avec des variables qualitatives exogènes pour permettre la description de la classification obtenue et mettre en évidence les variables explicatives les plus importantes. Nous définissons ainsi deux algorithmes originaux (KORRESP et KACM) pour l'analyse des relations entre variables qualitatives (comme en analyse des correspondances).

Mots clés

data analysis classification self-organization data mining correspondence analysis kohonen algorithm

analyse des données classification auto-organisation data mining analyse des correspondances algorithme de Kohonen

Domaines

Economies et finances

Fichier principal

R99009.pdf (447.26 Ko)

Origine : Fichiers produits par l'(les) auteur(s)
Licence : CC BY - Paternité

Lucie Label : Connectez-vous pour contacter le contributeur

https://shs.hal.science/halshs-03707207

Soumis le : mardi 28 juin 2022-13:47:37

Dernière modification le : mardi 20 juin 2023-18:19:11

Archivage à long terme le : lundi 3 octobre 2022-15:42:50

Dates et versions

halshs-03707207 , version 1 (28-06-2022)

Licence

Paternité

Identifiants

HAL Id : halshs-03707207 , version 1

Citer

Marie Cottrell, Patrice Gaubert, Patrick Letremy, Patrick Rousset. Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhône valley. The domestic consumption of the Canadian families. 1999. ⟨halshs-03707207⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-PARIS1 CNRS SAMOS CAHIERS-MSE

30 Consultations

10 Téléchargements