Application du coclustering à l'analyse exploratoire d'une table de données

Résumé : La classification croisée est une technique d'analyse non supervisée qui permet d'extraire la structure sous-jacente existante entre les individus et les variables d'une table de données sous forme de blocs homogènes. Cette technique se limitant aux variables de même nature, soit numériques soit catégo-rielles, nous proposons de l'étendre en proposant une méthodologie en deux étapes. Lors de la première étape, toutes les variables sont binarisées selon un nombre de parties choisi par l'analyste, par discrétisation en fréquences égales dans le cas numérique ou en gardant les valeurs les plus fréquentes dans le cas catégoriel. La deuxième étape consiste à utiliser une méthode de coclustering entre individus et variables binaires, conduisant à des regroupements d'indivi-dus d'une part, et de parties de variables d'autre part. Nous appliquons cette méthodologie sur plusieurs jeux de donnée en la comparant aux résultats d'une analyse par correspondances multiples ACM, appliquée aux même données bi-narisées.
Type de document :
Communication dans un congrès
Fabien Gandon; Gilles Bisson. Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC 2017), Jan 2017, Grenoble, France. Revue des Nouvelles Technologies de l'Information, RNTI-E-33, pp.177-188, 2017, Actes de la 17ème Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC'2017). <http://editions-rnti.fr/?inprocid=1002279>
Liste complète des métadonnées


https://hal.archives-ouvertes.fr/hal-01469509
Contributeur : Fabrice Rossi <>
Soumis le : jeudi 16 février 2017 - 15:09:22
Dernière modification le : vendredi 24 février 2017 - 01:08:49
Document(s) archivé(s) le : mercredi 17 mai 2017 - 19:43:29

Fichiers

boucharebboulleetal2017applica...
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Partage selon les Conditions Initiales 4.0 International License

Identifiants

  • HAL Id : hal-01469509, version 1

Collections

Citation

Aichetou Bouchareb, Marc Boullé, Fabrice Clérot, Fabrice Rossi. Application du coclustering à l'analyse exploratoire d'une table de données. Fabien Gandon; Gilles Bisson. Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC 2017), Jan 2017, Grenoble, France. Revue des Nouvelles Technologies de l'Information, RNTI-E-33, pp.177-188, 2017, Actes de la 17ème Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC'2017). <http://editions-rnti.fr/?inprocid=1002279>. <hal-01469509>

Partager

Métriques

Consultations de
la notice

53

Téléchargements du document

80