Co-clustering de données mixtes à base des modèles de mélange - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2017

Co-clustering de données mixtes à base des modèles de mélange

Résumé

Co-clustering is a data mining technique used to extract the underlying block structure between the rows and columns of a data matrix. Many approaches have been studied and have shown their capacity to extract such structures in continuous, binary or contingency tables. However, very little work has been done to perform co-clustering on mixed type data. In this article, we extend the use of latent bloc models to co-clustering in the case of mixed data (continuous and binary variables). We then evaluate the effectiveness of our extension on simulated data and we discuss its potential limits.
La classification croisée (co-clustering) est une technique non super-visée qui permet d'extraire la structure sous-jacente existante entre les lignes et les colonnes d'une table de données sous forme de blocs. Plusieurs approches ont été étudiées et ont démontré leur capacité à extraire ce type de structure dans une table de données continues, binaires ou de contingence. Cependant, peu de travaux ont traité le co-clustering des tables de données mixtes. Dans cet article, nous étendons l'utilisation du co-clustering par modèles à blocs latents au cas des données mixtes (variables continues et variables binaires). Nous évaluons l'efficacité de cette extension sur des données simulées et nous discutons ses limites potentielles.
Fichier principal
Vignette du fichier
boucharebboulleetal2017co-clustering.pdf (410.92 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01469546 , version 1 (16-02-2017)

Licence

Paternité - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : hal-01469546 , version 1

Citer

Aichetou Bouchareb, Marc Boullé, Fabrice Rossi. Co-clustering de données mixtes à base des modèles de mélange. Conférence Internationale Francophone sur l'Extraction et gestion des connaissances (EGC 2017), Jan 2017, Grenoble, France. pp.141-152. ⟨hal-01469546⟩
262 Consultations
832 Téléchargements

Partager

Gmail Facebook X LinkedIn More