Un modèle de mélange pour la classification croisée d'un tableau de données continue

Gérard Govaert; Mohamed Nadif

Communication Dans Un Congrès Année : 2009

Un modèle de mélange pour la classification croisée d'un tableau de données continue

(1) , (2)

1
2

Gérard Govaert

Fonction : Auteur
PersonId : 7762
IdHAL : gerard-govaert
IdRef : 059389710

Heuristique et Diagnostic des Systèmes Complexes [Compiègne]

Mohamed Nadif

Fonction : Auteur
PersonId : 761227
ORCID : 0000-0002-0007-3950
IdRef : 139245286

Centre de Recherche en Informatique de Paris 5

Résumé

Contrairement aux méthodes de classification automatique habituelles, les méthodes de classification croisée traitent l'ensemble des lignes et l'ensemble des colonnes d'un tableau de données simultanément en cherchant à obtenir des blocs homogènes. Dans cet article, nous abordons la classification croisée lorsque le tableau de données porte sur un ensemble d'individus décrits par des variables quantitatives et, pour tenir compte de cet objectif, nous proposons un modèle de mélange adapté à la classification croisée conduisant à des critères originaux permettant de prendre en compte des situations plus complexes que les critères habituellement utilisés dans ce contexte. Les paramètres sont alors estimés par un algorithme EM généralisé (GEM) maximisant la vraisemblance des données observées. Nous proposons en outre une nouvelle expression du critère bayésien de l'information, appelée BIC_B, adaptée à notre situation pour évaluer le nombre de blocs. Des expériences numériques portant sur des données synthétiques permettent d'évaluer les performances de GEM et de BIC_B et de montrer l'intérêt de cette approche.

Mots clés

Co-clustering classification croisée modèle de mélange algorithme GEM critère BIC

Domaines

Statistiques [math.ST] Théorie [stat.TH]

Fichier principal

govaert_nadif_cap09.pdf (202.98 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Gérard Govaert : Connectez-vous pour contacter le contributeur

https://hal.science/hal-00447804

Soumis le : vendredi 15 janvier 2010-18:59:46

Dernière modification le : mardi 16 avril 2024-12:00:08

Archivage à long terme le : jeudi 17 juin 2010-22:51:32

Dates et versions

hal-00447804 , version 1 (15-01-2010)

Identifiants

HAL Id : hal-00447804 , version 1

Citer

Gérard Govaert, Mohamed Nadif. Un modèle de mélange pour la classification croisée d'un tableau de données continue. CAP'09, 11e conférence sur l'apprentissage artificiel, May 2009, Hammamet, Tunisie. pp.287-302. ⟨hal-00447804⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-COMPIEGNE HEUDIASYC

300 Consultations

1136 Téléchargements

Un modèle de mélange pour la classification croisée d'un tableau de données continue

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager