Clustering en haute dimension par accumulation de clusterings locaux

Marc-Ismaël Akodjenou 1 Kavé Salamatian 2 Patrick Gallinari 1
1 MALIRE - Machine Learning and Information Retrieval
LIP6 - Laboratoire d'Informatique de Paris 6
2 NPA - Networks and Performance Analysis
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Le clustering est une tâche fondamentale de la fouille de données. Ces dernières années, les méthodes de type cluster ensembles ont été l'objet d'une attention soutenue. Il s'agit d'agréger plusieurs clusterings d'un jeu de données afin d'obtenir un clustering "moyen". Les clusterings individuels peuvent être le résultat de différents algorithmes. Ces méthodes sont particulièrement utiles lorsque la dimensionalité des données ne permet pas aux méthodes classiques basées sur la distance et/ou la densité de fonctionner correctement. Dans cet article, nous proposons une méthode pour obtenir des clusterings individuels à faible coût, à partir de projections partielles du jeu de données. Nous évaluons empiriquement notre méthode et la comparons à trois méthodes de différents types. Nous constatons qu'elle donne des résultats sensiblement supérieurs aux autres.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01301563
Contributor : Lip6 Publications <>
Submitted on : Tuesday, April 12, 2016 - 2:32:58 PM
Last modification on : Thursday, March 21, 2019 - 1:09:12 PM

Identifiers

  • HAL Id : hal-01301563, version 1

Citation

Marc-Ismaël Akodjenou, Kavé Salamatian, Patrick Gallinari. Clustering en haute dimension par accumulation de clusterings locaux. Extraction et Gestion des Connaissances EGC'2008, Jan 2008, Sophia-Antipolis, France. pp.253-264. ⟨hal-01301563⟩

Share

Metrics

Record views

57