MultiCons: Multiple Consensus Clustering Method Using Frequent Closed Pattern Mining

Résumé : Le clustering, dont l'objectif est l'identification de groupes d'instances similaires dans un ensemble de données, est l'une des tâches les importantes de la fouille de données. De nombreux algorithmes de clustering ont été développés durant les 50 dernières années. Toutefois, choisir un algorithme pour regrouper des données par similarité est une tâche difficile, surtout si aucune connaissance préalable sur la structure de l'espace des données n'est disponible. Les méthodes de clustering par consensus peuvent être utilisées afin de combiner les résultats de plusieurs clusterings dans une nouvelle solution afin d'obtenir un partitonnement des instances de meilleure qualité. Dans ce travail, nous présentons une nouvelle méthode de clustering par consensus fondée sur la détection des motifs de regroupement sous-jacents communs aux clusterings initiaux en utilisant les itemsets fermés fréquents. De plus, au lieu de générer un unique consensus comme dans les approaches par consensus classiques, cette nouvelle approche permet de générer plusieurs solutions, en se basant sur la variation du nombre d'aggrégation des clusterings initiaux, et de les relier dans une vue hiérarchique afin de faciliter la sélection des regroupements les pus pertinents. Ce point de vue hiérarchique fournit également un outil d'analyse de l'espace des données, par exemple, afin de découvrir des sous-groupes d'instances fortements correlées ou des instances aberrantes.
Type de document :
Rapport
[Research Report] Laboratoire d'Informatique, Signaux et Systèmes de Sophia-Antipolis I3S - UMR7271 - UNS CNRS. 2015


https://hal.archives-ouvertes.fr/hal-01245704
Contributeur : Atheer Al-Najdi <>
Soumis le : jeudi 17 décembre 2015 - 15:16:44
Dernière modification le : vendredi 16 septembre 2016 - 15:17:53

Fichier

MultiCons - research report.pd...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01245704, version 1

Collections

UNICE | I3S | LARA

Citation

Atheer Al-Najdi, Nicolas Pasquier, Frédéric Precioso. MultiCons: Multiple Consensus Clustering Method Using Frequent Closed Pattern Mining. [Research Report] Laboratoire d'Informatique, Signaux et Systèmes de Sophia-Antipolis I3S - UMR7271 - UNS CNRS. 2015. <hal-01245704>

Partager

Métriques

Consultations de
la notice

124

Téléchargements du document

117