Clustering hiérarchique non paramétrique de données fonctionnelles

Résumé : Dans cet article, il est question de clustering de courbes. Nous proposons une méthode non paramétrique qui segmente les courbes en clusters et discrétise en intervalles les variables continues décrivant les points de la courbe. Le produit cartésien de ces partitions forme une grille de données qui est inférée en utilisant une approche Bayésienne de sélection de modèle ne faisant aucune hypothèse concernant les courbes. Enfin, une technique de post-traitement, visant à réduire le nombre de clusters dans le but d'améliorer l'interprétabilité des clusters, est proposée. Elle consiste à fusionner successivement et de façon optimale les clusters, ce qui revient à réaliser une classification hiérarchique ascendante dont la mesure de dissimilarité correspond à la variation du critère. De manière intéressante, cette mesure est en fait une somme pondérée de divergences de Kullback-Leibler entre les distributions des clusters avant et après fusions. L'intérêt de l'approche dans le cadre de l'analyse exploratoire de données fonctionnelles est illustré par un jeu de données artificiel et réel.
Type de document :
Communication dans un congrès
Extraction et gestion des connaissances, Jan 2012, Bordeaux, France. pp.101--112, 2012


https://hal.archives-ouvertes.fr/hal-00672958
Contributeur : Fabrice Rossi <>
Soumis le : mercredi 22 février 2012 - 13:44:50
Dernière modification le : dimanche 8 février 2015 - 01:01:25
Document(s) archivé(s) le : vendredi 23 novembre 2012 - 16:30:36

Fichiers

EGC12-Boulle_Guigoures.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00672958, version 1

Citation

Marc Boullé, Romain Guigourès, Fabrice Rossi. Clustering hiérarchique non paramétrique de données fonctionnelles. Extraction et gestion des connaissances, Jan 2012, Bordeaux, France. pp.101--112, 2012. <hal-00672958>

Exporter

Partager

Métriques

Consultations de
la notice

245

Téléchargements du document

549