Clustering hiérarchique non paramétrique de données fonctionnelles

Résumé : Dans cet article, il est question de clustering de courbes. Nous proposons une méthode non paramétrique qui segmente les courbes en clusters et discrétise en intervalles les variables continues décrivant les points de la courbe. Le produit cartésien de ces partitions forme une grille de données qui est inférée en utilisant une approche Bayésienne de sélection de modèle ne faisant aucune hypothèse concernant les courbes. Enfin, une technique de post-traitement, visant à réduire le nombre de clusters dans le but d'améliorer l'interprétabilité des clusters, est proposée. Elle consiste à fusionner successivement et de façon optimale les clusters, ce qui revient à réaliser une classification hiérarchique ascendante dont la mesure de dissimilarité correspond à la variation du critère. De manière intéressante, cette mesure est en fait une somme pondérée de divergences de Kullback-Leibler entre les distributions des clusters avant et après fusions. L'intérêt de l'approche dans le cadre de l'analyse exploratoire de données fonctionnelles est illustré par un jeu de données artificiel et réel.
Document type :
Conference papers
Extraction et gestion des connaissances, Jan 2012, Bordeaux, France. pp.101--112, 2012


https://hal.archives-ouvertes.fr/hal-00672958
Contributor : Fabrice Rossi <>
Submitted on : Wednesday, February 22, 2012 - 1:44:50 PM
Last modification on : Sunday, February 8, 2015 - 1:01:25 AM

Files

EGC12-Boulle_Guigoures.pdf
fileSource_public_author

Identifiers

  • HAL Id : hal-00672958, version 1

Citation

Marc Boullé, Romain Guigourès, Fabrice Rossi. Clustering hiérarchique non paramétrique de données fonctionnelles. Extraction et gestion des connaissances, Jan 2012, Bordeaux, France. pp.101--112, 2012. <hal-00672958>

Export

Share

Metrics

Consultation de
la notice

167

Téléchargement du document

211