Une analyse par matrices aléatoires du clustering en ligne : comprendre l'impact des limitations en mémoire - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Une analyse par matrices aléatoires du clustering en ligne : comprendre l'impact des limitations en mémoire

Résumé

Cet article présente une analyse par matrices aléatoires du clustering sur des flux de données. En supposant que, du fait de limitations mémoire, l'on a accès qu'à un petit nombre de données, la matrice de Gram ne peut être calculée que partiellement. Dans un contexte où les données sont de grande dimension, on étudie sa distribution spectrale limite et ses valeurs et vecteurs propres isolés. Puis, on précise comment ces résultats permettent de réaliser un clustering spectral en ligne avec des garanties de performance théoriques. Des applications au clustering d'images confirment nos résultats.
Fichier principal
Vignette du fichier
GRETSI_22_final.pdf (395.77 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03756033 , version 1 (22-08-2022)

Licence

Paternité

Identifiants

  • HAL Id : hal-03756033 , version 1

Citer

Hugo Lebeau, Romain Couillet, Florent Chatelain. Une analyse par matrices aléatoires du clustering en ligne : comprendre l'impact des limitations en mémoire. GRETSI 2022 - XXVIIIème Colloque Francophone de Traitement du Signal et des Images, Sep 2022, Nancy, France. pp.1-4. ⟨hal-03756033⟩
70 Consultations
77 Téléchargements

Partager

Gmail Facebook X LinkedIn More