Échantillonnage compressé et réduction de dimension pour l'apprentissage non supervisé

Anthony Bourrier

Thèse Année : 2014

Échantillonnage compressé et réduction de dimension pour l'apprentissage non supervisé

Compressed sensing and dimensionality reduction for unsupervised learning

(1)

Anthony Bourrier

Fonction : Auteur
PersonId : 780226
IdRef : 180347403

Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio

Résumé

This thesis is motivated by the perspective of connecting compressed sensing and machine learning, and more particularly by the exploitation of compressed sensing techniques to reduce the cost of learning tasks. After a reminder of compressed sensing and a quick description of data analysis techniques in which similar ideas are exploited, we propose a framework for estimating probability density mixture parameters in which the training data is compressed into a fixed-size representation. We instantiate this framework on an isotropic Gaussian mixture model. This proof of concept suggests the existence of theoretical guarantees for reconstructing signals belonging to models beyond usual sparse models. We therefore study generalizations of stability results for linear inverse problems for very general models of signals. We propose conditions under which reconstruction guarantees can be given in a general framework. Finally, we consider an approximate nearest neighbor search problem exploiting signatures of the database vectors in order to save resources during the search step. In the case where the considered distance derives from a Mercer kernel, we propose to combine an explicit embedding of data followed by a signature computation step, which principally leads to a more accurate approximate search.

Cette thèse est motivée par la perspective de rapprochement entre traitement du signal et apprentissage statistique, et plus particulièrement par l'exploitation de techniques d'échantillonnage compressé afin de réduire le coût de tâches d'apprentissage. Après avoir rappelé les bases de l'échantillonnage compressé et mentionné quelques techniques d'analyse de données s'appuyant sur des idées similaires, nous proposons un cadre de travail pour l'estimation de paramètres de mélange de densités de probabilité dans lequel les données d'entraînement sont compressées en une représentation de taille fixe. Nous instancions ce cadre sur un modèle de mélange de Gaussiennes isotropes. Cette preuve de concept suggère l'existence de garanties théoriques de reconstruction d'un signal pour des modèles allant au-delà du modèle parcimonieux usuel de vecteurs. Nous étudions ainsi dans un second temps la généralisation de résultats de stabilité de problèmes inverses linéaires à des modèles tout à fait généraux de signaux. Nous proposons des conditions sous lesquelles des garanties de reconstruction peuvent être données dans un cadre général. Enfin, nous nous penchons sur un problème de recherche approchée de plus proche voisin avec calcul de signature des vecteurs afin de réduire la complexité. Dans le cadre où la distance d'intérêt dérive d'un noyau de Mercer, nous proposons de combiner un plongement explicite des données suivi d'un calcul de signatures, ce qui aboutit notamment à une recherche approchée plus précise.

Mots clés

Signal processing Compressed sensing

Traitement du signal Apprentissage compressé

Domaines

Traitement du signal et de l'image [eess.SP]

Fichier principal

BOURRIER_Anthony.pdf (1.32 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-01023030

Soumis le : vendredi 5 septembre 2014-14:42:07

Dernière modification le : jeudi 6 avril 2023-05:04:53

Archivage à long terme le : samedi 6 décembre 2014-11:41:12

Dates et versions

tel-01023030 , version 1 (11-07-2014)

tel-01023030 , version 2 (05-09-2014)

Identifiants

HAL Id : tel-01023030 , version 2

Citer

Anthony Bourrier. Échantillonnage compressé et réduction de dimension pour l'apprentissage non supervisé. Signal and Image processing. Université de Rennes, 2014. English. ⟨NNT : 2014REN1S023⟩. ⟨tel-01023030v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA STAR IRISA-D5 INRIA2 UR1-THESES UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

637 Consultations

1290 Téléchargements

Échantillonnage compressé et réduction de dimension pour l'apprentissage non supervisé

Compressed sensing and dimensionality reduction for unsupervised learning

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager