Dimension reduction via Sliced Inverse Regression: Ideas and new proposals - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2016

Dimension reduction via Sliced Inverse Regression: Ideas and new proposals

Réduction de dimension via Sliced Inverse Regression: Idées et nouvelles propositions

Résumé

In this thesis, Sliced Inverse Regression (SIR), a method for semi-parametric dimension reduction is discussed, analyzed and extended. Three different contributions namely, Collaborative SIR, Student SIR and Knockoff SIR are presented and disdiscussed. Collaborative SIR aims at finding subgroups in the data that have different characteristics and that are better described dividing the dataset. Student SIR is a robustified version of SIR where the error is described by a multivariate t-Student distribution, a heavy tailed distribution that is flexible to outliers. Finally Knockoff SIR is a method to perform variable selection and to provide sparse solutions at the same time. The basic idea comes from a paper of R. F. Barber and E. J. Candes that controls the false discovery rate in regression procedure such as LASSO. In the first chapter of the thesis, SIR is presented and discussed, an analysis of the state of the art is detailed. The last part of the chapter is dedicated to give an overview of the three different contributions. The second chapter focuses on Collaborative SIR and includes the paper published in Communications in Statistics - Theory and Methods. Student SIR is treated in chapter 3 where the paper is published in Computational Statistics & Data Analysis is shown. Finally Knockoff SIR is outlined and the main results are presented and discussed providing applications on simulated and real data. Dulcis in fundo, the conclusion is drawn.
Dans cette thèse, SIR, une méthode de réduction de dimension semi-paramétrique est discutée, analysée et étendue. Trois contributions différentes, soit Collaborative SIR, Student SIR et Knockoff SIR sont présentées et discutées. Collaborative SIR vise à trouver des sous-groupes dans les données ayant des caractéristiques différentes et mieux décrites en divisant l'ensemble de données. Student SIR est une version robuste de SIR où l'erreur est décrite par une distribution multivariée t-Student, une distribution à queue lourde qui est flexible vis à vis des valeurs aberrantes. Enfin, Knockoff SIR est une méthode pour effectuer une sélection de variables et fournir des solutions parsimonieuses. L'idée de base provient d'un article de R. F. Barber et E. J. Candes qui contrôle le taux de fausses découvertes dans une procédure de régression telle que LASSO. Dans le premier chapitre de la thèse, SIR est présentée et discutée, une analyse de l'état de l'art est détaillée. La dernière partie du chapitre est consacrée à donner un aperçu des trois contributions différentes. Le deuxième chapitre se concentre sur Collaborative SIR et comprend le document publié dans Communications in Statistics - Theory and Methods. Student SIR est traité au chapitre 3 où le document publié dans Computational Statistics and Data Analysis est présenté. Enfin, Knockoff SIR est décrite et les principaux résultats sont présentés et discutés en fournissant des applications sur des données simulées et réelles. Dulcis in fundo, une conclusion est proposée.
Fichier principal
Vignette du fichier
A.Chiancone_PhD.pdf (3.47 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01571824 , version 1 (03-08-2017)
tel-01571824 , version 2 (10-01-2018)

Identifiants

  • HAL Id : tel-01571824 , version 1

Citer

Alessandro Chiancone. Dimension reduction via Sliced Inverse Regression: Ideas and new proposals. Statistics [math.ST]. Université Grenoble - Alpes, 2016. English. ⟨NNT : ⟩. ⟨tel-01571824v1⟩
749 Consultations
804 Téléchargements

Partager

Gmail Facebook X LinkedIn More