Régression inverse par tranches sur flux de données - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Régression inverse par tranches sur flux de données

Résumé

Dans cette communication, nous nous concentrons sur des données arrivant séquentiellement par bloc. Nous supposons la présence d'un modèle semi-paramétrique sous-jacent incluant une direction EDR (Effective Dimension Reduction) commune dans chaque bloc. Nous proposons une approche SIR (Sliced Inverse Regression pour régression inverse par tranches) adaptative afin d'estimer b. L'estimateur proposé est plus rapide qu'une application séquentielle de la méthode SIR à l'union des blocs disponibles. Nous montrons la convergence en probabilité et la normalité asymptotique de cet estimateur. Dans une simulation, nous illustrons le bon comportement numérique de notre approche. Nous fournissons également des graphiques permettant de détecter s'il existe une dérive de la direction EDR ou bien des blocs de données aberrantes, et nous illustrons notre approche avec différents scénarios. Quelques extensions possibles de cette méthode sont discutées en conclusion. / In this communication, we consider block-wise evolving data streams. When a semiparametric regression model involving a common dimension reduction direction is assumed for each block, we propose an adaptive SIR (Sliced Inverse Regression) estimator of B. This estimator is faster than usual SIR applied to the union of all the blocks, both from computational complexity and running time points of view. We show the consistency of our estimator at the root-n rate and give its asymptotic distribution. In a simulation study, we illustrate the good numerical behavior of the estimator. We also provide a graphical tool in order to detect if there exists a drift of the dimension reduction direction or some aberrant blocks of data. We illustrate our approach with various scenarios. Finally, possible extensions of this method are given.
Fichier principal
Vignette du fichier
bx2012-pub00035658.pdf (1.08 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00736584 , version 1 (28-09-2012)

Identifiants

Citer

Marie Chavent, Stéphane Girard, Vanessa Kuentz, Benoit Liquet, Thi Mong Ngoc Nguyen, et al.. Régression inverse par tranches sur flux de données. 44e Journées de Statistique, May 2012, Bruxelles, Belgique. 7 p. ⟨hal-00736584⟩
556 Consultations
179 Téléchargements

Partager

Gmail Facebook X LinkedIn More