Régression inverse par tranches sur flux de données

Résumé : Dans cette communication, nous nous concentrons sur des données arrivant séquentiellement par bloc. Nous supposons la présence d'un modèle semi-paramétrique sous-jacent incluant une direction EDR (Effective Dimension Reduction) commune dans chaque bloc. Nous proposons une approche SIR (Sliced Inverse Regression pour régression inverse par tranches) adaptative afin d'estimer b. L'estimateur proposé est plus rapide qu'une application séquentielle de la méthode SIR à l'union des blocs disponibles. Nous montrons la convergence en probabilité et la normalité asymptotique de cet estimateur. Dans une simulation, nous illustrons le bon comportement numérique de notre approche. Nous fournissons également des graphiques permettant de détecter s'il existe une dérive de la direction EDR ou bien des blocs de données aberrantes, et nous illustrons notre approche avec différents scénarios. Quelques extensions possibles de cette méthode sont discutées en conclusion. / In this communication, we consider block-wise evolving data streams. When a semiparametric regression model involving a common dimension reduction direction is assumed for each block, we propose an adaptive SIR (Sliced Inverse Regression) estimator of B. This estimator is faster than usual SIR applied to the union of all the blocks, both from computational complexity and running time points of view. We show the consistency of our estimator at the root-n rate and give its asymptotic distribution. In a simulation study, we illustrate the good numerical behavior of the estimator. We also provide a graphical tool in order to detect if there exists a drift of the dimension reduction direction or some aberrant blocks of data. We illustrate our approach with various scenarios. Finally, possible extensions of this method are given.
Complete list of metadatas

Cited literature [6 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00736584
Contributor : Import Ws Irstea <>
Submitted on : Friday, September 28, 2012 - 3:32:15 PM
Last modification on : Monday, September 2, 2019 - 2:46:11 PM
Long-term archiving on : Friday, December 16, 2016 - 6:43:12 PM

File

bx2012-pub00035658.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00736584, version 1
  • IRSTEA : PUB00035658

Collections

Citation

Marie Chavent, Stephane Girard, Vanessa Kuentz, Benoit Liquet, Thi Mong Ngoc Nguyen, et al.. Régression inverse par tranches sur flux de données. 44e Journées de Statistique, May 2012, Bruxelles, Belgique. 7 p. ⟨hal-00736584⟩

Share

Metrics

Record views

1007

Files downloads

250