Régression inverse par tranches sur flux de données

Résumé : Dans cette communication, nous nous concentrons sur des données arrivant séquentiellement par bloc. Nous supposons la présence d'un modèle semi-paramétrique sous-jacent incluant une direction EDR (Effective Dimension Reduction) commune dans chaque bloc. Nous proposons une approche SIR (Sliced Inverse Regression pour régression inverse par tranches) adaptative afin d'estimer b. L'estimateur proposé est plus rapide qu'une application séquentielle de la méthode SIR à l'union des blocs disponibles. Nous montrons la convergence en probabilité et la normalité asymptotique de cet estimateur. Dans une simulation, nous illustrons le bon comportement numérique de notre approche. Nous fournissons également des graphiques permettant de détecter s'il existe une dérive de la direction EDR ou bien des blocs de données aberrantes, et nous illustrons notre approche avec différents scénarios. Quelques extensions possibles de cette méthode sont discutées en conclusion. / In this communication, we consider block-wise evolving data streams. When a semiparametric regression model involving a common dimension reduction direction is assumed for each block, we propose an adaptive SIR (Sliced Inverse Regression) estimator of B. This estimator is faster than usual SIR applied to the union of all the blocks, both from computational complexity and running time points of view. We show the consistency of our estimator at the root-n rate and give its asymptotic distribution. In a simulation study, we illustrate the good numerical behavior of the estimator. We also provide a graphical tool in order to detect if there exists a drift of the dimension reduction direction or some aberrant blocks of data. We illustrate our approach with various scenarios. Finally, possible extensions of this method are given.
Type de document :
Communication dans un congrès
44e Journées de Statistique, May 2012, Bruxelles, Belgique. 7 p., 2012
Liste complète des métadonnées

Littérature citée [6 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00736584
Contributeur : Import Ws Irstea <>
Soumis le : vendredi 28 septembre 2012 - 15:32:15
Dernière modification le : jeudi 11 janvier 2018 - 06:22:38
Document(s) archivé(s) le : vendredi 16 décembre 2016 - 18:43:12

Fichier

bx2012-pub00035658.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00736584, version 1
  • IRSTEA : PUB00035658

Collections

Citation

Marie Chavent, Stephane Girard, Vanessa Kuentz, Benoît Liquet, Thi Mong Ngoc Nguyen, et al.. Régression inverse par tranches sur flux de données. 44e Journées de Statistique, May 2012, Bruxelles, Belgique. 7 p., 2012. 〈hal-00736584〉

Partager

Métriques

Consultations de la notice

838

Téléchargements de fichiers

191