Behaviour of non parametric estimators of second order statistics of high dimensional time series : a large random matrix approach - Signal and communications Accéder directement au contenu
Thèse Année : 2021

Behaviour of non parametric estimators of second order statistics of high dimensional time series : a large random matrix approach

Comportement d'estimateurs non paramétriques des statistiques du second ordre de séries temporelles de grande dimension via les grandes matrices aléatoires

Résumé

Large random matrices have been proved to be of fundamental importance in mathematics (high dimensional probability, operator algebras, combinatorics, number theory,...) and in physics (nuclear physics, quantum fields theory, quantum chaos,..) for a long time. The use of large random matrices is more recent in statistical signal processing and time series analysis. The corresponding tools turn out to be useful when the observation is a large dimension (say M) multivariate time series and the sample size N is not much larger than M, a situation that becomes very common due to the spectacular development of data acquisition devices and sensor networks. This context poses several new difficult statistical problems that are intensively studied by the high-dimensional statistics community. The most significant example is related to the fundamental problem of estimating the covariance matrix of the observation because the standard empirical covariance matrix is known to perform poorly if N is not significantly larger than M. As a result, the conventional statistical inference schemes that are based on functionals of the empirical covariance matrix may perform poorly. To mitigate this conceptual difficulty, the most popular approaches were based on the design of inference schemes using some possible degree of sparsity of the underlying parameters. However, sparsity is a property that does not necessarily hold. The use of large random matrix theory is an appealing alternative because, under some assumptions on the observations, it is possible to precise the behaviour of certain functionals of the empirical covariance matrix when M and N are both large, and to use the corresponding results to design new improved performance inference schemes. While some papers produced several valuable results, considerable work remains to be done to exploit the potential of large random matrix technics in the context of statistics of high-dimensional Gaussian time series. The proposed works in this manuscript are thus at the interface between large random matrices and the statistics of multivariate time series
Les grandes matrices aléatoires se sont révélées depuis quelques temps être fondamentales en mathématiques (statistiques en grande dimension, algèbre d'opérateur, combinatoire, théorie des nombres,...) et en physique (physique nucléaire, théorie quantique des champs, chaos quantique,...). Leur utilisation en traitement statistique du signal et analyse des séries temporelles est en revanche plus récente. Elles s'avèrent être utiles quand les observations sont issues de séries temporelles multivariées de grande dimension (notée M) et que la taille de l'échantillon (noté N) n'est pas beaucoup plus grande que M, une situation qui devient très courante en raison du développement spectaculaire des dispositifs d'acquisition de données et des réseaux de capteurs. Ce contexte soulève un certain nombre de questions qui sont beaucoup étudiées par les chercheurs de la communauté des statistiques en grande dimension. L'exemple le plus parlant est lié au problème fondamental de l'estimation de la matrice de covariance car il est connu que son estimateur empirique classique se comporte mal quand N n'est pas significativement plus grand que M. Par conséquent, les schémas d'inférence statistique conventionnels basés sur des fonctionnelles de la matrice de covariance empirique peuvent mal se comporter. Afin de résoudre ce type de problème, les approches les plus populaires proposées sont basées sur une hypothèse de parcimonie des paramètres sous-jacents. Malheureusement cette hypothèse n'est pas toujours valide. L'application de la théorie des grandes matrices aléatoires est une alternative prometteuse car, sous certaines hypothèses, il est possible de comprendre le comportement de fonctionnelles de la matrice de covariance empirique quand M et N sont simultanément grand, et d'utiliser ces résultats afin de proposer de nouvelles techniques d'inférence plus performantes. Bien qu'un certain nombre de travaux récents aillent dans cette direction, il reste un travail considérable à accomplir pour étudier des schémas d'inférence statistique basés sur des estimateurs empiriques des statistiques du second ordre de séries temporelles de grande dimensions. Le travail présenté est donc à l'interface entre grandes matrices aléatoire et statistiques des séries temporelles multivariées
Fichier principal
Vignette du fichier
TH2021UEFL2034.pdf (1.81 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03665080 , version 1 (11-05-2022)

Identifiants

  • HAL Id : tel-03665080 , version 1

Citer

Alexis Rosuel. Behaviour of non parametric estimators of second order statistics of high dimensional time series : a large random matrix approach. Statistics [math.ST]. Université Gustave Eiffel, 2021. English. ⟨NNT : 2021UEFL2034⟩. ⟨tel-03665080⟩
114 Consultations
47 Téléchargements

Partager

Gmail Facebook X LinkedIn More