Analyzing spatio-temporal data with R: Everything you always wanted to know - but were afraid to ask - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Journal de la Société Française de Statistique Année : 2017

Analyzing spatio-temporal data with R: Everything you always wanted to know - but were afraid to ask

Données spatio-temporelles avec R : tout ce que vous avez toujours voulu savoir sans jamais avoir osé le demander

Denis Allard
Liliane Bel
Nicolas Desassis
Ghislain Geniaux
Davide Martinetti
Éric É. Parent
Thomas Romary
Nicolas Saby

Résumé

We present an overview of (geo-)statistical models, methods and techniques for the analysis and prediction of continuous spatio-temporal processes residing in continuous space. Various approaches exist for building statistical models for such processes, estimating their parameters and performing predictions. We cover the Gaussian process approach, very common in spatial statistics and geostatistics, and we focus on R-based implementations of numerical procedures. To illustrate and compare the use of some of the most relevant packages, we treat a real-world application with high-dimensional data. The target variable is the daily mean PM10 concentration predicted thanks to a chemistry-transport model and observation series collected at monitoring stations across France in 2014. We give R code covering the full work-flow from importing data sets to the prediction of PM10 concentrations with a fitted parametric model, including the visualization of data, estimation of the parameters of the spatio-temporal covariance function and model selection. We conclude with some elements of comparison between the packages that are available today and some discussion for future developments.
Nous présentons un aperçu des modèles, méthodes et techniques (géo-)statistiques pour l’analyse et la prévision de processus spatio-temporels continus. De nombreuses approches sont possibles pour la construction de modèles statistiques pour ces processus, l’estimation de leurs paramètres et leur prédiction. Nous avons choisi de présenter l’approche par processus gaussien, la plus communément utilisée en statistiques spatiales et en géostatistiques, ainsi que son implémentation avec le logiciel R. La variable cible est la moyenne de la concentration quotidienne PM10 à l’échelle de la France, prédite à l’aide d’un modèle de transport en chimie de l’atmosphère et de séries d’observations obtenues à des stations de surveillance de la qualité de l’air. En suivant le fil d’une application réelle de grande dimension, nous comparons certains des paquets R les plus utilisés. Le code R permettant la visualisation des données, l’estimation des paramètres de la fonction de covariance spatio-temporelle ainsi que la sélection d’un modèle et la prédiction de la concentration de PM10 est également présenté afin d’illustrer l’enchaînement des étapes. Nous concluons avec une comparaison entre les paquets qui sont disponibles aujourd’hui et ainsi que les pistes de développement qui nous paraissent intéressantes.
Fichier principal
Vignette du fichier
analyzing-spatio-temporal_1.pdf (12.01 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02618656 , version 1 (25-05-2020)

Licence

Paternité - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : hal-02618656 , version 1
  • PRODINRA : 406701

Citer

Denis Allard, Maxime Beauchamp, Liliane Bel, Nicolas Desassis, Ghislain Geniaux, et al.. Analyzing spatio-temporal data with R: Everything you always wanted to know - but were afraid to ask. Journal de la Société Française de Statistique, 2017, 158 (3), pp.124-158. ⟨hal-02618656⟩
970 Consultations
174 Téléchargements

Partager

Gmail Facebook X LinkedIn More