How to cope with modelling and privacy concerns ? A regression model and a visualisation tool for aggregated data - Archive ouverte HAL Accéder directement au contenu
Poster De Conférence Année : 2014

How to cope with modelling and privacy concerns ? A regression model and a visualisation tool for aggregated data

Résumé

Regulation of official statistical institutes does not allow the diffusion of microdata for privacy-related purposes. In general, it is easier to obtain aggregated data of a set of individuals. Most of the modelling tools in statistics (e.g., regression) works on microdata and cannot be easily extended to macrodata. In this paper, we show the use of a regression method developed for aggregated data, where both the explanatory and the response variables present quantile distributions as observations. The analysis has been performed on a dataset of economic indicators related to the specific cost of agriculture products in the France regions. We show how the proposed method can predict distribution values. In conclusion a PCA method on quantile data is used in order to visualize relationships between the predicted distributions.
La réglementation des instituts statistiques officiels ne permet pas la diffusion de microdonnées en raison d'obligations de confidentialité. Cependant, il est plus facile d'obtenir des données agrégées d'un ensemble d'individus. La plupart des outils de modélisation statistique (par exemple, la régression) travaille sur microdonnées et ne peuvent être facilement appliqués aux macrodonnées correspondantes. Dans cette communication, les auteurs présentent l'utilisation d'une méthode de régression développée pour les données agrégées, où à la fois la variable expliquée et les variables explicatives ont pour observations les quantiles de distributions. L'analyse a été réalisée sur un ensemble d'indicateurs économiques liés aux coûts spécifiques des produits agricoles pour les régions françaises. Ils montrent comment la méthode proposée peut prédire les valeurs distributionnelles. Finalement, une analyse en composantes principales (ACP) est utilisée sur les estimations quantiles afin de visualiser les relations entre les distributions prédites.
Fichier non déposé

Dates et versions

hal-01310592 , version 1 (02-05-2016)

Identifiants

  • HAL Id : hal-01310592 , version 1
  • PRODINRA : 350323

Citer

Rosanna Verde, Antonio Irpino, Dominique Desbois. How to cope with modelling and privacy concerns ? A regression model and a visualisation tool for aggregated data. The first Conference of European Statistics Stakeholders, Nov 2014, Rome, Italy. , 2014. ⟨hal-01310592⟩
107 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More