Données Agrégées et Variables Compositionnelles : Note Méthodologique - Archive ouverte HAL Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2019

Aggregated Data and Compositional Variables: Methodological Note

Données Agrégées et Variables Compositionnelles : Note Méthodologique

Enora Belz
  • Fonction : Auteur
  • PersonId : 174792
  • IdHAL : enora-belz

Résumé

The reform of personal data law in Europe makes it difficult to access personal data (even often non-nominative), especially when looking for data considered sensitive (and often income falls into this category). One solution often considered is the provision of spatially aggregated data. However, these data pose two technical problems. The first is that categorical data become compositions. The second is related to the ecological paradox that says it is dangerous to infer individual econometric relationships from aggregate data. We will see here how to work with compositional data (possibly just to validate a classical linear regression approach - easier to interpret). And we will discuss the second, but unfortunately it remains too general to be dealt with satisfactorily. Translated with www.DeepL.com/Translator
La réforme du droit sur les données personnelles en Europe rend difficile l'accès aux données individuelles (même souvent non-nominatives), surtout quand on cherche des données jugées sensibles (et souvent, le revenu entre dans cette catégorie). Une solution souvent envisagée est la mise à disposition de données agrégées spatialement. Ces données posent toutefois deux problèmes techniques. Le premier est que les données catégorielles deviennent des compositions. Le second est lié au paradoxe écologique qui dit qu'il est dangereux d'inférer des relations économétriques individuelles à partir de données agregées. Nous verrons ici comment travailler avec des données compositionnelles (pour éventuellement juste valider une approche classique de régression linéaire-plus simple à interpréter). Et nous évoquerons le second, mais qui reste malheureusement trop général pour pouvoir être traité de manière satisfaisante.
Fichier principal
Vignette du fichier
Compositions.pdf (4.76 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02097031 , version 1 (12-04-2019)

Identifiants

  • HAL Id : hal-02097031 , version 1

Citer

Enora Belz, Arthur Charpentier. Données Agrégées et Variables Compositionnelles : Note Méthodologique. 2019. ⟨hal-02097031⟩
584 Consultations
1041 Téléchargements

Partager

Gmail Facebook X LinkedIn More