Skip to Main content Skip to Navigation
Conference papers

Méthode multivariée de fusion statistique de fichiers appliquée au marché résidentiel de l'électricité

Résumé : Le marché résidentiel français de l’électricité, actuellement dominé par EDF, s’ouvre désormais progressivement à la concurrence. Dans ce contexte une meilleure connaissance de ses clients devient un enjeu d’importance pour l’entreprise. Pour parfaire la connaissance de sa clientèle, EDF dispose de deux sources d’information principales : le fichier de facturation recensant l’ensemble des clients, ainsi qu’un ensemble de fichiers d’enquêtes régionales et nationales comprenant davantage d’information individuelles sur les personnes interrogées. La fusion statistique de fichiers de données permet de combiner des données issues de sources différentes en s’appuyant sur leur information commune lorsque des variables sont manquantes. Elle fournit ainsi une base unique de données, plus large, regroupant toute l’information disponible. L’approche utilisée consiste à modéliser un certain nombre de variables Y présentes dans les fichiers d’enquêtes, mais manquantes dans le fichier de facturation, à partir de certaines variables X candidates à l’explication et communes aux différents fichiers. De manière à préserver les corrélations entre variables à expliquer observées et estimées, la modélisation mise en œuvre utilise la régression PLS2 (Partial Least Square multivariée), par ailleurs bien adaptée aux données très corrélées. Dans cette étude les variables Y à expliquer sont ordinales (niveau de satisfaction, par exemple) et les variables communes explicatives X sont qualitatives (année de souscription du contrat, type de logement, puissance, tarif, …). L’une des approches envisagées consiste à estimer un modèle logit ordinal multivarié permettant l’estimation simultanée des Y. L’intérêt du modèle réside dans sa préservation des corrélations et sa relativement bonne reconstitution de l’information, notamment sur les distributions marginales.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-01124748
Contributor : Laboratoire Cedric <>
Submitted on : Friday, December 11, 2020 - 12:01:57 PM
Last modification on : Thursday, January 14, 2021 - 12:00:15 PM

Identifiers

  • HAL Id : hal-01124748, version 1

Collections

Citation

Nicolas Fischer, Christian Derquenne, Gilbert Saporta. Méthode multivariée de fusion statistique de fichiers appliquée au marché résidentiel de l'électricité. 34èmes Journées de Statistique, SFdS, May 2002, Bruxelles, Belgique. ⟨hal-01124748⟩

Share

Metrics

Record views

78

Files downloads

6