Skip to Main content Skip to Navigation
Conference papers

Fusion et greffes de données

Abstract : La fusion statistique de fichiers a pour but de compléter un fichier « receveur » où certaines variables ne sont pas renseignées (questions non posées) à l'aide d'un ou plusieurs fichiers « donneurs » portant sur d'autres individus. Le fichier donneur comprend bien sûr des variables communes ainsi que les variables d'intérêt renseignées pour tous les individus. Les remplacements de données manquantes se font soit par des méthodes d'imputation basées sur des proches voisins (injection) soit à l'aide de méthodes explicites de type régression. Les greffes d'enquêtes poursuivent des objectifs proches, en ce sens qu'il s'agit par exemple de positionner des résultats d'un sondage (une analyse factorielle) sur ceux d'un autre en utilisant des variables passerelles, mais sans nécessairement chercher à estimer les données manquantes. Cet exposé présentera la problématique, les principales techniques utilisées, les critères de validation, ainsi que les dangers potentiels ...
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01124592
Contributor : Gilbert Saporta <>
Submitted on : Monday, March 30, 2020 - 3:25:24 PM
Last modification on : Friday, April 3, 2020 - 1:26:54 PM

File

fusionetgreffesdedonnees.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01124592, version 2

Collections

Citation

Gilbert Saporta, Nicolas Fischer. Fusion et greffes de données. 5èmes Journées Modulad. Data Mining des Données Clientèle, Nov 2000, Clamart, France. pp.43-66. ⟨hal-01124592v2⟩

Share

Metrics

Record views

19

Files downloads

6