Fusion et greffes de données - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2000

Fusion et greffes de données

Résumé

La fusion statistique de fichiers a pour but de compléter un fichier « receveur » où certaines variables ne sont pas renseignées (questions non posées) à l'aide d'un ou plusieurs fichiers « donneurs » portant sur d'autres individus. Le fichier donneur comprend bien sûr des variables communes ainsi que les variables d'intérêt renseignées pour tous les individus. Les remplacements de données manquantes se font soit par des méthodes d'imputation basées sur des proches voisins (injection) soit à l'aide de méthodes explicites de type régression. Les greffes d'enquêtes poursuivent des objectifs proches, en ce sens qu'il s'agit par exemple de positionner des résultats d'un sondage (une analyse factorielle) sur ceux d'un autre en utilisant des variables passerelles, mais sans nécessairement chercher à estimer les données manquantes. Cet exposé présentera la problématique, les principales techniques utilisées, les critères de validation, ainsi que les dangers potentiels ...
Fichier principal
Vignette du fichier
RC185.pdf (282.14 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01124592 , version 1 (12-03-2020)
hal-01124592 , version 2 (30-03-2020)

Identifiants

  • HAL Id : hal-01124592 , version 1

Citer

Gilbert Saporta, Nicolas Fischer. Fusion et greffes de données. 5èmes Journées Modulad : Data Mining des Données Clientèle,, Nov 2000, Clamart, France. pp.43-66. ⟨hal-01124592v1⟩
64 Consultations
37 Téléchargements

Partager

Gmail Facebook X LinkedIn More