Implementing Rubin's Alternative Multiple Imputation Method for Statistical Matching in Stata - Archive ouverte HAL Accéder directement au contenu
Autre Publication Scientifique Année : 2015

Implementing Rubin's Alternative Multiple Imputation Method for Statistical Matching in Stata

Anil Alpman

Résumé

This paper introduces two new commands, smpred and smmatch, that implement the statistical matching procedure proposed by Rubin (1986). The purpose of statistical matching in Rubin's procedure is to generate a single dataset from various datasets, where each dataset contains a specific variable of interest and all contain some variables in common. For two variables of interest that are not observed jointly for any unit, smpred generates the predicted values of each as a function of the other variable of interest and a set of control variables by assuming a partial correlation value (defined by the user) between the two variables of interest (while current programs assume that they are conditionally independent given the control variables). The smmatch command, on the other hand, matches observations of different datasets according to their predicted values (using a minimum distance criterion) conditional on a set of control variables, and it imputes the observed value of the match for the missing.
Cet article introduit deux nouvelles commandes, smpred et smmatch, qui implémentent la procédure d'appariement statistique de Rubin (1986). La procédure de Rubin consiste à générer une seule base de données à partir de plusieurs, où chaque base de données contient une variable d'intérêt spécifique et tous contiennent des variables en commun. Pour deux variables d'intérêt qui ne sont pas observées conjointement dans la même base de donnée, smpred génère la valeur prédite de la variable d'intérêt en fonction de l'autre variable d'intérêt et des variables de contrôle en supposant une valeur (définie par l'utilisateur) de la corrélation partielle entre les deux variables d'intérêt (alors que les programmes actuels supposent que ces deux variables sont conditionnellement indépendantes). La commande smmatch apparie les observations des différentes bases de données selon les valeurs prédites (en se basant sur la distance minimale) conditionnellement à un ensemble de variables de contrôle et ensuite smmatch impute la valeur observée de « l'appariée » à la variable manquante.
Fichier principal
Vignette du fichier
15008.pdf (657.93 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01159191 , version 1 (02-06-2015)

Identifiants

  • HAL Id : hal-01159191 , version 1

Citer

Anil Alpman. Implementing Rubin's Alternative Multiple Imputation Method for Statistical Matching in Stata. 2015. ⟨hal-01159191⟩
173 Consultations
918 Téléchargements

Partager

Gmail Facebook X LinkedIn More