, Elles sont de deux sortes: techniques et déontologiques

. D'un-point-de-vue-méthodologique, Il est clair que les méthodes de fusion répondent à un besoin fréquemment exprimé par les praticiens et les gestionnaires de données qui souhaitent fournir à l'utilisateur final une base unique sans « trou ». La prudence s'impose quand on utilise des « données » qui sont en réalité des estimations et non des valeurs observées: de selles données ne devraient jamais être utilisées à un niveau individuel, mais uniquement agrégé, la fusion de données est un problème de données manquantes massives, et les statisticiens devraient être intéressés dans le développement et la validation de nouvelles méthodes

, Avec de telles méthodes, on arrive à la situation suivante: des données qui n'ont pas été recueillies sont estimées et peuvent être ajoutées dans des fichiers à l'insu des individus concernés. Il y a là un paradoxe quand on passe aux efforts fournis parles Instituts Nationaux de Statistique pour préserver la confidentialité de leurs fichiers. Les greffes d'enquêtes sont moins sujettes à suspicion

T. Aluja-banet, A. Morineau, and R. Rius, La greffe de fichiers et ses conditions d'application. Méthode et exemple, pp.94-102, 1997.

K. Baker, P. Harris, and J. O'brien, Data fusion: An appraisal and experimental evaluation, Journal of the Market Research Society, vol.31, pp.153-212, 1989.

S. Bonnefous, J. Brenot, and J. P. Pagès, Méthode de la greffe et communications entre enquêtes, Data Analysis and Informatics, vol.4, pp.603-617, 1986.

S. V. Buuren and L. A. Van-rijckevorsel, Imputation of missing categorical data by maximizing internal consistency, Psychometrika, vol.57, pp.567-580, 1992.

V. Co, Méthodes statistiques et informatiques pour le traitement des données manquantes, Ph.D, 1997.

M. Comyn, Modélisation et validation des rapprochements et fusions de fichiers d'enquêtes, Ph.D, 1999.

D. Leeuw and J. , Canonical analysis of categorical data, 1973.

A. P. Dempster, N. M. Laird, and D. B. Rubin, Maximum likelihood from incomplete data via the EM algorithm, Journal of the Royal Statistical Society B39, 1977.

C. Derquenne, Une méthode pour construire un échantillon de données virtuelles à partir de plusieurs tableaux de données existants, Combiner des données de sources différentes, recueil du Symposium 99 de Statistique Canada, 1999.

A. Gifi, Nonlinear multivariate analysis, 1990.

M. Lejeune, De l'usage des fusions de données dans les études de marché, Proceedings 50th Session of ISI-Beijing, pp.923-935, 1995.

R. J. Little and D. B. Rubin, Statistical analysis with missing data, 1987.

J. Meulman, Homogeneity analysis of incomplete data, 1982.

S. Rassler and K. Fleischer, Aspects concerning data fusion techniques. Discussion paper 16, 1997.

D. B. Rubin, Mutiple imputation for nonresponse in surveys, 1987.

G. Santini, La méthode de fusion sur référentiel factoriel. Séminaire IREP, mars, 1984.

G. Saporta and V. Co, Fusion de fichiers: une nouvelle méthode basée sur l'analyse homogène, pp.81-93, 1999.