Validation croisée

Sylvain Arlot 1, 2
1 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : Ce texte présente un survol des connaissances actuelles sur la validation croisée. Après avoir défini l'ensemble des méthodes de validation croisée, on étudie leurs propriétés pour deux objectifs: estimer le risque d'un estimateur fixé, d'une part, et sélectionner le meilleur estimateur possible au sein d'une famille donnée, d'autre part. Pour l'estimation du risque, on calcule leur biais (ou on le corrige) et leur variance. Pour la sélection d'estimateurs, on procède d'abord à une analyse au premier ordre (sur la base de calculs d'espérances) puis on explique comment tenir compte de termes de second ordre (sur la base de calculs de variance, et en tenant compte de l'utilité de la surpénalisation). Ceci permet, au final, de dégager quelques principes pour choisir la meilleur méthode de validation croisée pour un problème d'apprentissage donné.
Type de document :
Pré-publication, Document de travail
2017
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01485508
Contributeur : Sylvain Arlot <>
Soumis le : mercredi 8 mars 2017 - 22:31:25
Dernière modification le : jeudi 15 juin 2017 - 09:09:13
Document(s) archivé(s) le : vendredi 9 juin 2017 - 14:31:26

Fichiers

hal_JES_validation-croisee.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01485508, version 1
  • ARXIV : 1703.03167

Collections

Citation

Sylvain Arlot. Validation croisée. 2017. 〈hal-01485508〉

Partager

Métriques

Consultations de
la notice

515

Téléchargements du document

427