Indices de sensibilité, sélection de paramètres et erreur quadratique de prédiction : des liaisons dangereuses ? - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Journal de la Société Française de Statistique Année : 2011

Indices de sensibilité, sélection de paramètres et erreur quadratique de prédiction : des liaisons dangereuses ?

Matieyendou M. Lamboni
  • Fonction : Auteur
David D. Makowski

Résumé

Lorsqu'un modèle contient un grand nombre de paramètres, l'analyse de sensibilité globale est souvent utilisée pour sélectionner les paramètres à estimer parmi ceux identifiés comme les plus influents. Une telle procédure de sélection est basée sur des données simulées et se distingue de la procédure de validation du modèle qui est basée sur des données réelles. Néanmoins, ces deux procédures sont liées dans leurs objectifs et il est intéressant d'évaluer les bénéfices de la sélection par analyse de sensibilité à l'aide des critères EQMP (Erreur Quadratique Moyenne de Prédiction) et EQM (Erreur Quadratique Moyenne). Dans cet article, nous formalisons d'abord la démarche consistant à sélectionner les paramètres à estimer par analyse de sensibilité et à fixer les autres paramètres à leur valeur nominale. Dans le cadre du modèle linéaire, nous explicitons ensuite, de façon exacte, les liens formels qui existent entre les indices de sensibilité des paramètres et la qualité de prédiction mesurée par les critères d'évaluation EQM et EQMP. Nous complétons ces résultats par des simulations pour étudier l'impact sur la qualité prédictive du modèle, d'une part du plan d'expériences (variables d'entrées du modèle), d'autre part du point où l'analyse de sensibilité est effectuée. Dans ces simulations, l'approche de sélection de paramètres par analyse de sensibilité est comparée à la méthode LASSO qui sert de référence pour sélectionner des modèles creux. Les résultats montrent qu'estimer les paramètres les plus influents contribue à la réduction de l'EQM et de l'EQMP mais que cette réduction n'est pas systématique. En effet, la relation entre l'EQMP et les indices de sensibilité est complexe et elle dépend fortement du plan d'expériences. Par exemple, seul un plan d'expériences orthogonal garantit une réduction systématique de l'EQMP. De plus, les résultats dépendent des points supports de l'analyse de sensibilité. La performance de la sélection des paramètres par l'analyse de sensibilité est équivalente à celle de LASSO en termes de l'EQMP si nous disposons a priori des connaissances pertinentes sur le degré d'incertitudes des différents paramètres pour conduire l'analyse de sensibilité. Les conséquences pratiques des résultats font l'objet d'une discussion en fin d'article.
Fichier non déposé

Dates et versions

hal-00999847 , version 1 (04-06-2014)

Identifiants

  • HAL Id : hal-00999847 , version 1
  • PRODINRA : 42855

Citer

Matieyendou M. Lamboni, David D. Makowski, Herve H. Monod. Indices de sensibilité, sélection de paramètres et erreur quadratique de prédiction : des liaisons dangereuses ?. Journal de la Société Française de Statistique, 2011, 152 (1), pp.26-48. ⟨hal-00999847⟩
58 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More