Régression non linéaire robuste en grande dimension

Emeline Perthame 1 Florence Forbes 1 Brice Olivier 1 Antoine Deleforge 2
1 MISTIS - Modelling and Inference of Complex and Structured Stochastic Systems
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
2 PANAMA - Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio
IRISA-D5 - SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE, Inria Rennes – Bretagne Atlantique
Résumé : La régression non-linéaire permet de modéliser des relations complexes entre des variables cibles et un nombre possiblement grand de covariables. Cependant, dans le cadre classique gaussien, il a été montré que les outliers affectent la stabilité des résultats ce qui peut mener à des prédictions erronées. Il est donc nécessaire de développer des approches robustes, applicables en grande dimension, afin de réduire l'impact de ces outliers et d'améliorer la précision des méthodes de régression linéaire ou non linéaire. La non-linéarité est prise en compte dans la méthode proposée par un modèle de mélange de régressions. Les modèles de mélanges, et paradoxalement les mélanges de régression sont principalement utilisés pour répondre à un objectif de classification et peu d'articles font référence aux mélanges de régression dans une optique de régression et de prédiction. La pertinence d'une approche de prédiction fondée sur un mélange de régression dans un contexte Gaussien a pourtant été montrée dans (Deleforge et al., 2015 [1]). Cependant la méthode développée par ces auteurs n'est pas une approche de régression robuste. On propose donc d'étendre cette méthode en considérant un mélange de lois de Student généralisées, capables de prendre en compte les outliers. Un algorithme EM est proposé pour l'estimation des paramètres, numériquement implémentable en grande dimension (nombre de variables supérieur au nombre d'observations). Durant la présentation, les performances de la méthode seront étudiées sur des simulations et sur une application sur données réelles.
Type de document :
Communication dans un congrès
48èmes Journées de Statistique organisées par la Société Française de Statistique, May 2016, Montpellier, France. 2016
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01423630
Contributeur : Florence Forbes <>
Soumis le : vendredi 30 décembre 2016 - 17:21:10
Dernière modification le : mercredi 16 mai 2018 - 11:24:07
Document(s) archivé(s) le : mardi 21 mars 2017 - 08:36:04

Fichier

gabarit_text_long.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01423630, version 1

Citation

Emeline Perthame, Florence Forbes, Brice Olivier, Antoine Deleforge. Régression non linéaire robuste en grande dimension. 48èmes Journées de Statistique organisées par la Société Française de Statistique, May 2016, Montpellier, France. 2016. 〈hal-01423630〉

Partager

Métriques

Consultations de la notice

991

Téléchargements de fichiers

153