Régularisation des modèles linéaires généralisés mixtes par construction de composantes supervisées - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Supervised Component-based regularisation of multivariate generalised linear mixed models

Régularisation des modèles linéaires généralisés mixtes par construction de composantes supervisées

Résumé

Une forte redondance des variables explicatives cause de gros problèmes d'identifiabilité et d'instabilité des coefficients dans les modèles de régression. Même lorsque l'estimation est possible, l'interprétation des résultats est donc extrêmement délicate. Il est alors indispensable de combiner à la vraisemblance de ces modèles un critère supplémentaire qui régularise l'estimateur. Dans le sillage de la régression PLS, la stratégie de régularisation que nous considérons est fondée sur l'extraction de composantes supervisées. Contraintes à l'orthogonalité entre elles, ces composantes doivent non seulement capturer l'information structurelle des variables explicatives, mais aussi prédire autant que possible les variables réponses, qui peuvent être de types divers (continues ou discrètes, quantitatives, ordinales ou nominales). La régression sur composantes supervisées a été développée pour les GLMs multivariés, mais n'a jusqu'alors concerné que des modèles à observations indépendantes. Or, dans de nombreuses situations, les observations sont groupées. Nous proposons une extension de la méthode aux GLMMs multivariés, pour lesquels les corrélations intra-groupes sont modélisées au moyen d'effets aléatoires. À chaque étape de l'algorithme de Schall permettant l'estimation du GLMM, nous procédons à la régularisation du modèle par l'extraction de composantes maximisant un compromis entre qualité d'ajustement et pertinence structurelle. Comparé à la régularisation par pénalisation de type ridge ou LASSO, nous montrons sur données simulées que notre méthode non seulement permet de révéler les dimensions explicatives les plus importantes pour l'ensemble des réponses, mais fournit souvent de meilleures estimations. La méthode est aussi évaluée sur des données réelles d'écologie forestière.
slidesSHERBROOKE.pdf (1.88 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-02306608 , version 1 (10-10-2019)

Identifiants

  • HAL Id : hal-02306608 , version 1

Citer

Jocelyn Chauvet, Catherine Trottier, Xavier Bry. Régularisation des modèles linéaires généralisés mixtes par construction de composantes supervisées. 7èmes rencontres scientifiques Sherbrooke-Montpellier, Jun 2019, Sherbrooke, Canada. ⟨hal-02306608⟩
77 Consultations
26 Téléchargements

Partager

Gmail Facebook X LinkedIn More