Aggregation of estimators and classifiers : theory and methods - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2013

Aggregation of estimators and classifiers : theory and methods

Agrégation d'estimateurs et de classificateurs : théorie et méthodes

Résumé

This thesis is devoted to the study of both theoretical and practical properties of various aggregation techniques. We first extend the PAC-Bayesian theory to the high dimensional paradigm in the additive and logistic regression settings. We prove that our estimators are nearly minimax optimal, and we provide an MCMC implementation, backed up by numerical simulations. Next, we introduce an original nonlinear aggregation strategy. Its theoretical merits are presented, and we benchmark the method---called COBRA---on a lengthy series of numerical experiments. Finally, a Bayesian approach to model admixture in population genetics is presented, along with its MCMC implementation. All approaches introduced in this thesis are freely available on the author's website.
Ce manuscrit de thèse est consacré à l'étude des propriétés théoriques et méthodologiques de différentes procédures d'agrégation d'estimateurs. Un premier ensemble de résultats vise à étendre la théorie PAC-bayésienne au contexte de la grande dimension, dans les modèles de régression additive et logistique. Nous prouvons dans ce contexte l'optimalité, au sens minimax et à un terme logarithmique près, de nos estimateurs. La mise en \oe uvre pratique de cette stratégie, par des techniques MCMC, est étayée par des simulations numériques. Dans un second temps, nous introduisons une stratégie originale d'agrégation non linéaire d'estimateurs de la fonction de régression. Les qualités théoriques et pratiques de cette approche --- dénommée COBRA --- sont étudiées, et illustrées sur données simulées et réelles. Enfin, nous présentons une modélisation bayésienne --- et l'implémentation MCMC correspondante --- d'un problème de génétique des populations. Les différentes approches développées dans ce document sont toutes librement téléchargeables depuis le site de l'auteur.
Fichier principal
Vignette du fichier
these.pdf (1.78 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00922353 , version 1 (26-12-2013)

Identifiants

  • HAL Id : tel-00922353 , version 1

Citer

Benjamin Guedj. Aggregation of estimators and classifiers : theory and methods. Statistics Theory [stat.TH]. Université Pierre et Marie Curie - Paris VI, 2013. English. ⟨NNT : ⟩. ⟨tel-00922353⟩
892 Consultations
1210 Téléchargements

Partager

Gmail Facebook X LinkedIn More