Incomplete information and internal regret in prediction of individual sequences - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2005

Incomplete information and internal regret in prediction of individual sequences

Information incomplète et regret interne en prédiction de suites individuelles

Gilles Stoltz

Résumé

This thesis takes place within the theory of prediction of individual sequences. The latter avoids any modelling of the data and aims at providing some techniques of robust prediction and discuss their possibilities, limitations, and difficulties. It considers issues arising from the machine learning as well as from the game-theory communities, and these are dealt with thanks to statistical techniques, including martingale concentration inequalities and minimax lower bound techniques. The obtained results consist, among others, in external and internal regret minimizing strategies for label efficient prediction or in games with partial monitoring. Such strategies are valuable for the on-line pricing problem or for on-line bandwidth allocation. We then focus on internal regret for general convex losses. We consider first the case of on-line portfolio selection, for which simulations on real data are provided, and generalize later the results to show how players can learn correlated equilibria in games with compact sets of strategies.
Le domaine de recherche dans lequel s'inscrit ce travail de thèse est la théorie de la prédiction des suites individuelles. Cette dernière considère les problèmes d'apprentissage séquentiel pour lesquels on ne peut ou ne veut pas modéliser le problème de manière stochastique, et fournit des stratégies de prédiction très robustes. Elle englobe aussi bien des problèmes issus de la communauté du machine learning que de celle de la théorie des jeux répétés, et ces derniers sont traités avec des méthodes statistiques, incluant par exemple les techniques de concentration de la mesure ou de l'estimation adaptative. Les résultats obtenus aboutissent, entre autres, à des stratégies de minimisation des regrets externe et interne dans les jeux à information incomplète, notamment les jeux répétés avec signaux. Ces stratégies s'appliquent au problème d'ajustement séquentiel des prix de vente, ou d'allocation séquentielle de bande passante. Le regret interne est ensuite plus spécifiquement étudié, d'abord dans le cadre de l'investissement séquentiel dans le marché boursier, pour lequel des simulations sur des données historiques sont proposées, puis pour l'apprentissage des équilibres corrélés des jeux infinis à ensembles de stratégies convexes et compacts.
Fichier principal
Vignette du fichier
tel-000097591.pdf (1.87 Mo) Télécharger le fichier
tel-00009759.pdf (1.68 Mo) Télécharger le fichier
Format : Autre

Dates et versions

tel-00009759 , version 1 (13-07-2005)

Identifiants

  • HAL Id : tel-00009759 , version 1

Citer

Gilles Stoltz. Incomplete information and internal regret in prediction of individual sequences. Mathematics [math]. Université Paris Sud - Paris XI, 2005. English. ⟨NNT : ⟩. ⟨tel-00009759⟩
291 Consultations
718 Téléchargements

Partager

Gmail Facebook X LinkedIn More