Apprentissage statistique sur données longitudinales de grande taille et applications au design des jeux vidéo

Résumé : Cette thèse s'intéresse à l'analyse des données longitudinales, potentiellement grandes selon les trois axes suivants : nombre d'individus, fréquence d'observation et nombre de covariables. A partir de ces données, éventuellement censurées, nous considérons comme facteur d'étude le temps d'apparition d'un ou plusieurs évènements. Nous cherchons dans des classes de modèles à coefficients dépendant du temps à estimer l’intensité d’apparition des événements. Or les estimateurs actuels, ne permettent pas de traiter efficacement un grand nombre d’observations et/ou un grand nombre de covariables. Nous proposons un nouvel estimateur défini via la vraisemblance complète de Cox et une pénalisation permettant à la fois la sélection de variables et de forcer, quand c’est possible, les coefficients à être constants. Nous introduisons des algorithmes d'optimisation proximaux, permettant d'estimer les coefficients du modèle de manière efficace. L'implémentation de ces méthodes en C++ et dans le package R coxtv permet d'analyser des jeux de données de taille supérieure à la mémoire vive; via un streaming du flux de données et des méthodes d'apprentissage en ligne, telles que la descente de gradient stochastique proximale aux pas adaptatifs. Nous illustrons les performances du modèle sur des simulations en nous comparant aux méthodes existantes. Enfin, nous nous intéressons à la problématique du design des jeux vidéo. Nous montrons que l'application directe de ce modèle, sur les grands jeux de données dont dispose l'industrie du jeu vidéo, permet de mettre en évidence des leviers d'amélioration du design des jeux étudiés. Nous nous intéressons d'abord à l'analyse des composantes bas niveau, telles que les choix d'équipement fait par les joueurs au fils du temps et montrons que le modèle permet de quantifier l'effet de chacun de ces éléments de jeu, offrant ainsi aux designers des leviers d'amélioration direct du design. Enfin, nous montrons que le modèle permet de dégager des enseignements plus généraux sur le design tels que l'influence de la difficulté sur la motivation des joueurs.
Type de document :
Thèse
Traitement du signal et de l'image. Conservatoire national des arts et metiers - CNAM, 2017. Français. 〈NNT : 2017CNAM1136〉
Liste complète des métadonnées

Littérature citée [140 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01683136
Contributeur : Abes Star <>
Soumis le : vendredi 12 janvier 2018 - 18:36:08
Dernière modification le : vendredi 26 janvier 2018 - 16:13:06
Document(s) archivé(s) le : lundi 7 mai 2018 - 19:40:31

Fichier

These_Thibault_Allart_v5.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01683136, version 1

Collections

Citation

Thibault Allart. Apprentissage statistique sur données longitudinales de grande taille et applications au design des jeux vidéo. Traitement du signal et de l'image. Conservatoire national des arts et metiers - CNAM, 2017. Français. 〈NNT : 2017CNAM1136〉. 〈tel-01683136〉

Partager

Métriques

Consultations de la notice

403

Téléchargements de fichiers

172