Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire

Emmanuel Ferreira
  • Fonction : Auteur
  • PersonId : 772440
  • IdRef : 192901885
Bassam Jabaian
Fabrice Lefevre

Résumé

Adversarial bandit for optimising online active learning of spoken language understanding Many speech understanding modules have in common to be probabilistic and to rely on machine learning algorithms to train their models from large amount of data. The difficulty remains in the cost of collecting such data and the time for updating an existing model to a new domain. In this paper, we propose to drive an online adaptive process with a policy learnt using the Adversarial Bandit algorithm. We showthat this proposition can optimally balance the cost of gathering valuable user feedbacks and the overall performance of the spoken language understanding module after its update.
De nombreux modules de compréhension de la parole ont en commun d'être probabilistes et basés sur des algorithmes d'apprentissage automatique. Deux difficultés majeures, rencontrées par toutes les méthodes existantes sont : le coût de la collecte des données et l'adaptation d'un module existant à un nouveau domaine. Dans cet article, nous proposons un processus d'adaptation en ligne avec une politique apprise en utilisant un algorithme de type bandit contre un adversaire. Nous montrons que cette proposition peut permettre d'optimiser un équilibre entre le coût de la collecte des retours demandés aux utilisateurs et la performance globale de la compréhension du langage parlé après sa mise à jour.
Fichier non déposé

Dates et versions

hal-02063583 , version 1 (11-03-2019)

Identifiants

  • HAL Id : hal-02063583 , version 1

Citer

Emmanuel Ferreira, Alexandre Reiffers-Masson, Bassam Jabaian, Fabrice Lefevre. Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire. JEP, 2016, Paris, France. ⟨hal-02063583⟩

Collections

UNIV-AVIGNON LIA
32 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More