Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire

Emmanuel Ferreira; Alexandre Reiffers-Masson; Bassam Jabaian; Fabrice Lefevre

Communication Dans Un Congrès Année : 2016

Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire

(1) , (1) , (1) , (1)

Emmanuel Ferreira

Fonction : Auteur
PersonId : 772440
IdRef : 192901885

Laboratoire Informatique d'Avignon

Alexandre Reiffers-Masson

Fonction : Auteur
PersonId : 7844
IdHAL : alexandre-reiffers-masson
ORCID : 0000-0002-4084-1977
IdRef : 196622085

Laboratoire Informatique d'Avignon

Bassam Jabaian

Fonction : Auteur
PersonId : 172824
IdHAL : bassam-jabaian
IdRef : 171425081

Laboratoire Informatique d'Avignon

Fabrice Lefevre

Fonction : Auteur
PersonId : 175133
IdHAL : fabricelefevre
IdRef : 089427092

Laboratoire Informatique d'Avignon

Résumé

Adversarial bandit for optimising online active learning of spoken language understanding Many speech understanding modules have in common to be probabilistic and to rely on machine learning algorithms to train their models from large amount of data. The difficulty remains in the cost of collecting such data and the time for updating an existing model to a new domain. In this paper, we propose to drive an online adaptive process with a policy learnt using the Adversarial Bandit algorithm. We showthat this proposition can optimally balance the cost of gathering valuable user feedbacks and the overall performance of the spoken language understanding module after its update.

De nombreux modules de compréhension de la parole ont en commun d'être probabilistes et basés sur des algorithmes d'apprentissage automatique. Deux difficultés majeures, rencontrées par toutes les méthodes existantes sont : le coût de la collecte des données et l'adaptation d'un module existant à un nouveau domaine. Dans cet article, nous proposons un processus d'adaptation en ligne avec une politique apprise en utilisant un algorithme de type bandit contre un adversaire. Nous montrons que cette proposition peut permettre d'optimiser un équilibre entre le coût de la collecte des retours demandés aux utilisateurs et la performance globale de la compréhension du langage parlé après sa mise à jour.

Mots clés

Compréhension de la parole Apprentissage sans données de références Bandit contre un adversaire Adaptation en ligne

Domaines

Intelligence artificielle [cs.AI]

Bassam Jabaian : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02063583

Soumis le : lundi 11 mars 2019-12:20:50

Dernière modification le : lundi 26 juillet 2021-09:12:01

Dates et versions

hal-02063583 , version 1 (11-03-2019)

Identifiants

HAL Id : hal-02063583 , version 1

Citer

Emmanuel Ferreira, Alexandre Reiffers-Masson, Bassam Jabaian, Fabrice Lefevre. Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire. JEP, 2016, Paris, France. ⟨hal-02063583⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-AVIGNON LIA

32 Consultations

0 Téléchargements

Optimiser l'adaptation en ligne d'un module de compréhension de la parole avec un algorithme de bandit contre un adversaire

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager