Unsupervised Word Segmentation from Speech with Attention

Abstract : We present a first attempt to perform attentional word segmen-tation directly from the speech signal, with the final goal to automatically identify lexical units in a low-resource, unwritten language (UL). Our methodology assumes a pairing between recordings in the UL with translations in a well-resourced language. It uses Acoustic Unit Discovery (AUD) to convert speech into a sequence of pseudo-phones that is segmented using neural soft-alignments produced by a neural machine translation model. Evaluation uses an actual Bantu UL, Mboshi; comparisons to monolingual and bilingual baselines illustrate the potential of attentional word segmentation for language documentation.
Type de document :
Communication dans un congrès
Interspeech 2018, Sep 2018, Hyderabad, India
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01818092
Contributeur : Laurent Besacier <>
Soumis le : lundi 18 juin 2018 - 16:41:32
Dernière modification le : mercredi 13 février 2019 - 01:26:26
Document(s) archivé(s) le : mercredi 26 septembre 2018 - 18:25:36

Fichier

template.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01818092, version 1

Citation

Pierre Godard, Marcely Zanon Boito, Lucas Ondel, Alexandre Berard, François Yvon, et al.. Unsupervised Word Segmentation from Speech with Attention. Interspeech 2018, Sep 2018, Hyderabad, India. 〈hal-01818092〉

Partager

Métriques

Consultations de la notice

276

Téléchargements de fichiers

133