A SEGMENT-LEVEL CONFIDENCE MEASURE FOR SPOKEN DOCUMENT RETRIEVAL

Abstract : This paper presents a semantic confidence measure that aims to predict the relevance of automatic transcripts for a task of Spoken Document Retrieval (SDR). The proposed predicting method relies on the combination of Automatic Speech Recognition (ASR) confidence measure and a Semantic Com-pacity Index (SCI), that estimates the relevance of the words considering the semantic context in which they occurred. Experiments are conducted on the French Broadcast news corpus ESTER, by simulating a classical SDR usage scenario : users submit text-queries to a search engine that is expected to return the most relevant documents regarding the query. Results demonstrate the interest of using semantic level information to predict the transcription indexability.
Type de document :
Communication dans un congrès
ICASSP 2011, 2011, Prague, Czech Republic. ICASSP 2011, 2011
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00959164
Contributeur : Benjamin Lecouteux <>
Soumis le : jeudi 9 novembre 2017 - 09:30:40
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : samedi 10 février 2018 - 12:25:58

Fichier

Senay_ICASSP_2011.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00959164, version 1

Citation

Gregory Senay, Georges Linares, Benjamin Lecouteux. A SEGMENT-LEVEL CONFIDENCE MEASURE FOR SPOKEN DOCUMENT RETRIEVAL. ICASSP 2011, 2011, Prague, Czech Republic. ICASSP 2011, 2011. 〈hal-00959164〉

Partager

Métriques

Consultations de la notice

311

Téléchargements de fichiers

17