Prediction of transcription indexability

Résumé : Cet article présente une mesure de confiance sémantique permettant de prédire la qualité d'une transcription automatique dédiée à de la recherche d'information dans les documents audio (RIDA). La méthode proposée est basée sur une combinaison de la mesure de confiance issue du système automatique de reconnaissance de la parole (SRAP) et d'un index de compacité séman-tique (ICS). Elle permet d'estimer la pertinence des mots en fonction du contexte sémantique dans lequel ils apparaissent. Les expériences sont menées sur le corpus de la campagne ESTER 2, en simulant un scénario classique d'utilisation d'un système de RIDA : les utilisateurs soumettent des requêtes textuelles à un moteur de recherche qui est supposé leur retourner les documents audio les plus pertinents. Les résultats démontrent l'intérêt d'utiliser un niveau d'information sémantique pour prédire l'indexabilité de la transcription.
Type de document :
Communication dans un congrès
Actes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 1: JEP, 2012, Grenoble, France. ATALA/AFCP, 1, pp.x-x, 2012
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00954215
Contributeur : Benjamin Lecouteux <>
Soumis le : jeudi 23 novembre 2017 - 10:14:11
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03

Fichier

PredictionDeLindexabiliteDuneT...
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-00954215, version 1

Citation

Gregory Senay, Benjamin Lecouteux, Georges Linares. Prediction of transcription indexability. Actes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 1: JEP, 2012, Grenoble, France. ATALA/AFCP, 1, pp.x-x, 2012. 〈hal-00954215〉

Partager

Métriques

Consultations de la notice

315

Téléchargements de fichiers

16