Indexation en locuteur : utilisation d'informations lexicales

Abstract : The automatic speaker indexing consists in splitting the signal into homogeneous segments and cluster- ing them by speakers. However the speaker segments are speci ed with anonymous labels. This paper pro- pose to identify those speakers by extracting their full names pronounced in the show. With a semantic clas- si cation tree, the full names detected in the segment transcription are associated to this segment or to one of its neighbors. Then, a merging method associates a full name to a speaker cluster instead of the anony- mous label. The experiments are carried out over French broadcast news from the ESTER 2005 evalua- tion campaign. About 70% show duration is correctly processed for evaluation corpus.
Type de document :
Communication dans un congrès
Les Journées d'Étude sur la Parole (JEP) 2006, 2006, Dinard, France. Les Journées d'Étude sur la Parole (JEP) 2006, pp.5, 2006
Liste complète des métadonnées

Littérature citée [6 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01434240
Contributeur : Sylvain Meignier <>
Soumis le : mercredi 22 mars 2017 - 15:28:28
Dernière modification le : jeudi 6 avril 2017 - 10:12:32
Document(s) archivé(s) le : vendredi 23 juin 2017 - 13:52:39

Fichier

final-108.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01434240, version 1

Collections

Citation

Julie Mauclair, Sylvain Meignier, Yannick Estève. Indexation en locuteur : utilisation d'informations lexicales. Les Journées d'Étude sur la Parole (JEP) 2006, 2006, Dinard, France. Les Journées d'Étude sur la Parole (JEP) 2006, pp.5, 2006. 〈hal-01434240〉

Partager

Métriques

Consultations de la notice

62

Téléchargements de fichiers

37