Indexation en locuteur : utilisation d'informations lexicales - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Indexation en locuteur : utilisation d'informations lexicales

Résumé

The automatic speaker indexing consists in splitting the signal into homogeneous segments and cluster- ing them by speakers. However the speaker segments are speci ed with anonymous labels. This paper pro- pose to identify those speakers by extracting their full names pronounced in the show. With a semantic clas- si cation tree, the full names detected in the segment transcription are associated to this segment or to one of its neighbors. Then, a merging method associates a full name to a speaker cluster instead of the anony- mous label. The experiments are carried out over French broadcast news from the ESTER 2005 evalua- tion campaign. About 70% show duration is correctly processed for evaluation corpus.
Fichier principal
Vignette du fichier
final-108.pdf (368.72 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01434240 , version 1 (22-03-2017)

Identifiants

  • HAL Id : hal-01434240 , version 1

Citer

Julie Mauclair, Sylvain Meignier, Yannick Estève. Indexation en locuteur : utilisation d'informations lexicales. Les Journées d'Étude sur la Parole (JEP) 2006, 2006, Dinard, France. pp.5. ⟨hal-01434240⟩
101 Consultations
53 Téléchargements

Partager

Gmail Facebook X LinkedIn More