Segmentation selon le locuteur : les activités du consortium ELISA dans le cadre de Nist RT03 - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2004

Segmentation selon le locuteur : les activités du consortium ELISA dans le cadre de Nist RT03

Résumé

This paper presents the ELISA consortium activities in automatic speaker diarization (also known as speaker segmentation) during the NIST Rich Transcription (RT) 2003 evaluation. The experiments were achieved on real broadcast news data (HUB4), in the framework of the ELISA consortium. The paper firstly shows the interest of segmentation in acoustic macro classes (like gender or bandwidth) as a front-end processing for segmentation/diarization task. The impact of this prior acoustic segmentation is evaluated in terms of speaker diarization performance. Secondly, two different approaches from CLIPS and LIA laboratories are presented and different possibilities of combining them are investigated. The system submitted as ELISA primary obtained the second lower diarization error rate compared to the other RT03-participant primary systems. Another ELISA system submitted as secondary outperformed the best primary system (i.e. it obtained the lowest speaker diarization error rate).
Cet article présente les activités du consortium ELISA en segmentation et regroupement automatique des locuteurs au cours de l'évaluation NIST Rich Transcription (RT) 2003. Les expériences ont été réalisées sur de véritables données de radio et de télévision (HUB4), dans le cadre du consortium ELISA. L'article montre tout d'abord l'intérêt de la segmentation en macro classes acoustiques (comme le genre ou la bande passante) en tant que prétraitement pour la tâche de segmentation / regroupement. L'impact de cette segmentation acoustique préalable est évalué en termes de DER. Deuxièmement, deux approches différentes issues du CLIPS et du LIA sont présentées et différentes possibilités de les combiner sont étudiées. Le système présenté comme système primaire du consortium ELISA a été classé 2e à RT03.
Fichier principal
Vignette du fichier
Moraru-Meignier-etal.pdf (172.75 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-01434484 , version 1 (28-03-2017)

Identifiants

  • HAL Id : hal-01434484 , version 1

Citer

Daniel Moraru, Sylvain Meignier, Corinne Fredouille, Laurent Besacier, Jean-François Bonastre. Segmentation selon le locuteur : les activités du consortium ELISA dans le cadre de Nist RT03. Journées d'Etude sur la Parole (JEP 2004), AFCP, Apr 2004, Fès, Maroc. pp.4. ⟨hal-01434484⟩
166 Consultations
67 Téléchargements

Partager

Gmail Facebook X LinkedIn More