Reconnaissance Automatique de Locuteurs à l'aide de Fonctions de Croyance - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Reconnaissance Automatique de Locuteurs à l'aide de Fonctions de Croyance

Résumé

In this paper, we consider the extraction of speaker identity (first name and last name) from audio records of broadcast news. Using an automatic speech recognition system, we present improvements for a method which allows to extract speaker identities from automatic transcripts and to assign them to speaker turns. The detected complete names are chosen as potential candidates for these assignments. All this information, which is often contradictory, is described and combined in the Belief Functions formalism, which makes the knowledge representation of the problem coherent. Experiments are carried out on French broadcast news records from a French evaluation campaign of automatic speech recocognition.
Le thème de cet article est l'extraction automatique de l'identité du locuteur (prénom et patronyme) présente dans des enregistrements sonores. ` A partir des résultats d'un système de transcription de la parole, nous pro-posons d'améliorer une méthode récente visantàvisant`visantà extraire l'identité des locuteurs de la transcription etàet`età l'assigner aux différents tours de parole. Les identités des locuteurs détectés par la transcription sont prises comme candidats potentiels pour ces assignations. L'ensemble de ces in-formations souvent conflictuelles est décrit puis combiné combiné`combinéà l'aide du formalisme des Fonctions de Croyance, qui ap-porte une cohérencè a la représentation des connaissances duprobì eme. Le système estévaluéest´estévalué sur des enregistrements radiophoniques provenant d'une campagne d'´ evaluation francophone de systèmes de reconnaissance automatique de la parole.
Fichier principal
Vignette du fichier
ident_locuteur_RFIA10.pdf (366.26 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01433893 , version 1 (03-04-2017)

Identifiants

  • HAL Id : hal-01433893 , version 1

Citer

Simon Petitrenaud, Vincent Jousse, Sylvain Meignier, Yannick Estève. Reconnaissance Automatique de Locuteurs à l'aide de Fonctions de Croyance. 17e congrès francophone Reconnaissance des Formes et Intelligence Artificielle (RFIA'10), 2010, Caen, France. ⟨hal-01433893⟩
101 Consultations
27 Téléchargements

Partager

Gmail Facebook X LinkedIn More