Mesure de similarité fondée sur des réseaux de neurones siamois pour le doublage de voix - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Mesure de similarité fondée sur des réseaux de neurones siamois pour le doublage de voix

Résumé

Dubbing aims to broadcast a multimedia document to a larger audience. The process that consists in selecting a voice in a target language is referred as voice casting and it is performed by a human. This selection is not only based on acoustic similarity between two voices. Actually, it is suppported by more subjective criteria such as emotions, sociocultural choices... In this paper we propose a siamese neural networks based approach measuring proximity between the original voice and the dubbed one. The concept of similarity we want to model does not only consider the acoustic part of a voice, also it takes into account spectators receptive concerns. We perform a statistical test to evaluate our model. Our results show that there is an information in the acoustic parameters that allows a voice to be associated with another one with respect to a particular character.
Le doublage vocal d'une œuvre culturelle permet sa diffusion vers une audience plus large. Le processus de sélection de voix dans une nouvelle langue, intégralement réalisé par un opérateur humain, est appelé casting vocal. Cette sélection dépasse le simple cadre de la proximité acoustique entre deux voix, intégrant de nombreux critères plus subjectifs qui peuvent être liés notamment à des choix socioculturels, émotionnels... Dans ce papier, nous proposons une approche par réseaux de neurones siamois mesurant la proximité entre la voix originale et la voix dans la langue cible, en intégrant la notion de similarité entre les voix non pas d'un point de vue purement acoustique mais également réceptif. Les premiers résultats obtenus montrent, grâce à un test d'hypothèse statistique, que des informations sont contenues dans les paramètres acoustiques pour un même personnage permettant à une voix d'être associée à une autre.
Fichier principal
Vignette du fichier
main_final.pdf (182.79 Ko) Télécharger le fichier
présentation.pdf (227.4 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01819198 , version 1 (20-06-2018)

Identifiants

Citer

Adrien Gresse, Richard Dufour, Vincent Labatut, Mickael Rouvier, Jean-François Bonastre. Mesure de similarité fondée sur des réseaux de neurones siamois pour le doublage de voix. XXXIIèmes Journées d’Études sur la Parole (JEP), Jun 2018, Aix-en-Provence, France. ⟨10.21437/JEP.2018-2⟩. ⟨hal-01819198⟩
204 Consultations
874 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More