Synthèse de la parole à partir du texte

Christophe d'Alessandro; Gael Richard

Chapitre D'ouvrage Année : 2013

Synthèse de la parole à partir du texte

(1) , (2)

1
2

Christophe d'Alessandro

Fonction : Auteur
PersonId : 16760
IdHAL : christophe-dalessandro
ORCID : 0000-0002-2629-8752
IdRef : 05971638X

Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur

Gael Richard

Fonction : Auteur
PersonId : 14146
IdHAL : gael-richard
IdRef : 094977208

Laboratoire Traitement et Communication de l'Information

Résumé

L'objet de la synthèse de la parole à partir du texte (ou TTS, Text-To-Speech) est de calculer automatiquement le signal de parole correspondant à un texte donné. Le texte lui-même peut provenir de diverses sources : journaux, livres, systèmes de réponse vocale, de dialogue ou traduction automatique (borne interactive, assistant personnel), base de données dun système dinformation, jeu vidéo, courriers électroniques, SMS, documents butinés sur la toile, ou tout simplement texte saisi au clavier dun ordinateur. La réponse vocale sous sa forme la plus simple peut être un ensemble de messages préenregistrés (ou « prompts »). Lambition de la synthèse de la parole à partir du texte est plus grande : il sagit de calculer automatiquement les échantillons sonores correspondant à un énoncé écrit quelconque, qui nest pas connu davance et qui peut être de grande taille. Les deux versants de la synthèse de parole sont dune part, lanalyse et linterprétation du texte, dautre part, la prédiction des paramètres acoustico- phonétiques du son et la synthèse du signal proprement dite : analyse du texte. La première étape de la transformation dun texte en parole implique la capacité danalyser, de comprendre le texte écrit, ses nuances et ses connotations, la situation du discours et lacte de parole à effectuer. En plus du texte, le contexte peut être spécifié (style de parole, émotion, attitude, type de personnage, voix spécifique...) ; synthèse du signal. Une fois le texte analysé, il sagit de calculer le signal acoustique qui interprète au mieux le contenu linguistique, avec une voix aussi naturelle que possible, ressemblant à un locuteur particulier, et avec les nuances dattitude, voire démotion que le texte réclame. En plus du signal audio, le synthétiseur peut fournir des indications pour synchroniser le mouvement des lèvres dun avatar ou personnage vidéo, ou les mouvements dun robot.

Mots clés

synthèse de parole

Domaines

Interface homme-machine [cs.HC] Acoustique [physics.class-ph] Traitement du signal et de l'image [eess.SP] Musique, musicologie et arts de la scène

Christophe d'Alessandro : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01712517

Soumis le : lundi 19 février 2018-15:53:17

Dernière modification le : lundi 9 octobre 2023-12:49:40

Dates et versions

hal-01712517 , version 1 (19-02-2018)

Identifiants

HAL Id : hal-01712517 , version 1

Citer

Christophe d'Alessandro, Gael Richard. Synthèse de la parole à partir du texte. Techniques de l'ingénieur, Edition Techniques de l'ingénieur, pp.27, 2013. ⟨hal-01712517⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM CNRS PARISTECH LIMSI SORBONNE-UNIVERSITE LTCI IDS S2A LISN MUSCI

213 Consultations

0 Téléchargements

Synthèse de la parole à partir du texte

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager