Synthèse de la parole à partir du texte - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2013

Synthèse de la parole à partir du texte

Résumé

L'objet de la synthèse de la parole à partir du texte (ou TTS, Text-To-Speech) est de calculer automatiquement le signal de parole correspondant à un texte donné. Le texte lui-même peut provenir de diverses sources : journaux, livres, systèmes de réponse vocale, de dialogue ou traduction automatique (borne interactive, assistant personnel), base de données d’un système d’information, jeu vidéo, courriers électroniques, SMS, documents butinés sur la toile, ou tout simplement texte saisi au clavier d’un ordinateur. La réponse vocale sous sa forme la plus simple peut être un ensemble de messages préenregistrés (ou « prompts »). L’ambition de la synthèse de la parole à partir du texte est plus grande : il s’agit de calculer automatiquement les échantillons sonores correspondant à un énoncé écrit quelconque, qui n’est pas connu d’avance et qui peut être de grande taille. Les deux versants de la synthèse de parole sont d’une part, l’analyse et l’interprétation du texte, d’autre part, la prédiction des paramètres acoustico- phonétiques du son et la synthèse du signal proprement dite : – analyse du texte. La première étape de la transformation d’un texte en parole implique la capacité d’analyser, de comprendre le texte écrit, ses nuances et ses connotations, la situation du discours et l’acte de parole à effectuer. En plus du texte, le contexte peut être spécifié (style de parole, émotion, attitude, type de personnage, voix spécifique...) ; – synthèse du signal. Une fois le texte analysé, il s’agit de calculer le signal acoustique qui interprète au mieux le contenu linguistique, avec une voix aussi naturelle que possible, ressemblant à un locuteur particulier, et avec les nuances d’attitude, voire d’émotion que le texte réclame. En plus du signal audio, le synthétiseur peut fournir des indications pour synchroniser le mouvement des lèvres d’un avatar ou personnage vidéo, ou les mouvements d’un robot.
Fichier non déposé

Dates et versions

hal-01712517 , version 1 (19-02-2018)

Identifiants

  • HAL Id : hal-01712517 , version 1

Citer

Christophe d'Alessandro, Gael Richard. Synthèse de la parole à partir du texte. Techniques de l'ingénieur, Edition Techniques de l'ingénieur, pp.27, 2013. ⟨hal-01712517⟩
213 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More