Phonotactique prédictive et alignement automatique : Application au corpus MARSEC et perspectives

Cyril Auran 1, * Caroline Bouzon 1
* Auteur correspondant
Résumé : Cet article présente la méthodologie employée lors de la constitution du corpus aligné (phonèmes, constituants syllabiques, syllabes, mots, pieds accentuels et unités intonatives) Aix-MARSEC. Après avoir défini les concepts d'alignement et de granularité, cet article détaille, dans sa partie centrale, les trois phases menant à la transcription phonétique alignée du corpus : phonétisation automatique brute par dictionnaire, optimisation par règles d'élision et alignement automatique par "force Viterbi" de la transcription optimisée. Après évaluation de la phonétisation optimisée et de l'alignement final, des perspectives d'amélioration de ces deux composantes sont proposées.
Type de document :
Article dans une revue
Travaux Interdisciplinaires du Laboratoire Parole et Langage d'Aix-en-Provence (TIPA), Laboratoire Parole et Langage, 2003, 22, pp.33-63
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00285551
Contributeur : Cnrs : Umr6057 Laboratoire Parole Et Langage <>
Soumis le : jeudi 5 juin 2008 - 16:59:58
Dernière modification le : jeudi 18 janvier 2018 - 02:24:56
Document(s) archivé(s) le : vendredi 28 mai 2010 - 21:18:58

Fichier

2102.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-00285551, version 1

Collections

Citation

Cyril Auran, Caroline Bouzon. Phonotactique prédictive et alignement automatique : Application au corpus MARSEC et perspectives. Travaux Interdisciplinaires du Laboratoire Parole et Langage d'Aix-en-Provence (TIPA), Laboratoire Parole et Langage, 2003, 22, pp.33-63. 〈hal-00285551〉

Partager

Métriques

Consultations de la notice

576

Téléchargements de fichiers

227