Erreurs d'écoute dans la transcription de données orales - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue PAROLE Année : 2002

Erreurs d'écoute dans la transcription de données orales

Résumé

The transcription of french oral corpora was checked and errors in transcribing were quantified and analyzed. They differ in number and kinds of errors according to the corpora. Was verified the great predominance of omission over addition in silent and filled pauses as well as turn taking. In the same way, lexical units and interjections are far more omitted than added. These changes form the third of suggested changes in the texts. The size of utterances which are understood only during the verfication phase may vary from one to 24 phonems. The fourth of changes is composed of substituted sequences. If some multitranscriptions are withdrawn, thoses which are inserted are twice less numerous. Both categories are nearly as important as substituted units. These listening errors may be considered as "slips of the ear" encountered during the transcribing activity.
On a observé lors de la vérification des transcriptions de 12 corpus de français parlé un certain nombre d'erreurs très variables en quantité et en types d'un corpus à l'autre; On retrouve la très grande prédominance des oublis dans les pauses silencieuses et remplies ainsi que dans les tours de parole. De même les éléments lexicaux, onomatopées et interjections sont beaucoup plus souvent oubliés qu'ajoutés. Ils constituent le tiers des modifications apportées aux textes. la taille des passages qui ne sont élucidés que lors de la vérification peut varier d'une vingtaine de phonèmes. Le quart des modifications concernent des propositions de remplacement d'énoncés. Si des multitranscriptions sont supprimées, celles qui sont proposées après vérification sont deux fois moins importantes. Ces deux catégories sont presqu'aussi nombreuses que les éléments remplacés. Ces erreurs d'écoute nous semblent constituer les "mal-entendus", erreurs d'écoute chez le transcripteur.
Fichier principal
Vignette du fichier
1405.pdf (422.77 Ko) Télécharger le fichier
Origine : Accord explicite pour ce dépôt

Dates et versions

hal-00265194 , version 1 (02-06-2008)

Identifiants

  • HAL Id : hal-00265194 , version 1

Citer

Berthille Pallaud. Erreurs d'écoute dans la transcription de données orales. Revue PAROLE, 2002, 22-24, pp.267-294. ⟨hal-00265194⟩
222 Consultations
119 Téléchargements

Partager

Gmail Facebook X LinkedIn More