Segmentation automatique en périodes pour le français parlé - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Automatic Period Segmentation of Oral French

Segmentation automatique en périodes pour le français parlé

Résumé

Natural Language Processing in oral speech segmentation is still looking for a minimal unit for analyze. In this work, we propose a comparison of two methods of automatic segmentation in macrosyntactic periods which allows to take into account syntactic and prosodic components of speech. We compare the performances of an existing tool Analor (Avanzi et al., 2008) developed for automatic segmentation of prosodic periods and of CRF models relying on syntactic and / or prosodic features. We find that Analor tends to divide speech into smaller segments and that CRF models detect larger segments than macro-syntactic periods. However, in general CRF models perform with better results than Analor in terms of F-measure.
Nous proposons la comparaison de deux méthodes de segmentation automatique du français parlé en périodes macro-syntaxiques, qui permettent d’analyser la syntaxe et la prosodie du discours. Nous comparons l’outil Analor (Avanzi et al., 2008) qui a été développé pour la segmentation des périodes prosodiques et les modèles de segmentations utilisant des CRF et des traits prosodiques et / ou morphosyntaxiques. Les résultats montrent qu’Analor divise le discours en plus petits segments prosodiques tandis que les modèles CRF détectent des segments plus larges que les périodes macro-syntaxiques. Cependant, les modèles CRF ont de meilleurs résultats qu’Analor en termes de F-mesure.
Fichier principal
Vignette du fichier
64.pdf (406.27 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02784773 , version 1 (07-06-2020)
hal-02784773 , version 2 (18-06-2020)
hal-02784773 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02784773 , version 3

Citer

Natalia Kalashnikova, Iris Eshkol-Taravella, Loïc Grobol, François Delafontaine. Segmentation automatique en périodes pour le français parlé. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2 : Traitement Automatique des Langues Naturelles, Jun 2020, Nancy, France. pp.241-248. ⟨hal-02784773v3⟩
303 Consultations
125 Téléchargements

Partager

Gmail Facebook X LinkedIn More