Skip to Main content Skip to Navigation
Conference papers

Chunker différents types de discours oraux : défis pour l'apprentissage automatique

Résumé : Le travail décrit le développement d'un chunker pour l'oral par apprentissage supervisé avec les CRFs, à partir d'un corpus de référence de petite taille et composé de productions de nature différente : monologue préparé vs discussion spontanée. La méthodologie respecte les spécificités des données traitées. L'apprentissage tient compte des résultats proposés par différents étiqueteurs morpho-syntaxiques disponibles sans correction manuelle de leurs résultats. Les expériences montrent que le genre de discours (monologue vs discussion), la nature de discours (spontané vs préparé) et la taille du corpus peuvent influencer les résultats de l'apprentissage, ce qui confirme que la nature des données traitées est à prendre en considération dans l'interprétation des résultats.
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-02567769
Contributor : Yannick Parmentier <>
Submitted on : Friday, May 8, 2020 - 12:07:04 AM
Last modification on : Monday, July 13, 2020 - 3:30:46 AM

Identifiers

  • HAL Id : hal-02567769, version 1

Citation

Iris Eshkol-Taravella, Mariame Maarouf, Marie Skrovec, Flora Badin. Chunker différents types de discours oraux : défis pour l'apprentissage automatique. Actes de la Conférence sur le Traitement Automatique des Langues Naturelles (TALN) - PFIA 2019 - Volume II : Articles courts, Jul 2019, Toulouse, France. pp.195-204. ⟨hal-02567769⟩

Share

Metrics

Record views

62