TCOF-POS : un corpus libre de français parlé annoté en morphosyntaxe

Abstract : This article details the creation of TCOF-POS, the first freely available corpus of spontaneous spoken French. We present here the methodology that was followed in order to obtain the best possible quality in the final resource. This corpus already is freely available and can be used as a training/validation corpus for NLP tools, as well as a study corpus for linguistic research. We also present the results obtained by two POS-taggers trained on the corpus.
Type de document :
Communication dans un congrès
JEP-TALN 2012 - Journées d'Études sur la Parole et conférence annuelle du Traitement Automatique des Langues Naturelles, Jun 2012, Grenoble, France. pp.99-112, 2012
Liste complète des métadonnées


https://hal.archives-ouvertes.fr/hal-00709187
Contributeur : Karën Fort <>
Soumis le : lundi 18 juin 2012 - 10:25:37
Dernière modification le : mardi 11 octobre 2016 - 15:20:59
Document(s) archivé(s) le : mercredi 19 septembre 2012 - 02:35:25

Fichier

TALN2012_CBKFBS_Oral_FinaleSou...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00709187, version 1

Citation

Christophe Benzitoun, Karën Fort, Benoît Sagot. TCOF-POS : un corpus libre de français parlé annoté en morphosyntaxe. JEP-TALN 2012 - Journées d'Études sur la Parole et conférence annuelle du Traitement Automatique des Langues Naturelles, Jun 2012, Grenoble, France. pp.99-112, 2012. <hal-00709187>

Partager

Métriques

Consultations de
la notice

1003

Téléchargements du document

384