Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA

Résumé : L'étiquetage des rôles grammaticaux est une tâche de pré-traitement récurrente. Pour le français, deux outils sont majoritairement utilisés : TreeTagger et Brill. Nous proposons une démarche, ne nécessitant aucune ressource, pour la création d'un modèle de Markov caché (HMM) pour palier les problèmes de ces outils, et de licences notamment. Nous distribuons librement toutes les ressources liées à ce travail.
Type de document :
Communication dans un congrès
17e Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2010, Montréal, Canada. 2010
Liste complète des métadonnées


https://hal.archives-ouvertes.fr/hal-00493847
Contributeur : Matthieu Vernier <>
Soumis le : lundi 21 juin 2010 - 14:25:06
Dernière modification le : mercredi 24 juin 2015 - 10:59:21
Document(s) archivé(s) le : lundi 22 octobre 2012 - 12:35:29

Fichiers

Identifiants

  • HAL Id : hal-00493847, version 1

Collections

Citation

Charles Dejean, Manoel Fortun, Clotilde Massot, Vincent Pottier, Fabien Poulard, et al.. Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA. 17e Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2010, Montréal, Canada. 2010. <hal-00493847>

Partager

Métriques

Consultations de
la notice

461

Téléchargements du document

429