Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA

Résumé : L'étiquetage des rôles grammaticaux est une tâche de pré-traitement récurrente. Pour le français, deux outils sont majoritairement utilisés : TreeTagger et Brill. Nous proposons une démarche, ne nécessitant aucune ressource, pour la création d'un modèle de Markov caché (HMM) pour palier les problèmes de ces outils, et de licences notamment. Nous distribuons librement toutes les ressources liées à ce travail.
Type de document :
Communication dans un congrès
17e Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2010, Montréal, Canada. 2010
Liste complète des métadonnées

Littérature citée [4 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-00493847
Contributeur : Matthieu Vernier <>
Soumis le : lundi 21 juin 2010 - 14:25:06
Dernière modification le : jeudi 5 avril 2018 - 10:36:49
Document(s) archivé(s) le : lundi 22 octobre 2012 - 12:35:29

Fichiers

Identifiants

  • HAL Id : hal-00493847, version 1

Collections

Citation

Charles Dejean, Manoel Fortun, Clotilde Massot, Vincent Pottier, Fabien Poulard, et al.. Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA. 17e Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2010, Montréal, Canada. 2010. 〈hal-00493847〉

Partager

Métriques

Consultations de la notice

485

Téléchargements de fichiers

557