Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA

Résumé

L'étiquetage des rôles grammaticaux est une tâche de pré-traitement récurrente. Pour le français, deux outils sont majoritairement utilisés : TreeTagger et Brill. Nous proposons une démarche, ne nécessitant aucune ressource, pour la création d'un modèle de Markov caché (HMM) pour palier les problèmes de ces outils, et de licences notamment. Nous distribuons librement toutes les ressources liées à ce travail.
Fichier principal
Vignette du fichier
article-taln-2010.pdf (75.57 Ko) Télécharger le fichier
article-taln2010.tar.bz2 (86.82 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Format : Autre
Loading...

Dates et versions

hal-00493847 , version 1 (21-06-2010)

Identifiants

  • HAL Id : hal-00493847 , version 1

Citer

Charles Dejean, Manoel Fortun, Clotilde Massot, Vincent Pottier, Fabien Poulard, et al.. Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA. 17e Conférence sur le Traitement Automatique des Langues Naturelles, Jul 2010, Montréal, Canada. ⟨hal-00493847⟩
206 Consultations
653 Téléchargements

Partager

Gmail Facebook X LinkedIn More