| HAL : hal-00493847, version 1 |
| Fiche détaillée | Récupérer au format |
|
|
| 17e Conférence sur le Traitement Automatique des Langues Naturelles, Montréal : Canada (2010) |
|
|
|
|
| Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA |
|
|
| Charles Dejean 1Manoel Fortun 1 |
|
|
| (21/07/2010) |
|
|
| L'étiquetage des rôles grammaticaux est une tâche de pré-traitement récurrente. Pour le français, deux outils sont majoritairement utilisés : TreeTagger et Brill. Nous proposons une démarche, ne nécessitant aucune ressource, pour la création d'un modèle de Markov caché (HMM) pour palier les problèmes de ces outils, et de licences notamment. Nous distribuons librement toutes les ressources liées à ce travail. |
|
|
|
|
|
|
|
|
|
|
| 1 : | Laboratoire d'Informatique de Nantes Atlantique (LINA) |
| CNRS : UMR6241 – Université de Nantes – Ecole des Mines de Nantes | |
|
|
|
|
|
|
|
|
| Domaine | : | Informatique/Traitement du texte et du document |
|
|
| étiquetage grammatical – Modèle de Markov caché – UIMA – Brill – TreeTagger |
|
|
| Liste des fichiers attachés à ce document : | ||||||||||
|
|
|
| hal-00493847, version 1 | |
| http://hal.archives-ouvertes.fr/hal-00493847 | |
| oai:hal.archives-ouvertes.fr:hal-00493847 | |
| Contributeur : Matthieu Vernier | |
| Soumis le : Lundi 21 Juin 2010, 14:25:06 | |
| Dernière modification le : Lundi 21 Juin 2010, 17:33:10 | |