Construction automatique d'un large corpus libre annoté morpho-syntaxiquement en français - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Construction automatique d'un large corpus libre annoté morpho-syntaxiquement en français

Résumé

Cet article étudie la possibilité de créer un nouveau corpus écrit en français annoté morpho-syntaxiquement à partir d'un corpus annoté existant. Nos objectifs sont de se libérer de la licence d'exploitation contraignante du corpus d'origine et d'obtenir une modernisation perpétuelle des textes. Nous montrons qu'un corpus pré-annoté automatiquement peut permettre d'entraîner un étiqueteur produisant des performances état-de-l'art, si ce corpus est suffisamment grand.
Fichier principal
Vignette du fichier
TALN13.pdf (332.44 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-00816350 , version 1 (22-04-2013)

Identifiants

  • HAL Id : hal-00816350 , version 1

Citer

Nicolas Hernandez, Florian Boudin. Construction automatique d'un large corpus libre annoté morpho-syntaxiquement en français. Traitement Automatique des Langues Naturelles (TALN), Jun 2013, Sables d'Olonne, France. ⟨hal-00816350⟩
283 Consultations
540 Téléchargements

Partager

Gmail Facebook X LinkedIn More