Intégrer des connaissances linguistiques dans un CRF : application à l'apprentissage d'un segmenteur-étiqueteur du français - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Intégrer des connaissances linguistiques dans un CRF : application à l'apprentissage d'un segmenteur-étiqueteur du français

Résumé

Dans cet article, nous synthétisons les résultats de plusieurs séries d'expériences réalisées à l'aide de CRF (Conditional Random Fields ou "champs markoviens conditionnels") linéaires pour apprendre à annoter des textes français à partir d'exemples, en exploitant diverses ressources linguistiques externes. Ces expériences ont porté sur l'étiquetage morphosyntaxique intégrant l'identification des unités polylexicales. Nous montrons que le modèle des CRF est capable d'intégrer des ressources lexicales riches en unités multi-mots de différentes manières et permet d'atteindre ainsi le meilleur taux de correction d'étiquetage actuel pour le français.
Fichier principal
Vignette du fichier
Constant_Tellier_alii.pdf (128.17 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00620923 , version 1 (09-09-2011)

Identifiants

  • HAL Id : hal-00620923 , version 1

Citer

Mathieu Constant, Isabelle Tellier, Denys Duchier, Yoann Dupont, Anthony Sigogne, et al.. Intégrer des connaissances linguistiques dans un CRF : application à l'apprentissage d'un segmenteur-étiqueteur du français. TALN, Jun 2011, Montpellier, France. pp.321. ⟨hal-00620923⟩
619 Consultations
582 Téléchargements

Partager

Gmail Facebook X LinkedIn More