Apprentissage automatique d'un chunker pour le français - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Apprentissage automatique d'un chunker pour le français

Résumé

Nous décrivons dans cet article comment nous avons procédé pour apprendre automatiquement un chunker à partir du French Treebank, en utilisant les CRF (Conditional Random Fields). Nous avons réalisé diverses expériences, pour reconnaître soit l'ensemble de tous les chunks possibles, soit les seuls groupes nominaux. Nous évaluons le chunker obtenu aussi bien de manière interne (sur le French Treebank lui-même) qu'externe (sur un corpus distinct transcrit de l'oral), afin de mesurer sa robustesse. ABSTRACT Machine Learning of a chunker for French We describe in this paper how to automatically learn a chunker for French, from the French Treebank and CRFs (Conditional Random Fields). We did several experiments, either to recognize every possible kind of chunks, or to focus on nominal phrases only. We evaluate the obtained chunker on internal data (i.e. also extracted from the French Treebank) as well as on external (i.e from a distinct corpus) ones, to measure its robustness.
Fichier principal
Vignette du fichier
Tellier12_chunking.pdf (93.22 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01174591 , version 1 (17-07-2015)

Identifiants

  • HAL Id : hal-01174591 , version 1

Citer

Isabelle Tellier, Denys Duchier, Iris Eshkol, Arnaud Courmet, Mathieu Martinet. Apprentissage automatique d'un chunker pour le français. TALN2012, Jun 2012, Grenoble, France. pp.431-438. ⟨hal-01174591⟩
264 Consultations
492 Téléchargements

Partager

Gmail Facebook X LinkedIn More