2956 articles  [english version]
HAL : hal-00436330, version 1

Fiche détaillée  Récupérer au format
TALN 2009, Senlis : France (2009)
Annotation fonctionnelle de corpus arborés avec des Champs Aléatoires Conditionnels
Erwan Moreau 1, Isabelle Tellier 2, Antonio Balvet 3, Grégoire Laurence 4, 5, Antoine Rozenknop 1, Thierry Poibeau 1
Crotal - ANR-07-MDCO-03 Collaboration(s)
(24/06/2009)

L'objectif de cet article est d'évaluer dans quelle mesure les "fonctions syntaxiques" qui figurent dans une partie du corpus arboré de Paris 7 sont apprenables à partir d'exemples. La technique d'apprentissage automatique employée pour cela fait appel aux "Champs Aléatoires Conditionnels" (Conditional Random Fields ou CRF), dans une variante adaptée à l'annotation d'arbres. Les expériences menées sont décrites en détail et analysées. Moyennant un bon paramétrage, elles atteignent une F1-mesure de plus de 80%.
1 :  Laboratoire d'informatique de Paris-nord (LIPN)
CNRS : UMR7030 – Université Paris XIII - Paris Nord
2 :  Laboratoire d'Informatique Fondamentale d'Orléans (LIFO)
Université d'Orléans : EA4022 – Ecole Nationale Supérieure d'Ingénieurs de Bourges
3 :  Savoirs, Textes, Langage (STL)
CNRS : UMR8163 – Université Lille I - Sciences et technologies – Université Lille III - Sciences humaines et sociales
4 :  MOSTRARE (INRIA Lille - Nord Europe)
INRIA – CNRS : UMR8022 – Université Lille I - Sciences et technologies – Université Lille III - Sciences humaines et sociales
5 :  Laboratoire d'Informatique Fondamentale de Lille (LIFL)
CNRS : UMR8022 – Université Lille I - Sciences et technologies – Université Lille III - Sciences humaines et sociales – INRIA
Informatique/Traitement du texte et du document

Informatique/Apprentissage
fonctions syntaxiques – Conditional Random Fields – corpus arborés
Liste des fichiers attachés à ce document : 
PDF
TALN_83.pdf(133.2 KB)