Uniformisation de corpus anglais annotés en sens

Résumé : Pour la désambiguïsation lexicale en anglais, on compte aujourd'hui une quinzaine de corpus annotés en sens dans des formats souvent différents et provenant de différentes versions du Princeton WordNet. Nous présentons un format pour uniformiser ces corpus, et nous fournissons à la communauté l'ensemble des corpus annotés en anglais portés à notre connaissance avec des sens uniformisés du Princeton WordNet 3.0, lorsque les droits le permettent et le code source pour construire l'ensemble des corpus à partir des données originales.
Document type :
Conference papers
Liste complète des métadonnées

Cited literature [9 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01599578
Contributor : Loïc Vial <>
Submitted on : Monday, October 2, 2017 - 12:38:50 PM
Last modification on : Tuesday, February 12, 2019 - 1:31:16 AM

File

TALN_2017__corpus_demo_(4).pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01599578, version 1

Collections

Citation

Loïc Vial, Benjamin Lecouteux, Didier Schwab. Uniformisation de corpus anglais annotés en sens. 24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France. ⟨hal-01599578⟩

Share

Metrics

Record views

119

Files downloads

69