Uniformisation de corpus anglais annotés en sens

Résumé : Pour la désambiguïsation lexicale en anglais, on compte aujourd'hui une quinzaine de corpus annotés en sens dans des formats souvent différents et provenant de différentes versions du Princeton WordNet. Nous présentons un format pour uniformiser ces corpus, et nous fournissons à la communauté l'ensemble des corpus annotés en anglais portés à notre connaissance avec des sens uniformisés du Princeton WordNet 3.0, lorsque les droits le permettent et le code source pour construire l'ensemble des corpus à partir des données originales.
Type de document :
Communication dans un congrès
24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01599578
Contributeur : Loïc Vial <>
Soumis le : lundi 2 octobre 2017 - 12:38:50
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03

Fichier

TALN_2017__corpus_demo_(4).pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01599578, version 1

Collections

Citation

Loïc Vial, Benjamin Lecouteux, Didier Schwab. Uniformisation de corpus anglais annotés en sens. 24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France. 〈hal-01599578〉

Partager

Métriques

Consultations de la notice

112

Téléchargements de fichiers

58