La désambiguïsation lexicale d'une langue moins bien dotée, l'exemple de l'arabe

Résumé : Les corpus annotés en sens sont des ressources cruciales pour la tâche de désambiguïsation lexicale (Word Sense Disambiguation). La plupart des langues n'en possèdent pas ou trop peu pour pouvoir construire des systèmes robustes. Nous nous intéressons ici à la langue arabe et présentons 12 corpus annotés en sens, fabriqués automatiquement à partir de 12 corpus en langue anglaise. Nous évaluons la qualité de nos systèmes de désambiguïsation grâce à un corpus d'évaluation en arabe nouvellement disponible.
Type de document :
Communication dans un congrès
25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01781185
Contributeur : Didier Schwab <>
Soumis le : dimanche 29 avril 2018 - 17:17:28
Dernière modification le : lundi 11 février 2019 - 16:36:02
Document(s) archivé(s) le : mardi 25 septembre 2018 - 12:57:08

Fichier

TALN2018_Hajj-Salah-et-al.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01781185, version 1

Collections

Citation

Marwa Hadj Salah, Loïc Vial, Hervé Blanchon, Mounir Zrigui, Benjamin Lecouteux, et al.. La désambiguïsation lexicale d'une langue moins bien dotée, l'exemple de l'arabe. 25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France. 〈hal-01781185〉

Partager

Métriques

Consultations de la notice

113

Téléchargements de fichiers

127