La désambiguïsation lexicale d'une langue moins bien dotée, l'exemple de l'arabe

Résumé : Les corpus annotés en sens sont des ressources cruciales pour la tâche de désambiguïsation lexicale (Word Sense Disambiguation). La plupart des langues n'en possèdent pas ou trop peu pour pouvoir construire des systèmes robustes. Nous nous intéressons ici à la langue arabe et présentons 12 corpus annotés en sens, fabriqués automatiquement à partir de 12 corpus en langue anglaise. Nous évaluons la qualité de nos systèmes de désambiguïsation grâce à un corpus d'évaluation en arabe nouvellement disponible.
Type de document :
Communication dans un congrès
25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01781185
Contributeur : Didier Schwab <>
Soumis le : dimanche 29 avril 2018 - 17:17:28
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : mardi 25 septembre 2018 - 12:57:08

Fichier

TALN2018_Hajj-Salah-et-al.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01781185, version 1

Collections

Citation

Marwa Salah, Loïc Vial, Hervé Blanchon, Mounir Zrigui, Benjamin Lecouteux, et al.. La désambiguïsation lexicale d'une langue moins bien dotée, l'exemple de l'arabe. 25e conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France. 〈hal-01781185〉

Partager

Métriques

Consultations de la notice

100

Téléchargements de fichiers

119