Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale.

Résumé : En désambiguïsation lexicale, l'utilisation des réseaux de neurones est encore peu présente et très récente. Cette direction est pourtant très prometteuse, tant les résultats obtenus par ces premiers systèmes arrivent systématiquement en tête des campagnes d'évaluation, malgré une marge d'amé-lioration qui semble encore importante. Nous présentons dans cet article une nouvelle architecture à base de réseaux de neurones pour la désambiguïsation lexicale. Notre système est à la fois moins complexe a entraîner que les systèmes neuronaux existants et il obtient des résultats état de l'art sur la plupart des tâches d'évaluation de la désambiguïsation lexicale en anglais. L'accent est porté sur la reproductibilité de notre système et de nos résultats, par l'utilisation d'un modèle de vecteurs de mots, de corpus d'apprentissage et d'évaluation librement accessibles. ABSTRACT LSTM Based Supervised Approach for Word Sense Disambiguation In word sense disambiguation, there are still few usages of neural networks. This direction is very promiseful however, the results obtained by these first systems being systematically in the top of the evaluation campaigns, with an improvement gap which seems still high. We present in this paper a new architecture based on neural networks for word sense disambiguation. Our system is at the same time less difficult to train than existing neural networks, and it obtains state of the art results on most evaluation tasks in English. The focus is on the reproducibility of our systems and our results, through the use of a word embeddings model, training corpora and evaluation corpora freely accessible. MOTS-CLÉS : désambiguïsation lexicale, approche supervisée, LSTM, réseau neuronal.
Type de document :
Rapport
[Rapport de recherche] UGA - Université Grenoble Alpes. 2018
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01753343
Contributeur : Benjamin Lecouteux <>
Soumis le : jeudi 29 mars 2018 - 15:45:16
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03

Fichier

TALN2018_paper_30ok.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01753343, version 1

Collections

Citation

Loïc Vial, Benjamin Lecouteux, Didier Schwab. Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale.. [Rapport de recherche] UGA - Université Grenoble Alpes. 2018. 〈hal-01753343〉

Partager

Métriques

Consultations de la notice

66

Téléchargements de fichiers

122