Approches d'analyse distributionnelle pour améliorer la désambiguïsation sémantique - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Approches d'analyse distributionnelle pour améliorer la désambiguïsation sémantique

Résumé

Word sense disambiguation (WSD) improves many Natural Language Processing (NLP) applications such as Information Retrieval, Machine Translation or Lexical Simplification. WSD is the ability of determining a word sense among different ones within a polysemic lexical unit taking into account the context. The most straightforward approach uses a semantic proximity measure between the word sense candidates of the target word and those of its context. Such a method very easily entails a combinatorial explosion. In this paper, we propose two methods based on distributional analysis which enable to reduce the exponential complexity without losing the coherence. We present a comparison between the selection of distributional neighbors and the linearly nearest neighbors. The figures obtained show that selecting distributional neighbors leads to better results.
La désambiguïsation sémantique permet d'améliorer de nombreuses applications en traitement automatique des langues (TAL) comme la recherche d'information, la traduction automatique ou la simplification lexicale de textes. Elle consiste à choisir le sens des unités lexicales polysémiques dans un texte et s'effectue en tenant compte du contexte. L'approche la plus directe consiste à estimer la proximité sémantique entre chaque sens candidat et les sens des mots du contexte. Cette méthode engendre rapidement une explosion combinatoire. Dans cet article, nous proposons deux approches à base d'analyse distributionnelle permettant de réduire la complexité exponentielle et de ne pas perdre de la cohérence au niveau de la désambiguïsation, cela en sélectionnant les voisins distributionnels les plus proches. Nous présentons une comparaison entre la sélection des voisins distributionnels et les voisins les plus proches linéairement. Les résultats montrent que la sélection des voisins distributionnels est bien meilleure.
Fichier principal
Vignette du fichier
BILLAMI_Article_Complet_JADT_2016.pdf (670.46 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01477502 , version 1 (27-02-2017)

Identifiants

Citer

Mokhtar Boumedyen Billami, Núria Gala. Approches d'analyse distributionnelle pour améliorer la désambiguïsation sémantique. Journées internationales d'Analyse statistique des Données Textuelles (JADT), Jun 2016, Nice, France. ⟨hal-01477502⟩
179 Consultations
339 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More