Représentation vectorielle de sens pour la désambiguïsation lexicale à base de connaissances

Résumé : Dans cet article, nous proposons une nouvelle méthode pour représenter sous forme vectorielle les sens d'un dictionnaire. Nous utilisons les termes employés dans leur définition en les projetant dans un espace vectoriel, puis en additionnant les vecteurs résultants, avec des pondérations dépendantes de leur partie du discours et de leur fréquence. Le vecteur de sens résultant est alors utilisé pour trouver des sens reliés, permettant de créer un réseau lexical de manière automatique. Le réseau obtenu est ensuite évalué par rapport au réseau lexical de WordNet, construit manuellement. Pour cela nous comparons l'impact des différents réseaux sur un système de désambiguïsation lexicale basé sur la mesure de Lesk. L'avantage de notre méthode est qu'elle peut être appliquée à n'importe quelle langue ne possédant pas un réseau lexical comme celui de WordNet. Les résultats montrent que notre réseau automatiquement généré permet d'améliorer le score du système de base, atteignant quasiment la qualité du réseau de WordNet.
Document type :
Conference papers
Liste complète des métadonnées

Cited literature [10 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01599572
Contributor : Loïc Vial <>
Submitted on : Monday, October 2, 2017 - 12:35:27 PM
Last modification on : Tuesday, February 12, 2019 - 1:31:16 AM

File

TALN_2017__embeddings_(13).pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01599572, version 1

Collections

Citation

Loïc Vial, Benjamin Lecouteux, Didier Schwab. Représentation vectorielle de sens pour la désambiguïsation lexicale à base de connaissances. 24ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France. ⟨hal-01599572⟩

Share

Metrics

Record views

142

Files downloads

222