Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques

Mokhtar Boumedyen Billami

Communication Dans Un Congrès Année : 2015

A Knowledge-Based Approach to Word Sense Disambiguation by distributional selection and semantic features

Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques

(1)

Mokhtar Boumedyen Billami

Fonction : Auteur
PersonId : 12706
IdHAL : mokhtar-boumedyen-billami
ORCID : 0000-0003-4428-4298

Laboratoire d'informatique Fondamentale de Marseille

Résumé

Word sense disambiguation improves many Natural Language Processing (NLP) applications such as Information Retrieval, Information Extraction, Machine Translation, or Lexical Simplification. Roughly speaking, the aim is to choose for each word in a text its best sense. One of the most popular method estimates local semantic similarity relatedness between two word senses and then extends it to all words from text. The most direct method computes a rough score for every pair of word senses and chooses the lexical chain that has the best score (we can imagine the exponential complexity that returns this comprehensive approach). In this paper, we propose to use a combinatorial optimization metaheuristic for choosing the nearest neighbors obtained by distributional selection around the word to disambiguate. The test and the evaluation of our method concern a corpus written in French by means of the semantic network BabelNet. The obtained accuracy rate is 78 % on all names and verbs chosen for the evaluation.

La désambiguïsation lexicale permet d’améliorer de nombreuses applications en traitement automatique des langues (TAL) comme la recherche d’information, l’extraction d’information, la traduction automatique, ou la simplification lexicale de textes. Schématiquement, il s’agit de choisir quel est le sens le plus approprié pour chaque mot d’un texte. Une des approches classiques consiste à estimer la similarité sémantique qui existe entre les sens de deux mots puis de l’étendre à l’ensemble des mots du texte. La méthode la plus directe donne un score de similarité à toutes les paires de sens de mots puis choisit la chaîne de sens qui retourne le meilleur score (on imagine la complexité exponentielle liée à cette approche exhaustive). Dans cet article, nous proposons d’utiliser une méta-heuristique d’optimisation combinatoire qui consiste à choisir les voisins les plus proches par sélection distributionnelle autour du mot à désambiguïser. Le test et l’évaluation de notre méthode portent sur un corpus écrit en langue française en se servant du réseau sémantique BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms et des verbes choisis pour l’évaluation.

Mots clés

unsupervised word sense disambiguation distributional similarity measure semantic similarity measures

désambiguïsation lexicale non supervisée mesure de similarité distributionnelle mesures de similarité sémantique

Domaines

Traitement du texte et du document Complexité [cs.CC]

Fichier principal

recital-2015-long-002.pdf (870.37 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Mokhtar Boumedyen BILLAMI : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01477463

Soumis le : lundi 27 février 2017-14:33:52

Dernière modification le : vendredi 24 mars 2023-14:53:03

Archivage à long terme le : dimanche 28 mai 2017-13:13:23

Dates et versions

hal-01477463 , version 1 (27-02-2017)

Identifiants

HAL Id : hal-01477463 , version 1
ARXIV : 1702.08450

Citer

Mokhtar Boumedyen Billami. Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques. 22ème Conférence sur le Traitement Automatique des Langues Naturelles et 17ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, Jun 2015, Caen, France. pp.13--24. ⟨hal-01477463⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

LIF CNRS UNIV-AMU EC-MARSEILLE LIS-LAB

230 Consultations

685 Téléchargements

A Knowledge-Based Approach to Word Sense Disambiguation by distributional selection and semantic features

Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager