Explorer le graphe de voisinage pour améliorer les thésaurus distributionnels

Vincent Claveau 1 Ewa Kijak 1 Olivier Ferret 2
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
2 LVIC - Laboratoire Vision et Ingénierie des Contenus
DIASI - Département Intelligence Ambiante et Systèmes Interactifs : DRT/LIST/DIASI
Résumé : Dans cet article, nous abordons le problème de construction et d'amélioration de thésaurus distributionnels. Nous montrons d'une part que les outils de recherche d'information peuvent être directement utilisés pour la construction de ces thésaurus, en offrant des performances comparables à l'état de l'art. Nous nous intéressons d'autre part plus spécifiquement à l'amélioration des thésaurus obtenus, vus comme des graphes de plus proches voisins. En tirant parti de certaines des informations de voisinage contenues dans ces graphes nous proposons plusieurs contributions. 1) Nous montrons comment améliorer globalement les listes de voisins en prenant en compte la réciprocité de la relation de voisinage, c'est-à-dire le fait qu'un mot soit un voisin proche d'un autre et vice-versa. 2) Nous proposons également une méthode permettant d'associer à chaque liste de voisins (i.e. à chaque entrées du thésaurus construit) un score de confiance. 3) Enfin, nous montrons comment utiliser ce score de confiance pour réordonner les listes de voisins les plus proches. Ces différentes contributions sont validées expérimentalement et offrent des améliorations significatives sur l'état de l'art.
Document type :
Conference papers
Complete list of metadatas

Cited literature [16 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01027787
Contributor : Vincent Claveau <>
Submitted on : Tuesday, July 22, 2014 - 12:20:26 PM
Last modification on : Thursday, February 7, 2019 - 4:45:29 PM
Long-term archiving on : Tuesday, November 25, 2014 - 10:51:08 AM

File

Claveau-Kijak-Ferret.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01027787, version 1

Citation

Vincent Claveau, Ewa Kijak, Olivier Ferret. Explorer le graphe de voisinage pour améliorer les thésaurus distributionnels. 21ème conférence sur le Traitement Automatique des Langues Naturelles, TALN 2014, Jul 2014, Marseille, France. 12 p. ⟨hal-01027787⟩

Share

Metrics

Record views

555

Files downloads

272