Thésaurus distributionnels pour la recherche d'information et vice-versa

Vincent Claveau 1 Ewa Kijak 1
1 LinkMedia - Creating and exploiting explicit links between multimedia fragments
IRISA-D6 - MEDIA ET INTERACTIONS, Inria Rennes – Bretagne Atlantique
Résumé : Les thésaurus distributionnels sont utiles à de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problèmes de leur construction et de leur évaluation sous l'angle de la recherche d'information. Deux contributions sont proposées. D'une part, en poursuite des travaux initiés par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent être utilisées avec succès pour construire ces thésaurus. Au moyen d'une évaluation directe par comparaison avec des lexiques de référence et au travers de plusieurs expérimentations, nous montrons que les résultats obtenus par des modèles de RI dépassent les performances des systèmes état de l'art. D'autre part, nous utilisons la RI comme cadre applicatif pour proposer une évaluation indirecte des thésaurus produits. Là encore, cette évaluation valide l'approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des évaluations directes utilisées dans la littérature. Les différences constatées remettent en cause en partie ces pratiques d'évaluation. MOTS-CLÉS : thésaurus distributionnels, sémantique distributionnelle, construction de lexique, modèles de RI, évaluation directe, évaluation par tâche, extension de requêtes.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2015, 18 (2-3), 〈10.3166/DN.18.2-3.101-121〉
Liste complète des métadonnées

Littérature citée [47 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01226551
Contributeur : Vincent Claveau <>
Soumis le : vendredi 27 novembre 2015 - 13:41:15
Dernière modification le : jeudi 15 novembre 2018 - 11:58:51
Document(s) archivé(s) le : vendredi 28 avril 2017 - 05:29:47

Fichier

Claveau_Kijak_DN2015.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Citation

Vincent Claveau, Ewa Kijak. Thésaurus distributionnels pour la recherche d'information et vice-versa. Revue des Sciences et Technologies de l'Information - Série Document Numérique, Lavoisier, 2015, 18 (2-3), 〈10.3166/DN.18.2-3.101-121〉. 〈hal-01226551〉

Partager

Métriques

Consultations de la notice

281

Téléchargements de fichiers

246