Une approche de recherche d'information structurée fondée sur la correction d'erreurs à l'indexation des documents

Arnaud Renard 1 Sylvie Calabretto 1 Béatrice Rumpler 1
1 DRIM - Distribution, Recherche d'Information et Mobilité
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : Dans cet article, nous nous sommes intéressés à la prise en compte des erreurs dans les contenus textuels des documents XML. Nous proposons une approche visant à diminuer l'impact de ces erreurs sur les systèmes de Recherche d'Information (RI). En effet, ces systèmes produisent des index (dans le but d'accélérer l'exécution des requêtes) associant chaque document aux termes qu'il contient. Les erreurs affectent donc la qualité des index ce qui conduit à considérer à tort les documents mal indexés comme non pertinents vis-à-vis de certaines requêtes. Afin de faire face à ce problème, nous proposons d'inclure un mécanisme de correction d'erreurs lors de la phase d'indexation des documents. Nous avons implémenté cette approche au sein d'un prototype que nous avons évalué dans le cadre de la campagne d'évaluation INEX.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01352986
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Wednesday, August 10, 2016 - 4:17:54 PM
Last modification on : Friday, January 11, 2019 - 4:35:40 PM

Identifiers

  • HAL Id : hal-01352986, version 1

Citation

Arnaud Renard, Sylvie Calabretto, Béatrice Rumpler. Une approche de recherche d'information structurée fondée sur la correction d'erreurs à l'indexation des documents. 19ème conférence sur le Traitement Automatique des Langues Naturelles (TALN 2012), Jun 2012, Grenoble, France. pp.519-526. ⟨hal-01352986⟩

Share

Metrics

Record views

98