Apprentissage Statistique pour la Constitution de Corpus d'évaluation

Huyen-Trang Vu 1 Patrick Gallinari 1
1 MALIRE - Machine Learning and Information Retrieval
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : La constitution de corpus d’évaluation est une étape essentielle pour évaluer la performance des systèmes de recherche d’information. Le coût de développement de tels corpus est en général assez élevé à cause en particulier de l’effort humain nécessaire à l’évaluation de la pertinence des documents pour chaque requête. Cette difficulté devient un véritable goulot d’étranglement dans le cas de corpus de très grande taille. Le travail que nous présentons vise à sélectionner adaptativement les documents des corpus d’évaluation. Nous utilisons pour cela des algorithmes d’apprentissage statistique qui optimisent des critères d’ordonnancement. Nous présentons des essais d’un algorithme d’ordonnancement, dit RankBoost, sur des données de TREC et analysons les résultats obtenus au moyen de différents critères. Les résultats de ces analyses montrent que la méthode proposée permet de créer des corpus d’évaluation de qualité supérieure à la méthode de TREC.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01352076
Contributor : Lip6 Publications <>
Submitted on : Friday, August 5, 2016 - 2:19:19 PM
Last modification on : Thursday, March 21, 2019 - 1:10:05 PM

Identifiers

  • HAL Id : hal-01352076, version 1

Citation

Huyen-Trang Vu, Patrick Gallinari. Apprentissage Statistique pour la Constitution de Corpus d'évaluation. 3eme Conference en Recherche d'Information et Applications (CORIA'06), Mar 2006, Lyon, France. pp.85-96. ⟨hal-01352076⟩

Share

Metrics

Record views

51