РасшиРение запРоса в инфоРмационном поиске: что мы можем узнать из глубинного анализа запРоса? - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Conférence francophone en Recherche d'Information et Applications, CORIA 2010 Année : 2016

Query expansion in information retrieval : What Can We learn from a Deep analysis of Queries?

РасшиРение запРоса в инфоРмационном поиске: что мы можем узнать из глубинного анализа запРоса?

Josiane Mothe
Irina Ovchinnikova
  • Fonction : Auteur

Résumé

Пермский государственный национальный исследовательский университет, Пермь, Россия Одна из основных задач информационного поиска-извлечение до-кументов, релевантных информационной потребности пользователя, выраженной запросом. Зачастую пользовательские запросы не пре-восходят 3 слов, что усложняет задачу. Многочисленные исследова-ния показали, что автоматическое расширение запроса в среднем повышает точность, несмотря на то, что для некоторых запросов ре-зультаты ухудшаются. В статье предлагается новый метод автомати-ческого расширения запроса, основанный на оценки важности слов-кандидатов, определяемой силой их связи со словами из запроса. Предлагаемый метод комбинирует локальный анализ, а именно обрат-ную связь по релевантности, и глобальный анализ коллекции докумен-тов. Оценка метода была произведена на международных тестовых коллекциях, согласно установленным метрикам. Полученные резуль-таты были сравнены с одной из лучших моделей, описанных в лите-ратуре. Системы показали сравнимые результаты в среднем. Однако глубинный анализ исходных и расширенных запросов позволил сде-лать выводы, которые могут помочь в исследовании данной области. Ключевые слова: информационный поиск, расширение запроса, анализ слов запроса, обратная связь по релевантности, глобальный анализ, совстречаемость Information retrieval aims at retrieving relevant documents answering a user's need expressed through a query. Users' queries are generally less than 3 words which make a correct answer really difficult. Automatic query expansion (QE) improves the precision on average even if it can decrease the results for some queries. We propose a new automatic QE method that estimates the importance of expansion candidate terms by the strength of their relation to the query terms. The method combines local analysis and global analysis of texts. We evaluate the method using international benchmark collections and measures. We found comparable results on average compared to the Bo2 method. However, we show that a deep analysis of initial and expanded queries brings interesting insights that could help future research in the domain.
Fichier non déposé

Dates et versions

hal-03006409 , version 1 (17-11-2020)

Identifiants

  • HAL Id : hal-03006409 , version 1

Citer

Liana Ermakova, Josiane Mothe, Irina Ovchinnikova. РасшиРение запРоса в инфоРмационном поиске: что мы можем узнать из глубинного анализа запРоса?. Conférence francophone en Recherche d'Information et Applications, CORIA 2010, 2016. ⟨hal-03006409⟩
16 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More