The process from informational need to query formulation: the study of user expertise differentiation to improve an information retrieval system results
Du besoin d'informations à la formulation des requêtes : étude des usages de différents types d'utilisateurs visant l'amélioration d'un système de recherche d'informations
Résumé
With the massive and heterogeneous web document collections, IR system must analyze
the behaviors of users which are unpredictable and varied. The approach described
in this paper provides a comparison of the verbalizations for both natural language and
web query for the same information need by the same user. For this, we used data collected
(i.e. users’ complaints in natural language and web queries) through a search engine
dedicated to economic reports in French over 5 consecutive years totaling a corpus of
1398 natural language requests and 3427 web queries. Then, we compared the expression
of the information need and highlighted the contributions in terms of information
and clarification, the use of either language used.
Devant des collections massives et hétérogènes de données, les systèmes de RI doivent
désormais pouvoir appréhender des comportements d’utilisateurs aussi variés qu’imprévisibles.
L’objectif de notre travail est d’évaluer la façon dont un même utilisateur verbalise
un besoin informationnel à travers un énoncé de type « expression libre » (appelé
langage naturel) et un énoncé de type mots-clés (appelé langage de requêtes). Pour cela,
nous nous situons dans un contexte applicatif, à savoir des demandes de remboursement
des utilisateurs d’un moteur de recherche dédié à des études économiques en français.
Nous avons recueilli via ce moteur, les deux types d’énoncés sur 5 années consécutives
totalisant un corpus de 1398 demandes en langage naturel et de 3427 requêtes. Nous
avons alors comparé l’expression en tant que tel du besoin informationnel et mis en
avant ce qu’apportait, en termes d’informations et de précisions, le recours à l’un ou
l’autre du langage utilisé.
Loading...