Toward the highest effectiveness in text description-based service retrieval - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2015

Toward the highest effectiveness in text description-based service retrieval

Résumé

In this paper, we address the problem of retrieving services which fulfil users' needs expressed in free text queries. We aim to deal with term mismatch problems which affect the effectiveness of Information Retrieval (IR) models applied in prior research on text description-based service retrieval. These problems are caused due to service descriptions are most of the time very brief. Service providers use only few terms to describe services, hence, when these descriptions are different to the sentences in queries, term mismatch problems decrease the effectiveness of classical models which depend on the observable text features instead of its latent semantic features. In this work, we apply a family of IR models for the purpose of increasing the effectiveness acquired with the models applied in prior research on service retrieval. To the best of our knowledge, these models have not been applied before in the service retrieval domain. Besides, we have conducted systematic experiments to compare the IR models of this family with those used in the state-of-the-art in service retrieval. These experiments show that the IR model of this family, which is based on query expansion via a co-occurrence thesaurus, outperforms the effectiveness of all the models studied in this work. Therefore, we have implemented this model in a text description-based service search engine, which is part of a system designed to provide nomad users with services that fulfil users' needs expressed in query in free text.
Dans cet article, nous abordons le problème de la recherche des services qui répondent aux besoins des utilisateurs exprimés sous forme de requêtes en texte libre. Notre objectif à faire face aux problèmes d'inadéquation de termes qui affectent l'efficacité des modèles existants de Recherche d'Information (RI) appliqués à la découverte de services basée sur des descriptions textuelles. Ces problèmes sont dus à la brièveté des descriptions des services. Les fournisseurs n'utilisent que quelques mots pour décrire les services qu'ils exposent. Il s'ensuit que lorsque ces descriptions sont différentes des phrases données dans les requêtes, les problèmes d'inadéquation de terme diminuent l'efficacité des modèles classiques. En effet, ces derniers dépendent du texte observable et non de la sémantique du texte. Dans ce travail, nous proposons une famille de modèles de RI dans le but d'accroître l'efficacité des modèles proposés dans l'état de l'art sur la découverte de services. Au meilleur de notre connaissance, ces modèles n'ont pas été appliqués dans le domaine de la recherche de services. En outre, nous avons mené des expériences systématiques afin de comparer les modèles de cette famille avec ceux utilisés dans l'état de l'art. Ces expériences nous permettent de conclure que parmi les modèles de cette famille, celui qui est basé sur l'extension des requêtes via un thésaurus de co-occurrence est plus efficace que tous les autres modèles étudiés. Par conséquent, nous avons mis en place ce modèle dans un moteur de recherche de services qui est l'un des modules d'un système plus complexe qui vise à fournir à des utilisateurs nomades des services contextualisés qui répondent à leurs besoins exprimés par des requêtes données sous forme de texte libre.
Fichier principal
Vignette du fichier
CaicedoFauvetLbathDuarteCORIA2015_CAMERA_VERSION.pdf (404.03 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01888340 , version 1 (05-10-2018)

Identifiants

Citer

Isaac Caicedo-Castro, Marie-Christine Fauvet, Ahmed Labath, Helga Duarte-Amaya. Toward the highest effectiveness in text description-based service retrieval. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2015, 18 (2-3), pp.155 - 177. ⟨10.3166/dn.18.2-3.155-177⟩. ⟨hal-01888340⟩
62 Consultations
75 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More