Gismo : Mettez un tigre dans votre moteur - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Gismo: Put a tiger in your engine

Gismo : Mettez un tigre dans votre moteur

Résumé

Searching for documents is a task that everyone faces on a regular basis, especially when looking for a relevant Internet page, an e-mail, or a document on an Intranet. An effective search relies on a precise and well-organized search engine. The majority of current techniques combine a keyword search with structural information (ontologies, relationships between elements) in order to order the documents in a corpus by relevance. In this article, we present a new navigation engine called Gismo (Generic Information Search with a Mind of its Own). Gismo exploits only the textual content of documents and does not require ontology, metadata, or prelearning. It is thus possible to use it on any corpus without making assumptions about the type of documents or their language. The model chosen and the algorithms used allow Gismo to be extremely fast even on large corpora. Finally, Gismo allows you to find, sort and organize documents by theme and relevance, making it an navigation engine and not a simple search engine.
La recherche de documents (pages Web, courriels, fichiers Intranet\...) est une tâche à laquelle tout un chacun est confronté régulièrement. Une recherche efficace repose sur un moteur de recherche précis et bien organisé. La majorité des techniques actuelles combinent une recherche par mots-clés à des informations structurelles (ontologies, relations entre éléments) afin de classer les documents d'un corpus par pertinence. Nous présentons dans cet article un nouveau moteur de navigation, appelé Gismo (Generic Information Search with a Mind of its Own). Gismo exploite uniquement le contenu textuel des documents et ne nécessite ni ontologie, ni méta-données, ni pré-apprentissage. Il est ainsi possible de l'utiliser sur n'importe quel corpus sans faire d'hypothèse sur le type ou la langue des documents. Le modèle choisi et les algorithmes utilisés permettent à Gismo d'être extrêmement rapide même sur des grands corpus. Gismo permet de trouver, trier et organiser les documents par thème et par pertinence, ce qui en fait un moteur de navigation et non un simple moteur de recherche.
Fichier principal
Vignette du fichier
gismo-algotel-en.pdf (141.44 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02880360 , version 1 (24-06-2020)

Identifiants

  • HAL Id : hal-02880360 , version 1

Citer

Marc-Olivier Buob, Fabien Mathieu. Gismo : Mettez un tigre dans votre moteur. ALGOTEL 2020 – 22èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications, Sep 2020, Lyon, France. ⟨hal-02880360⟩
111 Consultations
77 Téléchargements

Partager

Gmail Facebook X LinkedIn More