La technologie de l'hypertexte Analyse bibliométrique de brevets

Résumé : L'hypertexte est un mode de présentation de l'information aujourd'hui très répandu. Qu'il soit utilisé en tant que structuration de la documentation technique ou présentation des données sur Internet, l'hypertexte est utilisé dans de nombreux domaines. Son application à la gestion des informations de veille est très séduisante par sa capacité à produire de l'information endogène : information non présente dans le dossier mais issue du croisement de deux informations. Deux freins majeurs ont cependant retardé la généralisation de l'utilisation d'hypertextes en veille: - Les limites liées à l'édition manuelle des liens. D'une part, lier manuellement deux documents impose une bonne connaissance du contenu de la base. D'autre part, le temps utilisé pour la création manuelle serait inacceptable dans un processus de veille. - Le manque de vision globale. Le manque de vue d'ensemble du corpus est à l'encontre de ce qui est requis d'un outil de veille. L'hypertexte classique présente uniquement des liens entre documents, sans outils de cartographie ou de classement du corpus. De nombreuses recherches s'effectuent dans le domaine de la génération automatique d'hypertextes. L'objet de cet article est de préciser ce que la notion d'hypertexte recouvre dans le domaine technologique et industriel. Après avoir brièvement rappelé les différentes notions se rapportant à l'hypertexte, nous présenterons une étude portant sur un ensemble de plus de 200 brevets extrait de la base de données WPIL. Tous ces brevets traitent des différentes technologiques utilisées dans le domaine de l'hypertexte. Pour cela, nous utiliserons une méthode originale de réduction du vocabulaire (phase de lemmatisation) sur plusieurs champs du corpus. Celle-ci est faite à l'aide d'un dictionnaire comportant plus de 50 000 termes édité par le producteur de la base de données Derwent. L'homogénéisation des champs étudiés est nécessaire car les résultats des analyses statistiques sont souvent erronés à cause des variétés des formes graphiques présentes dans les corpus. La préparation des données, notamment le découpage du titre en deux parties, permettra d'extraire les notions se rapportant à la description et à l'application des brevets, deux notions que ne différencient pas Derwent dans son champ TT. Après cette phase préliminaire, l'étude bibliométrique proprement dite portera sur les champs Title (TI1: decription, et TI2 application), Use and Advantage (UA) et Patent Assignee (PA). Nous terminerons notre étude par une analyse des réseaux sémantiques de chacun de ces champs. Nous tenterons ainsi de faire émerger les thématiques principales se rapportant à l'hypertexte tant du point de vue descriptif, applicatif que des revendications contenues dans les brevets. Nous présenterons enfin ce corpus sous l'interface Regate. En intégrant les champs lemmatisés Description, Application et Revendication, l'utilisateur pourra ainsi naviguer entre ces trois univers documentaires. Ceci serait difficilement possible avec des brevets bruts fournis par Derwent ou avec des hypertextes construits après analyse classificatoire
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01905234
Contributor : Hervé Rostaing <>
Submitted on : Thursday, October 25, 2018 - 4:14:23 PM
Last modification on : Tuesday, May 14, 2019 - 12:04:05 PM

Identifiers

  • HAL Id : hal-01905234, version 1

Collections

Citation

Violaine Pillet, Valérie Leveillé, Luc Quoniam, Hervé Rostaing. La technologie de l'hypertexte Analyse bibliométrique de brevets. Les systèmes d’informations élaborées, Sep 1999, Ile Rousse, France. ⟨hal-01905234⟩

Share

Metrics

Record views

19