Nouveau modèle de documents pour une bibliothèque numérique de thèses accessibles par leur contenu sémantique

Résumé : La diversité des initiatives existantes en faveur de la diffusion des thèses sur Internet témoigne de l'intérêt pour ce besoin au sein des milieux universitaires. Les projets de bibliothèques numériques actuels offrent à l'utilisateur l'accès aux thèses à partir d'une recherche en utilisant le titre de la thèse, les noms de l'auteur, le nom du directeur de la thèse, et la date de soutenance. Ce type de recherche ne permet pas d'extraire les parties pertinentes de la thèse et ne renvoie que la thèse intégrale. Ainsi l'utilisateur doit lire des chapitres entiers pour connaître les parties qui correspondent à son besoin. Le projet CITHER de l'INSA de Lyon (Consultation en texte Intégral des THèses En Réseau) dans lequel s'inscrit cette étude, porte sur la mise en ligne des thèses. CITHER, dans une première phase, a mis en place une diffusion des thèses, via un serveur, sous forme de texte intégral, en format PDF (Portable Document Format). De ce fait, lors d'une recherche il est possible d'accéder au contenu d'une seule thèse à la fois, par le biais de chaque chapitre. Pourtant il existe le besoin d'effectuer une recherche d'information de manière plus précise, plus sélective et d'offrir à l'utilisateur l'information la plus pertinente. L'objet du travail de recherche vise à améliorer la diffusion des thèses. Pour cela, nous proposons de permettre l'accès à son contenu de façon précise grâce à l'utilisation de " tags sémantiques " rajoutés, par le doctorant, au sein de la thèse lors de sa rédaction. L'exploitation de ces tags permet d'affiner la recherche et ainsi mieux satisfaire l'utilisateur. Notre travail porte sur la définition d'un nouveau modèle de document en nous appuyant sur l'étude des différentes structures de la thèse (structure logique et structure sémantique). Notre approche est fondée sur la modélisation sémantique des thèses de l'INSA de Lyon. Nous avons aussi, été amenés à mettre en place des fonctionnalités d'aide à la recherche et à l'accès aux contenus documentaires, adaptées à notre cas d'étude, c'est à dire les thèses scientifiques. Enfin, nous avons mis en place des procédures d'évaluations expérimentales qualitatives et quantitatives, permettant une analyse de performance des résultats des recherches itératives de notre prototype et de les comparer avec le système actuel de CITHER. Cette recherche représente un apport intéressant pour la recherche d'information pertinente dans les thèses, en fournissant au doctorant les moyens de construire facilement sa thèse de manière adaptée. Nos résultats ont permis de valider l'importance de définir la structure sémantique lors de la création de documents afin de mieux exploiter l'information contenue
Type de document :
Pré-publication, Document de travail
4297; T. 2005
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01465677
Contributeur : Équipe Gestionnaire Des Publications Si Liris <>
Soumis le : lundi 13 février 2017 - 08:55:23
Dernière modification le : mardi 14 février 2017 - 01:10:33

Identifiants

  • HAL Id : hal-01465677, version 1

Collections

Citation

Maria del Rocio Abascal Mena. Nouveau modèle de documents pour une bibliothèque numérique de thèses accessibles par leur contenu sémantique. 4297; T. 2005. <hal-01465677>

Partager

Métriques

Consultations de la notice

37