Documents multi-structurés : de la modélisation vers l'exploitation

Résumé : La structuration multiple des documents pose différents types de problématiques. Parmi celles-ci la représentation des ces documents ainsi que leurs exploitations notamment dans un contexte de recherche d’information. Le problème principal réside dans le fait qu’il n’existe pas un formalisme standardisé permettant de matérialiser de manière appropriée et pérenne un document possédant plusieurs structures. Les travaux de recherche que nous avons mené au cours de cette thèse nous ont conduit à définir un modèle spécifique pour la représentation de ce type de documents. Le modèle MSDM (Multi-Structured Document Model) que nous proposons se veut un modèle générique intégrant des caractéristiques spécifiques aux documents multi-structurés tout en étant facilement exploitable. Partant de ce modèle nous avons proposé un formalisme, basé sur XML, appelé MultiX permettant la sérialisation de ces documents. Nous avons étudié l’exploitation de ces documents dans le contexte de la recherche d’information. Pour interroger efficacement les documents multi-structurés au format MultiX, nous avons développé une extension du langage XQuery sous forme d’une bibliothèque de fonctions spécifiques. Ces fonctions permettent une exploitation plus efficace et plus facile des documents MultiX. Pour valider nos propositions nous avons implémenté un framework offrant des possibilités de création d’analyse et de manipulation de documents multi-structurés.
Type de document :
Pré-publication, Document de travail
4170; T. 2006
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01464178
Contributeur : Équipe Gestionnaire Des Publications Si Liris <>
Soumis le : vendredi 10 février 2017 - 09:44:34
Dernière modification le : samedi 11 février 2017 - 01:08:00

Identifiants

  • HAL Id : hal-01464178, version 1

Collections

Citation

Noureddine Chatti. Documents multi-structurés : de la modélisation vers l'exploitation. 4170; T. 2006. <hal-01464178>

Partager

Métriques

Consultations de la notice

49