Interprétation vague des contraintes structurelles pour la RI dans des corpus de documents XML ; Evaluation d'une méthode approchée de RI structurée - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2007

Interprétation vague des contraintes structurelles pour la RI dans des corpus de documents XML ; Evaluation d'une méthode approchée de RI structurée

Résumé

We propose specific data structures designed to the indexing and retrieval of information elements in heterogeneous XML data bases. The indexing scheme is well suited to the management of various contextual searches, expressed either at a structural level or at an information content level. The approximate search mechanisms are based on a modified Levenshtein editing distance and information fusion heuristics. The implementation described highlights the mixing of structured information presented as field/value instances and free text elements. The retrieval performances of the proposed approach are evaluated within the INEX 2005 evaluation campaign. The evaluation results rank the proposed approach among the best evaluated XML IR systems for the VVCAS task.
Fichier principal
Vignette du fichier
popoviciDocNum07_v003.5_1200dpi.pdf (1.2 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-00493616 , version 1 (08-07-2010)

Identifiants

  • HAL Id : hal-00493616 , version 1

Citer

Eugen Popovici, Gildas Ménier, Pierre-François Marteau. Interprétation vague des contraintes structurelles pour la RI dans des corpus de documents XML ; Evaluation d'une méthode approchée de RI structurée. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2007, 10, ISSN 1279-5127 (1/2007,), pp.63-88. ⟨hal-00493616⟩
45 Consultations
167 Téléchargements

Partager

Gmail Facebook X LinkedIn More