Construction des documents multistructurés dans le contexte des Humanités Numériques

Pierre-Edouard Portier 1
1 DRIM - Distribution, Recherche d'Information et Mobilité
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : Nous posons que tes documents sont les produits d’interactions qui se jouent au sein d'un système qui comprend plateformes informatiques et opérateurs humains. Un contexte applicatif particulier nous permet de valider nos hypothèses. Il s'agit de l'analyse critique et de la mise en valeur, par une équipe de chercheurs de l'ENS Lyon, du fonds d'archives des manuscrits du philosophe Jean-Toussaint Desanti. Nous montrons que tout document possède une structure générique de graphe, c'est un ensemble d'éléments interconnectés : des pages manuscrites numérisées, du texte transcrit et annoté, des zones d'images, etc. Une opération courante consiste à découper ce graphe et sous graphes aux propriétés intéressantes (arborescence, acyclisme, arêtes décorées avec une même catégorie sémantique etc.). C'est au sens de cette opération que nous pouvons dire d'un document qu’il est multi-structuré. Dans ce contexte, nous étudions les processus d'annotation qui sont à J'origine de la création de ces différentes structures. Une analyse critique de la manière dont Je formalisme XML comprend ces deux faces de J'annotation (fragmentation et greffe d'information) nous procure les éléments nécessaires à la construction de notre système (qui repose par ailleurs sur le langage RDF). Ainsi, nous facilitons l'association de sens aux moments de la construction d'un document où apparaît localement une structure de graphe. Finalement, nous proposons une présentation en contexte des opérations sur les termes d'annotation afin de rendre explicite Je contexte sémantique de la greffe d'information et de permettre la construction et la documentation dynamiques de vocabulaires de termes d'annotation.
Mots-clés : XML
Type de document :
Pré-publication, Document de travail
4893; T. 2010
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01459918
Contributeur : Équipe Gestionnaire Des Publications Si Liris <>
Soumis le : mardi 7 février 2017 - 15:15:57
Dernière modification le : mercredi 8 février 2017 - 01:05:26

Identifiants

  • HAL Id : hal-01459918, version 1

Collections

Citation

Pierre-Edouard Portier. Construction des documents multistructurés dans le contexte des Humanités Numériques. 4893; T. 2010. <hal-01459918>

Partager

Métriques

Consultations de la notice

109