Préservation des mémoires numériques : Apports du terme et du concept - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue AIDAinformazioni: Rivista di Scienze dell'informazione Année : 2016

Préservation des mémoires numériques : Apports du terme et du concept

Résumé

Beyond the material dimension (physical support, encoding format, reading system), digital memories are preserved, if they are accessible. As a matter of fact, in today's information world, to exist is to be visible and accessible. How to represent information and render it in a readable format, how to organize and classify it, so that it is accessible? But also how and what to look for? How then to find it? These issues are all the more important that data are more and more open and interlinked through multiple relationships in an inextricable web (open and linked data). Facing these issues, the "knowledge" of the domain, whether linguistic, through the terms used to describe digital memories, or conceptual, through the ideas that we have of them, appears as a panacea. Domain knowledge, sometimes also called "metadata" or "semantic", aims to organize and structure our memories, identify the most suitable terms for describing them, and thus preserve digital heritage, since we will then know how to access it. This approach falls under four main disciplines: Information Sciences - Thesaurus to be more precise -, Terminology, since term and concept are involved, Linguistics to some extent, and, most importantly, Knowledge representation; four disciplines also heavily impacted by the latest advances in digital. The web has become semantic, and knowledge bases are rethought as ontologies. The latter notion has also permeated Terminology and Thesaurus, as well as the ISO international standards on Terminology (TC 37) and Information and documentation (TC 46). This talk will present the notions of Terminology, Ontology and Thesaurus from the perspective of term and concept, what these approaches have in common, but also how they differ. Indeed, if a terminology or an ontology can be used for information management, that does not mean it can be considered as a thesaurus, nor should it be taken for one. However, combining terminologies, thesauri, and ontologies into a new paradigm, which remains to be defined, opens up new perspectives, as suggested by one of the topics of this conference (“thesauri and ontologies”). The final part of the talk will be dedicated to the notion of ontoterminology, i.e. a terminology whose concept system is a formal ontology. Such an approach allows an information management system to take multilingualism and multiculturalism into account. It also offers new paradigms of interactive navigation and semantic search. This will be illustrated by means of an example of an ontology-oriented CMS (Content Management System). The paper will close with the presentation of a software environment for multilingual ontology-oriented thesauri building carried out under the umbrella of a European project in Cultural Heritage (FP7 AthenaPlus).
Au delà de la dimension matérielle (support, format d’encodage, système de lecture), notre patrimoine numérique est préservé dans la mesure où nous sommes capables d’y accéder. Dans le monde informationnel qui est aujourd’hui le nôtre, exister, c’est être accessible, visible. Comment représenter et décrire dans un format lisible, mais aussi organiser et classer une information de telle sorte qu’elle demeure accessible ? Comment ensuite la retrouver ? Mais aussi comment et quoi chercher ? Des questions d’autant plus prégnantes que les données, à travers le réseau internet et au-delà de la barrière des langues et des cultures, s’ouvrent et se lient par de multiples relations en une toile encore plus inextricable (données ouvertes et liées). Face à ces interrogations, les « connaissances » du domaine, qu’elles soient linguistiques, à travers les termes employés pour décrire le patrimoine, ou conceptuelles, à travers les idées que nous nous en faisons, apparaissent comme une panacée. Parfois qualifiées de « métadonnées » ou de « sémantiques », on espère, grâce à ces connaissances, organiser et structurer nos mémoires, identifier les termes qui en parlent le mieux, et ainsi les préserver puisqu’on saura comment y accéder. La démarche relève des Sciences de l’information – des thésaurus pour être plus précis – de la Terminologie, de la Linguistique dans une certaine mesure, et surtout de la Modélisation des connaissances. Autant de disciplines fortement impactées par les dernières avancées du numérique. Le web est devenu sémantique, les bases de connaissances se font ontologies, une notion qui envahit également la Terminologie et les thésaurus – les normes internationales ISO (International Organization for Standardization), censées régimenter tout cela, qu’elles portent sur la Terminologie (TC 37) ou la Gestion de l’information (TC 46), n’y échappent pas. Nous verrons, dans le cadre de cette contribution, les notions de Terminologie, d’Ontologie et de Thesaurus étudiées sous l’angle du terme et du concept. Nous verrons ainsi ce que ces approches ont de commun qui justifie qu’on puisse ici les convoquer, mais aussi en quoi elles diffèrent. En effet, si une terminologie, tout comme une ontologie, peuvent être mobilisées à des fins de gestion de l’information, elles ne se confondent pas et ne sont pas davantage des thésaurus ; et réciproquement. Par contre, les associer en un nouveau paradigme qui reste à préciser ouvre des perspectives des plus intéressantes, comme le laisse à penser le thème « thésaurus et ontologies » de la conférence. Cela nous amènera au dernier chapitre consacré à la notion d’ontoterminologie, terminologie dont le système notionnel est une ontologie formelle. Nous verrons comment cette démarche permet la gestion de l’information prenant en compte le multilinguisme et le multiculturalisme. Elle offre également, nous l’illustrerons à travers un premier exemple dédié à la gestion de contenus, de nouveaux paradigmes de navigation interactive et de recherche sémantique. Une application aux thésaurus multilingues réalisée dans le cadre d’un projet européen dédié à la gestion de biens culturels (Projet FP7 AthenaPlus) clôturera l’article.
Fichier non déposé

Dates et versions

hal-01354281 , version 1 (19-08-2016)

Identifiants

Citer

Christophe Roche. Préservation des mémoires numériques : Apports du terme et du concept. AIDAinformazioni: Rivista di Scienze dell'informazione, 2016, Terminologia e organizzazione della conoscenza nella conservazione della memoria digitale, N.1-2, Anno 34, gennaio-giugno 2016, ⟨10.4399/97888548940205⟩. ⟨hal-01354281⟩
143 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More