Uncertainty Management for Linked Data Reliability on the Semantic Web - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2022

Uncertainty Management for Linked Data Reliability on the Semantic Web

Gestion de l'Incertitude pour la fiabilité des Données Liées dans le Web Sémantique

Résumé

The Semantic Web has evolved to reach different applications. It was designed to enable machines to understand available resources on the World Wide Web and use the extracted information in the decision-making and reasoning processes. Hence, the Web is an open world where people can say whatever they want, and users -in this case, people and machines- can relate to it. One of the main challenges nowadays is to deal with information from multiple and mostly unreliable sources. The Linked Open Data is luckily presented in a machine-readable format. Whether automatically extracted from Web documents, directly introduced from data sources, or inferred by reasoning processes, the Linked Open Data can be outdated, incorrect, incomplete, vague, ambiguous, or more generally, uncertain. Dealing with Uncertain Linked Data faces multiple challenges like uncertainty qualification (or quantification), calculus, representation, and in the Semantic Web case: publishing and reusability. In this thesis, we analyze the existing results treating uncertainty in the Semantic Web. To introduce the proper terminology, we describe in Chapter 2 the preliminary notions related to uncertainty and the Semantic Web. We provide an overview of the technologies used in the Semantic Web stack and the limits of uncertain data. Afterward, we deliver in Chapter 3 a representation for uncertainty on the Semantic Web. We discuss our contribution of the “Uncertainty ontology” and the methods for annotating statements with uncertainty. Chapter 4 discusses uncertainty management and access in a contextualized view and the reading of uncertainty inside contexts. For sources without explicit uncertainty information, we present a framework in Chapter 5 enabling the evaluation of uncertainty based on syntactical and semantic similarities with entities from a reference source and within a specific use case. We conclude with a discussion about the dialogue between data sources and the consensual knowledge in the Semantic Web. We follow that with our perception of the reality and perspectives of this research
Le Web Sémantique a évolué pour faire partie de différents domaines d'application. Il a été conçu pour permettre aux machines de comprendre les ressources disponibles sur le World Wide Web et d'utiliser les informations extraites dans les processus de décision et de raisonnement. Le Web est donc un monde ouvert où les gens peuvent dire ce qu'ils veulent et où les utilisateurs - dans ce cas, les personnes et les machines - peuvent s'y retrouver. L'un des principaux défis actuels consiste à traiter des informations provenant de multiples sources, généralement peu fiables. Les données ouvertes liées sont présentées dans un format lisible par les machines. Qu'elles soient extraites automatiquement de documents Web, introduites directement à partir de sources de données ou déduites par des processus de raisonnement, les données ouvertes liées peuvent être périmées, incorrectes, incomplètes, vagues, ambiguës ou -plus généralement- incertaines. Le traitement des données liées incertaines fait face à de multiples défis tels que la qualification (ou quantification) de l'incertitude, le formalisme de calcul, la représentation, la publication et la réutilisation dans le Web sémantique. Dans cette thèse, nous analysons les résultats existants traitant l'incertitude dans le Web sémantique. Afin d'introduire la terminologie adéquate, nous décrivons au chapitre 2 les notions préliminaires liées à l'incertitude et au Web sémantique. Nous donnons un aperçu des technologies utilisées dans la pile du Web sémantique et des limites des données incertaines. Ensuite, nous livrons dans le chapitre 3 une représentation de l'incertitude sur le Web sémantique. Nous proposons une ontologie de l'incertitude et des méthodes d'annotation des données avec de l'incertitude. Le chapitre 4 considère l'incertitude des données dans une vue contextualisée et traite les différentes lectures de l'incertitude dans ces contextes. Pour les sources sans information explicite sur l'incertitude, nous présentons au chapitre 5 un cadre permettant l'évaluation de l'incertitude en se basant sur les similarités syntaxiques et sémantiques avec les entités d'une source de référence et dans un cas d'utilisation spécifique. Nous concluons par une discussion sur le dialogue entre les sources de données et la connaissance consensuelle dans le Web sémantique.
Fichier principal
Vignette du fichier
Thesis_fixed.pdf (15.38 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-03679118 , version 1 (25-05-2022)

Identifiants

  • HAL Id : tel-03679118 , version 1

Citer

Ahmed El Amine Djebri. Uncertainty Management for Linked Data Reliability on the Semantic Web. Artificial Intelligence [cs.AI]. Université Côte D’Azur, 2022. English. ⟨NNT : ⟩. ⟨tel-03679118⟩
110 Consultations
14 Téléchargements

Partager

Gmail Facebook X LinkedIn More