Efficient computation of polynomial explanations of Why-Not questions

Nicole Bidoit 1, 2, 3, 4 Melanie Herschel 5 Katerina Tzompanaki 2, 3, 4, 1
3 OAK - Database optimizations and architectures for complex large data
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Résumé : Answering a Why-Not question consists in explaining why the result of a query does not contain some expected data, called missing answers. This paper [6] focusses on processing Why-Not questions following a query-based approach that identifies the culprit query components. The first contribution of this paper is a general definition of a Why-Not explanation by means of a polynomial. Intuitively , the polynomial provides all possible explanations to explore in order to recover the missing answers. Moreover, this formalism allows us to represent Why-Not explanations to extended relational models having for instance probabilistic or bag semantics. Computing the Why-Not explanation is a complex process and the second contribution of the paper is an algorithm that efficiently generates the aforementioned polynomials that answer Why-Not questions. An experimental evaluation demonstrates the practicality of the algorithm both in terms of efficiency and explanation quality, compared to existing algorithms. Répondre à des questions de type "Pourquoi pas" (Why Not) consiste à expliquer pourquoi certaines données appelées réponses manquantes sont absentes du résultat d'une requête. Cet article traite de questions de type "Pourquoi pas" en suivant une approche "requête", c'est à dire que les explications sont fournies par les combinaisons de conditions de la requête qui sont responsables de la non obtention de certaines réponses. La première contribution est une définition générale de ce qu'est l'explication d'une question "Pourquoi pas" sous la forme d'un polynôme. Intuitivement, ce polynôme fournit toutes les voies à explorer pour récupérer les réponses manquantes. De plus, cette définition permet, avec le même formalisme, de s'intéresser à des extensions du modèle re-lationnel tel que la sémantique multi-ensembliste ou probabliliste. La deuxième contribution de cet article est liée au calcul des ex-plications d'une question "Pourquoi pas". Un algorithme efficace est présenté, accompagné d'une validation expérimentale et d'une étude comparative.
Document type :
Conference papers
Complete list of metadatas

Cited literature [25 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01182104
Contributor : Aikaterini Tzompanaki <>
Submitted on : Thursday, July 30, 2015 - 2:17:45 PM
Last modification on : Monday, May 28, 2018 - 2:38:02 PM
Long-term archiving on : Saturday, October 31, 2015 - 10:34:26 AM

File

BDA2015.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01182104, version 1

Citation

Nicole Bidoit, Melanie Herschel, Katerina Tzompanaki. Efficient computation of polynomial explanations of Why-Not questions. 31ème Conférence sur la Gestion de Données — Principes, Technologies et Applications - BDA 2015, Sep 2015, Île de Porquerolles, France. ⟨hal-01182104⟩

Share

Metrics

Record views

311

Files downloads

467