Requêtes discriminantes pour l'exploration des données

Résumé : À l'ère du Big Data, les profils d'utilisateurs deviennent de plus en plus diversifiés et les données de plus en plus complexes, rendant souvent très difficile l'exploration des données. Dans cet article, nous proposons une technique de réécriture de requêtes pour aider les analystes à formuler leurs interrogations , pour explorer rapidement et intuitivement les données. Nous intro-duisons les requêtes discriminantes, une restriction syntaxique de SQL, avec une condition de sélection qui dissocie des exemples positifs et négatifs. Nous construisons un ensemble de données d'apprentissage dont les exemples positifs correspondent aux résultats souhaités par l'analyste, et les exemples négatifs à ceux qu'il ne veut pas. En utilisant des techniques d'apprentissage automatique, la requête initiale est reformulée en une nouvelle requête, qui amorce un proces-sus itératif d'exploration des données. Nous avons implémenté cette idée dans un prototype (iSQL) et nous avons mené des expérimentations dans le domaine de l'astrophysique.
Document type :
Conference papers
Complete list of metadatas

Cited literature [12 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01400473
Contributor : Jean Marc Petit <>
Submitted on : Tuesday, November 22, 2016 - 7:51:41 AM
Last modification on : Thursday, July 25, 2019 - 4:34:13 PM
Long-term archiving on : Tuesday, March 21, 2017 - 12:11:45 AM

File

2016_EGC.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01400473, version 1

Citation

Julien Cumin, Jean-Marc Petit, Fabien Rouge, Vasile-Marian Scuturici, Christian Surace, et al.. Requêtes discriminantes pour l'exploration des données. 16ème conférence internationale francophone sur l'Extraction et la Gestion des Connaissance (EGC 2016), Jan 2016, Reims, France. pp.195-206. ⟨hal-01400473⟩

Share

Metrics

Record views

375

Files downloads

234