Skip to Main content Skip to Navigation
Conference papers

DAGOBAH : Un système d’annotation sémantique de données tabulaires indépendant du contexte

Résumé : Cet article présente le système DAGOBAH permettant d’annoter sémantiquement des tables à l’aide d’entités Wikidata et DBPedia. Le système proposé annote les cellules et les colonnes d’une table et identifie des relations entre ces colonnes. Pour cela, un processus allant du pré-traitement des tables jusqu’à l’enrichissement d’un graphe de connaissances existant en utilisant uniquement les informations contenues dans la table est utilisé. Pour répondre au problème spécifique du typage des colonnes des tables, deux techniques sont introduites pour sélectionner des types suffisamment représentatifs tout en restant à un niveau de spécificité porteur d’informations. Les types ainsi identifiés sont ensuite utilisés dans un processus de désambiguisation des cellules. Le système a été évalué lors du challenge SemTab2019 (Jiménez-Ruiz et al., 2020) de la conférence ISWC 2019 où il a obtenu des résultats prometteurs (Chabot et al., 2019b).
Document type :
Conference papers
Complete list of metadata

Cited literature [32 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02888088
Contributor : Sébastien Ferré Connect in order to contact the contributor
Submitted on : Tuesday, July 7, 2020 - 1:45:39 PM
Last modification on : Friday, January 14, 2022 - 11:42:01 AM
Long-term archiving on: : Friday, November 27, 2020 - 1:26:31 PM

File

ic2020 (2).pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02888088, version 1

Collections

Citation

Yoan Chabot, Thomas Labbé, Jixiong Liu, Raphaël Troncy. DAGOBAH : Un système d’annotation sémantique de données tabulaires indépendant du contexte. 31es Journées francophones d'Ingénierie des Connaissances, Sébastien Ferré, Jun 2020, Angers, France. ⟨hal-02888088⟩

Share

Metrics

Les métriques sont temporairement indisponibles