DAGOBAH: Annotation sémantique de données tabulaires par comparaison du contexte des tables et d'un graphe de connaissances - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

DAGOBAH: Annotation sémantique de données tabulaires par comparaison du contexte des tables et d'un graphe de connaissances

Viet-Phi Huynh
  • Fonction : Auteur
Yoan Chabot
  • Fonction : Auteur
Frédéric Deuzé
  • Fonction : Auteur
Thomas Labbé
  • Fonction : Auteur
Pierre Monnin
Raphaël Troncy

Résumé

In this paper, we present the latest improvements of the DAGOBAH system that performs automatic pre-processing and semantic interpretation of tables. In particular, we report promising results obtained in the SemTab 2021 challenge thanks to optimisations in lookup mechanisms and new techniques for studying the context of nodes in the knowledge graph. We also present the deployment of DAGOBAH within the Orange company via the TableAnnotation API and a front-end called DAGOBAH UI. These two access methods enable to accelerate the adoption of Semantic Table Interpretation solutions within the company.
Cet article présente les améliorations apportées à DAGO-BAH, un système effectuant un pré-traitement automatique et une interprétation sémantique de données tabulaires à l'aide d'un graphe de connaissances. Nous détaillons les optimisations des mécanismes de recherche de candidats et les nouvelles techniques d'étude du contexte des noeuds du graphe de connaissances qui nous ont permis d'obtenir les meilleures performances lors du challenge SemTab 2021 en terme de précision. Nous décrivons également le déploiement des algorithmes DAGOBAH au sein de l'entreprise Orange via l'API TableAnnotation et une interface utilisateur. Ces deux méthodes d'accès permettent d'accélérer l'adoption de solutions d'interprétation de tables au sein de l'entreprise pour répondre à des besoins industriels.
Fichier principal
Vignette du fichier
Viet-Phi_Huynh_2022.pdf (904.96 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03819784 , version 1 (18-10-2022)

Identifiants

  • HAL Id : hal-03819784 , version 1

Citer

Viet-Phi Huynh, Jixiong Liu, Yoan Chabot, Frédéric Deuzé, Thomas Labbé, et al.. DAGOBAH: Annotation sémantique de données tabulaires par comparaison du contexte des tables et d'un graphe de connaissances. Journées Francophones d’Ingénierie des Connaissances, Jun 2022, Saint-Etienne, France. ⟨hal-03819784⟩

Collections

EURECOM
77 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More