DAGOBAH: Annotation sémantique de données tabulaires par comparaison du contexte des tables et d'un graphe de connaissances
Résumé
In this paper, we present the latest improvements of the DAGOBAH system that performs automatic pre-processing and semantic interpretation of tables. In particular, we report promising results obtained in the SemTab 2021 challenge thanks to optimisations in lookup mechanisms and new techniques for studying the context of nodes in the knowledge graph. We also present the deployment of DAGOBAH within the Orange company via the TableAnnotation API and a front-end called DAGOBAH UI. These two access methods enable to accelerate the adoption of Semantic Table Interpretation solutions within the company.
Cet article présente les améliorations apportées à DAGO-BAH, un système effectuant un pré-traitement automatique et une interprétation sémantique de données tabulaires à l'aide d'un graphe de connaissances. Nous détaillons les optimisations des mécanismes de recherche de candidats et les nouvelles techniques d'étude du contexte des noeuds du graphe de connaissances qui nous ont permis d'obtenir les meilleures performances lors du challenge SemTab 2021 en terme de précision. Nous décrivons également le déploiement des algorithmes DAGOBAH au sein de l'entreprise Orange via l'API TableAnnotation et une interface utilisateur. Ces deux méthodes d'accès permettent d'accélérer l'adoption de solutions d'interprétation de tables au sein de l'entreprise pour répondre à des besoins industriels.
Origine : Fichiers éditeurs autorisés sur une archive ouverte