Service interruption on Monday 11 July from 12:30 to 13:00: all the sites of the CCSD (HAL, Epiciences, SciencesConf, AureHAL) will be inaccessible (network hardware connection).
Skip to Main content Skip to Navigation
Conference papers

Une approche combinée pour l’enrichissement d’ontologie à partir de textes et de données du LOD

Abstract : Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas forcément présentes dans les documents mêmes. Pour résoudre ce problème, nous proposons un processus d’annotation en deux étapes, guidé par une ontologie. La première consiste à peupler l’ontologie avec les données extraites des documents, complétées par d’autres issues de ressources externes. La deuxième est une étape de raisonnement sur les données extraites qui recouvre soit une phase d’apprentissage de définitions de concepts, soit une phase d’application des définitions apprises. L’approche SAUPODOC est ainsi une approche originale d’enrichissement d’ontologie qui exploite les fondements du Web sémantique, en combinant les apports du LOD et d’outils d’analyse de texte, d’apprentissage automatique et de raisonnement. L’évaluation, sur deux domaines d’application, donne des résultats de qualité et démontre l’intérêt de l’approche.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-01273273
Contributor : Chantal Reynaud Connect in order to contact the contributor
Submitted on : Friday, February 12, 2016 - 11:18:04 AM
Last modification on : Saturday, June 25, 2022 - 10:19:33 PM

Identifiers

  • HAL Id : hal-01273273, version 1

Citation

Céline Alec, Chantal Reynaud-Delaître, Brigitte Safar. Une approche combinée pour l’enrichissement d’ontologie à partir de textes et de données du LOD. EGC (Extraction et Gestion des Connaissances), Jan 2016, Reims, France. pp.171-182. ⟨hal-01273273⟩

Share

Metrics

Record views

135