Une approche combinée pour l’enrichissement d’ontologie à partir de textes et de données du LOD

Abstract : Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas forcément présentes dans les documents mêmes. Pour résoudre ce problème, nous proposons un processus d’annotation en deux étapes, guidé par une ontologie. La première consiste à peupler l’ontologie avec les données extraites des documents, complétées par d’autres issues de ressources externes. La deuxième est une étape de raisonnement sur les données extraites qui recouvre soit une phase d’apprentissage de définitions de concepts, soit une phase d’application des définitions apprises. L’approche SAUPODOC est ainsi une approche originale d’enrichissement d’ontologie qui exploite les fondements du Web sémantique, en combinant les apports du LOD et d’outils d’analyse de texte, d’apprentissage automatique et de raisonnement. L’évaluation, sur deux domaines d’application, donne des résultats de qualité et démontre l’intérêt de l’approche.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01273273
Contributor : Chantal Reynaud <>
Submitted on : Friday, February 12, 2016 - 11:18:04 AM
Last modification on : Wednesday, November 14, 2018 - 12:52:02 PM

Identifiers

  • HAL Id : hal-01273273, version 1

Citation

Céline Alec, Chantal Reynaud-Delaître, Brigitte Safar. Une approche combinée pour l’enrichissement d’ontologie à partir de textes et de données du LOD. EGC (Extraction et Gestion des Connaissances), Jan 2016, Reims, France. pp.171-182. ⟨hal-01273273⟩

Share

Metrics

Record views

173