Construction d'ontologies à partir d'une collection de pages web structurées - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Construction d'ontologies à partir d'une collection de pages web structurées

Résumé

De nombreuses collections de documents disponibles sur le web décrivent les caractéristiques d'entités d'un même type (e.g. des produits, des plantes), chaque page présentant une de ces entités. Ces documents sont des sources de connaissances particulièrement adaptées pour la construction d'ontologies. Alors qu'ils partagent une même mise en forme régulière, ils contiennent moins de texte rédigé que des fichiers textes mais leur architecture est riche de sens. De ce fait, les méthodes linguistiques classiques pour identifier des concepts et des relations sont moins adaptées pour les analyser. Nous proposons une approche exploitant les diverses propriétés de ces documents, combinant analyse de la structure et de la mise en forme avec une analyse linguistique, et exploitant leur annotation sémantique.
Fichier principal
Vignette du fichier
ic2013-08.pdf (609.33 Ko) Télécharger le fichier
Origine : Accord explicite pour ce dépôt
Loading...

Dates et versions

hal-00854428 , version 1 (27-08-2013)

Identifiants

  • HAL Id : hal-00854428 , version 1
  • OATAO : 12472

Citer

Nathalie Aussenac-Gilles, Mouna Kamel, Davide Buscaldi, Catherine Comparot. Construction d'ontologies à partir d'une collection de pages web structurées. 24èmes Journées francophones d'Ingénierie des Connaissances (IC 2013), Jul 2013, Lille, France. ⟨hal-00854428⟩
250 Consultations
434 Téléchargements

Partager

Gmail Facebook X LinkedIn More