Peuplement d'une base de connaissance par annotation automatique de textes relatifs à la cosmétique

Abstract : Dans cet article, nous proposons une approche pour construire une base de connaissances à partir de textes dans le domaine de la cosmétique. Il s’agit d’un cas particulier pour un domaine fixé du problème de l’extraction de relations à partir de textes. Dans le but de résoudre ce problème, nous proposons une approche semi-supervisée pour l’extraction des relations en combinant deux méthodes : (i) la construction de patrons d’extraction à partir des résumés présents dans les pages de DBpedia, (ii) l’annotation manuelle d’un ensemble de textes pour définir des patrons syntaxiques pour extraire les relations. Nous avons évalué notre approche sur deux types de corpus : (i) un premier corpus est composé d’articles de journaux spécialisés, tels que au féminin. com et Cosmétique Hebdo, (ii) un deuxième corpus est constitué d’un ensemble de phrases collectées sur sur le Web.
Document type :
Conference papers
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01570108
Contributor : Catherine Roussey <>
Submitted on : Friday, July 28, 2017 - 2:06:30 PM
Last modification on : Friday, April 5, 2019 - 9:56:05 AM

Identifiers

  • HAL Id : hal-01570108, version 1

Citation

Molka Tounsi, Cédric Lopez, Catherine Faron Zucker, Elena Cabrio, Fabien Gandon, et al.. Peuplement d'une base de connaissance par annotation automatique de textes relatifs à la cosmétique. 28es Journées francophones d'Ingénierie des Connaissances IC 2017, Jul 2017, Caen, France. pp.104-114. ⟨hal-01570108⟩

Share

Metrics

Record views

307