Skip to Main content Skip to Navigation
Conference papers

Extraction de relations : combiner les techniques pour s'adapter à la diversité du texte.

Résumé : Extraire des relations d'hyperonymie à partir des textes est une des étapes clés de la construction automatique d'ontologies et du peuplement de bases de connaissances. Plusieurs types de méthodes (linguis-tiques, statistiques, combinées) ont été exploités par une variété de propositions dans la littérature. Les apports respectifs et la complémentarité de ces méthodes sont cependant encore mal identifiés pour optimiser leur com-binaison. Dans cet article, nous nous intéressons à la complémentarité de deux méthodes de nature différente, l'une basée sur les patrons linguistiques, l'autre sur l'apprentissage supervisé, pour identifier la relation d'hy-peronymie à travers différents modes d'expression. Nous avons appliqué ces méthodes à un sous-corpus de Wikipedia en français, composé des pages de désambiguïsation. Ce corpus se prête bien à la mise en oeuvre des deux approches retenues car ces textes sont particulièrement riches en relations d'hyperonymie, et contiennent à la fois des formulations rédigées et d'autres syntaxiquement pauvres. Nous avons comparé les résultats des deux méthodes prises indépendamment afin d'établir leurs performances respectives, avec le résultat des deux méthodes appliquées ensemble. Les meilleurs résultats obtenus correspondent à ce dernier cas de figure avec une F-mesure de 0.68. De plus, l'extracteur Wikipedia issu de ce travail permet d'enrichir la ressource séman-tique DBPedia en français : 55% des relations exprimées et identifiées par notre extracteur ne sont pas présentes dans DBPedia.
Document type :
Conference papers
Complete list of metadatas

Cited literature [31 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01570070
Contributor : Catherine Roussey <>
Submitted on : Tuesday, September 1, 2020 - 1:05:14 AM
Last modification on : Friday, September 18, 2020 - 2:34:39 PM

File

Ghamnia_IC_2017.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01570070, version 1
  • OATAO : 19050

Citation

Adel Ghamnia, Mouna Kamel, Cássia Trojahn, Cécile Fabre, Nathalie Aussenac-Gilles. Extraction de relations : combiner les techniques pour s'adapter à la diversité du texte.. 28es Journées francophones d'Ingénierie des Connaissances IC 2017, AFIA, Jul 2017, Caen, France. pp.86-97. ⟨hal-01570070⟩

Share

Metrics

Record views

290

Files downloads

9