Extraction et regroupement de relations entre entités pour l’extraction d’information non supervisée - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2013

Extraction and clustering of relations between entities for unsupervised information extraction

Extraction et regroupement de relations entre entités pour l’extraction d’information non supervisée

Résumé

This article takes place in the context of unsupervised information extraction in open domain and focuses on the extraction and the clustering at a large scale of relations between named entities without defining their type a priori. The extraction step combines the use of basic but efficient criteria and a filtering procedure based on machine learning. The clustering step organizes extracted relations into clusters to characterize their type according to a multi-level strategy that takes into account both large volumes of relations and sophisticated clustering criteria. Experiments show that our approach is able to extract relations with a good precision and to organize them according to their semantic and topical similarity.
Cet article se situe dans le cadre de l’extraction d’information non supervisée en domaine ouvert en se concentrant sur l’extraction et le regroupement à large échelle de relations entre entités nommées de type non défini a priori. L’étape d’extraction combine l’utilisation de critères simples mais efficaces et une procédure de filtrage à base d’apprentissage. L’étape de regroupement organise quant à elle les relations extraites pour en caractériser le type selon une stratégie multiniveau permettant de prendre en compte à la fois un volume important et des critères de regroupement élaborés. Les évaluations menées montrent que cette approche a la capacité d’extraire des relations avec une bonne précision et de les grouper selon leurs similarités sémantique et thématique.
Fichier non déposé

Dates et versions

hal-01850469 , version 1 (27-07-2018)

Identifiants

  • HAL Id : hal-01850469 , version 1

Citer

Wang Wei, Romaric Besancon, Olivier Ferret, Brigitte Grau. Extraction et regroupement de relations entre entités pour l’extraction d’information non supervisée. Revue TAL : traitement automatique des langues, 2013, 54 (2), pp.69-100. ⟨hal-01850469⟩
126 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More