Regroupement de relations pour l'extraction d'information non supervisée - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Regroupement de relations pour l'extraction d'information non supervisée

Résumé

En contexte de veille, l’extraction d’information non supervisée a pour but d’extraire des relations entre entités sans fournir de connaissances a priori sur les natures de ces relations. Dans ce contexte, nous nous intéressons à l’identification et la caractérisation de nouvelles relations entre des types d’entités fixés. Nous présentons dans cet article une procédure de filtrage de relations combinant des méthodes heuristiques et des méthodes par apprentissage, permettant d’atteindre un score de F-mesure de 77,1%. Nous présentons ensuite une méthode de regroupement des relations extraites combinant un calcul optimisé des similarités entre les relations (All Pairs Similarity Search) et un algorithme de clustering (Markov Clustering). Une évaluation de ce regroupement, effectuée grâce à des mesures internes et externes, montre que l’utilisation du filtrage permet de doubler le rappel en conservant une précision équivalente.
Fichier principal
Vignette du fichier
191.pdf (147.85 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02289727 , version 1 (17-09-2019)

Identifiants

Citer

Wei Wang, Romaric Besançon, Olivier Ferret, Brigitte Grau. Regroupement de relations pour l'extraction d'information non supervisée. CORIA (Conférence en Recherche d'Infomations et Applications), Mar 2012, Bordeaux, France. pp.191--202, ⟨10.24348/coria.2012.191⟩. ⟨hal-02289727⟩
37 Consultations
29 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More