Fouille de règles d'annotation pour la reconnaissance d'entités nommées - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2013

Fouille de règles d'annotation pour la reconnaissance d'entités nommées

Résumé

Comme pour de nombreuses autres problématiques TAL, la reconnaissance d'entités nommées met en jeu aussi bien des systèmes à base de connaissances que des systèmes guidés par les données. Dans cet article, nous proposons une approche médiane par l'adaptation de méthodes issues de l'extraction de connaissances. Notre système, mXS, intègre des techniques de fouille séquentielle hiérarchique pour la détection des entités nommées. Le système adopte une démarche centrée sur les données pour extraire des motifs symboliques. Il repose par ailleurs sur une stratégie originale qui consiste à rechercher séparément le début et la fin des entités. Cette approche présente l'intérêt de conserver une certaine robustesse par rapport aux bruit et disfluences. Elle est adaptée au cadre applicatif visé par le système : la détection d'entités nommées au sein de flux de parole conversationnelle transcrite automatiquement. À ce titre, mXS a participé à la campagne d'évaluation ETAPE où il a présenté de bons résultats. Cet article présente le fonctionnement de mXS et ses performances sur les jeux de données issus de deux campagnes d'évaluation francophones (ESTER 2 et ETAPE).
Fichier principal
Vignette du fichier
tal_en_mxs.pdf (333.71 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-01016337 , version 1 (03-07-2014)

Identifiants

  • HAL Id : hal-01016337 , version 1

Citer

Damien Nouvel, Jean-Yves Antoine, Nathalie Friburger, Arnaud Soulet. Fouille de règles d'annotation pour la reconnaissance d'entités nommées. Revue TAL : traitement automatique des langues, 2013, 54 (2), pp.13-41. ⟨hal-01016337⟩
211 Consultations
251 Téléchargements

Partager

Gmail Facebook X LinkedIn More