Fouille de règles d'annotation partielles pour la reconnaissance des entités nommées - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Fouille de règles d'annotation partielles pour la reconnaissance des entités nommées

Résumé

Ces dernières décennies, l'accroissement des volumes de données a rendu disponible une diversité toujours plus importante de types de contenus échangés (texte, image, audio, vidéo, SMS, tweet, données statistiques, spatiales, etc.). En conséquence, de nouvelles problématiques ont vu le jour, dont la recherche d'information au sein de données potentiellement bruitées. Dans cet article, nous nous penchons sur la reconnaissance d'entités nommées au sein de transcriptions (manuelles ou automatiques) d'émissions radiodiffusées et télévisuelles. À cet effet, nous mettons en oeuvre une approche originale par fouille de données afin d'extraire des motifs, que nous nommons règles d'annotation. Au sein d'un modèle, ces règles réalisent l'annotation automatique de transcriptions. Dans le cadre de la campagne d'évaluation Etape, nous mettons à l'épreuve le système implémenté, mXS, étudions les règles extraites et rapportons les performances du système. Il obtient de bonnes performances, en particulier lorsque les transcriptions sont bruitées.
Fichier principal
Vignette du fichier
2013_TALN_REN_MXS.pdf (445.81 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-01016535 , version 1 (01-07-2014)

Identifiants

  • HAL Id : hal-01016535 , version 1

Citer

Damien Nouvel, Jean-Yves Antoine, Nathalie Friburger, Arnaud Soulet. Fouille de règles d'annotation partielles pour la reconnaissance des entités nommées. TALN'2013, 20e conférence sur le Traitement Automatique des Langues Naturelles, Jun 2011, Les Sable d'Olonne, France. pp.421-444. ⟨hal-01016535⟩
88 Consultations
75 Téléchargements

Partager

Gmail Facebook X LinkedIn More