Extração de nomes de pessoas em textos em português : uma abordagem usando gramáticas locais - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Extraction of person names from texts in Portuguese: an approach with local grammars

Extração de nomes de pessoas em textos em português : uma abordagem usando gramáticas locais

Résumé

Automatic identification of person names in texts is an important task in natural language processing. This paper describes an approach for identifying people's names in Portuguese texts, based on a local grammar built after a linguistic study of these texts. A local grammar for the book 'A Senhora', a classic by José de Alencar, was built and subsequently applied to articles of a local newspaper from Espírito Santo. The goal was to observe how appropriate a grammar built from a context is to another. It was observed that it is possible, but some adaptations are necessary to improve performance. On the book 'A Senhora' we obtained 99% recall and 100% precision. The results are promising.
A identificação automática de nomes de pessoas em textos é uma tarefa importante no processamento de linguagem natural. Esse artigo descreve uma abordagem para identificar nomes de pessoas em textos em português, com base em uma gramática local construída após um estudo linguístico desses textos. Uma gramática para o livro "A Senhora", um clássico de José de Alencar, foi construída e posteriormente aplicada a artigos de um jornal local do Espírito Santo. O objetivo foi observar a apropriação da gramática construída para um contexto em outro. Foi observado que issó e possível, mas algumas adaptações são necessárias para melhorar o desempenho. Para o livro "A Senhora" foi obtido 99% de abrangência e 100% de precisão. Os resultados são promissores.
Fichier principal
Vignette du fichier
6986-18928-1-SM.pdf (218.21 Ko) Télécharger le fichier
Origine : Publication financée par une institution
Loading...

Dates et versions

hal-01134971 , version 1 (24-03-2015)

Identifiants

  • HAL Id : hal-01134971 , version 1

Citer

Juliana Pinheiro Campos Pirovani, Elias Silva de Oliveira. Extração de nomes de pessoas em textos em português : uma abordagem usando gramáticas locais. Computer on the Beach, Universidade do Vale do Itajaí (UNIVALI); Centro de Ciências Tecnológicas da Terra e do Mar (CTTMar), Mar 2015, Florianópolis, Brazil. pp.1-10. ⟨hal-01134971⟩

Collections

LIGM_LINGU_INVITE
249 Consultations
474 Téléchargements

Partager

Gmail Facebook X LinkedIn More