Uso de uma ferramenta de processamento de linguagem natural como auxílio à coleta de exemplos para o estudo de propriedades sintático-semânticas de verbos - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Linguamática Année : 2015

Using a natural language processing tool to assist the collection of samples for the study of syntactic-semantic properties of verbs

Uso de uma ferramenta de processamento de linguagem natural como auxílio à coleta de exemplos para o estudo de propriedades sintático-semânticas de verbos

Résumé

The analysis and description of syntactic-semantic properties of verbs are fundamental both to the knowledge of the grammar of a language and to the automatic processing of natural language, as an encoded form of this description can be exploited by automatic tools. This paper experiments with the use of Unitex, a natural language processing tool, to collect a list of verbs that can be analysed and described by a linguist. This work contributes significantly to linguistics, by decreasing the human manual effort in the search for verbs. A case study is performed to partially automate the collection of verbs in -ecer with adjectival basis in a corpus of 47 million words. The proposed approach is compared with manual collection and with extraction from an NLP dictionary.
A análise e descrição de propriedades sintático-semânticas de verbos são importantes para a compreensão do funcionamento de uma língua e fundamentais para o processamento automático de linguagem natural, uma vez que a codificação dessa descrição pode ser explorada por ferramentas que realizam esse tipo de processamento. Esse trabalho experimenta o uso do Unitex, uma ferramenta de processamento de linguagem natural, para coletar uma lista de verbos que podem ser analisados e descritos por um linguista. Isso contribui significativamente para esse tipo de estudo linguístico, diminuindo o esforço manual humano na busca de verbos. Foi realizado um estudo de caso para automatizar parcialmente a coleta de verbos de base adjetiva com sufixo-ecer em um corpus de 47 milhões de palavras. A abordagem proposta é comparada com a coleta manual e a extração a partir de um dicionário para o PLN.
Fichier principal
Vignette du fichier
Linguamatica_Revisao_21-12-15.pdf (456.58 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01252528 , version 1 (07-01-2016)

Identifiants

  • HAL Id : hal-01252528 , version 1

Citer

Larissa Picoli, Juliana Pinheiro Campos Pirovani, Elias Silva de Oliveira, Eric Laporte. Uso de uma ferramenta de processamento de linguagem natural como auxílio à coleta de exemplos para o estudo de propriedades sintático-semânticas de verbos. Linguamática, 2015, 7 (2), pp.35-44. ⟨hal-01252528⟩
212 Consultations
549 Téléchargements

Partager

Gmail Facebook X LinkedIn More