Descrição e classificação de predicados nominais com o verbo-suporte 'fazer' - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2014

Description and classification of nominal predicates with the support verb 'fazer' ('make/do')

Description et classification des prédicats nominaux avec le verbe support "fazer" ("faire")

Descrição e classificação de predicados nominais com o verbo-suporte 'fazer'

Résumé

Lexical data base building can be considered an essential task for Natural Language Processing (NLP), since the data included can be used in numerous tools, such as parsers, semantic role labelers, automatic translators, text simplifiers, paraphrase systems, question answering systems, information extraction systems, among others. Among lexical information that can be used by these systems and, therefore, must be described and formalized are nominal predicates, which can be defined by the union of a predicative noun and a support verb. Predicative nouns are those with arguments, and support verbs are the ones semantically empty. The latter provides to nouns the tense-aspect-person-number marks that they don't have, given their morphology. In this context, this research presents the linguistic description of 1,815 Brazilian Portuguese nominal predicates (support verb fazer 'make/do' and a predicative noun) according to the Lexicon-Grammar Theory. Such theory proposes that the linguistic unity of analysis is the simple clause (the predicator and its arguments). The data is inserted in a binary table, which presents the lexical entries in rows and the formal properties (structural, distributional and transformational) in columns. Twenty-nine properties were identified, such as the type of prepositions, the possibility of passive voice, and others. The nominal predicates analysed were divided into 17 classes, which have syntactic regularities. This research has identified the variants of the support verb fazer 'make/do', which expand the possibilities of the ocurrence of these kinds of predicates. This research aims to contribute to the linguistic description of the Brazilian Portuguese language and to NLP, providing data to be used in the future by systems that use lexical knowledge.
La construction de bases de données d'informations lexicales est une tâche essentielle pour traitement automatique des langues naturelles (TALN), les données qu'ils contiennent étant utiles dans de nombreux outils tels que les analyseurs syntaxiques, annotateurs de rôles sémantiques, traducteurs automatiques, simplificateurs de textes, systèmes de paraphrase, de réponse à des questions ou d'extraction d'informations. Parmi les informations lexicales qui peuvent être utilisées par ces systèmes, et doivent donc être décrites et formalisées, figurent les prédicats nominaux, qui peuvent être définis comme la combinaison d'un nom prédicatif (Npred) avec un verbe support (Vsup). Les Npred sont les noms qui ont des arguments ; les Vsup sont les verbes à faible valeur sémantique qui fournissent au nom des marques de temps, d'aspect, de personne et de nombre qu'il n'a pas étant donné sa morphologie. Dans ce contexte, cette étude présente la description de 1815 prédicats nominaux, formés par le Vsup "fazer" ("faire") et un nom prédicatif en portugais du Brésil, dans le cadre théorique et méthodologique du Lexique-Grammaire, qui prend comme unité d'analyse linguistique la phrase simple (le prédicat et ses arguments) et non un élément lexical unique. La représentation des prédicats nominaux se fait dans une matrice binaire qui montre dans les lignes les entrées lexicales et dans les colonnes les propriétés formelles : structurelles, distributionnelles et transformationnelles . Dans ce travail, nous avons identifié 29 propriétés utilisées dans l'analyse des prédicats nominaux, telles que : (1) le type de prépositions introduisant des compléments essentiels ; (2) la possibilité d'une formation passive ; etc. Les prédicats nominaux décrits dans cette étude ont été divisés en 17 classes qui présentent des régularités syntaxiques. Il a également été recensé des variantes possibles du Vsup qui élargissent les possibilités de réalisation des prédicats nominaux analysés. Ce travail vise à contribuer, d'une part, à la description linguistique du portugais, à travers l'analyse lexicale et grammaticale des prédicats nominaux à verbe support "fazer" ("faire"), et d'autre part au TALN, grâce à la mise à disposition des données pour une utilisation future par des systèmes qui exploitent des connaissances sur le vocabulaire.
A construção de bases de dados com informações lexicais pode ser considerada uma tarefa essencial para o Processamento de Línguas Naturais (PLN), pois os dados ali contidos podem ser utilizados em muitas ferramentas, como parsers, anotadores de papéis semânticos, tradutores automáticos, simplificadores textuais, sistemas que lidam com paráfrases, sistemas de perguntas e respostas, sistemas de extração de informação, entre outros. Um tipo de informação lexical que pode ser utilizado por esses sistemas e, portanto, carece de ser descrito e formalizado, é o predicado nominal, que pode ser definido pela união de um nome predicativo (Npred) e um verbo-suporte (Vsup). Os Npred são aqueles que possuem argumentos e os Vsup são verbos considerados fracos do ponto de vista semântico e que fornecem ao nome as marcas de tempo-aspecto-pessoa-número que este não possui, devido à sua morfologia. Nesse contexto, a presente pesquisa apresenta a descrição de 1815 predicados nominais, formados pelo Vsup fazer e um nome predicativo do português do Brasil (PB), tendo como arcabouço teórico-metodológico a Léxico-Gramática, que propõe que a unidade de análise linguística seja a frase simples (o predicado e seus argumentos) e não um item lexical isolado. A representação dos predicados nominais é feita em uma matriz binária que apresenta as entradas lexicais nas linhas e as propriedades formais (estruturais, distribucionais e transformacionais) nas colunas. Neste trabalho, foram identificadas 29 propriedades, utilizadas na análise dos predicados nominais, como: (i) o tipo de preposições que introduzem os complementos; (ii) a possibilidade de haver formação de passiva, entre outras. Os predicados nominais descritos nesta pesquisa foram divididos em 17 classes, que apresentavam regularidades sintáticas. Foi realizado também nesta pesquisa o levantamento de possíveis variantes para o Vsup fazer, que expandem as possibilidades de realizações de predicados nominais com os Npred analisados. Espera-se, com este trabalho, contribuir para a Descrição Linguística do Português, por meio da análise léxico-gramática dos predicados nominais com o verbo-suporte fazer, e também contribuir para o PLN por meio da disponibilização dos dados para a futura utilização por sistemas que lidem com o léxico.
Fichier principal
Vignette du fichier
vup-fazer-claudia.pdf (3.84 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01384624 , version 1 (24-10-2016)

Identifiants

  • HAL Id : tel-01384624 , version 1

Citer

Cláudia Dias de Barros. Descrição e classificação de predicados nominais com o verbo-suporte 'fazer'. Linguistics. Universidade federal de São Carlos, 2014. Portuguese. ⟨NNT : ⟩. ⟨tel-01384624⟩

Collections

LIGM_LINGU_INVITE
85 Consultations
413 Téléchargements

Partager

Gmail Facebook X LinkedIn More