Un algoritmo lingüístico - estadístico para resumen automático de textos especializados

Iria da Cunha; Juan-Manuel Torres-Moreno; Patricia Velázquez-Morales; Jorge Vivaldi

Article Dans Une Revue Linguamática Année : 2000

Un algoritmo lingüístico - estadístico para resumen automático de textos especializados

(1, 2) , (1, 3) , , (2)

1
2
3

Iria da Cunha

Fonction : Auteur

Laboratoire Informatique d'Avignon

Universitat Pompeu Fabra [Barcelona]

Juan-Manuel Torres-Moreno

Fonction : Auteur
PersonId : 12610
IdHAL : juan-manuel-torres
ORCID : 0000-0002-4392-1825
IdRef : 130897019

Laboratoire Informatique d'Avignon

École Polytechnique de Montréal

Patricia Velázquez-Morales

Fonction : Auteur

Jorge Vivaldi

Fonction : Auteur

Universitat Pompeu Fabra [Barcelona]

Résumé

Resumen En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico , que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio. 1. Introducción El resumen automático es actualmente un tema de investigación muy relevante. La investigación en está area se inició en los años sesenta, emple-ando técnicas basadas en frecuencias de palabras (Luhn, 1959) o frases clave (Edmundson, 1969). Con el tiempo, estas técnicas han ido evolucio-nando y volviéndose más complejas. Podemos ha-cer una división general de estas técnicas en dos grupos principales: las técnicas estadísticas y las técnicas lingüísticas. En el primer grupo 1 , encon-tramos, entre otros, trabajos que emplean mo-delos bayesianos (Kupiec, Pedersen, and Chen, 1995), la Maximal Marginal Relevance (Golds-tein et al., 1999), técnicas de clustering (Ra-dev. En el segundo grupo, destacamos trabajos que explotan las posiciones textuales (Brandow, Mitze, and Rau, 1995; Lin and Hovy, 1997), la estructura del discurso (Ono, Sumita, 1 No pretendemos hacer aquí una revisión exhaustiva del estado de la cuestión en resumen automático. Para más información sobre técnicas y/o sistemas de resumen remitimos a los trabajos de (Spärck Jones, 2007; Mani, 2001; Mani and Maybury, 1999).

Domaines

Informatique [cs]

bibliothèque Universitaire Déposants HAL-Avignon : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01314836

Soumis le : jeudi 12 mai 2016-11:03:27

Dernière modification le : lundi 16 novembre 2020-15:26:06

Dates et versions

hal-01314836 , version 1 (12-05-2016)

Identifiants

HAL Id : hal-01314836 , version 1

Citer

Iria da Cunha, Juan-Manuel Torres-Moreno, Patricia Velázquez-Morales, Jorge Vivaldi. Un algoritmo lingüístico - estadístico para resumen automático de textos especializados. Linguamática, 2000. ⟨hal-01314836⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-AVIGNON LIA

51 Consultations

0 Téléchargements

Un algoritmo lingüístico - estadístico para resumen automático de textos especializados

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager