Reagrupamiento en familias y lexematización automática independientes del idioma - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Inteligencia Artificial. Ibero-American Journal of Artificial Intelligence Année : 2010

Reagrupamiento en familias y lexematización automática independientes del idioma

Résumé

Este artículo presenta un sistema basado en métodos de regrupamiento no supervisado que detecta algorítmicamente las raíces o lexemas de familias morfológicas. La idea principal es la constitución de familias morfológicas a través de reagrupamien-tos iterativos. Los criterios de este reagrupamiento se basan en la similitud gráfica de las palabras, en su representación vectorial y en la correcta utilización de pares de sufijos (o firma de la familia) extraídos automáticamente. Las pruebas sobre corpora en francés, inglés y español muestran resultados muy interesantes en los tres idiomas, con una gran robustez e independencia del idioma.
Fichier principal
Vignette du fichier
ia.pdf (406.06 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02562692 , version 1 (04-05-2020)

Identifiants

  • HAL Id : hal-02562692 , version 1

Citer

Juan-Manuel Torres-Moreno. Reagrupamiento en familias y lexematización automática independientes del idioma. Inteligencia Artificial. Ibero-American Journal of Artificial Intelligence, 2010, 14 (47). ⟨hal-02562692⟩

Collections

UNIV-AVIGNON LIA
45 Consultations
100 Téléchargements

Partager

Gmail Facebook X LinkedIn More