ANTELOPE - Une plateforme industrielle de traitement linguistique - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2008

ANTELOPE - Une plateforme industrielle de traitement linguistique

Résumé

The Antelope linguistic platform, inspired by Meaning-Text Theory, targets the syntactic and semantic analysis of texts, and can handle large corpora. Antelope integrates several pre-existing (parsing) components as well as broad-coverage linguistic data originating from various sources. Efforts towards integration of all components nonetheless make for a homogeneous platform. Our direct contribution deals with components for semantic analysis, and the formalization of a unified text analysis model. This paper introduces the platform and compares it with state-of-the-art projects. It offers to the NLP community a feedback from a software company, by underlining the architectural measures that should be taken to ensure that such complex software remains maintainable.
La plate-forme de traitement linguistique Antelope, en partie basée sur la Théorie Sens-Texte (TST), permet l'analyse syntaxique et sémantique de textes sur des corpus de volume important. Antelope intègre plusieurs composants préexistants (pour l'analyse syntaxique) ainsi que des données linguistiques à large couverture provenant de différentes sources. Un effort d'intégration permet néanmoins d'offrir une plate-forme homogène. Notre contribution directe concerne l'ajout de composants d'analyse sémantique et la formalisation d'un modèle linguistique unifié. Cet article présente la plate-forme et la compare à d'autres projets de référence. Il propose un retour d'expérience d'un éditeur de logiciel vers la communauté du TAL, en soulignant les précautions architecturales à prendre pour qu'un tel ensemble complexe reste maintenable.
Fichier principal
Vignette du fichier
ANTELOPE-dA_finitif-TAL-2008-49-2-02-Chaumartin.pdf (441.21 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00611238 , version 1 (25-07-2011)

Identifiants

  • HAL Id : hal-00611238 , version 1

Citer

Francois-Regis Chaumartin. ANTELOPE - Une plateforme industrielle de traitement linguistique. Revue TAL : traitement automatique des langues, 2008, 49 (2), pp.43-71. ⟨hal-00611238⟩
268 Consultations
292 Téléchargements

Partager

Gmail Facebook X LinkedIn More