Ogmios : une plate-forme d'annotation linguistique - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

Ogmios : une plate-forme d'annotation linguistique

Résumé

L'un des objectifs du projet ALVIS est d'intégrer des informations linguistiques dans des moteurs de recherche spécialisés. Dans ce contexte, nous avons conçu une plate-forme d'enrichissement linguistique de documents issus du Web, Ogmios, exploitant des outils de TAL existants. Les documents peuvent être en français ou en anglais. Cette architecture est distribuée, afin de répondre aux contraintes liées aux traitements de gros volumes de textes, et adaptable, afin de spécialiser l'analyse linguistique de ces textes. La plate-forme est développée en Perl et disponible sous forme de modules CPAN. Elle peut être vue comme un cadre de travail modulaire dans lequel il est possible d'intégrer des ressources adaptées au domaine traité mais aussi de nouveaux outils de TAL. Nous avons évalué les performances de la plateforme sur plusieurs collections de documents. En distribuant les traitements sur vingt machines, une collection de 55~329 documents du domaine de la biologie (106 millions de mots) a été annotée en 35 heures tandis qu'une collection de 48 422 dépêches relatives aux moteurs de recherche (14 millions de mots) a été annotée en 3 heures et 15 minutes.
Fichier non déposé

Dates et versions

hal-00158627 , version 1 (29-06-2007)

Identifiants

  • HAL Id : hal-00158627 , version 1

Citer

Thierry Hamon, Julien Derivière, Adeline Nazarenko. Ogmios : une plate-forme d'annotation linguistique. Traitement Automatique des Langues Naturelles, Jun 2007, Toulouse, France. pp.103-112. ⟨hal-00158627⟩
91 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More