Une infrastructure pour l'annotation linguistique de documents issus du web : le projet ALVIS - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2007

Une infrastructure pour l'annotation linguistique de documents issus du web : le projet ALVIS

Résumé

Cet article présente une architecture logicielle permettant l'annotation automatique de documents issus du web. Cette architecture est fondée sur l'intégration de composants d'analyse linguistique. Cette plateforme présente une double originalité : elle peut être adaptée en fonction du domaine visé et elle permet d'analyser de manière robuste des collections de documents qui sont hétérogènes, ce qui est caractéristiques des collections construites à partir du web. Cet article prend comme exemple le cas de bases de données textuelles dans le domaine de la biologie. Nous montrons comment la plateforme Ogmios peut être adaptée à ce domaine et nous détaillons les performances obtenues dans l'analyse de larges collections de documents destinées à des moteurs spécialisés sur internet.
Fichier non déposé

Dates et versions

hal-00160245 , version 1 (05-07-2007)

Identifiants

  • HAL Id : hal-00160245 , version 1

Citer

Sophie Aubin, Julien Derivière, Thierry Hamon, Adeline Nazarenko, Thierry Poibeau, et al.. Une infrastructure pour l'annotation linguistique de documents issus du web : le projet ALVIS. Revue des Nouvelles Technologies de l'Information, 2007. ⟨hal-00160245⟩
69 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More