La plate-forme Glozz: environnement d'annotation et d'exploration de corpus

Antoine Widlöcher 1 Yann Mathet 2
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
2 Equipe Hultech - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
Résumé : La nécessité d'une interaction systématique entre modèles, traitements et corpus impose la disponibilité d'annotations de référence auxquelles modèles et traitements pourront être confrontés. Or l'établissement de telles annotations requiert un cadre formel permettant la représentation d'objets linguistiques variés, et des applications permettant à l'annotateur de localiser sur corpus et de caractériser les occurrences des phénomènes observés. Si différents outils d'annotation ont vu le jour, ils demeurent souvent fortement liés à un modèle théorique et à des objets linguistiques particuliers, et ne permettent que marginalement d'explorer certaines structures plus récemment appréhendées expérimentalement, notamment à granularité élevée et en matière d'analyse du discours. La plate-forme Glozz répond à ces différentes contraintes et propose un environnement d'exploration de corpus et d'annotation fortement configurable et non limité a priori au contexte discursif dans lequel elle a initialement vu le jour. ------ The need for a systematic confrontation between models and corpora make it necessary to have - and consequently, to produce - reference annotations to which linguistic models could be compared. Creating such annotations requires both a formal framework which copes with various linguistic objects, and specific manual annotation tools, in order to make it possible to locate, identify and feature linguistic phenomena in texts. Though several annotation tools do already exist, they are mostly dedicated to a given theory and to a given set of structures. The Glozz platform, described in this paper, tries to address all of these needs, and provides a highly versatile corpus exploration and annotation framework.
Document type :
Conference papers
Complete list of metadatas

Cited literature [5 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01011969
Contributor : Greyc Référent <>
Submitted on : Wednesday, June 25, 2014 - 10:33:33 AM
Last modification on : Thursday, February 7, 2019 - 5:38:30 PM
Long-term archiving on: Thursday, September 25, 2014 - 10:50:38 AM

File

ACTN-WIDLOCHER-2009-1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01011969, version 1

Citation

Antoine Widlöcher, Yann Mathet. La plate-forme Glozz: environnement d'annotation et d'exploration de corpus. Actes de la 16e Conférence Traitement Automatique des Langues Naturelles (TALN'09), session posters, Jun 2009, Senlis, France, France. 10 p. ⟨hal-01011969⟩

Share

Metrics

Record views

489

Files downloads

459