Stratégie d'exploration de corpus multi-annotés avec GlozzQL - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Stratégie d'exploration de corpus multi-annotés avec GlozzQL

Yann Mathet

Résumé

More and more works in compuational linguistics and NLP rely on corpora. They lead to an increasing number of annotation campaigns and multi-annotated corpora, providing informations on various linguistic phenomena, annotated by several annotators or computational processes. In order to understand these linguistic phenomena, or to control annotated data, tools dedicated to annotated data mining are needed. We present here an exploration strategy and its implementation within the Glozz platform, GlozzQL.
La multiplication des travaux sur corpus, en linguistique computationnelle et en TAL, conduit à la multiplication des campagnes d'annotation et des corpus multi-annotés, porteurs d'informations relatives à des phénomènes variés, envisagés par des annotateurs multiples, parfois automatiques. Pour mieux comprendre les phénomènes que ces campagnes prennent pour objets, ou pour contrôler les données en vue de l'établissement d'un corpus de référence, il est nécessaire de disposer d'outils permettant d'explorer les annotations. Nous présentons une stratégie possible et son opérationalisation dans la plate-forme Glozz par le langage GlozzQL.

Mots clés

Fichier principal
Vignette du fichier
ACTN-MATHET-2011-2.pdf (169.78 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01021846 , version 1 (09-07-2014)

Identifiants

  • HAL Id : hal-01021846 , version 1

Citer

Yann Mathet, Antoine Widlöcher. Stratégie d'exploration de corpus multi-annotés avec GlozzQL. Actes de la 18e Conférence Traitement Automatique des Langues Naturelles (TALN'11), volume 2, papiers courts, Jun 2011, Montpellier, France. pp.143--148. ⟨hal-01021846⟩
242 Consultations
77 Téléchargements

Partager

Gmail Facebook X LinkedIn More