Une expérience d'annotation à large échelle : le projet OTIM - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Une expérience d'annotation à large échelle : le projet OTIM

Résumé

Nous proposons dans cette présentation de faire le point sur une opération d’annotation de grande envergure conduite dans le cadre du projet OTIM. Nous avons dans le cadre de ce projet constitué un grand corpus audio-visuel de parole spontanée comprenant 8 heures de dialogues (soit 102.457 mots correspondant à 6.611 formes différentes) totalement transcrit, aligné et richement annoté pour l’ensemble des domaines et des modalités. Nous avons donc été confrontés aux principaux problèmes posés par l’annotation de ce type de ressource. Cette présentation décrit les recommandations et les techniques que nous avons utilisées pour parvenir à nos fins.

Mots clés

Fichier principal
Vignette du fichier
bigi2011atala.pdf (72.51 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00983694 , version 1 (25-04-2014)

Identifiants

  • HAL Id : hal-00983694 , version 1

Citer

Philippe Blache, Roxane Bertrand, Brigitte Bigi, Robert Espesser, Mathilde Guardiola, et al.. Une expérience d'annotation à large échelle : le projet OTIM. Journée ATALA : Annoter les corpus oraux, Apr 2011, Paris, France. ⟨hal-00983694⟩
149 Consultations
100 Téléchargements

Partager

Gmail Facebook X LinkedIn More