4454 articles – 13148 Notices  [english version]
HAL : hal-00250271, version 1

Fiche détaillée  Récupérer au format
Travaux Interdisciplinaires du Laboratoire Parole et Langage d'Aix-en-Provence (TIPA) 25 (2006) 25-55
Le CID - Corpus of Interactional Data -: protocoles, conventions, annotations
Roxane Bertrand ( ) 1, Philippe Blache ( ) 1, Robert Espesser ( ) 1, Gaëlle Ferré ( ) 1, Christine Meunier ( ) 1, Béatrice Priego-Valverde ( ) 1, Stéphane Rauzy ( ) 1
(2006)

L'analyse du langage et de la parole repose sur l'étude de domaines variés allant de la phonétique à la pragmatique, tout en prenant en compte les modalités de leur expression. Pour la linguistique moderne, si chaque domaine dispose d'un certain niveau d'autonomie, il ne peut être expliqué que dans son interaction avec les autres : l'information linguistique est le produit de la convergence de multiples sources d'information, information aussi contrainte par l'environnement où le message a été produit. L'analyse linguistique ne peut donc se faire qu'en tenant compte des différentes modalités d'expression de l'information. Mais à ce jour, aucune théorie ne traite de manière intégrée des informations issues des différents niveaux de la chaîne linguistique, qui est par essence un contenu perceptuel multimodal. Bien que de nombreux projets d'annotation se soient développés ces dernières années, des problèmes subsistent: les ressources multimodales annotées n'existent quasiment pas pour le français ; les standards d'annotation ne répondent pas complètement aux besoins et les outils ne sont pas adaptés. Or, le développement de ce type de ressources est utile à plusieurs titres,entre autres la description des informations de chacun des domaines et de leurs interactions. Nous présentons le Corpus of Interactional Data (CID), corpus audio et vidéo comptant actuellement 8h de dilogue en français, les annotations à l'étude (phonétique, prosodique, morphosyntaxique, mimo-gestuelle) et leur état de réalisation.
1 :  Laboratoire Parole et Langage (LPL)
CNRS : UMR6057 – Université de Provence - Aix-Marseille I
Sciences de l'Homme et Société/Linguistique

Informatique/Traitement du texte et du document

Sciences cognitives/Psychologie
corpus français oral multimodalité annotation
Liste des fichiers attachés à ce document : 
PDF
2975.pdf(592.2 KB)