Rapport final du projet ANR CREAGEST. - Archive ouverte HAL Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2012

Rapport final du projet ANR CREAGEST.

Résumé

1-Constitution de corpus de LSF (enfants et adultes) et de gestualité naturelle pour l’analyse des processus de création d’unités gestuelles. Le propos était de constituer et documenter un corpus de données gestuelles incluant discours en LSF d’enfants et d’adultes sourds et gestualité naturelle, avec pour enjeu de mettre à disposition des communautés françaises et internationales concernées des corpus représentatifs et pérennes. Il s’agissait de pallier les manques majeurs en la matière et de complémenter l’existant, aussi bien en termes d’âges représentés que de genres discursifs et d’implantation régionale des locuteurs. Les choix méthodologiques opérés visaient à apporter des réponses à deux types d’objectifs : 1) l’un, de modélisation linguistique : affiner sur la base du modèle sémiologique (Cuxac 2000) la description des processus opérant dans la sémiotisation de la gestualité humaine, tant au plan des interrelations entre gestualité naturelle et LS, qu’à ceux de l’acquisition de la LSF et des émergences et évolutions dans la LSF adulte ; 2) l’autre, centré sur la documentation des corpus visant à explorer les méthodologies d’annotation, à pérenniser les données et à les rendre accessibles aux communautés de chercheurs et de locuteurs et surtout, parmi ces derniers, les enseignants de et en LSF. 2-Choix techniques et méthodologiques pour la constitution, la documentation, la pérennisation et l’édition des corpus. Les méthodes de recueil des données ont été élaborées selon les objectifs propres à chaque sous-projet (LSF enfantine : stimuli pour des tâches descriptives et interaction avec une poupée, en présence d’un adulte ; gestualité naturelle : protocole de test selon une méthode des juges et dialogue dirigé par une tâche de description ; LSF adulte : entretien semi-directif conduit par un enquêteur sourd). Pour les corpus de LSF, la captation est toujours faite selon plusieurs angles de vue (2/3 caméras). Les corpus sont renseignés selon la norme préconisée par le TGE-ADONIS selon les recommandations du CINES pour l’archivage pérenne (norme de métadonnées OLAC, archivage ouvert selon la norme OAI-PMH) en vue d’un archivage, d’une indexation et d’un référencement des corpus sur des métaportails ouverts (Google Scholar, OAIster database). Les annotations de corpus sont faites sous ELAN, selon des normes ouvertes, partageables, interrogeables y compris à distance (mise en ligne des annotations à moyen terme). L’absence de système de transcription stricto sensu contraint à recourir à des logiciels empilant sur une même image les moments clés d’un signe en mouvement. 3- Résultats majeurs du projet Nous avons constitué un corpus de données gestuelles d’une ampleur quantitative et qualitative inédite (voir 4.). Outre la valeur patrimoniale de ce corpus et le vivier de ressources pédagogiques ainsi créé, CREAGEST a permis d’élaborer et tester des schémas d’annotation originaux (langue sans tradition écrite, geste) et d’ouvrir des pistes novatrices (cf. Étude préliminaire d’un module d’annotation en 3D permettant d’enregistrer les coordonnées des positions des 3 degrés de liberté de la main et de l’amplitude des mouvements). Le projet a par ailleurs permis des avancées descriptives notables (expression du déplacement en LSF enfantine, structuration du geste, processus de la lexicogenèse). Enfin, il a donné lieu au développement partiel et/ou à l’élaboration d’un cahier des charges plus ajusté pour des outils d’optimisation du logiciel d’annotation utilisé, ELAN. 4-Production scientifique et brevets depuis le début du projet La production scientifique majeure est un corpus numérisé et pérenne, partiellement annoté (± 1h), de 365 h de LSF adulte et enfantine et 5h de gestualité naturelle, assorti de métadonnées détaillées débouchant sur des propositions de complémentation et normalisation des critères existants (OLAC et IMDI). Les données de LSF ont une représentativité sans précédent par la diversité des âges (enfants de 3 à 15 ans, adultes de 18 à 60 ans), des origines géographiques (4 régions de France) et des genres discursifs (descriptif, explicatif, métalinguistique, narratif).
RAPPORT final Creagest_mars 2012_depot HAL.pdf (1.7 Mo) Télécharger le fichier

Dates et versions

hal-01489531 , version 1 (17-12-2017)

Identifiants

  • HAL Id : hal-01489531 , version 1

Citer

Brigitte Garcia, Marie-Anne Sallandre, Antonio Balvet, Dominique Boutet, Marie-Thérèse L'Huillier, et al.. Rapport final du projet ANR CREAGEST.. [Rapport de recherche] Université Paris 8; Structures Formelles du langage; Université Lille 3 SHS; Université Paris 5 Sorbonne Descartes. 2012. ⟨hal-01489531⟩
594 Consultations
218 Téléchargements

Partager

Gmail Facebook X LinkedIn More