Skip to Main content Skip to Navigation
Conference papers

Organisation des données dans un observatoire multilingue en langues écrites et signées

Résumé : En France, l'Académie française a pour mission de défendre la langue française et d'en faire un patrimoine commun à tous les Français et à tous ceux qui pratiquent cette langue. Jusqu'à ce jour la langue des signes française n'a pas bénéficié d'un tel appui. Aujourd'hui pour faire face à cette situation, un outil de référence a vu le jour avec le soutien du Ministère de l'Éducation nationale et de la Délégation générale à la langue française et aux langues de France. Le projet « OCELLES » est un site internet collaboratif bilingue français / LSF qui a pour vocation de proposer, au minimum, pour un concept donné : sa définition et ses signifiants (dans les deux langues), dans tous les champs de la connaissance. Tous les contenus déposés sur ce site (texte, image, vidéo, présentation, …) par les utilisateurs sont ensuite validés par des experts tant sur le fond que sur la forme ou refusés avec justification. Compte tenu des disparités géographiques ou sociologiques, pour un même concept, plusieurs signes peuvent être proposés par les utilisateurs et retenus par les experts. Le projet n'a pas vocation à choisir le « signe idéal » mais à soumettre l'ensemble des propositions aux utilisateurs identifiés qui indiquent s'ils les ont ou non rencontrés et dans quel(s) contexte(s). Une série d'informations est ainsi recueillie pour chaque signe et peut être croisée avec les profils des utilisateurs. Plateforme d'échanges, ce site sert ainsi d'observatoire linguistique. L'une des principales problématiques de l'organisation des données a été d'arriver à concilier les différents points de vue et usages des utilisateurs, L'objectif de cette plateforme n'étant pas d'offrir un simple dictionnaire mais un réseau d'ontologies. L'autre problématique réside dans l'impossibilité de rester sur un modèle figé d'organisation, le site étant amené à évoluer et à s'enrichir à la fois par l'ajout de nouveaux concepts, mais aussi par la prise en compte de nouveaux descripteurs ou de nouvelles fonctionnalités (illustration, homonymies, antonymies, etc.) Après une brève description des objectifs de la plateforme, nous présentons dans cet article cette organisation particulière de données, qui permet par exemple l'utilisation de plusieurs classifications. Nous illustrons l'intérêt de cette approche en critiquant l'utilisation de la classification de Dewey, que nous avons dans un premier temps implémentée malgré ses limites (accès difficile à un concept précis, organisation peu intuitive, concepts récents ou spécifiques à la LSF non référençables, etc.). Nous proposons ensuite de la remplacer par des classifications réalisées directement par les utilisateurs, motivées par leurs attentes et leurs besoins. L'arborescence se construit alors au fur à mesure sous le contrôle des experts de chaque domaine. Chaque contenu est ainsi accompagné de descripteurs et de classificateurs qui lui permettent de jouer différents rôles en fonction du contexte dans lequel il se trouve. Ainsi un contenu peut à la fois être un concept, un thème ou un sous-thème de classification, ou encore une illustration : c'est le contexte d'utilisation qui mobilise les contenus dont il a besoin en fonction de leurs descripteurs et de leurs classificateurs. Nous terminons l'article en mettant en évidence la grande capacité d'évolution de la plateforme, en présentant nos travaux actuels pour l'intégration de recherches directes en LSF via les descripteurs de configuration spatiale. Nous montrons également que cette organisation des données permet un portage facile vers les langues des signes d'autres pays.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01381508
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Friday, October 14, 2016 - 2:47:17 PM
Last modification on : Wednesday, July 8, 2020 - 12:43:36 PM

Identifiers

  • HAL Id : hal-01381508, version 1

Citation

Bruno Mascret, Cédric Moreau. Organisation des données dans un observatoire multilingue en langues écrites et signées. Handicap 2010, Jun 2010, Paris, France. pp.66-71. ⟨hal-01381508⟩

Share

Metrics

Record views

152