Définition et conception d'une interface pour l'exploitation de corpus arborés pour non-informaticiens : la plateforme ScienQuest du projet Scientext

Résumé : La communauté du TAL développe de nombreux corpus, souvent librement disponibles, disposant d'annotations riches. Toutefois, ces annotations sont difficilement accessibles pour des chercheurs ayant peu d'expertise en informatique. Si la communauté du TAL souhaite ouvrir ses corpus à un public plus large de chercheurs non-informaticiens, elle doit impérativement concevoir et déployer des interfaces simples à manipuler, permettant l'exploitation de ces annotations par des non-informaticiens. Or, l'exploitation de corpus annotés pour le public non spécialiste n'est pas un problème trivial. Dans cet article, nous présentons un outil, ScienQuest, développé afin de démocratiser l'accès aux corpus d'écrits scientifiques, français et anglais, du projet Scientext. Cette plateforme permet d'explorer librement ces corpus en ligne, pour effectuer de recherches portant sur les parties textuelles, les parties du discours et les fonctions syntaxiques, avec un soin particulier porté à l'accessibilité. L'environnement ScienQuest est ouvert à d'autres corpus, et devrait permettre rapidement d'intégrer de nouvelles ressources textuelles libres.
Document type :
Journal articles
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-00953676
Contributor : Gilles Sérasset <>
Submitted on : Friday, February 28, 2014 - 2:41:09 PM
Last modification on : Monday, February 11, 2019 - 4:36:02 PM

Identifiers

  • HAL Id : hal-00953676, version 1

Collections

Citation

Achille Falaise, Agnès Tutin, Olivier Kraif. Définition et conception d'une interface pour l'exploitation de corpus arborés pour non-informaticiens : la plateforme ScienQuest du projet Scientext. Traitement Automatique des Langues, ATALA, 2012. ⟨hal-00953676⟩

Share

Metrics

Record views

196