Techniques de TAL et corpus pour faciliter les formulations en anglais scientifique écrit - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Techniques de TAL et corpus pour faciliter les formulations en anglais scientifique écrit

Résumé

This paper presents adaptations of the query options integrated into the online corpus Scientext so as to better serve a new audience: French scientists writing in English. We added pre-coded queries that display the contexts in which authors of scientific articles in English state their research objective. Furthermore, new functional options enrich the ScienQuest interface allowing results to be filtered for noise and then saved for consultation by a larger public. Previous studies on the scientific discourse and rhetoric of scientific articles have highlighted the importance of establishing and occupying a research niche. Here, francophone researchers and doctoral students without prior discursive knowledge, can access authentic and multiple ways of formulating a research objective. Our evaluation of a test corpus showed an overall accuracy of 86.5 %.
Nous présentons l'adaptation de la base d'écrits scientifiques en ligne Scientext pour un « nouveau » public : chercheurs et autres auteurs français d'écrits scientifiques, ayant besoin de rédiger en anglais. Cette adaptation a consisté à ajouter dans la base des requêtes précodées qui permettent d'afficher les contextes dans lesquels les auteurs d'articles scientifiques en anglais expriment leur objectif de recherche et à enrichir l'interface ScienQuest de nouvelles fonctionnalités pour mémoriser et réafficher les contextes pertinents, pour faciliter la consultation par un public plus large. Les nombreuses descriptions linguistiques de la rhétorique des articles scientifiques insistent sur l'importance de la création et de l'occupation d'une « niche » de recherche. Chercheurs et doctorants ont ici un moyen d'en visualiser des exemples sans connaître sa formulation a priori, via nos requêtes. Notre évaluation sur le corpus de test en donne une précision globale de 86,5 %.

Domaines

Linguistique
Fichier principal
Vignette du fichier
taln-2013-long-011.pdf (975.5 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-01911451 , version 1 (02-11-2018)

Identifiants

  • HAL Id : hal-01911451 , version 1

Citer

Marie-Paule Jacques, Laura M. Hartwell, Achille Falaise. Techniques de TAL et corpus pour faciliter les formulations en anglais scientifique écrit. 20e conférence sur le Traitement automatique des langues (TALN'2013), Jun 2013, Les Sables d'Olonne, France. ⟨hal-01911451⟩
212 Consultations
99 Téléchargements

Partager

Gmail Facebook X LinkedIn More