Que recèlent les données textuelles issues du web ? - Archive ouverte HAL Access content directly
Conference Papers Year : 2020

Que recèlent les données textuelles issues du web ?

Abstract

La collecte et l’usage opportunistes de données textuelles tirées du web sont sujets à une série de problèmes éthiques, méthodologiques et épistémologiques qui méritent l’attention de la communauté scientifique. Nous présentons des études empiriques de leur impact en linguistique et TAL centrées sur la forme (méthodes d’extraction des données) ainsi que sur le fond (contenu des corpus).
Fichier principal
Vignette du fichier
178.pdf (267 Ko) Télécharger le fichier
Origin : Publisher files allowed on an open archive
Loading...

Dates and versions

hal-02750223 , version 1 (05-06-2020)
hal-02750223 , version 2 (17-06-2020)
hal-02750223 , version 3 (23-06-2020)

Licence

Attribution - NonCommercial - NoDerivatives

Identifiers

  • HAL Id : hal-02750223 , version 1

Cite

Adrien Barbaresi, Gaël Lejeune. Que recèlent les données textuelles issues du web ?. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition), 2020, Nancy, France. pp.19-28. ⟨hal-02750223v1⟩
137 View
70 Download

Share

Gmail Facebook X LinkedIn More