Que recèlent les données textuelles issues du web ? - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Que recèlent les données textuelles issues du web ?

Résumé

La collecte et l’usage opportunistes de données textuelles tirées du web sont sujets à une série de problèmes éthiques, méthodologiques et épistémologiques qui méritent l’attention de la communauté scientifique. Nous présentons des études empiriques de leur impact en linguistique et TAL centrées sur la forme (méthodes d’extraction des données) ainsi que sur le fond (contenu des corpus).
Fichier principal
Vignette du fichier
178.pdf (405.62 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02750223 , version 1 (05-06-2020)
hal-02750223 , version 2 (17-06-2020)
hal-02750223 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02750223 , version 3

Citer

Adrien Barbaresi, Gaël Lejeune. Que recèlent les données textuelles issues du web ?. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). 2e atelier Éthique et TRaitemeNt Automatique des Langues (ETeRNAL), 2020, Nancy, France. pp.19-28. ⟨hal-02750223v3⟩
137 Consultations
70 Téléchargements

Partager

Gmail Facebook X LinkedIn More