La linguistique est-elle soluble dans la statistique ?
Résumé
This paper examines to what extent the massive availability of textual data in digital form has recently changed the way people carry out research in linguistics. Several subfields of the domain require large amounts of attested data : here, we primarily consider the case of corpus linguistics and natural language processing. We consider recent breakthroughs but also the main limitations of current approaches based on massive data. We will adopt an epistemological point of view, rather than a technical or historical one.
Cet article porte sur la façon dont l'arrivée massive de données textuelles sur support numérique a récemment changé la façon de faire des recherches en linguistique. Plusieurs branches de la linguistique travaillent à partir de grands ensembles de données attestées : nous examinerons essentiellement le cas de la linguistique de corpus et celui du traitement automatique des langues. Nous essaierons de mettre en avant les ruptures, les avancées mais aussi les limites des approches reposant sur des données massives. Notre regard sera donc avant tout épistémologique, davantage que technique ou historique.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...