Plaidoyer pour la statistique linguistique - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2011

Plaidoyer pour la statistique linguistique

Résumé

Les données textuelles ont des propriétés très avantageuses que Guiraud avait soulignées, dès 1959, deux ans après le colloque de Strasbourg : « La linguistique est la science statistique type ; les statisticiens le savent bien ; les linguistes l’ignorent encore.» Ces données sont d’abord bon marché ; il suffit d’un traitement de texte pour les enregistrer, ou d’un scanner, ou tout simplement d’une liaison à Internet où les textes foisonnent. Elles sont abondantes ; or la statistique se plaît dans les grands nombres et ses conclusions sont moins sûres quand les observations sont en nombre limité parce qu’elles sont chères, ce qui est le cas des enquêtes et des sondages, ou que la nature des choses le veut ainsi, comme il arrive en médecine. Les données textuelles sont faciles à contrôler, à reproduire, à transmettre, à corriger, et se prêtent volontiers à la répétition et aux variations des expériences. Elles sont exemptes de filtrage sélectif et subjectif, et la conscience du chercheur intervient peu à l’entrée. Enfin et surtout les textes sont immédiatement interprétables, sans le truchement des machines. La lecture et la connaissance du texte sont des garants contre les calculs aberrants et les manœuvres avortées. La conscience a au moins une idée de l’ordre de grandeur des résultats attendus et peut les rejeter s’ils sont exagérément erronés ou délibérément triviaux, alors que d’autres disciplines travaillent sans vision directe et se trouvent liées aux instruments, sans possibilité de récuser leur témoignage. Ce qui est un avantage est aussi un inconvénient. Puisqu’en matière littéraire ou linguistique, on peut se débrouiller sans appareillage, pourquoi s’encombrer de méthodes indirectes et grossières qui obscurcissent l’évidence ou brutalisent les nuances. Pour beaucoup d’esprits, le refus d’accueillir les méthodes quantitatives est une manière de réserver un espace de liberté pour la conscience individuelle. Qu’il y ait au moins un domaine préservé, une réserve naturelle comme il y des parcs du même nom pour la sauvegarde des paysages, un refuge contre l’invasion technologique, où puissent vivre et subsister les disciplines menacées : l’art, le langage, la philosophie, la religion, la musique, la cuisine… Là s’arrête notre plaidoirie à charge et à décharge. La défense et illustration de la statistique ne passe pas par des discours mais par des exemples. Nous nous proposons d’en donner quelques-uns.
Fichier principal
Vignette du fichier
16_plaidoyer.pdf (1.92 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01580838 , version 1 (02-09-2017)

Identifiants

  • HAL Id : hal-01580838 , version 1

Citer

Étienne Brunet. Plaidoyer pour la statistique linguistique. Céline Poudat. Ce qui compte. Ecrits choisis tome II, 2, Champion, pp.311-329, 2011, 978-2-7453-2225-8. ⟨hal-01580838⟩
109 Consultations
143 Téléchargements

Partager

Gmail Facebook X LinkedIn More