Ce que disent les chiffres - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 1999

Ce que disent les chiffres

Résumé

L'histoire de la langue a-t-elle besoin de chiffres? La langue est une réalité familière, une donnée immédiate, à laquelle la conscience a un accès direct. De même qu'on a conscience du temps qui passe, même sans horloge, ou du temps qu'il fait, même sans thermomètre, ainsi le sentiment linguistique se fait jour sans aide extérieure, sans qu'un appareil enregistreur soit nécessaire pour capter les représentations intérieures. Peut-on d'ailleurs imaginer quelque détecteur de mensonge ou de langage qui ne soit lui-même un mensonge? Reste qu'assez souvent ces phénomènes mentaux se manifestent au-dehors par le langage. Dès qu'est franchi le mur du son ou de l'écriture, la technique peut installer ses micros, ses appareils, ses pièges à paroles. Des montagnes de documents enregistrés s'accumulent chaque jour dans les agences de presse, les salles de rédaction, les studios de radio ou de télévision et même dans les entreprises où l'information compte autant que l'argent et où s'impose l'obligation de la veille technologique. Mais cette masse hétéroclite et sans cesse renouvelée de documents écrits, iconographiques ou sonores produit de redoutables engorgements, dont se dégagent difficilement les méthodes les plus sophistiquées et les plus puissantes de l'informatique et de la statistique. Ce n'est pourtant pas à Lycos qu'il faut s'adresser, non plus qu'à d'autres services comme Yahoo, AltaVista ou Infoseek, pour l'étude de la langue française - dont, au reste, on se sert peu sur Internet. Les informations qu'on en tirerait n'auraient guère d'intérêt linguistique, sinon pour constater que l'orthographe française y est souvent malmenée et les signes diacritiques sacrifiés. Et surtout la faible profondeur dans le temps, sinon dans l'espace, du champ d'observation interdirait tout point de vue comparatif et historique. Car la démarche statistique - et celle de l'historien a des exigences semblables - suppose que les faits soient étudiés à intervalles réguliers et confrontés les uns aux autres, aucune mesure, si précise soit-elle ne fournissant la moindre indication tant qu'elle n'est pas rapportée à quelque autre. Or depuis quelques mois Internet autorise de telles mesures, si l'on consulte, par ce canal, la meilleure des bases de données linguistiques qui existe au monde: Frantext. Avec près de 3000 textes de la littérature nationale, engrangés méthodiquement depuis trente ans, Frantext n'a guère d'équivalent dans les autres langues, ni pour l'étendue, ni pour l'homogénéité des données, ni même - cela est nouveau - pour leur accessibilité.
Fichier principal
Vignette du fichier
chaurand6.pdf (6.06 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01564077 , version 1 (18-07-2017)

Identifiants

  • HAL Id : hal-01564077 , version 1

Citer

Étienne Brunet. Ce que disent les chiffres : Aperçu statistique sur le vocabulaire français . J. Chaurand. Nouvelle histoire de la langue française, Seuil, pp.675-727, 1999, 978-2-02-107238-9. ⟨hal-01564077⟩
106 Consultations
119 Téléchargements

Partager

Gmail Facebook X LinkedIn More