Hugométrie - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2002

Hugométrie

Résumé

Nous empruntons ce titre à un livre de Charles Muller qui vient de paraître, à l'occasion du Bicentenaire de la naissance du poète, et où le promoteur de la statistique linguistique appelle de ses voeux la réalisation d'une base hugolienne enfin complète. Pourquoi ne pas faire pour Hugo ce qu'on a fait pour Voltaire Balzac, Dumas, Chateaubriand et beaucoup d'autres? Exploitant les données disponibles en 1988 à l'Institut National de la langue française, nous avions certes réalisé une étude, dont Muller avait écrit la préface. Mais Muller y regrettait l'absence de textes majeurs, non encore dépouillés : "Que bientôt le corpus de Nancy devienne le corpus de Hugo! Que les Chants du crépuscule viennent rejoindre les Contemplations; qu'avant 1993 Quatre-vingt-treize et les Châtiments prennent la place qu'ils méritent; que l'Art d'être grand-père ne reste pas en pénitence; que Cromwell et sa Préface sortent de l'ombre; et, malgré les aspérités des textes inachevés, que Dieu rejoigne Satan!" On verra que ces lacunes ont été comblées et beaucoup d'autres que Muller avait omises. L'accès à un corpus hugolien plus large ou plus pur n'est pourtant pas notre préoccupation première. L'objectif principal était d'assurer un traitement plus élaboré où les mots ne seraient plus seulement des graphies, mais des vocables ou des lemmes. L'examen des homographes ne peut s'exercer que dans le texte même, et c'est ce à quoi nous nous sommes employé ici, en recourant à un véritable logiciel d'étiquetage et de lemmatisation, dérivé de Cordial. (Une base plus récente peut être téléchargée gratuitement sur internet sous le nom HUGOPROSE et à l’adresse http://logometrie.unice.fr/pages/bases/. À la même adresse une base HUGOVERS est aussi disponible, avec 14 recueils poétiques s’ajoutant à 30 textes de prose. Le logiciel HYPERBASE est également téléchargeable pour traiter n’importe quel ensemble de textes, et particulièrement ceux qui n’ont pas encore trouvé place dans les bases hugoliennes.)
Fichier principal
Vignette du fichier
hugoCLUJ.pdf (688.41 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01562323 , version 1 (13-07-2017)

Identifiants

  • HAL Id : hal-01562323 , version 1

Citer

Étienne Brunet. Hugométrie. Colloque Victor Hugo, Université de CLUJ (Roumanie), Apr 2002, Cluj Roumanie. ⟨hal-01562323⟩
127 Consultations
58 Téléchargements

Partager

Gmail Facebook X LinkedIn More