Nouveau traitement des cooccurrences - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue Corpus Année : 2012

Nouveau traitement des cooccurrences

Résumé

New Statistical Processing of Co-occurences by HYPERBASE. The co-occurrences have mainly been studied to establish semantic relations, i.e., the relation in-between words. Certainly, they use to be extracted from a corpus, but indiscriminately, without taking into consideration the text divisions. When dealing with simple words, the usual approach is the comparison of texts. Here, we propose to extend those methods, approved at the lexical level, and to enlarge the application of statistical tools even to co-occurrential data.
Les coocurrences ont surtout servi jusqu’ici à établir les relations, principalement sémantiques, que les mots ont entre eux. On les relevait certes dans un corpus, mais de façon indifférenciée, sans opposer les textes les uns aux autres. Or la comparaison des textes est la démarche habituelle quand la lexicométrie s’occupe des mots simples. On se propose ici d’étendre aux données cooccurrentielles les méthodes et les outils statistiques qui ont fait leurs preuves au niveau lexical.
Fichier principal
Vignette du fichier
Brunet-cooccurrences.pdf (2.41 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01371386 , version 1 (21-05-2020)

Identifiants

  • HAL Id : hal-01371386 , version 1

Citer

Étienne Brunet. Nouveau traitement des cooccurrences. Corpus, 2012, La cooccurrence, du fait statistique au fait textuel, 11, pp.219-246. ⟨hal-01371386⟩
133 Consultations
72 Téléchargements

Partager

Gmail Facebook X LinkedIn More