Skip to Main content Skip to Navigation
Conference papers

Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase

Abstract : Finding word cooccurrences and calculating the specificity scores is one of the most popular statistical methods in the analysis of textual data. Within Hyperbase, there is a " theme " feature for this purpose, which is capable of locating words that are used more commonly near a given word form, grammatical structure or lemma. The graphical representation of such an analysis is often challenging ; more than a list of the cooccurring words, it should be able to indicate the order, the score and the relations between pairs of words. Now that Hyperbase has a Web version, this article proposes a new approach for the " theme " feature : the calculation of cooccurrences has been extended to include the second level. The accompanying graphical representation is betting on new visual features in order to simplify reading the results and render the underlying calculation more explicit. Résumé Le calcul des cooccurrents spécifiques d'un mot est une des méthodes statistiques les plus populaires de l'ADT. Le logiciel Hyperbase a introduit cette notion avec la fonction " Th eme " qui rend compte du lexique surutilisé autour d'une forme, d'une structure grammaticale ou d'un lemme. La représentation graphique d'une telle analyse est souvent loin d'ˆ etré evidente. Plus que la simple liste des cooccurrents spécifiques , elle se doit de nous indiquer aussi l'ordre, l'´ ecart ainsi que les relations entre chaque paire de mots. Avec l' arrivée de la version Web d'Hyperbase, nous proposons aujourd'hui une nouvelle approche de cette fonction. Le calcul se voit pour l'occasion approfondi, lui permettant d'identifier la cooccurrence dedeuxì eme niveau. La représentation graphique, quant a elle, fait le pari de simplifier la lecture du résultat de cette analyse tout en explicitant plus précisément les calculs sous-jacents.
Complete list of metadatas

Cited literature [11 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01359413
Contributor : Laurent Vanni <>
Submitted on : Friday, September 2, 2016 - 12:06:29 PM
Last modification on : Tuesday, May 26, 2020 - 6:50:57 PM
Document(s) archivé(s) le : Sunday, December 4, 2016 - 7:59:47 PM

File

85261.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-01359413, version 1

Collections

Citation

Laurent Vanni, Adiel Mittmann. Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase. JADT 2016 - Statistical Analysis of Textual Data, Jun 2016, Nice, France. pp.295-305. ⟨hal-01359413⟩

Share

Metrics

Record views

342

Files downloads

546