Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase

Résumé

Finding word cooccurrences and calculating the specificity scores is one of the most popular statistical methods in the analysis of textual data. Within Hyperbase, there is a " theme " feature for this purpose, which is capable of locating words that are used more commonly near a given word form, grammatical structure or lemma. The graphical representation of such an analysis is often challenging ; more than a list of the cooccurring words, it should be able to indicate the order, the score and the relations between pairs of words. Now that Hyperbase has a Web version, this article proposes a new approach for the " theme " feature : the calculation of cooccurrences has been extended to include the second level. The accompanying graphical representation is betting on new visual features in order to simplify reading the results and render the underlying calculation more explicit. Résumé Le calcul des cooccurrents spécifiques d'un mot est une des méthodes statistiques les plus populaires de l'ADT. Le logiciel Hyperbase a introduit cette notion avec la fonction " Th eme " qui rend compte du lexique surutilisé autour d'une forme, d'une structure grammaticale ou d'un lemme. La représentation graphique d'une telle analyse est souvent loin d'ˆ etré evidente. Plus que la simple liste des cooccurrents spécifiques , elle se doit de nous indiquer aussi l'ordre, l'´ ecart ainsi que les relations entre chaque paire de mots. Avec l' arrivée de la version Web d'Hyperbase, nous proposons aujourd'hui une nouvelle approche de cette fonction. Le calcul se voit pour l'occasion approfondi, lui permettant d'identifier la cooccurrence dedeuxì eme niveau. La représentation graphique, quant a elle, fait le pari de simplifier la lecture du résultat de cette analyse tout en explicitant plus précisément les calculs sous-jacents.
Fichier principal
Vignette du fichier
85261.pdf (1.69 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-01359413 , version 1 (02-09-2016)

Identifiants

  • HAL Id : hal-01359413 , version 1

Citer

Laurent Vanni, Adiel Mittmann. Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase. JADT 2016 - Statistical Analysis of Textual Data, Jun 2016, Nice, France. pp.295-305. ⟨hal-01359413⟩
298 Consultations
590 Téléchargements

Partager

Gmail Facebook X LinkedIn More