Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase

Abstract : Finding word cooccurrences and calculating the specificity scores is one of the most popular statistical methods in the analysis of textual data. Within Hyperbase, there is a " theme " feature for this purpose, which is capable of locating words that are used more commonly near a given word form, grammatical structure or lemma. The graphical representation of such an analysis is often challenging ; more than a list of the cooccurring words, it should be able to indicate the order, the score and the relations between pairs of words. Now that Hyperbase has a Web version, this article proposes a new approach for the " theme " feature : the calculation of cooccurrences has been extended to include the second level. The accompanying graphical representation is betting on new visual features in order to simplify reading the results and render the underlying calculation more explicit. Résumé Le calcul des cooccurrents spécifiques d'un mot est une des méthodes statistiques les plus populaires de l'ADT. Le logiciel Hyperbase a introduit cette notion avec la fonction " Th eme " qui rend compte du lexique surutilisé autour d'une forme, d'une structure grammaticale ou d'un lemme. La représentation graphique d'une telle analyse est souvent loin d'ˆ etré evidente. Plus que la simple liste des cooccurrents spécifiques , elle se doit de nous indiquer aussi l'ordre, l'´ ecart ainsi que les relations entre chaque paire de mots. Avec l' arrivée de la version Web d'Hyperbase, nous proposons aujourd'hui une nouvelle approche de cette fonction. Le calcul se voit pour l'occasion approfondi, lui permettant d'identifier la cooccurrence dedeuxì eme niveau. La représentation graphique, quant a elle, fait le pari de simplifier la lecture du résultat de cette analyse tout en explicitant plus précisément les calculs sous-jacents.
Type de document :
Communication dans un congrès
Damon Mayaffre; Céline Poudat; Laurent Vanni; Véronique Magri; Peter Follette. JADT 2016 - Statistical Analysis of Textual Data, Jun 2016, Nice, France. Presses de FacImprimeur, JADT 2016 - Statistical Analysis of Textual Data, 1, pp.295-305, 2016, Statistics Analysis of Textual Data
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01359413
Contributeur : Laurent Vanni <>
Soumis le : vendredi 2 septembre 2016 - 12:06:29
Dernière modification le : jeudi 13 octobre 2016 - 14:11:33
Document(s) archivé(s) le : dimanche 4 décembre 2016 - 19:59:47

Fichier

85261.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-01359413, version 1

Collections

Citation

Laurent Vanni, Adiel Mittmann. Cooccurrences spécifiques et représentations graphiques, le nouveau " Thème " d'Hyperbase. Damon Mayaffre; Céline Poudat; Laurent Vanni; Véronique Magri; Peter Follette. JADT 2016 - Statistical Analysis of Textual Data, Jun 2016, Nice, France. Presses de FacImprimeur, JADT 2016 - Statistical Analysis of Textual Data, 1, pp.295-305, 2016, Statistics Analysis of Textual Data. 〈hal-01359413〉

Partager

Métriques

Consultations de
la notice

98

Téléchargements du document

100