ON COUNTING MEANINGFUL UNITS IN TEXTS - Archive ouverte HAL Access content directly
Conference Papers Year : 1995

ON COUNTING MEANINGFUL UNITS IN TEXTS

Abstract

We analyse a sample text. By identifying compounds and other sequences of words between which strong dependencies hold, we embed simple words that have no meaning by themselves into larger units that do carry specific meaning. Hence, the counts of simple words, and those of the units marked by our method become quite different. The analysis presented is operational to a large extent.
L'analyse syntaxique automatique, première étape d'une procédure d'interprétation fine des textes par ordinateur, a recours à des outils comme les grammaires et les dictionnaires. Ces outils, tels qu'ils sont actuellement disponibles, ne sont pas suffisants. Ils doivent en effet prendre une forme électronique qui impose des révisions majeures de leur forme et contenu. Nous présentons une méthodologie linguistique qui a permis de construire des outils électroniques à large couverture des langues. Ces nouveaux outils mettent en évidence des unités linguistiques signifiantes, ce qui conduit à une modification substantielle de l'analyse du contenu des textes.
Fichier principal
Vignette du fichier
Rome.pdf (247.62 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

halshs-00278312 , version 1 (11-05-2008)

Identifiers

  • HAL Id : halshs-00278312 , version 1

Cite

Maurice Gross. ON COUNTING MEANINGFUL UNITS IN TEXTS. JADT, 1995, Rome, Italy. pp.5-18. ⟨halshs-00278312⟩

Collections

UNIV-PARIS7 CNRS
120 View
184 Download

Share

Gmail Facebook X LinkedIn More