Corpus spécialisé et ressource de spécialité. L'information forme le sens - Archive ouverte HAL Accéder directement au contenu
Chapitre D'ouvrage Année : 2008

Corpus spécialisé et ressource de spécialité. L'information forme le sens

Résumé

"Semantic Atlas" is a mathematic and statistic model to visualise word senses according to relations between words. The model, that has been applied to proximity relations from a corpus, has shown its ability to distinguish word senses as the corpus' contributors comprehend them. We propose to use the model and a specialised corpus in order to create automatically a specialised dictionary relative to the corpus' domain. A morpho-syntactic analysis performed on the corpus makes it possible to create the dictionary from syntactic relations between lexical units. The semantic resource can be used to navigate semantically - and not only lexically - through the corpus, to create classical dictionaries or for diachronic studies of the language.
Les Atlas sémantiques sont un modèle mathématique et statistique de représentation visuelle de la sémantique lexicale basé sur l'examen des relations entre les mots. Une application de ce modèle à des relations de proximité contextuelle dans un corpus a permis de montrer que le modèle était capable de dénoter le sens des unités lexicales tel qu'il est perçu par les rédacteurs du corpus. Nous nous appuyons sur ce constat pour proposer d'exploiter le modèle afin de construire automatiquement un dictionnaire spécialisé dans un domaine précis par l'analyse d'un corpus représentatif de ce domaine. Tout en conservant le modèle, nous modifions son application en faisant intervenir une analyse morphologique et syntaxique pour établir la réalité des unités lexicales ainsi que les liens entre elles, qui sont dès lors de nature syntaxique. Nous proposons également d'utiliser la ressource produite pour naviguer dans le corpus utilisé considéré comme une base d'information en suivant le sens plutôt que le mot. Enfin, nous proposons d'exploiter cette approche pour aider à la réalisation de dictionnaires plus classiques ou pour étudier la langue en diachronie.
Fichier principal
Vignette du fichier
JacqueminCRTT06.pdf (220.04 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00202570 , version 1 (08-01-2008)
hal-00202570 , version 2 (08-04-2015)

Licence

Paternité - Pas d'utilisation commerciale - Pas de modification

Identifiants

Citer

Bernard Jacquemin, Sabine Ploux. Corpus spécialisé et ressource de spécialité. L'information forme le sens. Maniez, François; Dury, Pascaline; Arlin, Nathalie; Rougemont, Claire. Corpus et dictionnaires de langues de spécialité, Presses Universitaires de Grenoble, pp.197-212, 2008, Travaux du CRTT. ⟨hal-00202570v2⟩
693 Consultations
332 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More