Un devin de microstructures pour importer ou normaliser des ressources lexicales - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

A micro-structure guesser to import or normalize lexical resources

Un devin de microstructures pour importer ou normaliser des ressources lexicales

Résumé

In this article, we present a tool to annotate an unstructured or semi-structured resource, in order to automate the import of its data in a generic environment that facilitates and standardizes its use. This tool is based on the computation of a signature, characterizing the resource with accounting information about its elements, and on heuristics using signature statistics to identify the entries and microstructure of each entry in the case of a lexical resource to be imported into the Jibiki lexical database platform. The product result is managed in iPolex, a lexical data warehouse dedicated to processing lexical resource files to add metadata. The Jibiki platform accesses iPoLex to directly import lexical resources. The import process thus constituted is used to create and populate lexical bases in Jibiki. The imported resources are then available for consultation and editing online
Dans cet article, nous présentation un outil pour annoter une ressource non structurée ou semi-structurée, de façon à automatiser l'import de ses données dans un environnement générique facilitant et uniformisant son exploitation. Cet outil s'appuie sur le calcul d'une signature, caractérisant la ressource par des informations comptables sur ses éléments, et sur des heuristiques exploitant les statistiques de la signature pour repérer les entrées et la microstructure de chaque entrée dans le cas d'une ressource lexicale à importer dans la plateforme de bases lexicales Jibiki. Le résultat produit est géré dans iPolex, un entrepôt dédié aux traitements de fichiers de ressources lexicales permettant d'y ajouter des méta-données. La plateforme Jibiki accède à iPoLex pour importer directement des ressources lexicales bien formées et suffisamment renseignées. Le processus d'import ainsi constitué est utilisé pour créer et peupler des bases lexicales dans Jibiki. Les ressources ainsi importées sont ensuite consultables et éditables en ligne.
Fichier principal
Vignette du fichier
LTT2018_MMVB.pdf (519.21 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02063815 , version 1 (11-03-2019)

Identifiants

  • HAL Id : hal-02063815 , version 1

Citer

Mathieu Mangeot, Valérie Bellynck. Un devin de microstructures pour importer ou normaliser des ressources lexicales. Lexicologie Terminologie Traduction LTT 2018, Sep 2018, Grenoble, France. ⟨hal-02063815⟩
73 Consultations
56 Téléchargements

Partager

Gmail Facebook X LinkedIn More