Vers un Système d'Annotation Automatique de Documents Historiques basé sur les Techniques des Modèles Markoviens
Résumé
Dans notre travail nous avons réalisé un système qui représente les documents du même domaine par un schéma XML. Un algorithme de Mapping est appliqué entre le schéma de référence et un nouveau schéma spécifique pour identifier les correspondances entre les deux schémas. La modélisation des schémas XML a été réalisée en utilisant les modèles de Markov. La pertinence de Mapping est calculée selon les probabilités retournées par les modèles de Markov. Les tests ont étés effectuées sur des schémas XML représentant 5 domaines et variant de 60 à 100 schémas par domaine. Pour le premier modèle éveloppé le taux de Mapping varie d'une manière croissante par rapport aux nombres communs de noeuds entre les deux schémas source et cible. Pour le deuxième modèle le taux de Mapping varie en fonction du nombre de noeuds en communs entre les deux schémas d'une manière aléatoire entre 0.05 et 0.4.
Domaines
Traitement du texte et du document
Origine : Fichiers produits par l'(les) auteur(s)
Loading...