Méthodologie de matching à large échelle pour des schémas XML

Sana Sellami 1
1 SOC - Service Oriented Computing
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : De l’intégration des schémas de bases de données jusqu’à l’alignement d’ontologies, la problématique qui a suscité le plus de points ardus à résoudre cette dernière décennie est la recherche des correspondances. Nous nous intéressons plus particulièrement au matching. Le matching est un processus qui vise à identifier et découvrir les correspondances sémantiques entre différents formats de données tels que les schémas, les ontologies,… Cependant, dès que l’on passe à un contexte à large échelle, plusieurs problèmes se posent tels que . les problèmes d'efficacité en termes de temps d'exécution et de qualité des résultats. L’objectif de notre travail est de relever le challenge du matching à grande échelle. En particulier, nous proposons une méthodologie de matching à large échelle, basée sur une approche hybride et structurée en trois phases (pré-matching, matching et post-matching), qui vise à optimiser le matching en s’appuyant notamment sur une phase préalable de prétraitement. Ce prétraitement se base sur des techniques d’analyse, de traitement linguistique des éléments des schémas et une approche de décomposition des schémas. La décomposition est une approche holistique qui consiste à diviser les schémas en sous schémas tout en identifiant ceux qui sont linguistiquement similaires. L’utilisation d’une telle approche nécessite des techniques qui passent à l’échelle et qui permettent un traitement d’un grand nombre de données en une seule fois. La méthodologie proposée est supportée par une plateforme nommée PLASMA (Platform for LArge Schema MAtching) que nous avons développée pour des besoins d’évaluation et d’expérimentations. Nous avons pu ainsi démontrer grâce aux expérimentations réalisées que notre système offre des résultats fiables pour des schémas très volumineux et que grâce à la méthodologie mise au point, nous avons réussi à améliorer les performances du matching en temps d’exécution.
Type de document :
Pré-publication, Document de travail
4535; T. 2009
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01459863
Contributeur : Équipe Gestionnaire Des Publications Si Liris <>
Soumis le : mardi 7 février 2017 - 14:56:33
Dernière modification le : mercredi 8 février 2017 - 01:05:26

Identifiants

  • HAL Id : hal-01459863, version 1

Collections

Citation

Sana Sellami. Méthodologie de matching à large échelle pour des schémas XML. 4535; T. 2009. 〈hal-01459863〉

Partager

Métriques

Consultations de la notice

211