Designing Data Warehouse : A group collaborative approach - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2020

Designing Data Warehouse : A group collaborative approach

Développer un entrepôt de données : Une approche collaborative de groupe

Résumé

Data warehouses (DWs) are widely known for their powerful analysis capabilities that serve either for historic data investigation or for predictions of potentially continuous phenomena. However, they are still in most cases limitedly used except by enterprises or governments while, with the huge amounts of data produced and collected by the Web2.0 technologies, many other unusual users might benefit from analysing their data if DWs are properly dedicated to their specific needs. They might be association adherents, online community members, observatory volunteers, etc. Unlike in classical contexts, requirements engineering RE with volunteers lacks group cohesion and straightforward strategic objectives. This is hence because they come with different backgrounds and they do not have an acknowledged representative leadership, which would very likely lead to multiple contradictory interpretations of the data and consequently of conflictual requirements. When stakeholders have divergent goals, it becomes problematic to maintain an agreement between them, especially when it comes to eliciting DW requirements whose future use is meant to serve as larger interested public as it possibly could. In this work, we propose a new generic and participative DW design methodology that relies on a Group Decision Support System (GDSS) to support the collaboration of the engaged volunteers. We suggest in this methodology two RE scenarios, (i) using GDSS for a collaborative elicitation when groups of users with common objectives are identifiable or (ii) with pivot tables and rapid prototyping formalisms when only individual volunteers are participating. Then, we reduce the number of the resulting models by fusing them based on their multidimensional (MD) similarities. The fused models require a further refinement that focuses on solving the remaining subject matter inconsistencies that are due to either erroneous definitions of unspecialized volunteers or to conceptually admissible, but irrelevant to the application domain, newly generated elements after the fusion. This is handled by the “collaborative resolution of requirement conflicts” step that we defined two methods for its execution. The first is a simplified collaborative method that we evaluate in which each model’s MD elements against a reduced number of criteria that apply for each component’stype using an existing GDSS that allows the collaborative process execution. The second is a profile-aware method that we suggest for which a more detailed set of evaluation criteria and adaptability of the collaborative process to allow its use by both crowdsourcing and enterprise DW design projects. As GDSS are designed to support a group engaged in a collective decision process, which is the main tool that we rely on which in two stages of our methodology i.e. RE and collaborative refinement of the fused models, we also propose a new GDSS that we adopted in its architecture the concept of Thinklets i.e. a well-known design pattern for collaborative processes. In addition to the group activities reproducibility that offers the concept of Thinklets, we have as well implemented a recommender system prototype that is mainly based on a hierarchical division of decision categories and an automatization of certain assistive functionalities to allow a guided and appropriate use of the system devoted to the facilitator. This has been done after a set of experiments conducted with real volunteer users engaged in solving risk management and uncertainty group problems. The new GDSS that we suggest introduces a customized implementation of certain Thinklets in order to improve their suitability to our methodology as well as for novice and inexperienced users from a more general perspective. In addition to that, we propose a new Thinklet, namely CollaborativeDW, that allows a fluid configuration and dynamic execution of our second refinement method i.e. the profile-aware approach, and that we have tested with real users.
Les entrepôts de données (EDs) sont connus pour leurs puissantes capacités d'analyse qui servent soit à la fouille de données historiques soit à la prévision de phénomènes potentiellement continus. Cependant, dans la plupart des cas, ils sont encore utilisés de manière limitée, sauf par les entreprises ou les gouvernements alors que, avec les énormes quantités de données produites et collectées par les technologies Web 2.0, de nombreux autres utilisateurs inhabituels pourraient bénéficier de l'analyse de leurs données si les EDs sont correctement dédiés à leurs besoins spécifiques. Il peut s'agir d'adhérents à une association, de membres d’une communauté en ligne, de volontaire d’un observatoire, etc. Contrairement aux contextes classiques, l’ingénierie des exigences (IE) avec les volontaires manque de cohésion de groupe et d'objectifs stratégiques précis. En effet, ils viennent d'horizons différents et n'ont pas un leadership représentatif reconnu, ce qui conduirait très probablement à de multiples interprétations contradictoires des données et par conséquent à des exigences conflictuelles. Lorsque les parties prenantes ont des objectifs divergents, il devient problématique de maintenir un accord entre elles, en particulier lorsqu'il s'agit d’éliciter des exigences d'ED dont l'utilisation future est destinée à servir le plus grand public intéressé possible. Dans ce travail, nous proposons une nouvelle méthodologie de conception participative d’ED, qui s'appuie sur un système d'aide à la décision de groupe (GDSS). Nous proposons deux scénarios d'IE (i) utiliser le GDSS pour une élicitation collaborative lorsque des groupes d'utilisateurs ayant des objectifs communs sont identifiables ou (ii) avec des tableaux croisés dynamiques et des formalismes de prototypage rapide lorsque seuls des volontaires individuels y participent. Ensuite, nous réduisons le nombre de modèles résultants en les fusionnant en fonction de leurs similitudes multidimensionnelles (MD). Les modèles fusionnés nécessitent une amélioration supplémentaire qui se concentre sur la résolution des incohérences causées soit par des définitions erronées de volontaires non spécialisés, soit par des éléments, conceptuellement admissibles mais sans rapport avec le domaine d'application, qui sont nouvellement générés après la fusion. Ceci est géré par la résolution collaborative des conflits d'exigences que nous avons défini au travers des deux méthodes précédemment évoquées. (i) Une méthode collaborative simplifiée que nous évaluons dans laquelle les éléments MD par rapport à un nombre réduit de critères en utilisant un GDSS existant qui permet l'exécution du processus collaboratif (PC). (ii) Une méthode sensible au profil que nous suggérons pour laquelle un ensemble plus détaillé de critères d'évaluation et une adaptabilité du PC pour permettre son utilisation à la fois dans des projets de crowdsourcing et d'entreprise. Nous proposons également un nouveau GDSS dans lequel nous nous sommes inspirés dans son architecture du concept de Thinklet, qui est un modèle de conception bien connu dans la littérature pour les PCs. En plus de la reproductibilité des activités de groupe qu’offrent les Thinklets, nous avons implémenté un prototype d’un système de recommandation qui est basé sur une hiérarchisation des catégories de décision pour permettre une utilisation guidée et appropriée du système pour le facilitateur. Cela a été testé par des expériences menées avec de vrais utilisateurs volontaires engagés dans la résolution de problèmes de gestion de risques et d'incertitude. Nous introduisons dans ce GDSS une implémentation personnalisée de certains Thinklets afin d'améliorer leur adéquation à notre méthodologie ainsi qu'aux utilisateurs novices et inexpérimentés dans une perspective plus générale. En plus de cela, nous proposons un nouveau Thinklet, à savoir CollaborativeDW, qui permet une configuration dynamique de notre deuxième méthode de résolution de conflits, et que nous avons testée avec de vrais utilisateurs.
Fichier principal
Vignette du fichier
Amir-Sakka-PhD-Manuscript-v2.pdf (6.43 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-03726740 , version 1 (18-07-2022)

Identifiants

  • HAL Id : tel-03726740 , version 1

Citer

Amir Sakka. Designing Data Warehouse : A group collaborative approach. Artificial Intelligence [cs.AI]. Université Toulouse 1 Capitole (UT1 Capitole), 2020. English. ⟨NNT : ⟩. ⟨tel-03726740⟩
89 Consultations
34 Téléchargements

Partager

Gmail Facebook X LinkedIn More