Designing Representations for Digital Documents - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2022

Designing Representations for Digital Documents

Conception de représentations pour les documents numériques

Résumé

Millions of users work with documents for their everyday tasks but their user interfaces have not fundamentally changed since they were first designed in the late seventies. Today’s computers come in many forms and are used by a wide variety of users for a wide range of tasks, challenging the limits of current document interfaces. I argue that by focusing on extreme users and taking on a principled perspective, we can design effective and flexible representations to support document-related knowledge work. I first study one of the most common document tasks, text editing, in the context of technical documents. By focusing on legal professionals, one example of extreme document users, we reveal the limits of current word processors. Legal professionals must rely on their memory to manage dependencies and maintain consistent vocabulary within their technical documents. To address these issues, we introduce Textlets, interactive objects that reify text selections into persistent items. We present a proof-of-concept prototype demonstrating several use cases, including selective search and replace, word count, and alternative wording. The observational evaluation shows the usefulness and effectiveness of textlets, providing evidence of the validity of the textlet concept. During my work with legal professionals in the first project, I was introduced to the domain of patent writing and filling. In the patent process, patent attorneys write patent submissions that describe the invention created by the inventor. Patent examiners review the submission and decide whether the submission can be granted as a patent. In collaboration with a European Patent Office, I studied the patent examiners’ search and review process. The study reveals the need to manage text from multiple documents across various interconnected activities, including searching, collecting, annotating, organizing, writing and reviewing, while manually tracking their provenance. I extend Textlets to create Passages, text selection objects that can be manipulated, reused, and shared across multiple tools. Two user studies show that Passages facilitate knowledge workers practices and enable greater reuse of information. These two projects led to another important aspect of knowledge work: file management. I focus on scientists, another example of extreme knowledge workers, to study their document management practices. In an age where heterogeneous data science workflows are the norm, instead of relying on more self-contained environments such as Jupyter Notebooks, scientists work across many diverse tools. They have difficulties using the file system to keep track of, re-find and maintain consistency among related but distributed information. We created FileWeaver, a system that automatically detects dependencies among files without explicit user action, tracks their history, and lets users interact directly with the graphs representing these dependencies and version history. By making dependencies among files explicit and visible, FileWeaver facilitates the automation of workflows by scientists and other users who rely on the file system to manage their data. These three document representations rely on the same underlying theoretical principles: reification, polymorphism and reuse. I reflect on my experience designing and evaluating these representations and propose three new design principles: granularity, individuality and synchronization. Together with the empirical findings from three examples of extreme users, technological demonstration of three proof-of-concept prototypes and three design principles, this thesis demonstrates fresh new approaches to working with documents, a fundamental representation in GUIs. I argue that we should not accept current desktop interfaces as given, and that by taking on a principled and theory-driven perspective we can contribute innovative interface concepts.
Des millions d’utilisateurs travaillent à l’aide de documents afin d’effectuer leurs tâches quotidiennes, mais les interfaces utilisateurs n’ont pas fondamentalement changé depuis leur première conception à la fin des années 70. Les ordinateurs d’aujourd’hui sont utilisés par une grande variété d’utilisateurs pour réaliser un large éventail de tâches, ce qui interroge les limites des interfaces actuelles. Je soutiens qu’en se concentrant sur les utilisateurs extrêmes et en adoptant une perspective fondée sur des principes de conception, nous pouvons concevoir des représentations efficaces et flexibles pour soutenir le travail de connaissance lié aux documents. J’étudie d’abord l’une des tâches les plus courantes, à savoir le traitement de texte dans le contexte des documents techniques. En nous concentrant sur les professionnels du droit, nous mettons en lumière les limites des logiciels de traitement de texte actuels. Les professionnels du droit doivent faire appel à leur mémoire pour gérer les dépendances et maintenir un vocabulaire cohérent dans leurs documentations. Pour résoudre ces problèmes, nous introduisons Textlets, des objets interactifs qui réifient les sélections de texte en éléments persistants. Nous présentons un prototype de preuve de concept démontrant plusieurs cas d’utilisation, notamment la recherche et le remplacement sélectifs, le comptage des mots et les mots alternatifs. L’évaluation observationnelle montre l’utilité et l’efficacité de Textlets, ce qui prouve la validité du concept. Au cours de mon travail avec des professionnels du droit, j’ai été initié à la rédaction et au dépôt de brevets. Dans le processus de brevetage, les avocats rédigent des demandes de brevet qui décrivent une invention donnée. Les examinateurs de brevets étudient la demande et décident si un brevet peut lui être accordé. En collaboration avec l’Office européen des brevets, j’ai étudié le processus de recherche et de révision des examinateurs de brevets. L’étude montre la nécessité de gérer le texte de plusieurs documents à travers diverses activités interconnectées, tout en suivant manuellement leur provenance. Je prolonge Textlets pour créer Passages, des objets de sélection de texte qui peuvent être manipulés, réutilisés et partagés entre plusieurs outils. Deux études d’utilisateurs montrent que Passages facilitent les pratiques des professionnels et permettent une plus grande réutilisation des informations. Ces deux projets ont conduit à un autre aspect important du travail intellectuel : la gestion des fichiers. Je me concentre sur les scientifiques, un autre exemple d’utilisateurs extrêmes, pour étudier leurs pratiques de gestion des documents. Les scientifiques travaillent avec une variété d’outils et ils ont des difficultés à utiliser le système de fichiers pour suivre et maintenir la cohérence entre des informations connexes mais distribuées. Nous avons créé FileWeaver, un système qui détecte automatiquement les dépendances entre les fichiers sans action explicite de l’utilisateur, suit leur historique et permet aux utilisateurs d’interagir directement avec les graphiques représentant ces dépendances et l’historique des versions. En rendant les dépendances entre fichiers visibles, FileWeaver facilite l’automatisation des flux de travail des scientifiques et des autres utilisateurs qui s’appuient sur le système de fichiers pour gérer leurs données. Je réfléchis à mon expérience de conception et d’évaluation de ces représentations et propose trois nouveaux principes de conception : granularité, individualité et synchronisation. Avec les résultats empiriques de ces utilisateurs extrêmes, la démonstration technologique de trois prototypes de preuve de concept et trois principes de conception, cette thèse démontre de nouvelles approches originales pour travailler avec des documents. Je soutiens qu’en adoptant une perspective fondée sur les principes et la théorie, nous pouvons contribuer à des concepts d’interface innovants
Fichier principal
Vignette du fichier
105437_HAN_2022_archivage.pdf (20.63 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03662229 , version 1 (09-05-2022)

Identifiants

  • HAL Id : tel-03662229 , version 1

Citer

Han Han. Designing Representations for Digital Documents. Human-Computer Interaction [cs.HC]. Université Paris-Saclay, 2022. English. ⟨NNT : 2022UPASG025⟩. ⟨tel-03662229⟩
179 Consultations
143 Téléchargements

Partager

Gmail Facebook X LinkedIn More