Méthodes d'apprentissage automatique pour l'analyse des interactions utilisateurs - Archive ouverte HAL Accéder directement au contenu
Hdr Année : 2012

Machine learning methods for the analysis of user interactions

Méthodes d'apprentissage automatique pour l'analyse des interactions utilisateurs

Résumé

The research described in this habilitation document proposes new machine learning methods dedicated to the study of users interactions on three main levels. First, we are interested in the analysis of user interaction in the form of users’ activity traces. To this aim, we develop new incremental clustering algorithms for large scale data sets or data streams. Unlike existing approaches, our methods are not limited to numerical data processing and are paired with tools to research typical user profile and that provide dynamic web paths visualization to facilitate interpretation of the analyzes. Secondly, we are interested in semi-supervised clustering methods which allow the integration of expert knowledge in the clustering process. In this context, we have proposed active learning algorithms that optimize interactions between the human expert and the classification algorithms to improve their performance. Finally, we are interested in the problem of automatic extraction of metadata from structured corpus in the context of information retrieval. The specificity of this work is twofold: on one hand we have introduced methods that are independent of the document's content and, on the other hand, we have proposed methods based on the content that combine statistical learning algorithms and contextual, stylistic and linguistic features.
Les travaux de recherche présentés dans ce mémoire s'intéressent au dé\-ve\-lop\-pe\-ment de méthodes d'apprentissage pour l'étude des interactions utilisateurs selon trois principaux niveaux. En premier lieu, nous nous sommes intéressés à l'analyse des interactions utilisateurs sous la forme de traces d'usage. Nous avons développé pour cela des méthodes de clustering incrémentales qui autorisent le passage à l'échelle ainsi que le traitement de flux de données. Contrairement aux approches existantes, nos méthodes ne sont pas limitées au traitement de données numériques et sont couplées à des outils de recherche de parcours typiques et de visualisation dynamique pour faciliter l'interprétation des analyses. En second lieu, nous nous sommes intéressés aux méthodes de clustering semi-supervisé qui permettent l'intégration de connaissances expertes dans le processus de construction des clusters. Dans ce cadre, nous avons notamment proposé des algorithmes actifs qui optimisent les interactions de l'expert avec l'algorithme d'apprentissage pour en améliorer les performances. Enfin, nous nous sommes intéressés au problème de l'extraction automatique de métadonnées à partir de corpus structurés dans le cadre de la recherche d'information. La spécificité de ces travaux est double : d'une part nous avons introduit des méthodes indépendantes du contenu et d'autre part, nous avons proposé des méthodes basées sur le contenu qui combinent apprentissage statistique et descripteurs contextuels, stylistiques et linguistiques.
Fichier principal
Vignette du fichier
hdr_labroche.pdf (1.6 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01247379 , version 1 (21-12-2015)

Identifiants

  • HAL Id : tel-01247379 , version 1

Citer

Nicolas Labroche. Méthodes d'apprentissage automatique pour l'analyse des interactions utilisateurs. Informatique [cs]. Université Pierre et Marie Curie, Paris 6, 2012. ⟨tel-01247379⟩
973 Consultations
4480 Téléchargements

Partager

Gmail Facebook X LinkedIn More