Contextualisation de messages courts : l’importance des métadonnées - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Contextualisation de messages courts : l’importance des métadonnées

Résumé

Les recherches présentées portent sur l’analyse de données fournies par le site Vodkaster. Dans l’optique d’alimenter un système de recommandation (SR) basé sur le contenu, nous developpons un système permettant, grâce à l’apprentissage automatique, de prédire la catégorie de note d’une critique. Cette critique est appelée micro-critique (μC) (140 caractères ou moins). Durant cette tâche, la prise en compte de l’identité de l’utilisateur et du titre du film, en les intégrant tels quels dans le sac de mot de la μC, a permis d’améliorer globalement les performances du système et ce, quelle que soit la méthode utilisée pour la prédiction. Nous montrons qu’avec un nombre égal de documents, l’ensemble d’apprentissage le plus proche (temporellement parlant) des données de test donnait de meilleurs résultats que les documents plus éloignés dans le temps. Ceci nous amène à envisager pour la suite de considérer une métadonnée additionnelle : la dimension temporelle.
Fichier non déposé

Dates et versions

hal-01339388 , version 1 (29-06-2016)

Identifiants

  • HAL Id : hal-01339388 , version 1

Citer

Jean-Valère Cossu, Julien Gaillard, Juan-Manuel Torres-Moreno, Marc El Bèze. Contextualisation de messages courts : l’importance des métadonnées. EGC'2013 13e Conférence Francophone sur l'Extraction et la Gestion des connaissances, Jan 2013, Toulouse, France. ⟨hal-01339388⟩
111 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More