Contextualisation de messages courts : l’importance des métadonnées

Abstract : Les recherches présentées portent sur l’analyse de données fournies par le site Vodkaster. Dans l’optique d’alimenter un système de recommandation (SR) basé sur le contenu, nous developpons un système permettant, grâce à l’apprentissage automatique, de prédire la catégorie de note d’une critique. Cette critique est appelée micro-critique (μC) (140 caractères ou moins). Durant cette tâche, la prise en compte de l’identité de l’utilisateur et du titre du film, en les intégrant tels quels dans le sac de mot de la μC, a permis d’améliorer globalement les performances du système et ce, quelle que soit la méthode utilisée pour la prédiction. Nous montrons qu’avec un nombre égal de documents, l’ensemble d’apprentissage le plus proche (temporellement parlant) des données de test donnait de meilleurs résultats que les documents plus éloignés dans le temps. Ceci nous amène à envisager pour la suite de considérer une métadonnée additionnelle : la dimension temporelle.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01339388
Contributor : Bibliothèque Universitaire Déposants Hal-Avignon <>
Submitted on : Wednesday, June 29, 2016 - 4:40:04 PM
Last modification on : Friday, March 22, 2019 - 11:34:07 AM

Identifiers

  • HAL Id : hal-01339388, version 1

Collections

Citation

Jean-Valère Cossu, Julien Gaillard, Juan-Manuel Torres-Moreno, Marc El Bèze. Contextualisation de messages courts : l’importance des métadonnées. EGC'2013 13e Conférence Francophone sur l'Extraction et la Gestion des connaissances, Jan 2013, Toulouse, France. ⟨hal-01339388⟩

Share

Metrics

Record views

141