Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

Mohamed Morchid
Georges Linares

Résumé

RÉSUMÉ Cet article présente une méthode d'étiquetage de vidéos collectées sur une plate-forme de par-tage de vidéos. Cette méthode combine un système de reconnaissance de la parole, qui extrait les contenus parlés des vidéos, et un module d'extraction de mots-clefs opérant sur les transcriptions automatiques. La difficulté majeure, dans cette caractérisation de vidéos par un ensemble de mots-clefs, est liée aux performances du SRAP qui sont souvent très faibles sur des vidéos gé-nérées par les utilisateurs.Dans cet article, une méthode d'extraction de mots-clefs robuste aux erreurs de reconnaissance est proposée. Cette méthode repose sur la projection des contenus parlés dans un espace thématique obtenue par Analyse Latente de Dirichlet. Nos expériences sont réalisées sur un ensemble de vidéos collectées sur une plate-forme de partage communau-taire. Elles montrent l'intérêt du modèle proposé, en particulier dans les situations d'échec du système de transcription automatique. ABSTRACT LDA-based tagging of Web videos This article presents a method for the automatic tagging of youtube videos. The proposed method combines an automatic speech recognition system, that extracts the spoken contents, and a keyword extraction system that aims at finding a small set of tags representing the video. In order to improve the robustness of the tagging system to the recognition errors, a video transcription is represented in a semantic space obtained by Latent Dirichlet Allocation (LDA), in which each dimension is automatically characterized by a list of weighted terms and chuncks. Our experiments demonstrate the interest of such a model to improve the robustness of the tagging system, especially when speech recognition (ASR) system produce highly errorneous transcript of spoken contents. MOTS-CLÉS : Reconnaissance de la parole, analyse des contenus, catégorisation audio, multi-média.
Fichier non déposé

Dates et versions

hal-01319794 , version 1 (23-05-2016)

Identifiants

  • HAL Id : hal-01319794 , version 1

Citer

Mohamed Morchid, Georges Linares. Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet. TALN 2012, Jun 2012, Grenoble, France. ⟨hal-01319794⟩

Collections

UNIV-AVIGNON LIA
38 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More