Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

Résumé : RÉSUMÉ Cet article présente une méthode d'étiquetage de vidéos collectées sur une plate-forme de par-tage de vidéos. Cette méthode combine un système de reconnaissance de la parole, qui extrait les contenus parlés des vidéos, et un module d'extraction de mots-clefs opérant sur les transcriptions automatiques. La difficulté majeure, dans cette caractérisation de vidéos par un ensemble de mots-clefs, est liée aux performances du SRAP qui sont souvent très faibles sur des vidéos gé-nérées par les utilisateurs.Dans cet article, une méthode d'extraction de mots-clefs robuste aux erreurs de reconnaissance est proposée. Cette méthode repose sur la projection des contenus parlés dans un espace thématique obtenue par Analyse Latente de Dirichlet. Nos expériences sont réalisées sur un ensemble de vidéos collectées sur une plate-forme de partage communau-taire. Elles montrent l'intérêt du modèle proposé, en particulier dans les situations d'échec du système de transcription automatique. ABSTRACT LDA-based tagging of Web videos This article presents a method for the automatic tagging of youtube videos. The proposed method combines an automatic speech recognition system, that extracts the spoken contents, and a keyword extraction system that aims at finding a small set of tags representing the video. In order to improve the robustness of the tagging system to the recognition errors, a video transcription is represented in a semantic space obtained by Latent Dirichlet Allocation (LDA), in which each dimension is automatically characterized by a list of weighted terms and chuncks. Our experiments demonstrate the interest of such a model to improve the robustness of the tagging system, especially when speech recognition (ASR) system produce highly errorneous transcript of spoken contents. MOTS-CLÉS : Reconnaissance de la parole, analyse des contenus, catégorisation audio, multi-média.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01319794
Contributor : Bibliothèque Universitaire Déposants Hal-Avignon <>
Submitted on : Monday, May 23, 2016 - 9:21:56 AM
Last modification on : Saturday, March 23, 2019 - 1:22:13 AM

Identifiers

  • HAL Id : hal-01319794, version 1

Collections

Citation

Mohamed Morchid, Georges Linares. Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet. TALN 2012, Jun 2012, Grenoble, France. ⟨hal-01319794⟩

Share

Metrics

Record views

47