Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

Mohamed Morchid; Georges Linares

Communication Dans Un Congrès Année : 2012

Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

(1) , (1)

Mohamed Morchid

Fonction : Auteur
PersonId : 21451
IdHAL : morchid
ORCID : 0000-0002-4427-2468
IdRef : 188328343

Laboratoire Informatique d'Avignon

Georges Linares

Fonction : Auteur
PersonId : 4977
IdHAL : georges-linares
IdRef : 079368794

Laboratoire Informatique d'Avignon

Résumé

RÉSUMÉ Cet article présente une méthode d'étiquetage de vidéos collectées sur une plate-forme de par-tage de vidéos. Cette méthode combine un système de reconnaissance de la parole, qui extrait les contenus parlés des vidéos, et un module d'extraction de mots-clefs opérant sur les transcriptions automatiques. La difficulté majeure, dans cette caractérisation de vidéos par un ensemble de mots-clefs, est liée aux performances du SRAP qui sont souvent très faibles sur des vidéos gé-nérées par les utilisateurs.Dans cet article, une méthode d'extraction de mots-clefs robuste aux erreurs de reconnaissance est proposée. Cette méthode repose sur la projection des contenus parlés dans un espace thématique obtenue par Analyse Latente de Dirichlet. Nos expériences sont réalisées sur un ensemble de vidéos collectées sur une plate-forme de partage communau-taire. Elles montrent l'intérêt du modèle proposé, en particulier dans les situations d'échec du système de transcription automatique. ABSTRACT LDA-based tagging of Web videos This article presents a method for the automatic tagging of youtube videos. The proposed method combines an automatic speech recognition system, that extracts the spoken contents, and a keyword extraction system that aims at finding a small set of tags representing the video. In order to improve the robustness of the tagging system to the recognition errors, a video transcription is represented in a semantic space obtained by Latent Dirichlet Allocation (LDA), in which each dimension is automatically characterized by a list of weighted terms and chuncks. Our experiments demonstrate the interest of such a model to improve the robustness of the tagging system, especially when speech recognition (ASR) system produce highly errorneous transcript of spoken contents. MOTS-CLÉS : Reconnaissance de la parole, analyse des contenus, catégorisation audio, multi-média.

Mots clés

Speech recognition content analysis audio categorization multimedia 273

Domaines

Informatique [cs]

bibliothèque Universitaire Déposants HAL-Avignon : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01319794

Soumis le : lundi 23 mai 2016-09:21:56

Dernière modification le : mardi 26 octobre 2021-15:28:01

Dates et versions

hal-01319794 , version 1 (23-05-2016)

Identifiants

HAL Id : hal-01319794 , version 1

Citer

Mohamed Morchid, Georges Linares. Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet. TALN 2012, Jun 2012, Grenoble, France. ⟨hal-01319794⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-AVIGNON LIA

38 Consultations

0 Téléchargements

Extraction de mots-clefs dans des vidéos Web par Analyse Latente de Dirichlet

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager