Recherche d'information textuelle et phonétique pour le contrôle de l'étiquetage automatique d'émissions dans un flux télévisuel

Camille Guinaudeau 1
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : En 2007, Naturel (Naturel, 2007) a proposé un système qui associe automatiquement une étiquette, c'est-à-dire un titre, à des émissions issues du découpage d'un flux TV. Cependant, ce système ne permet pas de vérifier la correction des associations étiquette-émission. Nous proposons dans cet article de contrôler cet étiquetage en nous basant sur les transcriptions textuelle et phonétique de la bande sonore contenue dans le flux. Nous montrons que des méthodes de recherche d'information permettent d'associer à chaque émission une description, issue d'un guide de programmes TV, description qui est ensuite comparée avec l'étiquette originale de l'émission. La technique proposée permet de contrôler un peu plus de 45% des émissions étudiées et de diminuer de nombre d'erreurs de l'étiquetage original de 3,5%.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-00762260
Contributor : Pascale Sébillot <>
Submitted on : Thursday, December 6, 2012 - 5:09:55 PM
Last modification on : Friday, November 16, 2018 - 1:22:10 AM
Long-term archiving on : Saturday, December 17, 2016 - 10:12:12 PM

File

rjcri2009.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00762260, version 1

Citation

Camille Guinaudeau. Recherche d'information textuelle et phonétique pour le contrôle de l'étiquetage automatique d'émissions dans un flux télévisuel. 4es rencontres des jeunes chercheurs en recherche d'information, RJCRI'09, May 2009, Presqu'île de Giens, France. 8 p. ⟨hal-00762260⟩

Share

Metrics

Record views

262

Files downloads

102