Cyndi : un moteur d'indexation de la bande sonore par une segmentation sémantique et extraction de mots clés

Abstract : La multiplication de Documents Audio-Visuels nécessite des outils de recherche et de navigation pour faire face à la profusion de ceux-ci. Dans cet article nous présentons CYNDI, notre moteur d’indexation de la bande sonore de programmes audiovisuels que nous avons réalisé dans le cadre du projet RNRT CYRANO. Notre moteur d’indexation CYNDI s’appuie sur une segmentation automatique de la bande sonore en musique ou parole, puis pour les segments de parole une technique de segmentation en « phrases » qui permet de faciliter la navigation dans un document audiovisuel tout en diminuant le taux d’erreur d’un moteur de transcription automatique. Notre technique de segmentation en phrases à partir d’un segment de parole est basée sur des statistiques de la taille normale d’une phrase. La détection de bordures de phrases est basée sur un seuillage automatique des valeurs de la distance de KullBack-Leibler. Les segments de musique sont indexés par CYNDI d’une manière à permettre une recherche par similarité.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01587084
Contributor : Équipe Gestionnaire Des Publications Si Liris <>
Submitted on : Wednesday, September 13, 2017 - 4:06:58 PM
Last modification on : Thursday, November 21, 2019 - 1:44:51 AM

Identifiers

  • HAL Id : hal-01587084, version 1

Citation

Liming Chen, Hadi Harb. Cyndi : un moteur d'indexation de la bande sonore par une segmentation sémantique et extraction de mots clés. CORESA 2003, Jan 2003, Lyon, France. pp.1-6. ⟨hal-01587084⟩

Share

Metrics

Record views

743