Reconnaissance automatique de texte dans des vidéos à l'aide d'un OCR et de connaissances linguistiques - Archive ouverte HAL Access content directly
Conference Papers Year : 2011

Reconnaissance automatique de texte dans des vidéos à l'aide d'un OCR et de connaissances linguistiques

Abstract

Cet article traite de l'extraction automatique d'éléments textuels incrustés dans des vidéos afin de décrire sémantiquement leur contenu. Pour ce faire, nous avons développé un OCR (Optical Character Recognition) vidéo, spécifiquement adapté pour détecter et reconnaître les textes incrustés. Reposant sur une approche neuronale, notre méthode se distingue par sa robustesse à la variabilité de styles et de tailles, à la complexité du fond et aux faibles résolutions de l'image. Nous introduisons également un modèle de langue qui pilote l'OCR vidéo afin de lever les ambiguïtés de la reconnaissance et réduire les erreurs de segmentation. L'approche, évaluée sur une base de journaux télévisés français, a obtenu des taux de reconnaissance de caractères de 95%, offrant ainsi la possibilité d'alimenter un système d'indexation de vidéos.
Fichier principal
Vignette du fichier
KE_Gresti.pdf (951.97 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-00645217 , version 1 (27-11-2011)

Identifiers

  • HAL Id : hal-00645217 , version 1

Cite

Khaoula Elagouni, Christophe Garcia, Pascale Sébillot. Reconnaissance automatique de texte dans des vidéos à l'aide d'un OCR et de connaissances linguistiques. GRETSI, Sep 2011, Bordeaux, France. 4 p., 2 columns. ⟨hal-00645217⟩
674 View
986 Download

Share

Gmail Facebook X LinkedIn More