Reconnaissance automatique de texte dans des vidéos à l'aide d'un OCR et de connaissances linguistiques

Khaoula Elagouni 1, * Christophe Garcia 2 Pascale Sébillot 3
* Corresponding author
2 imagine - Extraction de Caractéristiques et Identification
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
3 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Cet article traite de l'extraction automatique d'éléments textuels incrustés dans des vidéos afin de décrire sémantiquement leur contenu. Pour ce faire, nous avons développé un OCR (Optical Character Recognition) vidéo, spécifiquement adapté pour détecter et reconnaître les textes incrustés. Reposant sur une approche neuronale, notre méthode se distingue par sa robustesse à la variabilité de styles et de tailles, à la complexité du fond et aux faibles résolutions de l'image. Nous introduisons également un modèle de langue qui pilote l'OCR vidéo afin de lever les ambiguïtés de la reconnaissance et réduire les erreurs de segmentation. L'approche, évaluée sur une base de journaux télévisés français, a obtenu des taux de reconnaissance de caractères de 95%, offrant ainsi la possibilité d'alimenter un système d'indexation de vidéos.
Complete list of metadatas

Cited literature [11 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00645217
Contributor : Pascale Sébillot <>
Submitted on : Sunday, November 27, 2011 - 2:03:31 PM
Last modification on : Tuesday, February 26, 2019 - 11:20:52 AM
Long-term archiving on : Tuesday, February 28, 2012 - 2:21:28 AM

File

KE_Gresti.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00645217, version 1

Citation

Khaoula Elagouni, Christophe Garcia, Pascale Sébillot. Reconnaissance automatique de texte dans des vidéos à l'aide d'un OCR et de connaissances linguistiques. GRETSI, Sep 2011, Bordeaux, France. 4 p., 2 columns. ⟨hal-00645217⟩

Share

Metrics

Record views

1111

Files downloads

761