Modeling Visual Context is Key to Augmenting Object Detection Datasets

Nikita Dvornik; Julien Mairal; Cordelia Schmid

doi:10.1007/978-3-030-01258-8_23

Communication Dans Un Congrès Année : 2018

Modeling Visual Context is Key to Augmenting Object Detection Datasets

(1) , (1) , (1)

Nikita Dvornik

Fonction : Auteur
PersonId : 1034811

Apprentissage de modèles à partir de données massives

Julien Mairal

Fonction : Auteur
PersonId : 1034832
ORCID : 0000-0001-6991-2110
IdRef : 152125256

Apprentissage de modèles à partir de données massives

Cordelia Schmid

Fonction : Auteur
PersonId : 831154

Apprentissage de modèles à partir de données massives

Résumé

Performing data augmentation for learning deep neural networks is well known to be important for training visual recognition systems. By artificially increasing the number of training examples, it helps reducing overfitting and improves generalization. For object detection, classical approaches for data augmentation consist of generating images obtained by basic geometrical transformations and color changes of original training images. In this work, we go one step further and leverage segmentation annotations to increase the number of object instances present on training data. For this approach to be successful, we show that modeling appropriately the visual context surrounding objects is crucial to place them in the right environment. Otherwise, we show that the previous strategy actually hurts. With our context model, we achieve significant mean average precision improvements when few labeled examples are available on the VOC’12 benchmark.

Mots clés

Visual Context Object Detection Data Augmentation

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

eccv2018submission.pdf (2.64 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Nikita Dvornik : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01844474

Soumis le : jeudi 19 juillet 2018-13:45:40

Dernière modification le : jeudi 4 avril 2024-21:40:18

Archivage à long terme le : samedi 20 octobre 2018-15:52:44

Dates et versions

hal-01844474 , version 1 (19-07-2018)

Identifiants

HAL Id : hal-01844474 , version 1
ARXIV : 1807.07428
DOI : 10.1007/978-3-030-01258-8_23

Citer

Nikita Dvornik, Julien Mairal, Cordelia Schmid. Modeling Visual Context is Key to Augmenting Object Detection Datasets. ECCV 2018 - European Conference on Computer Vision, Sep 2018, Munich, Germany. pp.375-391, ⟨10.1007/978-3-030-01258-8_23⟩. ⟨hal-01844474⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 UGA CNRS INRIA IRISA LJK LJK_GI INRIA2 LJK-GI-THOTH UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES ANR UR1-MATH-NUM

353 Consultations

396 Téléchargements

Modeling Visual Context is Key to Augmenting Object Detection Datasets

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager