Segmentation de scènes extérieures à partir d'ensembles d'étiquettes à granularité et sémantique variables

Résumé : Ce papier présente une approche permettant d'utiliser plusieurs bases de données annotées avec différents ensembles d'étiquettes pour améliorer la précision d'un clas-sifieur entrainé sur une tâche de segmentation sémantique de scènes extérieures. Dans ce contexte, la base de don-nées KITTI nous fournit un cas d'utilisation particulière-ment pertinent : des sous-ensembles distincts de cette base ont été annotés par plusieurs équipes en utilisant des éti-quettes différentes pour chaque sous-ensemble. Notre mé-thode permet d'entraîner un réseau de neurones convolu-tionnel (CNN) en utilisant plusieurs bases de données avec des étiquettes possiblement incohérentes. Nous présentons une fonction de perte sélective pour entrainer ce réseau et plusieurs approches de fusion permettant d'exploiter les corrélations entre les différents ensembles d'étiquettes. Le réseau utilise ainsi toutes les données disponibles pour améliorer les performances de classification sur chaque ensemble. Les expériences faites sur les différents sous-ensembles de la base de données KITTI montrent comment chaque proposition contribue à améliorer le classifieur. Mots Clef Deep Learning, Réseaux de neurones de convolution, Seg-mentation sémantique. Abstract In this work, we present an approach that leverages multiple datasets annotated using different classes (different labelsets) to improve the classification accuracy on each individual dataset. We focus on semantic full scene labeling of outdoor scenes. To achieve our goal, we use the KITTI dataset as it illustrates very well the focus of our paper : it has been sparsely labeled by multiple research groups over the past few years but the semantics and the granula-rity of the labels differ from one set to another. We propose a method to train deep convolutional networks using multiple datasets with potentially inconsistent labelsets and a selective loss function to train it with all the available labeled data while being reliant to inconsistent labelings. Experiments done on all the KITTI dataset's labeled subsets show that our approach consistently improves the classification accuracy by exploiting the correlations across data-sets both at the feature level and at the label level.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01374580
Contributor : Elisa Fromont <>
Submitted on : Friday, September 30, 2016 - 4:30:09 PM
Last modification on : Tuesday, February 26, 2019 - 4:35:37 PM

Identifiers

  • HAL Id : hal-01374580, version 1

Citation

Fourure Damien, Emonet Rémi, Fromont Elisa, Muselet Damien, Tremeau Alain, et al.. Segmentation de scènes extérieures à partir d'ensembles d'étiquettes à granularité et sémantique variables. Vingtième congrès national sur la Reconnaissance des Formes et l'Intelligence Artificielle (RFIA'16), Jun 2016, Clermont Ferrand, France. ⟨hal-01374580⟩

Share

Metrics

Record views

310