Détection de regards de visite sur des images à haute résolution spatiale par une méthode d'apprentissage

Résumé : L’utilisation de la télédétection en milieux urbains s’est focalisée dans un premier temps sur l’identification et l’estimation des surfaces urbaines (Weng, 2011), la mise en évidence de l’expansion urbaine (Xian et Crane, 2005), la quantification du microclimat (Arthur-Harthnaft et al., 2001) ou de l’îlot de chaleur urbain (Dousset et Gourmelon, 2004; Gallo et al., 1994).En combinant les approches multi-spectrales et multi-temporelles, des suivis ont ainsi pu être faits sur l’évolution de ces phénomènes. A mesure que la résolution spatiale des images s’améliorait, l’identification d’objets précis du paysage urbain devenait possible (Bhaskaran et al., 2010). Ainsi, depuis quelques années, les images sont utilisées pour détecter les réseaux routiers (Péteri et Ranchin, 2006, Stoica et al. 2004), la végétation urbaine (Höfle, 2012), les caractéristiques du bâti (Hermosilia et al., 2011; Freire et al., 2010; Lhomme et al., 2004). En comparaison, la localisation d'objets de plus petite dimension (inférieure à un immeuble) reste relativement peu étudiée et pose le problème de l'identification d'objets dans un environnement variable, sur fond non-uniforme et souvent peu contrasté. Dans le cadre du projet Cart’eaux*, nous proposons une méthode de détection de regards de visite (plaques d’égout) sur des images à très haute résolution spatiale. Cette méthode par apprentissage consiste à appliquer un réseau de neurones à convolution, AlexNet, sur des orthophotos à très haute résolution spatiale prises dans le visible. Le réseau est entrainé sur une image à 5cm de résolution de la ville de Prades-Le-Lez dans l’Hérault. Afin de pallier le manque de données – seulement 605 plaques d’égout présentes sur l’image – une procédure d’augmentation de la base d’apprentissage est appliquée : rotation, miroir… conduisant à une base d’apprentissage à de 2 classes constituée de 18405 « plaques d’égout » et 458915 « autres objets ». Une fois le réseau entrainé et « boosté », il est appliqué sur la ville de Gigean avec une précision de 72% et un rappel de 54%. Plusieurs pistes de recherche sont actuellement explorées afin d’améliorer ces résultats déjà encourageants. D’une part, l’utilisation d’une information altimétrique (MNT, LIDAR) ou de données géographiques (bâtis) permettrait de réduire le nombre de faux positifs (e.g. cheminées) ; d’autre part l’application d’un filtre géométrique en amont de la classification fournira une information supplémentaire au réseau de neurones qui devrait augmenter le nombre de vrais positifs. * Projet financé par la région Occitanie et l’Europe (fond FEDER)
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-01867226
Contributor : Carole Delenne <>
Submitted on : Wednesday, September 19, 2018 - 3:52:00 PM
Last modification on : Tuesday, May 28, 2019 - 1:48:07 PM

Identifiers

  • HAL Id : hal-01867226, version 1

Citation

Benjamin Commandré, Driss En-Nejjary, Lionel Pibre, Marc Chaumont, Gérard Subsol, et al.. Détection de regards de visite sur des images à haute résolution spatiale par une méthode d'apprentissage. TEMU: Télédétection pour l'Etude des Milieux Urbains, Mar 2018, Strasbourg, France. ⟨hal-01867226⟩

Share

Metrics

Record views

214

Files downloads

17