НЕЙРОМЕРЕЖЕВЕ РОЗПІЗНАВАННЯ ОБ’ЄКТІВ ЗАБУДОВИ НА АЕРОФОТОЗНІМКАХ

Автор(и)

DOI:

https://doi.org/10.32782/IT/2023-1-5

Ключові слова:

згорткові нейронні мережі, сегментація зображень, розпізнавання, аерофотознімок, комп’ютерний зір

Анотація

Автоматизоване розпізнавання об’єктів забудови на аерофотознімках є однією з найбільш складних проблем у комп'ютерному зорі. Це пов'язано як з варіаціями зовнішнього вигляду будівель, так і з їх семантичною характеристикою в міських районах. У даній роботі запропоновано метод автоматизованого розпізнавання об’єктів забудови на цифрових аерофотознімках на основі 2D-CNN. Спочатку завантажуються та обробляються знімки високого просторового розрізнення, отримані з безпілотних літальних апаратів. Потім проводиться класифікація та сегментація зображення на основі архітектури нейронної мережі 2D-CNN з функцією softmax для вихідного шару та використовується випрямлений лінійний блок (ReLu) для решти шарів. Згорткові шари застосовують фільтри до всіх пікселів вхідного зображення, щоб отримати набір абстрактних особливостей високого рівня. Далі, для класифікації кожного пікселя зображення з БПЛА, була проведена сегментація даних, де поле сприйняття (fov) для кожного зображення вважається ковзним вікном розміру 3×3 вхідних даних. Це дозволяє визначати приналежність об’єкту до певного класу. Завершальним етапом є створення бінарної маски розпізнавання об’єктів забудови на основі функції втрат перехресної ентропії. Тренування мережі проводилося на рівні пікселів, що дозволило підвищити точність ідентифікації об'єктів забудови та зменшити кількість неправильно класифікованих зон. Експериментальні результати показали значне покращення точності розпізнавання будівель у загальнодоступному наборі даних. Зокрема, метрики OA, AA та K покращилися на 2,6%, 5,6% та 3,2% відповідно для навчального набору даних і на 1,2%, 1,8% та 1,5% для тестового набору даних.

Посилання

Kalantar B., Halin A.A., Al-Najjar H.A.H., Mansor S., van Genderen J.L., Shafri H.Z.M., Zand, M. A Framework for Multiple Moving Objects Detection in Aerial Videos. In Spatial Modeling in GIS and R for Earth and Environmental Sciences. Elsevier: Amsterdam, The Netherlands. 2019. P. 573–588.

Kalantar B., Mansor S.B., Halin A.A., Shafri H.Z.M., Zand, M. Multiple moving object detection from UAV videos using trajectories of matched regional adjacency graphs. IEEE Trans. Geosci. Remote Sens. 2017. Vol. 55. P.5198–5213.

Kalantar B., Mansor S.B., Sameen M.I., Pradhan B., Shafri H.Z.M. Drone-based land-cover mapping using a fuzzy unordered rule induction algorithm integrated into object-based image analysis. Int. J. Remote Sens. 2017. Vol.38. P. 2535–2556.

Waleed A., Turky A., Basil D. Detecting Buildings and Nonbuildings from Satellite Images Using U-Net. Computational Intelligence and Neuroscience, 2018. P.1687-5265. DOI: 10.1155/2022/4831223.

Krówczyńska M., Raczko E., Staniszewska N., Wilk, E. Asbestos–cement roofing identification using remote sensing and convolutional neural networks (CNNs). Remote Sens. 2020. Vol. 12, P.2-16.

Cheng G., Han J., Lu X. Remote sensing image scene classifcation: Benchmark and state of the art. Proceedings of the IEEE, 2017. Vol.105 (10). P. 1865-188.

Avudaiamma R., Dayana S., Prabhu R. and Swarnalatha A. Automatic Building Extraction from VHR Satellite Image. International Conference on Current Trends towards Converging Technologies (ICCTCT). 2018. P. 1-6, DOI: 10.1109/ICCTCT.2018.8551119.

Long J., Shelhamer E., Darrell T. Fully convolutional networks for semantic segmentation. In Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston, MA, USA. 2015. P. 3431–3440.

Liu L., Ouyang W., Wang X., Fieguth W.P., Chen J., Liu X., Pietikinen M. Deep learning for generic object detection. A survey. I International Journal of Computer Vision. 2020. Vol. 128. P. 261–31.

Yuan J. Learning building extraction in aerial scenes with convolutional networks. IEEE Trans. Pattern Anal. Mach. Intell. 2017. P. 2793–2798.

Xu Y., Wu L., Xie Z., Chen Z. Building extraction in very high resolution remote sensing imagery using deep learning and guided filters. Remote Sens. 2018. Vol. 10. P. 144.

Huang J., Zhang X., Xin Q., Sun Y., Zhang P. Automatic building extraction from high-resolution aerial images and LiDAR data using gated residual refinement network. ISPRS J. Photogramm. Remote Sens. 2019. P. 91–105.

Kim E.K., Lee H., Kim J.Y., Kim S. Data Augmentation Method by Applying Color Perturbation of Inverse PSNR and Geometric Transformations for Object Recognition Based on Deep Learning. Appl. Sci. 2020. Vol. 10. P. 3755. DOI: 10.3390/app10113755

Yang J., Guo J., Yue H., Liu Z., Hu H., Li K. CDnet: CNN-Based Cloud Detection for Remote Sensing Imagery. IEEE Trans. Geosci. Remote Sens. 2019. Vol. 57. P. 6195–6211.

Rahman T., Chowdhury M.E., Khandakar A., Islam K.R., Islam K.F., Mahbub Z.B., Kadir M.A., Kashem S. Transfer Learning with Deep Convolutional Neural Network (CNN) for Pneumonia Detection using Chest X-ray. Appl. Sci. 2020. Vol. 10. P. 32-33.

Mäyrä J., Keski-Saari S., Kivinen S., Tanhuanpää T., Hurskainen P., Kullberg P., Poikolainen L., Viinikka A., Tuominen S., Kumpula T., et al. Tree species classification from airborne hyperspectral and LiDAR data using 3D convolutional neural networks. Remote Sens. Environ. 2021. Vol.256. P. 112-322.

Каштан В.Ю., Гнатушенко В.В. Контурна сегментація цифрових супутникових знімків з використанням особливих точок вейвлет-перетворення. Системні технології. Регіональний міжвузівський збірник наукових робіт. 2019. Випуск 1 (120). С.3 - 11.

Yılmaz I., Imamo˘glu M., Özbulak G., Kahraman F., Aptoula E. Large Scale Crop Classification from Multi-temporal and ˙Multi-spectral Satellite Images. In Proceedings of the 2020 28th Signal Processing and Communications Applications Conference (SIU). 2020. P. 1–4.

Cheng H., Lian D., Gao S., Geng Y. Evaluating Capability of Deep Neural Networks for Image Classification via Information Plane. In Proceedings of the European Conference on Computer Vision (ECCV). 2018. P. 168–182.

##submission.downloads##

Опубліковано

2023-06-20