ПОРІВНЯННЯ МЕТОДІВ ГЛИБОКОГО НАВЧАННЯ В ЗАДАЧАХ РОЗПІЗНАВАННЯ ЛІТАКІВ ЗА ДАНИМИ АЕРОКОСМІЧНОЇ ЗЙОМКИ
DOI:
https://doi.org/10.32782/EIS/2024-106-15Ключові слова:
машинне навчання, розпізнавання образів та контурів, попереднє оброблення оптичних зображень, знімки високої роздільної здатності, розпізнавання літаківАнотація
Мета – дослідження методів глибокого навчання в задачах розпізнавання літаків за даними аерокосмічної зйомки. Методи. У ході дослідження проведено порівняльний аналіз методів глибокого навчання для розпізнавання літаків, зокрема Faster R-CNN, SSD, SSD Lite, FCOS та RetinaNet, на спеціалізованому наборі даних, що складається з 2120 зображень високої роздільної здатності й містить 14335 анотованих літаків. Для кожної з моделей розраховано метрики точності Precision, Recall, mAP50-95 та mAP50. Результати. Отримані результати дослідження вказують на те, що моделі Faster R-CNN та FCOS забезпечують найвищі значення за метриками mAP50-95та mAP50. Для моделі Faster R-CNN значення метрики mAP50-95 становило 0,786, а mAP50 – 0,985, для моделі FCOS – 0,789 та 0,984 відповідно. Це свідчить про високу точність у виявленні контурів об’єктів. Моделі RetinaNet і SSD, хоча й показують дещо нижчі результати (0,746 і 0,617 за метрикою mAP50-95 відповідно), зберігають високі показники Precision та Recall, що підтверджує їх ефективність. Для моделі RetinaNet показник Precision становив 0,98, а Recall – 0,91, а для моделі SSD – 0,99 і 0,71 відповідно. Модель SSD Lite продемонструвала найнижчі результати за метриками mAP50-95 (0,275) та mAP50 (0,520), проте її висока швидкість роботи та задовільні значення Precision (0,98) роблять її перспективною для застосування в задачах з обмеженими ресурсами або в режимі реального часу. Новизна. Виконано порівняльний аналіз продуктивності різних моделей глибокого навчання для задачі розпізнавання літальних апаратів на аерокосмічних зображеннях високої роздільної здатності. Встановлено, що моделі Faster R-CNN та FCOS забезпечують найвищу точність серед протестованих алгоритмів, тоді як модель SSD Lite демонструє оптимальне співвідношення між точністю та швидкістю оброблення, що робить її придатною для застосувань з обмеженими ресурсами або в режимі реального часу. Цінність. Результати дослідження показали, що моделі Faster R-CNN та FCOS завдяки високим показникам mAP50-95 і mAP50 є найбільш ефективними для задач, де основним пріоритетом є точність виявлення. Це робить їх доцільними для використання у військових або безпекових системах моніторингу, де мінімізація хибних спрацьовувань і підвищення надійності виявлення об’єктів є важливими. Модель SSD Lite, зі своєю вищою швидкістю оброблення, є оптимальним вибором для систем безпілотних літальних апаратів, мобільних платформ або інших додатків, де час реакції є ключовим фактором.
Посилання
Jian Ding, Nan Xue, Gui-Song Xia, Xiang Bai, Wen Yang, Micheal Ying Yang, Serge Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo, Liangpei Zhang. Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2021. 44, 11, 7778–7796. 10.1109/TPAMI.2021.3117983
UgurAlganci, MehmetSoydas, and ElifSertel. Comparative Research on Deep Learning Approaches for Airplane Detection from Very High-Resolution Satellite Images. Remote Sensing. 2020, 12, № 3, 458. 10.3390/rs12030458
Zhang, P., Yan, P., Zhang, T., Cui, W., Zhu, Q. UAV Aerial Image Detection Based on Improved FCOS Algorithm. Digital TV and Wireless Multimedia Communication. IFTC 2020. Communications in Computer and Information Science. 1390, 2021, 52–62. Springer, Singapore.10.1007/978-981-16-1194-0_5
Yadav, A., Jain, K., Pandey, A., Ranyal, E., & Majumdar, J. (2022). An Optimal Retinanet Model For Automatic Satellite Image Based Missile Site Detection. Defence Science Journal. 72(5), 753–761. 10.14429/dsj.72.18215
DilsadUnsal. HRPlanesv2 – High Resolution Satellite Imagery for Aircraft Detection. 2022, 10.5281/ZENODO.7331974
Tsung-Yi Lin, Michael Maire, Serge Belongie, LubomirBourdev, Ross Girshick, James Hays, Pietro Perona, Deva Ramanan, C. Lawrence Zitnick, and Piotr Dollár. 2014. Microsoft COCO: Common Objects in Context. 10.48550/ARXIV.1405.0312