РОЛЬ КОМП’ЮТЕРНОГО ЗОРУ В СУЧАСНОМУ СВІТІ: ДОСЯГНЕННЯ, ВИКЛИКИ ТА ПЕРСПЕКТИВИ
DOI:
https://doi.org/10.32782/IT/2024-2-10Ключові слова:
штучний інтелект, комп’ютерний зір, нейронні мережі, штучні нейронні мережі, згорткові нейронні мережі, рекурентні нейронні мережі, розпізнавання образівАнотація
Ця наукова стаття розглядає сутність комп’ютерного зору як сучасної технології, її досягнення, виклики та перспективи. Комп’ютерний зір відіграє важливу роль у різних галузях, таких як медицина, автомобільна промисловість, робототехніка та багато інших. У статті досліджуються основні принципи комп’ютерного зору, його застосування в різних сферах, порівняльний аналіз нейронних мереж. Метою дослідження є вибір топології згорткових нейронних мереж шляхом проведення порівняльного аналізу моделей згорткових нейронних мереж та їх характеристик, які суттєво впливають на реалізацію типових задач комп’ютерного зору. Методологія дослідження полягає у порівняльному аналізі основних методів класифікації на основі відомих згорткових нейронних мереж, які орієнтовані на обробку та розпізнавання образів зображень, сегментацію текстових даних, а також звукових потоків. Проведено аналіз існуючих досліджень та публікацій щодо технологій комп’ютерного зору, емпіричне дослідження та оцінку ефективності і точності різних підходів до комп’ютерного зору. Наукова новизна отриманих у роботі результатів полягає у визначенні основних викликів, що стоять перед розвитком комп’ютерного зору, зокрема, проблеми обробки великих обсягів даних, забезпечення точності та швидкості алгоритмів, проведенні комплексного аналізу сучасних досягнень у галузі комп’ютерного зору з урахуванням останніх наукових досліджень та технологічних розробок. Висновки. Нейромережі, такі як штучні нейронні мережі (ANN), згорткові нейронні мережі (CNN) та рекурентні нейронні мережі (RNN), мають власні переваги та недоліки, що можуть залежати від конкретних завдань та даних. Враховуючи це, доцільно їх використовувати в залежності від проблем чи завдань, які необхідно вирішити, а саме: ANN (штучні нейронні мережі) корисні для вирішення складних проблем; CNN (згорткові нейронні мережі) є найефективнішим способом вирішення проблем комп’ютерного зору; RNN (рекурентні нейронні мережі) здатні обробляти природну мову, корисні для прогнозування часових рядів.
Посилання
Marta Beltrán, Miguel Calvo. A privacy threat model for identity verification based on facial recognition. 2023. URL: https://doi.org/10.1016/j.cose.2023.103324 (дата звернення: 18.04.2024).
Abhishek Gupta, Alagan Anpalagan, Ling Guan, Ahmed Shaharyar Khwaja. Deep learning for object detection and scene perception in self-driving cars: Survey, challenges, and open issues. 2021. https://doi.org/10.1016/j.array.2021.100057 (дата звернення: 18.04.2024).
Rajasshrie Pillai, Brijesh Sivathanu, Yogesh K. Dwivedi. Shopping intention at AI-powered automated retail stores (AIPA). Journal of Retailing and Consumer Services. 2020. URL: https://doi.org/10.1016/j.jretconser.2020.102207 (дата звернення: 18.04.2024).
Arshi Parvaiz, Muhammad Anwaar Khalid, Rukhsana Zafar, Huma Ameer, Muhammad Ali, Muhammad Moazam Fraz. Vision Transformers in medical computer vision–A contemplative retrospection. Engineering Applications of Artificial Intelligence. 2023. URL: https://doi.org/10.1016/j.engappai.2023.106126 (дата звернення: 19.04.2024).
Jittima Varagula, Panit-a-nong Kulproma, Toshio ITO. Object Detection Method in Traffic by On-Board Computer Vision with Time Delay Neural Network. Procedia Computer Science. 2017. URL: https://doi.org/10.1016/j.procs.2017.08.185 (дата звернення: 19.04.2024).
Phat Thai, Sameer Alam, Nimrod Lilith, Binh T. Nguyen. A computer vision framework using Convolutional Neural Networks for airport-airside surveillance. Transportation Research Part C: Emerging Technologies. 2022. URL: https://doi.org/10.1016/j.trc.2022.103590 (дата звернення: 19.04.2024).
V.G. Dhanya, A. Subeesh, N.L. Kushwaha, Dinesh Kumar Vishwakarma, T. Nagesh Kumar, G. Ritika, A.N. Singh. Deep learning based computer vision approaches for smart agricultural applications. 2022. URL: https://doi.org/10.1016/j.aiia.2022.09.007 (дата звернення: 26.04.2024).
Markus Friedrich, Theresa Gerber, Jonas Dumler, Frank Döpper. A system for automated tool wear monitoring and classification using computer vision. Procedia CIRP. 2023. URL: https://doi.org/10.1016/j.procir.2023.06.073 (дата звернення: 26.04.2024).
Phat Thai, Sameer Alam, Nimrod Lilith, Binh T. Nguyen. An overview of Human Action Recognition in sports based on Computer Vision. Journal Heliyon. 2022. URL: https://doi.org/10.1016/j.heliyon.2022.e09633 (дата звернення: 26.04.2024).
A. Nouriani, R. McGovern, R. Rajamani. Activity recognition using a combination of high gain observer and deep learning computer vision algorithms. Intelligent Systems with Applications. 2023. URL: https://doi.org/10.1016/j.iswa.2023.200213 (дата звернення: 02.05.2024).
Masooma Memon. ANN vs CNN vs RNN: Neural Networks Guide. 2022. URL: https://levity.ai/blog/neural-networks-cnn-ann-rnn (дата звернення: 02.05.2024).
Zahra Elhamraoui, Introduction to convolutional neural network. 2020. URL: https://medium.com/analytics-vidhya/introduction-to-convolutional-neural-network-6942c189a723 (дата звернення: 02.05.2024).
James Le The 5 Computer Vision Techniques That Will Change How You See The World. 2018.
URL: https://heartbeat.comet.ml/the-5-computer-vision-techniques-that-will-change-how-you-see-the-world-1ee19334354b (дата звернення: 02.05.2024).
Jingfei Chang, Yang Lu, Ping Xue, Yiqun Xu, Zhen Wei. Iterative clustering pruning for convolutional neural networks. Knowledge-Based Systems. 2023. URL: https://doi.org/10.1016/j.knosys.2023.110386 (дата звернення: 03.05.2024).
Vidushi Meel. ANN and CNN: Analyzing Differences and Similarities. URL: https://viso.ai/deep-learning/ann-and-cnn-analyzing-differences-and-similarities/ (дата звернення: 03.05.2024).
Recurrent Neural Network Tutorial (RNN). 2022. URL: https://www.datacamp.com/tutorial/tutorial-forrecurrent-neural-network (дата звернення: 03.05.2024).
Kristina Host, Marina Ivašić-Kos. An overview of Human Action Recognition in sports based on Computer Vision. 2022. URL: https://doi.org/10.1016/j.heliyon.2022.e09633 (дата звернення: 03.05.2024).
What is a recurrent network? URL: https://h2o.ai/wiki/recurrent-network/ (дата звернення: 03.05.2024).