АЛГОРИТМ ФОРМУВАННЯ НАБОРУ АПРІОРНИХ ДАНИХ НЕЙРОННОЇ МЕРЕЖІ ДЛЯ ОБРОБКИ ЦИФРОВИХ АЕРОЗНІМКІВ

Автор(и)

  • Сергій Валентинович Ковбасюк Житомирський військовий інститут імені С. П. Корольова, Україна
  • Руслан Миколайович Осадчук Житомирський військовий інститут імені С. П. Корольова, Україна
  • Микола Петрович Романчук Житомирський військовий інститут імені С. П. Корольова, Україна
  • Леонід Михайлович Наумчак Житомирський військовий інститут імені С. П. Корольова, Україна

DOI:

https://doi.org/10.46972/2076-1546.2022.23.06

Ключові слова:

безпілотний літальний апарат, згорткова нейронна мережа, аугментація даних, автоматизована обробка цифрових аерознімків

Анотація

Аналіз застосування безпілотних авіаційних комплексів у зоні проведення бойових дій вказує на постійне підвищення вимог до розвідувальних даних. Одним із шляхів підвищення ефективності застосування цього виду озброєння є використання методів штучного інтелекту. Базисом для побудови надійної моделі нейронної мережі є велика кількість різноманітних даних, що допомагає точніше узагальнити інформацію про поставлене завдання. У статті розглянуто підхід до підвищення точності класифікації зображень об’єктів згортковими нейронними мережами на базі аугментації даних, який відрізняється від відомих адаптацією до факторів знімання та специфіки об’єктів аеророзвідки.

Важливим та найбільш трудомістким етапом побудови точної моделі машинного навчання є пошук та анотація даних, які будуть використовуватися для навчання та тестування точності роботи нейронної мережі. Від кількості зібраних даних залежить стабільність роботи мережі в реальних умовах. На сьогодні добре описано та проаналізовано такі методи аугментації зображень об’єктів, як геометричні перетворення, колірна корекція та просторова фільтрація зображення. Не розглянутими досі залишаються можливості оптимальних комбінацій методів аугментації даних для досягнення потрібного узагальнення слабопомітних інваріантних ознак об’єктів. З урахуванням проведених досліджень було запропоновано алгоритм формування набору апріорних даних нейронної мережі для розпізнавання об’єктів на цифрових аерознімках, що дозволить значно зменшити складність процесу збирання потрібних даних і замінити методами збільшення, які набагато простіші, витрачають менше обчислювального ресурсу та здатні підвищити точність роботи згорткових нейронних мереж. Крім того, у статті проведено моделювання використання запропонованого підходу.

Посилання

Petruk, S. (n.d.). Bezpilotni aviatsiini kompleksy v zbroinykh konfliktakh ostannikh desiatyrich. Retrieved from https://journal.cndiovt.com.ua/article/download/210/222/ [in Ukrainian].

Lemley, J., Bazrafkan, S., & Corcoran, P. (2017). Smart Augmentation Learning an Optimal Data Augmentation Strategy. IEEE Access, Vol. 5, 5858–5869. https://doi.org/10.1109/ACCESS.2017.2696121

DeVries, T., & Taylor, G. (2017). Dataset Augmentation in Feature Space. Workshop track- ICLR. https://doi.org/10.48550/arXiv.1702.05538

Inoue, H. (n.d.). Data Augmentation by Pairing Samples for Images Classification. https://doi.org/10.48550/arXiv.1801.02929

Zoph, B., Cubuk, E., & Ghiasi, G. et al. (n.d.). Learning Data Augmentation Strategies for Object Detection. European Computer Vision Association. https://doi.org/10.48550/arXiv.1906.11172

Dwibedi, D., Misra, I., & Hebert, M. (2017). Cut, Paste and Learn: Surprisingly Easy Synthesis for Instance Detection. In IEEE International Conference on Computer Vision. https://doi.org/10.1109/iccv.2017.146

Fang, H.-Shu, Sun, J., & Wang, R. et al. (2019). InstaBoost: Boosting Instance Segmentation via Probability Map Guided Copy-Pasting. In IEEE/CVF International Conference on Computer Vision. https://doi.org/10.1109/iccv.2019.00077

Kwon, O., & Sim, J. (2013). Effects of data set features on the performances of classification algorithms. Expert Systems with Applications, Iss. 5, Vol. 40, 1847–1857. https://doi.org/10.1016/j.eswa.2012.09.017

Sbai, O., Couprie, C., & Aubry, M. (2020). Impact of base dataset design on few-shot image classification. In European Conference on Computer Vision. (pp. 597–613). https://doi.org/10.1007/978-3-030-58517-4_35

Zendel, O. et al. (2017). How good is my test data? introducing safety analysis for computer vision. International Journal of Computer Vision, 125, 95–109. https://doi.org/10.1007/s11263-017-1020-z

Hendrycks, D. et al. (n.d.). The many faces of robustness: A critical analysis of out-of-distribution generalization. In IEEE/CVF International Conference on Computer Vision. https://doi.org/10.1109/iccv48922.2021.00823

Zheng, S. et al. (2016). Improving the Robustness of Deep Neural Networks via Stability Training. In Proceedings of the IEEE conference on computer vision and pattern recognition. (pp. 4480–4488). https://doi.org/10.48550/arXiv.1604.04326

Deng, J. et al. (2009). Imagenet: A large-scale hierarchical image database. In IEEE conference on computer vision and pattern recognition. (pp. 248–255). https://doi.org/10.1109/CVPR.2009.5206848

Lin, T. et al. (2014). Microsoft COCO: Common objects in context. In European conference Computer Vision – ECCV, 8693, 740–755. https://doi.org/10.1007/978-3-319-10602-1_48

Xia, G.-S. et al. (2018). DOTA: A Large-scale Dataset for Object Detection in Aerial Images. In IEEE Conference on Computer Vision and Pattern Recognition. (pp. 3974–3983). https://doi.org/10.1109/cvpr.2018.00418

Heilbron, F. et al. (2015). ActivityNet: A large-scale video benchmark for human activity understanding. In IEEE Conference on Computer Vision and Pattern Recognition (CVPR). (pp. 961–970). https://doi.org/10.1109/cvpr.2015.7298698

Tan, C. et al. (2018). A survey on deep transfer learning. In International conference on artificial neural networks. (pp. 270–279). https://doi.org/10.48550/arXiv.1808.01974

Vannucci, C., & Colla, V. (2016). Classification of Unbalanced Datasets and Detection of Rare Events in Industry: Issues and Solutions. In International Conference on Engineering Applications of Neural Networks. (pp. 337–351). https://doi.org/10.1007/978-3-319-44188-7_26

Wang, Y. et al. (2022). Generalizing from a Few Examples: A Survey on Few-shot Learning. ACM Computing Surveys, Vol. 53, № 3, 1–34. https://doi.org/10.1145/3386252

LeCun, Y. et al. (1996). Handwritten Digit Recognition with a Back-Propagation Network. Advances in Neural Information Processing Systems. P. 396–404.

Alom, Z. et al. (2019). The History Began from AlexNet: A Comprehensive Survey on Deep Learning Approaches. Preprint arXiv:1803.01164. https://doi.org/10.48550/arXiv.1803.01164

Russakovsky, O., Deng, J., & Su, H. (2016). Imagenet large scale visual recognition challenge. Advances in Neural Information Processing Systems. P. 3108–3116. https://doi.org/10.1007/s11263-015-0816-y

Simonyan, K., & Zisserman, A. (2014). Two-Stream Convolutional Networks for Action Recognition in Videos. Advances in Neural Information Processing Systems 27 (NIPS 2014), Vol. 1, 568–576.

Karpovich, I. N. (1990). Voennoe deshifrirovanie aerosnimkov [Military interpretation of aerial photographs]. Moscow [in Russian].

Rebrin, Iu. K. (1988). Optiko-elektronnoe razvedyvatel'noe oborudovanie letatel'nykh apparatov [Optoelectronic reconnaissance equipment of aircraft]. Kyiv [in Russian].

##submission.downloads##

Опубліковано

2023-02-22

Як цитувати

Ковбасюк , С. В. ., Осадчук , Р. М. ., Романчук , М. П. ., & Наумчак , Л. М. . (2023). АЛГОРИТМ ФОРМУВАННЯ НАБОРУ АПРІОРНИХ ДАНИХ НЕЙРОННОЇ МЕРЕЖІ ДЛЯ ОБРОБКИ ЦИФРОВИХ АЕРОЗНІМКІВ. ПРОБЛЕМИ СТВОРЕННЯ, ВИПРОБУВАННЯ, ЗАСТОСУВАННЯ ТА ЕКСПЛУАТАЦІЇ СКЛАДНИХ ІНФОРМАЦІЙНИХ СИСТЕМ, (23), 77–88. https://doi.org/10.46972/2076-1546.2022.23.06