Detection of flying objects in images using the YOLOv4-CSP convolutional neural network model | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2024. № 69. DOI: 10.17223/19988605/69/8

Detection of flying objects in images using the YOLOv4-CSP convolutional neural network model

Исследуется эффективность модели сверточной нейронной сети YOLOv4-CSP при решении задачи детектирования в воздушном пространстве объектов двух классов: беспилотных летательных аппаратов вертолетного типа и самолетного типа. Изображения объектов получены в оптическом и инфракрасном диапазонах длин волн, из них сформировано два соответствующих датасета. Модель YOLOv4-CSP обучена с использованием обучающей и валидационной выборок из каждого датасета. Проведены комплексные исследования эффективности обученной модели с использованием тестовых выборок из датасетов. Показано, что точность детектирования летающих объектов на оптических изображениях выше, чем на изображениях, полученных в инфракрасном диапазоне, а результаты по скорости вычисления модели при анализе оптических и инфракрасных изображений близки. Даны рекомендации по использованию модели YOLOv4-CSP в системах компьютерного зрения для мониторинга воздушного пространства. Вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.

Ключевые слова

система компьютерного зрения, сверточная нейронная сеть YOLOv4-CSP, детектирование летающих объектов, беспилотный летательный аппарат вертолетного типа, беспилотный летательный аппарат самолетного типа

Авторы

ФИООрганизацияДополнительноE-mail
Небаба Степан ГеннадьевичТомский политехнический университеткандидат технических наук, доцент отделения информационных технологий Инженерной школы информационных технологий и робототехникиstepanlfx@tpu.ru
Марков Николай ГригорьевичТомский политехнический университетдоктор технических наук, профессор отделения информационных технологий Инженерной школы информационных технологий и робототехникиmarkovng@tpu.ru
Всего: 2

Ссылки

Zoev, I.V., Markov, N.G. & Ryzhova, S.E. (2019) Intelligent computer vision system for unmanned aerial vehicles for monitoring technological objects of oil and gas industry. Bulletin of the Tomsk Polytechnic University. Geo Assets Engineering. 330(11). pp. 34-49.
Alzubaidi, L., Zhang, J., Humaidi, A.J., Al-Dujaili, A., Duan, Y., Al-Shamma, O., Santamara, J., Fadhel, M.A., Al-Amidie, M. & Farhan, L. (2021) Review of deep learning: Concepts, CNN architectures, challenges, applications, future directions. Journal of Big Data. 8(1). pp. 53.
Makarenko, S.I., Timoshenko, A.V. & Vasilchenko, A.S. (2020) Counter Unmanned Aerial Vehicles. Part 1. Unmanned aerial vehicle as an object of detection and destruction. Systems of Control, Communication and Security. 1. pp. 109-146.
Klekovkin, V.A. & Markov, N.G. (2023) Model of convolutional neural network LeNet5 for detection and classification of air space objects in images. Bulletin of the Tomsk Polytechnic University. Industrial Cybernetics. 1(2). pp. 11-16.
Nebaba, S.G. & Markov, N.G. (2022) Effectiveness of moving objects detecting and tracking in airspace by images in near infrared. Light & Engineering. 30(2). pp. 62-69.
Girshick, R., Donahue, J., Darrell, T. & Malik, J. (2014) Rich feature hierarchies for accurate object detection and semantic segmentation. Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 580-587.
Ren, S., He, K., Girshick, R. & Sun, J. (2015) Faster R-CNN: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence. 39(6). pp. 1137-1149.
Bochkovskiy, A., Wang, C.Y. & Liao, H.Y.M. (2020) YOLOv4: Optimal Speed and Accuracy of Object Detection. Journal arXiv, preprint arXiv: 2004.10934v1.
Redmon, J. & Ali, F. (2018) Yolov3: An incremental improvement. Journal arXiv, preprint arXiv:1804.02767.
Wang, C.Y., Mark Liao, H.Y., Yeh, I.H., Wu, Y.H., Chen, P.Y. & Hsieh, J.W. (2019) CSPNet: A New Backbone that can Enhance Learning Capability of CNN. Journal arXiv, preprint arXiv:. 1911.11929v1. 10.48550/arXiv. 1911.11929.
He, K., Zhang, X., Ren, S. & Sun, J. (2015) Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition. Journal arXiv, preprint arXiv. 1406.4729v4.
Wang, C.Y., Bochkovskiy, A. & Liao, H.Y.M. (2021) Scaled-YOLOv4: Scaling Cross Stage Partial Network. Proceedings of the IEEE/cvf conference on computer vision and pattern recognition.
 Detection of flying objects in images using the YOLOv4-CSP convolutional neural network model | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2024. № 69. DOI: 10.17223/19988605/69/8

Detection of flying objects in images using the YOLOv4-CSP convolutional neural network model | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2024. № 69. DOI: 10.17223/19988605/69/8