Обнаружение аномалий в составных объектах в формате JSON | Прикладная дискретная математика. 2022. № 56. DOI: 10.17223/20710410/56/5

Работа посвящена проблеме защиты от компьютерных атак современных веб-приложений и мобильных приложений с «облачной» серверной частью. Рассматривается задача обнаружения вредоносного содержимого в данных в формате JSON, который стал одним из самых распространённых способов сериализации и передачи объектов между клиентской и серверной частями приложений. Предложен метод построения эталонной модели для некоторой заданной коллекции JSON-объектов, на основе которой можно обнаруживать аномалии различных типов. Эталонная модель строится на основе моделей простых типов, входящих в состав объектов из коллекции, а также схемы, которая обобщает их структуру. Экспериментально исследован метод построения эталонной модели с использованием модификаций, затрагивающих структуру JSON-объекта, а также внедрения SQL-инъекций, инъекций команд ОС и JavaScript/HTML-инъекций. Проведён анализ статистической значимости предсказаний модели, измерено качество работы модели, определяемое коэффициентом корреляции Мэтьюса, на тестовых выборках, состоящих из данных, взятых из трафика реальных веб-приложений.
  • Title Обнаружение аномалий в составных объектах в формате JSON
  • Headline Обнаружение аномалий в составных объектах в формате JSON
  • Publesher Tomask State UniversityTomsk State University
  • Issue Прикладная дискретная математика 56
  • Date:
  • DOI 10.17223/20710410/56/5
Ключевые слова
безопасность веб-трафика, обнаружение аномалий, машинное обучение
Авторы
Ссылки
www.json-schema.org. JSON Schema. 2021.
Frozza A. A., dos Santos Mello R., and da Costa F. S. An approach for schema extraction of JSON and extended JSON document collections // IEEE Intern. Conf. IRI. 6-9 July 2018. P. 356-363.
Klettke M., Storl U., and Scherzinger S. Schema extraction and structural outlier detection for JSON-based NoSQL data stores // Conf. BTW, Hamburg, Germany, 4-6 March 2015. P. 425-444.
Baazizi M. A., Colazzo D., Ghelli G., et al. Parametric schema inference for massive JSON datasets // VLDB J. 2019. V.28. No.4. P.497-521.
Miller B. N. Detection of Malicious Content in JSON Structured Data using Multiple Concurrent Anomaly Detection Methods. Dissertation. Eastern Michigan University, 2016. 125 p.
www.github.com/payloadbox. Payload Box. 2021.
www.github.com/fuzzdb-project/fuzzdb. FuzzDB Project. 2021.
www.kaggle.com/syedsaqlainhussain/sql-injection-dataset. SQL injection dataset. 2021.
www.kaggle.com/syedsaqlainhussain/cross-site-scripting-xss-dataset-for-deep-learning. Cross site scripting XSS dataset for Deep learning. 2021.
Baldi P., Brunak S., Chauvin Y, et al. Assessing the accuracy of prediction algorithms for classification: an overview // Bioinformatics. 2000. V. 16. No. 5. P.412-424.
Chicco D. and Jurman G. The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation // BMC Genomics. 2020. V. 21. No. 1. P. 1-13.
Chicco D., Totsch N., and Jurman G. The Matthews correlation coefficient (MCC) is more reliable than balanced accuracy, bookmaker informedness, and markedness in two-class confusion matrix evaluation // BioData Mining. 2021. V. 14. No. 1. P. 1-22.
 Обнаружение аномалий в составных объектах в формате JSON | Прикладная дискретная математика. 2022. № 56. DOI: 10.17223/20710410/56/5
Обнаружение аномалий в составных объектах в формате JSON | Прикладная дискретная математика. 2022. № 56. DOI: 10.17223/20710410/56/5