Формирование одномерных распределений значений корреляторов агрегатов сетевого трафика | Известия вузов. Физика. 2020. № 4. DOI: 10.17223/00213411/63/4/30

Формирование одномерных распределений значений корреляторов агрегатов сетевого трафика

Предложена математическая модель потока агрегированных нагрузочных характеристик пакетов данных сетевого трафика в виде совокупности аналитических сигналов. При этом реальные части аналитических сигналов определены как функции числа пакетов в каждом агрегате, а каждый аналитический сигнал соответствует одному из флаговых индексов агрегата. Проведена условная аналогия между потоком агрегатов сетевого трафика и огибающей потока волновых пакетов когерентного электромагнитного поля, на основе которой рассмотрены фазовые портреты и корреляторы агрегатов сетевого трафика, подобные фазовым портретам и корреляторам огибающих когерентного электромагнитного поля. Показано, что фазовые портреты и одномерные распределения значений корреляторов возможно использовать для описания различных нормальных и аномальных состояний сетевого трафика, обусловленных сложными DDoS-атаками.

Formation of one-dimensional distributions of values of correlators of network traffic agregates.pdf Введение Для анализа сетевого трафика с целью обнаружения и классификации его аномальных состояний, вызванных, например, DDoS-атаками, было построено множество статистик, основанных на методах корреляционного, спектрального, фрактального и динамического анализа [1, 2]. Однако результаты применения данных статистик для обнаружения сложных атак [2] в литературе не приведены, а были лишь высказаны предположения о возможной применимости рассмотренных методов. В [3] был предложен и исследован новый метод корреляционного анализа связанных с сетевым трафиком сигналов, основанный на введении оператора их эволюции, а также экспериментально показана его применимость для обнаружения сложных атак на основе байесовской классификации. В данной работе оператор эволюции реконструировался по вещественным сигналам, связанным с нагрузочными характеристиками заголовков пакетов данных сетевого трафика. Цель настоящей работы - развитие метода оператора эволюции, но применительно к аналитическим сигналам трафика, позволяющим рассматривать сетевой канал передачи телеметрических данных как динамическую систему, описываемую обобщенными координатами и скоростями. Для этого вводятся поток агрегатов или агрегированных нагрузочных характеристик пакетов данных сетевого трафика, каждый аналитический сигнал связывается с одним из флаговых индексов агрегата, а значение его реальной части определяется как функция числа агрегированных пакетов. Для формирования статистик и их распределений, характеризующих различные нормальные и аномальные состояния трафика, в работе проводится условная аналогия между потоком агрегатов сетевого трафика и огибающей потока волновых пакетов когерентного электромагнитного поля. Важной задачей исследования является проведение численного эксперимента по использованию данных распределений для различения состояний сетевого трафика при сложных DDoS-атаках. 1. Постановка задачи В численном эксперименте использовались 10-минутные записи сетевого трафика, снятые с одного из Frontend-серверов к некоторому Web-сервису. Frontend-сервер работал под управлением сервера Nginx [4]. В качестве аппаратной поддержки применялась сетевая карта Qlogic с производительностью 10 Гбит/с. Для извлечения значений управляющих бинарных полей (флагов) заголовков передаваемых пакетов данных использовался формат потокового протокола передачи (TCP) [5,6]. Двоичная последовательность флагов образует двоичный код возможных флаговых индексов пакета. В эксперименте использовалось 6 флагов протокола TCP, образующих 64 флаговых индекса. Все пакеты данных, наблюдаемых на смежных интервалах с временной длительностью , были сгруппированы по 64 флаговым индексам. Для каждого j-го флагового индекса (j = 1, 2, …, J) каждого агрегата интервала регистрировались число пакетов и их общая информационная емкость (j == 1, 2, …, J). На основании рассмотренных данных построим статистическую и динамическую модели потока агрегатов сетевого трафика, а также их статистики, необходимые для формирования распределений статистик, описывающих различные состояния сетевого трафика. 1.1. Статистическая модель потока агрегатов сетевого трафика В результате был сформирован поток последовательных по дискретному времени (k = 0, 1, …, K) сгруппированных пакетов (агрегатов) сетевого трафика. Каждому k-му агрегату поставим в соответствие его обобщенную динамическую координату , где вид функции ( ) будет обоснован ниже. С помощью быстрого преобразования Фурье временного ряда и преобразования Гильберта [1] в частотной области вычислим значения обобщенной скорости для каждого k-го агрегата. Дискретную модель потока агрегатов сетевого трафика зададим в виде совокупности аналитических сигналов: (1) Пример реализации компонентов аналитического сигнала для нормального состояния трафика (normal) одного из флаговых индексов приведен на рис. 1. Из рисунка виден достаточно сложный флуктуационный характер дискретного аналитического сигнала . Рис. 1. Реальная X и мнимая Y компоненты аналитического сигнала Модель (1) совокупности флуктуирующих аналитических сигналов в форме спектрального представления выражается как [7]: (2) где - комплексные амплитуды гармонических составляющих сигналов с соответствующими плотностями распределений вероятности совокупностей комплексных значений спектральных амплитуд. Заметим, что в случае стационарных сигналов их усредненные спектральные плотности , определяемые через моменты второго порядка известной зависимостью Эйнштейна - Винера - Хинчина, являются описанием в целом структур сигналов в спектральном представлении [7]. При этом усреднение производится по ансамблю различных условий процедуры измерения сигналов с помощью многомерных плотностей распределений вероятности, зависящих лишь от абсолютных значений спектральных амплитуд из (2). При использовании плотностей возникает известная фазовая проблема - различным сигналам, спектральные амплитуды которых отличаются фазовыми составляющими, отвечают одинаковые спектральные описания [7]. Поэтому в общем случае как при стационарных, а тем более при нестационарных сигналах исключить фазовую проблему возможно, используя плотности . Таким образом, выражения (1) и (2) с учетом плотностей описывают статистическую модель потока агрегатов сетевого трафика. 1.2. Динамическая модель потока агрегатов сетевого трафика При описании динамической модели сетевого трафика будем использовать подход, основанный на операторе эволюции [3], но применительно не к самому введенному потоку аналитических сигналов (1), а к их нормированным образам, которым соответствует комплексный фазовый вектор : (3) Тогда динамическая модель изменения фазового вектора , двигающегося в соответствии с (3) по единичной гиперсфере, описывается оператором эволюции: (4) Используя результаты работы [3], запишем выражение для неэрмитового оператора эволюции из (4) для каждых дискретных моментов времени в виде (5) В дальнейшем будем использовать только реальную часть оператора эволюции: (6) 2. Аналогия потока агрегатов сетевого трафика с огибающей потока волновых пакетов когерентного электромагнитного поля Приведем в данном пункте полезную, на наш взгляд, аналогию рассмотренных моделей потока агрегатов сетевого трафика с моделью огибающей потока волновых пакетов когерентного электромагнитного поля. Полезность физических аналогий еще раз подтверждена в работе [8], в которой рассмотрено описание структуры (координатной волновой функции) фотона как «радиационного осциллятора», т.е. поведение электромагнитного поля фотона рассматривалось по аналогии с поведением механического осциллятора. Как будет видно далее, из аналогии, проводимой нами, будет получен явный вид функции , а главное - вид статистик агрегатов сетевого трафика и их распределений. 2.1. Поток волновых пакетов когерентного электромагнитного поля Осуществим с помощью сигналов (j = 1, 2, …, J) внешнюю пространственную модуляцию когерентного электромагнитного поля одного источника, имеющего комплексную амплитуду электрической напряженности c заданным единичным вектором поляризации и циклическую оптическую частоту . При этом каждому j-му флаговому индексу агрегата поставим в соответствие j-ю пространственную координату или моду поля. В результате получим поток волновых пакетов поля , каждая j-я пространственная мода которых описывается как (7) где - единичный импульс с длительностью , сдвинутый во времени на величину . Медленно меняющаяся по сравнению с частотой комплексная огибающая поля имеет в каждой своей j-й моде каждого k-го волнового пакета амплитуду и фазу . Запишем амплитуду в виде (8) Отсюда видно, что функцию логично выбрать как , поскольку , где - постоянная Планка; - число фотонов, излучаемых когерентным источником c мощностью . Тогда на каждую j-ю моду поля каждого k-го волнового пакета будет приходиться фотонов, пропорциональное числу пакетов в j-м флаговом состоянии для k-го агрегата, где - число фотонов, приходящихся на k-й волновой пакет. Например, для оптического диапазона ( Гц) число фотонов, излучаемых непрерывным лазером с мощностью P = 10 мВт в интервал времени агрегата = 50 мс, будет порядка . Поэтому даже для незначительных весов флаговых состояний, например для J = 64, числа фотонов в каждой моде поля будут большими ( 1013). Такой поток волновых пакетов из (7) можно рассматривать как квазиклассическое поле и описывать статистику его огибающих как их фазовыми портретами (ФП), так и классическими полевыми корреляторами [9, 10]. 2.2. Фазовые портреты потока агрегатов сетевого трафика Для статистического описания медленно флуктуирующей огибающей или аналитического сигнала , соответствующего классическому когерентному электромагнитному полю, наблюдаемому в одной пространственной моде (т.е. электромагнитному сигналу ), по аналогии с результатами работы [9] было введено распределение, названное распределением Глаубера [10]. Данное распределение является редуцированной оценкой многомерной плотности распределения вероятности комплексных амплитуд гармонических составляющих аналитического сигнала из представления (2): (9) где - дельта-функция Дирака. Распределение названо в [10] также ФП в силу следующего. Вещественные составляющие и аналитического сигнала связаны взаимным преобразованием Гильберта, т.е. и , где означает операцию свертки сигналов с обобщенной функцией (P - главное значение обобщенной функции). Протяженность обобщенной функцией дает причинную связь отсчетов аналитического сигнала , учитывая такие фазовые соотношения, как его прошлое, настоящее и будущее. В то же время по своему действию на сигнал гильберт-фильтрация аналогична взятию его производной [6]. Если считать измеряемый сигнал некоторой обобщенной координатой порождающего его динамического процесса, то гильберт-образ можно рассматривать как обобщенную скорость процесса. Тогда в соответствии с подходом Людвига Больцмана, Анри Пуанкаре и Уилларда Гиббса [11] распределение будет отображением процесса на фазовой плоскости : при изменении времени t изображающая точка с координатами , будет двигаться по некоторой траектории, формируя в пределе ( ) распределение . Следует заметить, что действительная и мнимая составляющие электромагнитного сигнала , также связанные взаимным преобразованием Гильберта, рассматриваются в оптике как его обобщенные координаты и скорости [9]. Однако в силу высокой несущей частоты электромагнитного поля оптического диапазона распределение , формируемое на плоскости Ван дер Поля [7], не наблюдаемо и имеет лишь теоретическое значение [7, 9, 10]. Следует заметить, что ФП играет роль, аналогичную многомерной плотности распределения вероятностей, но уже в двумерном пространстве, порожденном значениями измеряемого сигнала и его гильберт-образа. Его основным преимуществом по сравнению с исходным описанием, заданным в пространстве значений спектральных амплитуд сигнала, является значительное снижение размерности. В то же время оба статистических описания эквивалентны, так как в соответствии с (7) дают одно и то же среднее значение любой случайной физической величины - действительной функции , зависящей от данного сигнала через совокупность его комплексных спектральных амплитуд [10]: (10) В [12] показано, что ФП случайного комплексного сигнала является подобно (9) редукцией его n-точечной плотностью вероятности, которая наиболее полно описывает данный сигнал, поскольку позволяет определить элементарную вероятность прохождения его возможных траекторий через n «отверстий» с площадями , задаваемых в различные дискретные моменты времени ( ). Теоретически ФП соответствует плотности вероятности w совместных событий, заключающихся в том, что сигнал и его гильберт-образ принимают конкретные значения x и y в элементарной области . Элементарная вероятность того, что значения сигнала и его гильберт-образа находятся в данной области, равна . Поэтому она может быть легко оценена экспериментально путем измерения всевозможных комбинаций совместных значений попадания временных отсчетов сигналов и в элементарные -е области с координатами и последующим построением эмпирического распределения в виде нормированной двумерной гистограммы или диаграммы рассеяния ( ). При формировании ФП необходимо учесть, что все реализации случайных сигналов и практически недоступны. Поэтому в [12] было предложено производить оценивание ФП с помощью «размытия» эмпирического распределения , сформированного по реализации сигнала с достаточно большим временем T наблюдения, с использованием двумерной функции: (11) где, например, - произведение двух нормальных распределений со стандартными отклонениями и . В соответствии с рассмотренным для статистического описания потока агрегатов сетевого трафика необходимо формировать совокупность эмпирических распределений и с помощью (11) производить их сглаживание для оценивания теоретических ФП (j = 1, 2, …, J). Если считать, что сигналы флаговых состояний независимы, то результирующий ФП можно представить в виде . Однако для упрощения мы буднем использовать далее эмпирическое распределение в виде , где , (12) а - статистические веса или значимости флаговых индексов агрегатов. Тем не менее распределение , как и распределение , является сложным описанием, требующим больших вычислительных ресурсов. Поэтому мы рассмотрим далее более простые описания, используя также аналогию потока агрегатов сетевого трафика с огибающей потока волновых пакетов когерентного электромагнитного поля 2.3. Корреляторы потока агрегатов сетевого трафика Действию неэрмитового проекционного оператора из (5), отвечает действие реального физического объекта - объемной голограммы, записанной с помощью когерентных сигнальной и кодированной опорной электромагнитных волн [3]. Такая голограмма восстанавливает (путем резонансного брэгговского рассеяния) волну как отклик на входную волну , где . Тогда выходная волна несет огибающую или оптический сигнал, пропорциональный оптическому сигналу с коэффициентом перекрытия огибающей кодированной опорной волны и огибающей входной волны. При этом брэгговское рассеяние происходит на структуре объемных решеток, соответствующих структуре интерференции сигнальной и опорной волн [3]. В электродинамике контраст интерференционной картины, образованной электромагнитными волнами с амплитудами и , наблюдаемыми в двух пространственно-временных точках и , описывают нормированным коррелятором или комплексной функцией когерентности первого порядка [6, 9]: (13) модуль которой определяет контраст интерференционных решеток . Легко заметить, что рассмотренный в (6) оператор эволюции практически аналогичен , однако определяет контраст не отдельной интерференционной решетки, а целой интерференционной структуры , сформированной множеством ( ) решеток. Практически во всех экспериментах приведенное в (13) усреднение осуществляют путем временного накопления. Благодаря этому и проявляется высокий контраст ( ) интерференционных полос когерентных сигналов, поскольку для них [13]. Однако в нашем случае данное усреднение для флуктуирующих сигналов (см. рис. 1) не годится. Так, например, в [14] показано, что запись множества голограмм (в эксперименте их было записано несколько десятков) с различными сигнальными и опорными волнами, т.е. формирование усредненной структуры , приводит к снижению ее контрастности и размытию восстанавливаемых оптических сигналов. Поэтому мы будем использовать оператор эволюции, соответствующий смежным агрегатам (для k = 1, 2, …, K), а для количественного описания их связей введем парциальные (не усредненные по времени, но усредненные по флаговым индексам) корреляторы первого порядка: (14) (15) Диагональные матричные элементы статистического оператора из (15) соответствуют весам или значимостям одноименных флаговых индексов смежных агрегатов. Недиагональные матричные элементы определяют статистические веса связей их разнородных флаговых индексов. По сравнению с корреляторами, введенными в работе [3], нормированные парциальные корреляторы как средние (по флаговым индексам) значения физической величины, соответствующей оператору эволюции, учитывают перекрестные связи не только обобщенных координат смежных агрегатов сетевого трафика, но и их обобщенных скоростей, а также содержат информацию о статистических весах флаговых индексов смежных агрегатов. 3. Вычислительный эксперимент В вычислительном эксперименте были исследованы эмпирические распределения и для описания различных состояний сетевого трафика: нормального состояния - normal (r = 0); состояния атак tcpcon - TCP Connection Flood (r = 1); slowloris - Slow Loris (r = 2), httpget - HTTP Get Flood (r = 3). Данные атаки относятся к атакам прикладного уровня модели взаимодействия открытых систем (OSI) и по классификации работы [2] являются сложными для обнаружения. Ниже приведены некоторые эмпирические распределения для разных состояний сетевого трафика. 3.1. Фазовые портреты потока агрегатов сетевого трафика На рис. 2 приведены примеры эмпирических распределений , построенных для различных интервалов формирования агрегатов (50 мс, 1 мс). Виден различный характер их зависимости от переменных и , свидетельствующий о некотором вырождении распределений для малых : распределения практически зависят только от . Рис. 2. Эмпирические распределения : а) = 50 мс; б) = 1 мс 3.2. Корреляторы потока агрегатов сетевого трафика На рис. 3 приведены распределения значений парциальных корреляторов из (14) для = 50 мс. Наглядно видно значительное различие полученных распределений. Дополнительные численные эксперименты показали, что данное время является минимальным, при котором критерий различия распределений (16) удовлетворяет соотношению D > 0.9. На рис. 4 приведены экспериментальные (calculated data) и сглаженные (fit function) данные. При увеличении свыше 50 мс (selected aperture) критерий D практически не меняется, но при этом падает теоретическая вероятность чистых состояний агрегатов трафика: возрастает вероятность включения в его агрегаты пакетов, относящихся к атакам различного вида. Показанная на рис. 4 вероятность чистых состояний соответствует эффективному времени = 475 мс. Увеличение повлечет ситуацию, при которой агрегаты будут состоять из пакетов, относящихся к различным типам атак, что приведет к ошибке при оценивании состояний трафика. Рис. 3. Эмпирические распределения для = 50 мс Рис. 4. Зависимость меры D различия распределений и вероятности чистых состояний агрегатов от их временной апертуры Заключение Основным результатом проведенного исследования является построение статистической и динамической моделей потока агрегатов сетевого трафика на основе введения аналитических сигналов, зависящих от количества входящих в агрегаты пакетов данных с различными флаговыми индексами. Путем проведения условной аналогии между потоком агрегатов сетевого трафика и огибающей потока волновых пакетов когерентного электромагнитного поля рассмотрены фазовые портреты и парциальные корреляторы первого порядка смежных агрегатов сетевого трафика. В вычислительном эксперименте показано, что эмпирические фазовые портреты и одномерные распределения значений парциальных корреляторов возможно использовать для описания различных нормальных и аномальных состояний сетевого трафика, обусловленных сложными DDoS-атаками. В дальнейшем авторы намереваются провести исследование парциальных корреляторов более высокого порядка.

Ключевые слова

сетевой трафик, поток агрегатов, аналитический сигнал, аналогия, огибающая потока волновых пакетов, электромагнитное поле, фазовый портрет, парциальный коррелятор, network traffic, flow aggregates, analytical signal, analogy, envelope, wave packets flow, electromagnetic field, phase portrait, partial correlator

Авторы

ФИООрганизацияДополнительноE-mail
Краснов Андрей ЕвгеньевичРоссийский государственный социальный университетд.ф.-м.н., профессор РГСУkrasnovmgutu@yandex.ru
Никольский Дмитрий НиколаевичРоссийский государственный социальный университетк.ф.-м.н., доцент РГСУ.
Всего: 2

Ссылки

Kanarachos S., et al. // Information, Intelligence, Systems and Applications: Abstracts of 6th Int. Conf. - Corfu, Greece: IEEE, 2015. -P. 1-6.
Bhattacharyya D. and Kalita J. DDoS Attacks: Evolution, Detection, Prevention, Reaction, and Tolerance. - Boca Raton: CRC Press Taylor & Francis Group, 2016. -283 p.
Краснов А.Е., Надеждин Е.Н., Никольский Д.С. // Чебышевский сборник. - 2018. - Т. 19. - № 2. - С. 217-233.
Nedelcu C. Nginx HTTP server, third edition. - Birmingham: Packt Publishing Ltd., 2015. - 451 p.
URL: https://search.packtpub.com/?query=Nginx
Postel J. (ed.). Internet protocol - DARPA Internet Program Protocol Specification, rfc791 (Internet standard), Los Angeles: USC/Information Sciences Institute, 1981. - 45 p. URL: https://tools.ietf.org/html/12.
Postel J. (ed.). Transmission control protocol - DARPA Internet Program Protocol Specification,rfc793 (Internet standard), Los Angeles: USC/Information Sciences Institute, 1981. - 85 p. URL: https://tools.ietf.org/html/rfc793
Рытов С.М. Введение в статистическую радиофизику. Ч. 1. Случайные процессы. - М.: Наука, 1976. - 484 с.
Канавин А.П., Крохин О.Н. // Квантовая электроника. - 2018. - Т. 48. - № 8. - С. 711-714.
Glauber R. // Phys. Rev. -1963. - V. 130. - No. 6. - P. 2529-2539.
Краснов А.Е. // Радиотехника. - 1997. - № 2. - С. 49-54.
Nolte D.D. // Phys. Today. - 2010. - V. 63. - No. 4. - P. 31-33.
Краснов А.Е., Компанец И.Н. // Радиотехника. - 2001. - № 1. - С. 55-60.
Клаудер Дж., Сударшан Э. Основы квантовой оптики. - М.: Наука, 1970. - 428 с.
Краснов А.Е. // Квантовая электроника. - 1977. - Т. 4. - № 9. - С. 2011-2013.
 Формирование одномерных распределений значений корреляторов агрегатов сетевого трафика | Известия вузов. Физика. 2020. № 4. DOI: 10.17223/00213411/63/4/30

Формирование одномерных распределений значений корреляторов агрегатов сетевого трафика | Известия вузов. Физика. 2020. № 4. DOI: 10.17223/00213411/63/4/30