Описывается работа датчика, генерирующего устойчивые распределения. В основу моделирования положена обобщенная ЦПТ. Предложены формулы для определения параметров датчика.
On the stable-number generator design with characteristic exponent greater than one.pdf При изучении и построении моделей различных явлений часто используется нормальное распределение, зависящее от двух параметров, описывающих его. Но нормальное распределение, в свою очередь, принадлежит к более широкому классу устойчивых распределений, обладающих набором 4 параметров, благодаря чему при их применении возможна более тонкая настройка модели под реальные данные. Кроме того, использование нормального распределения не приводит к удовлетворительным результатам для описания явлений, имеющих импульсный характер, когда вероятность появления экстремального значения отлично от нуля. Поэтому устойчивые распределения, главной особенность которых являются «тяжелые хвосты», нашли широкое применение во многих областях [1-3]. Например, при описании и получении характеристик процессов в теории лазерного охлаждения атомов [4] и радиотехнике [5]. В [6] устойчивые распределения использовались для получения оптимального портфеля акций на основе методологии VaR. В работе [7], применяя устойчивые распределения, авторы предлагают алгоритм оценивания параметров регрессионных уравнений, обеспечивающий максимально правдоподобное оценивание даже в ситуациях, когда распределение случайных ошибок имеет большую дисперсию. Таким образом, имеющаяся потребность построения моделей с использованием устойчивых распределений делает актуальной задачу разработки датчиков для моделирования этих законов. Существует несколько подходов [8, 9] к моделированию одномерных устойчивых распределений. Наиболее часто применяется алгоритм, основанный на интегральном представлении Золотарева [10, 11]. Эти методы нельзя использовать для построения датчиков в многомерном случае, поскольку потребуется применение теоремы Коши в Zd, что является практически невыполнимой задачей. Указанная проблема не возникает, если разработка датчика основана на обобщенной ЦПТ [5]: Y при n ^да, a e(1,2), X + •••+Xn bn1 a Sn = (1) где Xj - центрированные независимые одинаково распределенные случайные величины со значениями из d-мерного евклидова пространства Rd, принадлежащие области притяжения устойчивых законов, а нормирующий множитель b зависит от формы параметризации устойчивой случайной величины Y. Первым шагом в применении (1) является разработка датчика для одномерного случая. Таким образом, стоит задача получить такие значения параметра b, чтобы распределение суммы Sn сходилась к распределению устойчивой случайной величины Y. Эту задачу можно решить через рассмотрение соответствующих им характеристических функций. Характеристическая функция устойчивого распределения в форме (А) представляется следующим образом [3]: {( па -(aa )а11 - фa tg—sign(t) (2) где Y - устойчивая случайная величина. Следовательно, необходимо получить характеристическую функцию суммы Sn. 1. Характеристическая функция суммы Sn Для моделирования двухстороннего устойчивого распределения использовалась смесь распределений Парето, которые являются наиболее простыми случайными величинами из области притяжения Y: Xj = pX+ + qX-, p + q = 1, (3) где X + = XX + - MX + , X- = XX- - MXа X + и X ^ имеют следующие функции распределения: la 1 -—, x -l, a 1--, X > r, Xa 0, x < r, Fx + (X) = и FX- ( x) = где r и l - граничные значения, являющиеся параметрами масштаба. Математические ожидания вычисляются по формулам al ar MX + = MX~ =a -1 a -1 Так как Xj - независимые одинаково распределенные по Парето случайные величины, то характеристическая функция их суммы равна произведению их характеристических функций fSn(t) = [fX(t/(bnla)]n. Поэтому сначала была вычислена характеристическая функция нормированной суммы Sn из (1), в которой отцентрированные математическим ожиданием слагаемые Xj имеют вид (3) t Л „ ( t fs_ (t) = Pf X 1/a .„1/ a 1+ qfX bn1 a; v bn1 Таким образом, было получено следующее выражение для характеристической функции суммы Sn смеси распределений Парето: (-itr )аГ(2 - a^-^L^) -i|t|2 r2 П Sign(t) f^ (t) = exp 2^_П2„(2/ a-1) 2 (2/a-1) 2b2 (a -1)2 n b2 n bn (a -1)ba (itl )ar(2 - a, -%) i|t|212-П sign(t) ^ +_bn + 2 12l2 +Rn (t), +q 2^-П2и(2/a-1) 2 (2/a-1) 2b2 (a -1)2 n b2 n (a -1)ba где Г( , ) - верхняя неполная гамма-функция, а Rn(t) - остаточный член и Rn(t)^0 при n^-да. 2. Моделирование устойчивых случайных чисел в форме A Теперь необходимо установить взаимосвязь между параметрами смеси распределений Парето и устойчивого закона. При n^-да характеристическая функция суммы Sn приобретает вид (-Г(1 - a). fs (t) ^ exp -Г(1 - a) (pra + qla )cosna|t|0 -(p(-itr)a + q(itl)a )}, n Vt e R. Применяя формулу для главного значения степени комплексного числа получим ' na 2 f (t) = exp (4) (л .pra - qla t na . (t) ^ 1 -1 a ,a t^^Sign(t) v pra + ql 2 , Для того чтобы характеристическая функция суммы Sn имела в пределе вид характеристической функции устойчивого распределения (2), необходимо определить параметр b следующим образом: ,a na ql coS^ Itl l 1a) r(2 - a, ) 1 - a bk - 1n f na pr cos-1 - a 1 К = -Г(2 - a,- (5) bk-1n a Как видно, параметр b зависит от t. Необходимо выбрать единственное значение b, поэтому потребовалось ввести меру качества аппроксимации fy(t) функцией fSn(t). Размеры существенной области D = {t: te [-tm, tm]}, в которой сравниваются характеристические функции, находятся на основании равенства Парсеваля, применяемого в теории цифровой обработки сигналов [5], при этом должно выполняться < 1 - е, Y(1/a,2aл • tm) Г(1/ a) где у(-, ) - нижняя неполная гамма-функция, а параметр etm выбран равным 10- и отвечает за уровень энергии отброшенных высокочастотных составляющих функции плотности f(x). Значения границ существенной области помещены в табл. 1. Таблица 1 Границы существенной области характеристической функции при aA= 1 a 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 1,95 1,99 1,999 tm 3 2,7 2,5 2,3 2,1 2 1,9 1,8 1,8 1,7 1,7 1,7 Порядок нахождения b следующий: для каждого tj из D по рекуррентной формуле (5) методом простой итерации до достижения точности £b=10-3 вычисляется b(tj): b = {bk*: \bk* -bk*-1I ^ £b Затем из всех полученных b(tj) выбирается такое, которое удовлетворяет bonT = arg min max Ifs (tf) - fY (t,)| . b(tj) tj&i n J 1 Из (2) и (4) видно, что параметры смеси распределений Парето и параметры устойчивого распределения связаны соотношениями ' p+q = 1 ■ pra + qla = oA, (6) .pra - qla = oA • Pa. 3. Результаты моделирования Для моделирования устойчивых случайных величин задаются следующие параметры: pA е (-1; 1), oA > 0; p < 1. Можно показать, что разные p и q, r и l, удовлетворяющие системе (6), дают хорошее приближение для теоретической функции плотности. При сравнении эмпирической и теоретической функций плотности fSn(x) и f(x) необходимо учитывать специфику поведения устойчивых распределений - «тяжелые хвосты». Поэтому было наложено следующее ограничение на диапазон [xl, xr], в котором проверяется работа датчика. Граничные значения xl, xr должны удовлетворять уравнению fY (X) = £ f . Параметр £f отвечает за размеры существенной области f(x). При реализации алгоритма был выбран уровень £f = 0,01. В этой области необходимо определить шаг дискретизации. Для восстановления функции плотности в теории цифровой обработки сигналов используют теорему Котельникова [5], которая устанавливает границы для шага по оси х: Ах < 1/(2tm). Полагая Дх = 1/(2tm), получим сетку значений {Xj = xl + Ахj, j = 0,...,N}, где N = [(xr - х1)/Дх]. Для оценки качества аппроксимации f(x) эмпирической функцией плотности fSn(x) вычисляются следующие показатели: 1) максимальное отклонение функций max AE = max | fY (х, ) - fsn (х, )|; Xj n 2) средняя абсолютная ошибка 1 N MAE = NT+T XI fY (Xj )- fsn (Xj)|; MAPE = fc^^M .100%. N + 1 j=0 fY (Xj ) В табл. 2 представлены параметры смеси распределений Парето и значения функционалов ошибки для различных значений параметров a и pA при p = 0,5, K = 105, n = 104. Отметим, что для отрицательных pA необходимо поменять местами значения r и l. Таблица 2 Параметры смеси распределений Парето и значения функционалов ошибки ачений параметров а и pA, aA p= 0,5 при p=1 при р=1 для различных значений параметров а и pA, aA=1, K = 105, n = 104, a в r l b maxAE MAE MAPE, %% 0 1 1 1,6264 0,009878 0,001894 0,0019 1,2 0,25 1,204 0,787 1,6263 0,008067 0,008067 3,9253 0,75 1,594 0,315 1,6249 0,009280 0,002038 3,4554 1 1 - 1,6265 0,008247 0,002122 3,8062 0 1 1 1,7745 0,010086 0,003207 4,7693 1,5 0,25 1,16 0,825 1,7735 0,012438 0,003472 5,5148 0,75 1,452 0,397 1,7647 0,013317 0,004831 4,9774 1 1 - 1,7745 0,015652 0,005233 5,3763 0 1 1 1,8979 0,011477 0,003999 4,8542 1,7 0,25 1,140 1,140 1,8957 0,013808 0,005252 6,8994 0,75 1,390 0,442 1,8766 0,024535 0,008694 7,9243 1 1 - 1,9031 0,022852 0,010870 9,4221 0 1 1 2,0063 0,019069 0,008836 7,6308 1,9 0,25 1,125 0,859 2,0027 0,022860 0,009066 7,8948 0,75 1,343 0,482 1,9755 0,032926 0,015570 11,0892 1 1 - 2,0495 0,041990 0,019988 13,9168 0 1 1 2,0378 0,013389 0,007777 6,5597 1,95 0,25 1,121 0,863 2,0338 0,020848 0,008471 7,0071 0,75 1,332 0,491 2,0134 0,042061 0,018752 12,4505 1 1 - 2,0889 0,043147 0,022561 14,8206 Работа датчика продемонстрирована на рис. 1 и 2, где, кроме того, для сравнения представлена теоретическая функция плотности fY(x) и указана информация о количестве слагаемых Xj - n, параметрах устойчивого закона, количестве сгенерированных устойчивых чисел K. Из графиков, представленных на рис. 2, видно, что при a^-2 предельные формулы для характеристической функции суммы Sn и полученное из них выражение для поиска параметра b не дают необходимой точности аппроксимации, а следовательно, требуется уточнение формул при конечном n. 1 3) средняя абсолютная процентная ошибка Рис.1. График функций плотности сгенерированных чисел и устойчивой случайной величины при разных pA в форме A при n = 104, K = 105, oA = 1; a = 1,2 (а), a = 1,5 (б) .А 0,3 0,3 б a \\ w \ 0,2 0,2 •• Random generator ■ Theoretical a=1 Random generator Theoretical a=1 0,1 0,1 J У 0 6 -6 -2 0 2 4 -4 -2 0 2 4 6 Рис.2. График функций плотности сгенерированных чисел и устойчивой случайной величины в форме A при n = 104, K = 105, pA = 0,75, oA = 1; a = 1,9 (а), a = 1,95 (б) Заключение В работе получены формулы для моделирования случайных величин, имеющих устойчивое распределение с характеристическим показателем a е (1,2) для формы параметризации A. Работа датчика демонстрируется на графиках.
Nolan J.P. Numerical calculation of stable densities and distribution functions // Commun. Statist. Stochastic Models. 1997. V.13. P. 759-774.
Chambers J., Mallows C., StuckB. A method for simulating stable random variables // Journal of the American Statistical Association. Theory and Methods Section. 1976. V. 71. No. 354. P. 340-344.
Uchaikin V.V., Zolotarev V.M. Chance and Stability. Stable Distributions and their Applications. Utrecht: VSP, 1999. 594 p.
Janicki A., Weron A. Simulation and Chaotic Behavior of -Stable Stochastic Processes. New York: Marcel Dekker, 1994. 355 p.
Денисов В.И., Тимофеев В.С. Устойчивые распределения и оценивание параметров регрессионных зависимостей // Известия Томского политехнического университета. Томск: Изд-во ТПУ, 2011. Т. 318. № 2. С. 10-15.
Mittnik S., Rachev S., and Schwartz E. Value-at-risk and asset allocation with stable return distributions // Allgemeines Statistisches Archiv. 2002. V. 86. No. 1. P. 53-68.
Маслов О.Н. Устойчивые распределения и их применение в радиотехнике. М: Радио и связь, 1994. 152 с.
Samorodnitsky G. and Taqqu M.S. Stable Non-Gaussian Random Processes. New York: Chapman and Hall, 1994. 632 p.
Барду Ф., Бушо Ж.-Ф., Аспе А., Коэн-Таннуджи К. Статистика Леви и лазерное охлаждение. Как редкие события останавливают атомы: пер. с англ. / под ред. В.П. Яковлева. М.: ФИЗМАТЛИТ, 2006. 216 с.
Rachev S., Mittnik S. Stable Paretian Models in Finance. Wiley, 2000. 855 p.
Золотарев В.М. Одномерные устойчивые распределения. М.: Наука, 1983. 304 с.