Построена процедура синтеза сходящихся в среднеквадратичном непараметрических ядерных оценок функционалов от неизвестных распределений по стационарным выборкам слабозависимых случайных величин в условиях равномерно сильного перемешивания. Получены достаточные условия сходимости полученных оценок в среднеквадратичном. Показана асимптотическая нормальность полученных оценок. Рассмотрена возможность применения предложенной процедуры в экономических и технических приложениях.
Procedure of a nonparametric estimation of terminal type functionals and its application in economic and engineering applications.pdf Для решения многих задач прикладной статистики в условиях отсутствия априорных сведений о функции распределения (ф.р.) F(х) наблюдаемых многомерных случайных величин требуется оценивание функционалов, представимых в виде [1, 2] H(F(х),F(a1)(х),...,F)(х)), хеRm, (1) где H: Rs+ ^ R1 - заданная функция, в качестве аргументов которой выступают Ааа Ь ч daqF(х) частные производные F q (х) =—а-а- порядка а =аq1 +... + аqm, ax^13x2q 2 ...a*mr q = 1, s, функции распределения F(х) в точке х е Rm . Мультииндекс aq = (а q1,..., а qm) здесь и далее представляет собой целочисленный вектор с неотрицательными составляющими. К функционалам типа (1) относится функция интенсивности Х( x) = F (1)( x)/(1 - F (x)) (теория надежности и массовое обслуживание [3, 4]), логарифмическая производная плотности x) = F (2)( x)/ F (1)( x) (проверка близких гипотез [5, 6], непараметрическая нелинейная фильтрация марковских процессов [7], оценивание кривой регрессии [8]), функционал потенциала экономической системы [9]. Естественный и наиболее распространенный метод оценивания состоит в подстановке вместо производных F('aq)(х) их состоятельных оценок F('aq)(х), q = 0, s . Однако прямое использование этого метода не всегда гарантирует получение оценок нужного качества, если, например, функция H (•) в (1) имеет некоторые особенности (неограниченность, недифференцируемость и др.). В результате некорректной подстановки может получиться оценка, не имеющая дисперсии или даже математического ожидания. В данной работе предложена универсальная процедура получения сходящихся в среднеквадратичном оценок функционалов (1) на основе использования непараметрических оценок ф.р. F(x) и ее производных F)(x) ядерного типа и операции усечения больших значений статистик н (F (x), F(a1)(x),..., F (as) (x)) , получаемых по методу прямой подстановки этих оценок в H (•). 1. Обозначения и определения Пусть {x(j) е Rm} - стационарная в узком смысле последовательность случайных величин, заданных на пространстве {X, BX, р }; F(x) = p (x(j) < x) - ф.р. элементов последовательности {x( j)}. Будем говорить, что {x( j)} удовлетворяет условию равномерно сильного перемешивания (РСП), если ее коэффициент перемешивания ф x (т) [10] удовлетворяет условию Ф x (т) = sup { Px (^B) Px (B): A еЗ*, B еЗ>т, Px (A) * 0}--— 0.(2) A,B I Px(A) J Здесь 3k - алгебры, порожденные соответственно семействами {x(t) : т < k}, {x(t) : т > k} . При построении состоятельных оценок F(fiq)(x) неизвестных F('aq)(x), определяющих значение функционала (1), будем использовать оценки ядерного типа. Для каждой оцениваемой величины F(аq)(x) рассмотрим да-мерное ядро m Kq (u) = П Kqi (и,-), представляющее собой произведение заданных одномерных i=1 ядерных вещественных функций Kqi (u, ): R1 ^ R1. В качестве состоятельных оценок F(fiq)(x) величин F(fiq)(x) рассмотрим оценки ядерного типа F{а q)(x) = F(a q)(x) i кq:: nhqaq j=1 q ( ( -Л x - x (j ) hq . (3) ( I x, - xi (j) hq . _m pP-qi 'n-VK* i=1 cx> x - x( j) hq . где K(;q) есть произведение производных одномерных ядерных функций; hq - параметр размытости. Оценки строятся на основе выборки Xn = (x(1),...,x(n)) объема n из генеральной совокупности всех последовательностей {x(j)}. В (3) и везде далее: q = 0,s ; a = (a1,a2,...,am); a = a1 +a2 + ... + am ; если x е Rm и a е Rm, то тогда xa = x^1xa2 ... xmm ; если x е R1 и а е Rm, то тогда xa = xal+а2+"+ y » xi > yi, i = 1, m ; ф(п) X у (n) » ф(п) < у (n) Vn > N ; sgn(х) = (sgn(x1), sgn(x2),..., sgn(xm)), где sgn(x.-) = Определение 1. Последовательность h = h(n) положительных вещественных чисел h е Hk, h е Hk e, если она удовлетворяет соответственно условиям lim | h +——1—— | = 0, lim | h+ —--1-— | = 0. n^A nh -sgn(k) J n^»^ n h -sgn(k) J Определение 2. Функция f е Na (х), если f (х) абсолютно непрерывна на Rm и имеет непрерывную производную f (a)( x) =_да^_ порядка а в точке х ; f е N+ (х), если f е Na (х) и sup | f(v) (х) | 0, если I x}. > 0, 0, xj = 0, -1, x; < X (1 -т/n )(фх (т))1/ p =0(1). т=1 Замечание 1 . Если фx(т) = с1х (1+е), е > 0 , то {x( j)} е Seqp , где p е (0, 1 + е). n Действительно, в этом случае -т/n)(т)-(1+е)/p =O((n)1-0+e)/p) + O(1) = O(1), т=1 если 0 < p < 1 + е . Подтверждением того, насколько широкое распространение находят последовательности РСП с.в. класса Seqp в практических приложениях, служит следующий пример. Рассмотрим последовательность с.в. {x(j)}, где x(j) представляет собой номер исхода в j-м испытании для однородной цепи Маркова с конечным числом состояний. Как показано ([10, с. 466-467]), «при достаточно широких условиях» последовательность {x( j)} стационарна и удовлетворяет условию РСП с коэффициентом перемешивания ф x (т) < K рт, р< 1. Следовательно, {x(j)} е Seqp. Отметим, что марковские процессы широко используются в различных практических приложениях: радиофизике, автоматике, телемеханике, ядерной физике [11,12], экономике [13] и др. Рассмотрим последовательность с. в. :(a) = K(a) f x - x(j) l - EK(a) ( x - x(j) . h J V h порождаемую выборкой Xn. Введем неограниченно возрастающую числовую последовательность dn с помощью равенства 1 s 1 _ -V_1_(5) dn £ nh!2a'-sgn(a') " j - K(a) ( | - EK(a) p J> | , () В соответствии с (4) и (5) положим = Й, n hSgn(a) D 1 i ч w n-1 = lim ( j-)l = V j=1 J j=1 J 5 ^ { E () )5 + 2n>: (1 -т / n )E d CTa = lim Pa" " 'a nh2a-sgn(a) ' Обозначим в„, - f (и)--"K(1)(u)du . -,a J (- -1)! 2. Усеченные оценки функционалов Рассмотрим функционал H (т( x)), где т( x) - (F (0)( x), F (a1)( x),..., F (a*)(x)). Положим tn(x) -(t0n(x),...,tm(x)), tin(x) - )(x) , Tn (x) - Etn (x), тш (x) - EFf')(X). Без ограничения общности везде далее m m >Хау , если i ф s . j=1 j=1 В некоторых случаях корректное использование прямого метода подстановки при оценивании H (т( х)) дает неудовлетворительный результат, так как наличие особенностей функции H(•) приводит к «выбросам» и несостоятельности получаемых таким способом оценок H (tn). Для избежания нежелательных эффектов такого сорта введем операцию усечения больших значений H (tn): ) = fH (tn ), 1 H (tn )l< (6) [C sign( H (tn ))dl, l H (tn )|> Cdl. Здесь C,у-положительные константы. Определенная таким образом процедура усечения (6) задает класс PC Y (H) зависящих от n функционалов, которые сходятся в среднеквадратичном к H (т(х)) при n —^ ж . Следующая теорема дает условия, при которых усеченная оценка G(tn) е PC в(H) сходится в среднеквадратичном к H(т(х)) при n — ж . Теорема 1. Пусть элементы выборки Xn взяты из последовательности слабозависимых случайных величин {х(j)} е Seqp , p > 1, причем F е N+ (х), цк > аш +1, i = 0, s ; k = 1, m . Пусть, кроме того, 1. h0 е H0; hj е H * , 5, =--/+ ' 1)) ' , j > 1; j'j J (2ц- 1)(ц + Wj-1)) C = max {sup j=0,4 и K (a j )(и) (7) 2Ц-1 (8) 2(ц- ws) Тогда усеченная оценка G(tn) е PC в(H) сходится к Hs(т) при n —ж в среднеквадратичном. При этом оптимальные последовательности параметров размы тости {hj} имеют вид h0 = Argmin u (G(tn)) и o I f 1 1ц (2ц-1) ц+Ws -1 2ц-1 h; = Argminu (G(tn)) = (9) V n (2ws - 1)ц!ст2(х) 1 2(ц - Ws )к,2F(ц)(х) n Л s's 1 Ц+Wj -1 j =1, s. (2Wj - 1)(ц- Ws - 1)!Hs (т)к (2ws - 1)(ц- Wj -1)!Hj (т)к; ; а оптимальная СКО u (G(tn)) равна -(G(tn)) - E(G(tn) - H(т))2 2(ц- Ws ) (ц-Ws ) 2(2Ws-1) 2(2Ws-1) 1 f (х)| 2ц-1 • ^ -(а,, )2ц-Г •(KsПЦ-Г • H2(т)•((x)) 2ц-1 ,(10) 2 2ws -1 | 2ц-1 2ц-1 ((ц-1)!) R..... = 2 . У a + где Ц,Ws V2(ц-Ws)J V"' ''' 2(ц-Ws) не зависящая от ядерных функций константа. кs = | (и)"-1 K(as \и^и ; aas = )(и))и f (х) i=1 В (9) и (10) ц = £ц , Ws =£ s / , s • i=1 Следующая теорема устанавливает асимптотическую нормальность оценок усеченного типа. Теорема 2. В условиях теоремы 1 JTn (G^(х),...,F(as)(х))-G(F(0)(х),...,F(as)(х))) (^ N^; р), ^ n = Hs (• j (и)"-a K1 (и)dи F^-M • (h; ) ц-Ws -> s ; p = Hs2(т)а„ (х). где Теорема 1 является конструктивной и дает способ построения оценок G(tn) е PC в (H) функционала H (т), сходящихся в среднеквадратичном к его истинному значению. Как следует из (10), асимптотическая СКО u2(G(tn)) таких оценок мажорируется степенной функцией, которая при увеличении параметра гладкости ц ф.р. F(х) неограниченно сближается с функцией 1/ n : 2 2l^-Ws) u (G(tn)) х C • R^W (n2ц-1 . Здесь C не зависит от ц и s. Известно, что скорость сходимости СКО и 1/ n имеет место в параметрической постановке задачи оценивания [1, 5]. Тот факт, что скорость сходимости СКО предлагаемых усеченных непараметрических оценок при соблюдении некоторых условий регулярности (условия 2 и 3 теоремы 1) неограниченно сближается с нижней границей сходимости СКО в параметрической постановке, говорит о перспективности процедуры усечения (6). 3. Применение «усеченной» процедуры непараметрического оценивания функционалов от распределений стационарных последовательностей в экономических и технических приложениях Предложенная в разделе 2 процедура усеченного непараметрического оценивания терминальных функционалов может быть реализована при решении различных задач экономики и техники. Одной из таких задач является задача распознавания пространственно распределенных объектов. Задачи распознавания пространственно распределенных объектов возникают в многих приложениях экономики, техники, метеорологии (лесных пожаров, посевных площадей, объектов загрязнения, затопления, тайфунов, ледниковых полей и т.д.). Описанная выше процедура оценивания в сочетании с процедурой функционального шкалирования [14] может быть использована для решения подобных задач. Пусть каждому объекту s е S из множества S однозначно соответствует вектор количественных дискрипторов xs еЗсRn ; причем для любого xе3 существует вероятность PA (x) его принадлежности к классу A и вероятность PB (x) = 1 - PA (x) принадлежности к классу B . Пусть E = {ег- е S, i = 1, n} с S - выборочное множество объектов, совокупность дескрипторов x(i) = {xj (i), j = 1, m} которых образует обучающую выборку {x(n) е Rm} слабозависимых случайных величин с неизвестной функцией распределения F(x); о каждом из объектов еi е E сообщается, к какому классу он принадлежит. Требуется восстановить функцию достоверности PA (x). Рассмотрим функцию /1, x е A, 1 (X) = {0, x е B, которая в точке x равна 1 с вероятностью PA (x) и 0 - с вероятностью PB (x). Ее математическое ожидание равно PA (x), т.е. той функции, которую надо восстановить. Пусть G(y, z) = y - z - «опорная» функция двух вещественных переменных, которая вместе с I (x) определяет на исходном множестве S матричную структуру Q =|| qik ||mxm , элементы которой определяются следующим образом: qlk = G(I(x(i)), I(x(k))) = I(x(i)) -1(x(k)) . Предположим, что I (x) есть информация о значениях PA (x), сообщаемая с помехой x), математическое ожидание которой равно нулю: I(x) = Pa (x) + 5(x), E[I(x)] = PA (x) . Аппроксимируем искомую функцию PA (x) некоторой неизвестной параметризованной функцией-шкалой ф(x, b) из заданного класса вещественных функций Ф = {Ф( x, b)}: Гz = ф(x, b), 0
Авен П.О., Мучник И.Б., Ослон А.А. Функциональное шкалирование. М.: Наука, 1988. 182 с.
Рюмкин В.И. Процедура функционального шкалирования пространственно распределенных объектов // Обозрение прикл. и промышл. матем. 2004. Т. 11. Вып. 4. C. 916-917.
Тихонов В.И., Миронов М.А. Марковские процессы. М.: Советское радио, 1977. 488 с.
Дынкин Е.Б., Юшкевич А.А. Управляемые марковские процессы и их приложения. М.: Наука, 1977. 172 с.
Кошкин Г.М., Рюмкин В.И. Оптимальные непараметрические алгоритмы выделения сигналов на фоне стационарной слабозависимой помехи // Математическое и программное обеспечение анализа данных. Минск, 1990. С. 114.
Ибрагимов И.А., Линник Ю.В. Независимые и стационарно связанные величины. М.: Наука, 1965. 524 с.
Надарая Э.А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси: Изд-во Тбилисского университета, 1983. 192 с.
Беленький В.З. О понятии потенциала экономической системы // ЭНСР. 2006. № 1(32). С. 17-28.
Добровидов А.В. Асимптотически s-оптимальная непараметрическая процедура нелинейной фильтрации стационарных последовательностей с неизвестными статистическими характеристиками // Автоматика и телемеханика. 1984. № 12. С. 40-49.
Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслуживания. М.: Наука, 1987. 336 с.
Боровков А.А. Математическая статистика. М.: Наука, 1984. 472 с.
Кушнир А. Ф. Асимптотически оптимальные критерии для регрессионной задачи проверки гипотез // Теория вероятностей и ее применения. 1968. Т. 13. Вып. 4. С. 682-700.
Рюмкин В.И. Непараметрическое оценивание одного класса функционалов // Обозрение прикл. и промышл. матем. 2003. Т.10. Вып. 3. С. 735.
Вопросы математической теории надежности / под ред. Б.В. Гнеденко. М.: Радио и связь, 1983. 376 с.
Васильев В.А., Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание функционалов от распределений случайных последовательностей. M.: Наука, 2004. 508 с.