Улучшение оценки скорости сходимости в многомерной центральной предельной теореме для сумм локально зависимых случайных векторов | ПДМ. 2017. № 36. DOI: 10.17223/20710410/36/2

Улучшение оценки скорости сходимости в многомерной центральной предельной теореме для сумм локально зависимых случайных векторов

Приведена улучшенная явная оценка скорости многомерной нормальной аппроксимации сумм локально зависимых случайных векторов. При любой фиксации размерности векторов и числа слагаемых данный результат позволяет вычислять численную оценку скорости сходимости. Установлено, что главный член полученной оценки для сумм независимых и одинаково распределённых случайных векторов имеет порядок d9/2n-1/2 ln n, где d - размерность векторов и n - число слагаемых. Приведено применение результата в задаче о нормальной аппроксимации числа рёбер, инцидентных вершинам одного цвета, в регулярном графе.

Improving the rate of convergence in the multidimensional central limit theorem for sums of locally dependent random vec.pdf Введение Оценки скорости сходимости сумм случайных векторов с различными типами зависимостей рассматриваются во многих работах [1-5]. В [1, 2] приводятся оценки для сумм независимых и m-зависимых случайных векторов соответственно. В [3-5] с использованием метода Стейна рассматриваются оценки для более сложных типов зависимостей. Данные результаты имеют приложения для дискретных математических объектов. В п. 3 приводится применение основного результата данной работы в задаче о раскраске вершин регулярного графа. Особенность оценок из упомянутых выше работ заключается в том, что для них не указывается явный вид зависимости от размерности векторов. Это обусловлено тем, что задача аппроксимации рассматривается для случая фиксированной размерности d и неограниченного роста числа слагаемых n; d, n Е N. В работе [6] анонсирован, а в [7] приведён результат об уточнении оценки скорости многомерной нормальной аппроксимации сумм локально зависимых случайных векторов, которая получена в [5]. Под уточнением подразумевается нахождение явного вида зависимости оценки от размерности d. При этом в [7] доказано, что главный член полученной оценки имеет порядок (2n)d/2d3n-1/2 ln n. (1) В настоящей работе приводится улучшение оценки (1), главный член которой имеет порядок d9/2n-1/2 ln n. Далее кратко рассмотрим основные понятия и определения, введённые в [5, 7]. В [5] рассматривается оценка скорости сходимости в многомерной центральной предельной теореме для сумм зависимых ограниченных случайных векторов n W =Е Xi, Xi Е Rd, d,n Е N, i=1 (2) |Xi| ^ B, i = 1,..., n, где через | • | обозначается сумма абсолютных значений всех элементов вектора (или матрицы); B Е R - неотрицательная величина, которая может зависеть от n и d. Структура зависимости определяется следующим образом. Рассмотрим множество индексов J = {1,... , n}. Для каждого i Е J сумма W представляется двумя способами: W = Ui + Vi и W = Ri + Ti, (3) при этом предполагается, что существуют неотрицательные величины A1,A2 Е R, которые могут зависеть от n и d, такие, что |Ui| ^ Ai, |Ri| ^ A2 и Ai ^ A2. (4) Интересующий нас результат работы [5] получен с использованием метода Стейна и заключается в оценке величины Y = sup |Eh(W) - Eh(Z)|, keH где H = {h : Rd ^ [-1,1]} - класс измеримых функций; Z - случайный вектор, имеющий d-мерное стандартное нормальное распределение. Заметим, что для класса H1 индикаторов измеримых выпуклых подмножеств Rd справедливо выражение Y = sup |Eh(W) - Eh(Z)| = sup |P(W G F) - P(Z G F)|, heh1 f ef где F - класс измеримых выпуклых подмножеств Rd. 1. Основная теорема о точности многомерной нормальной аппроксимации Обозначим: I - единичная матрица над R размера d х d; AT - матрица, транспонированная к матрице A; для i = l,...,n пусть Xi,Vi,Ui,Ti - вектор-столбцы, XT, ViT, UT, TT - вектор-строки. Введём также следующие обозначения: Х1 = Е E|E(Xi|Vi)|, Х2 = Е E|E(XiUT) - E(XiUT|Ti)|, Хз i=1 i=1 I - E E(XiUT) i=1 Теорема 1 [5]. Пусть W = E Xi - сумма ограниченных случайных векторов, таi=1 ких, что имеют место представления (2)-(4). Тогда существует такая величина с, зависящая только от размерности векторов d, что Y ^ c(aA2 + naA^B(| ln A2B| +lnn) + Х1 + (| ln A1B| + lnn)(x2 + Хз)), где a - величина, зависящая от конкретного класса функций H. Выбор представления (3) играет существенную роль в смысле уменьшения оценки сверху величины y. Если, например, для любого i G J выбрать в качестве Ti вектор - константу, то величина x2 окажется равной нулю, однако при этом может увеличиться A2. Если EW = 0 и ковариационная матрица вектора W является единичной, то при выборе V = 0 получим, что x3 = 0, однако это может привести к увеличению A1. В [5] указывается на возможность применения теоремы 1 для сумм локально зависимых ограниченных случайных векторов. Под этим подразумевается, что для любого i G J существуют множества J-^, J2^, 0 = J^ С j2^ С J, для которых выполнены два условия: случайный вектор Xi не зависит от совокупности случайных векторов {Xj : j G J \ J(i)} и множество случайных векторов {Xj : j G J^} не зависит от совокупности случайных векторов {Xj : j G J \ J(i)}. Если для всех i G J выбрать Ui = E Xj, Ri = E Xj, V = W - Ui и Ti = W - Ri, то в случае, когда слу-jej(i) jej(i) чайный вектор W является суммой одинаково распределённых случайных векторов, имеет нулевое среднее и единичную ковариационную матрицу, величины в теореме 1 равны х1 = Х2 = Х3 = 0, A1 = max (card(J-j;^)) B и A2 = max (card(J^1)) B, где через ieJ V / ieJ V / card(^) обозначается мощность множества. Для случая сумм независимых случайных векторов естественным является выбор Ui = Ri = Xi, i = 1,... ,n. В этом случае при центрировании и нормировании W оценка y имеет порядок n-1/2 ln n [5]. Обозначим через а^ квантиль уровня 7/8 распределения хи-квадрат с d степенями свободы. Сформулируем основную теорему настоящей работы. n Теорема 2. Пусть W = Е Xi - сумма случайных векторов, удовлетворяющих i=1 условиям (2)-(4) и K = 20,28nA1A2B, |K| < 1. Тогда если H = {h : Rd ^ [-1,1]} - класс измеримых функций, то верно неравенство K Y ^ aA2 + Kad |ln K| + 4dx1 + 4d2 |ln K| (Х2 + Хз) + 5aa^---, (5) 1 - K2 где a - величина, зависящая от конкретного класса функций H. 2. Доказательство теоремы 2 Вычислим те величины, которые в [5] при доказательстве теоремы 1 не определяются явно. Рассмотрим многомерный аналог уравнения Стейна [1, 5] относительно неизвестной функции Ф(х): ДФ(х) - хУФ(х) = h(x) - Eh(Z), Ф(х) : Rd ^ R, х E Rd, (6) d д2ф где Ф(х) - трижды дифференцируема на R; ДФ(х) = У] (х) и УФ(х) = i=i дх2 д Ф д Ф\ (х) -лапласиан и градиент функции Ф(х) соответственно. дx1 дх^ Обозначим через Ф функцию распределения стандартного нормального закона. Рассмотрим функцию hs(х) = h(si/2y + (1 - s)i/2x) dФd(y), s E (0,1), x,y E Rd, J Rd где Фd(y) = Ф(у1) ■ ... ■ ФЫ. Как замечено в [5], если в уравнение (6) вместо h подставить функцию hs, то оно будет иметь решение i 1 Г ds Фt(x) = -^ [hs(x) - Eh(Z)]-, s,t E (0,1), x E Rd. t Подставим данное решение в уравнение (6): ДФ^Ж) - WVФt(W) = h(W) - Eh(Z). Согласно обобщению метода Стейна, в многомерном случае для того, чтобы оценить величину y = sup |Eh(W) - Eh(Z)|, нужно оценить величину sup Е|ДФ^Ж) нен нен - WVФt(W)|. Рассмотрим равенство Yt = sup |Eht(W) - Eht(Z)|, t E (0,1). нен В [1] приводится следующая лемма о связи y и Yt. Лемма 1 [1]. Пусть Q - произвольная вероятностная мера, заданная на Rd, в соответствии с которой выбирается вектор W. Тогда для любого t E (0, 1) верно неравенство sup|Eh(W) - Eh(Z)| ^ 4 sup|Eht(W) - Eht(Z)| + a5ad^, нен 3 нен 2 1 - t где a - величина, зависящая от класса н . Из леммы 1 следует, что y и Yt связаны неравенством Y ^ 4 Yt + a5 ad J-^ t E (0,1). (7) Далее оценим величину Yt. Обозначим через Ф(1)(х) и Ф(2)(х) градиент и матрицу дФ^; вторых производных функции Ф;(х) соответственно. Элементы градиента -- (х), дхр p = l,...,d, обозначим через Ф^)^), элементы матрицы вторых производных д2Ф t (2) ---- (x), p,q = 1,..., d, - через Фt(>q)(x). В [7] доказана следующая лемма, в которой x р dd x q приводятся оценки для | Ф(1) (x) | и | Ф(2) (x) |. Лемма 2 [7]. Для любой функции h : Rd ^ [-1,1] при t Е (0,1) справедливы неравенства (1), м ^ ,(2), sup |Ф( )(x)| < dJxew,d V 2 d2 + JJX - П п \ V ne n sup №(2)(x)| < ln(t-1). xei Обозначим через Tr(M) след матрицы M. Тогда верны равенства Eht(W) - Eht(Z) = E[ДФДЖ) - WVФt(W)] = A - B - C + где Фt2)(w)(i -E Xj UT A = ETr B j=1 EE [XT ■ VФt(Vj)] j=1 с = E E XjT (Wt(W) - VФt (Vj) - Ф(2)(^- )Uj j=1 EETr XjUj (Фt2)(W) - Ф(2) (Vj) j=1 Заметим, что для оценки величины jt нужно оценить сумму |A| + |B| + |C| + |D|. Рассмотрим следующую лемму, доказанную в работе [7], о представлении в явном виде (3) зависимости интересующих нас величин от размерности d. Обозначим через Ф((^г) частную производную третьего порядка функции Фt(x) по переменным xp,xq и xr, p,q,r = 1,... ,d. Лемма 3 [7]. Пусть W,V и U - случайные векторы, принимающие значения в Rd, d Е N, W = V + U, и пусть Y - произвольная случайная величина. Предположим, что |U| ^ C1, |Y| ^ C2, где C1,C2 Е R. Тогда для любого т Е (0,1) и h Е Ж верно неравенство EYФ(3) )( t(pqr) (V + tU) < C12 (3,04rf/Vt + 1,52aC1M + ad |lnt|) , где a - величина, зависящая от конкретного класса функций Ж. Для доказательства леммы 3 в [7] приводится следующая вспомогательная лемма. (9) f10) Лемма 4 [7]. Пусть ф^г) : Rd ^ R - частная производная третьего порядка плотности распределения d-мерного стандартного нормального закона по переменным yp,yq и yr,p,q,r =1,...,d. Тогда a) для любых p, q, r = 1 , . . . , d Cr) (y)|dy< 1,52; б) для любых p,q,r = 1,... ,d [ Ы-|Ф(1)(У)ИУ< 1,21d + 0,65. J Rd ) Замечание 1. В работе [7] приведены более грубые оценки выражений в леммах 3 и 4. При проведении дополнительных исследований удалось улучшить данные оценки. Далее оценим величины A, B, C и D. 1. Оценим величину |C|. Обозначим через Xjp и Ujp координаты с номером p - = 1,... , d векторов Xj и Uj соответственно. С учётом обозначений для градиента и матрицы вторых производных функции Ф^(ж) рассмотрим выражение, которое является частью формулы для C: УФДЖ) - ) - + Uj) - ) - т (11) - (ф$)№+Uj)-Ф&М),...,+Uj)-Ф^-)) . Применим формулу Тейлора с интегральной формой остаточного члена [8] в окрестности точки Vj к каждой координате вектора в правой части равенств (11): Ф$)№ + Uj) - Ф£)М) - uJ1«&(Vf) + ... + ) + Г1 d (3) (12) + (1 - T) E (Vj + tUj ) Ujq Ujr dT, p - 1, . . . , d, T € (0, 1). J 0 q,r= 1 Теперь рассмотрим другое выражение, являющееся частью формулы для C: Ф(2)(^)Uj - (Uj 1 Ф^^-) +... + UJdФ(21d)(Vj),..., и»Ф™1)(Ъ) +... + U^gd)(Vj))T. С учётом последнего равенства и формул (11), (12) рассмотрим следующие равенства: VФt(w) -УФ4(У;- ) - Ф(2)(^ )Uj - Г1 d d \ т / (1 - T) E Ф(3С)(^ + tUj )dT,..., /о1(1 - T) E Ф(3

Ключевые слова

многомерная центральная предельная теорема, локально зависимые случайные векторы, multivariate CLT, locally dependent random vectors

Авторы

ФИООрганизацияДополнительноE-mail
Волгин Артем ВладимировичМосковский государственный университет информационных технологий, радиотехники и электроникипреподавательartem.volgin@bk.ru
Всего: 1

Ссылки

Ootze F. On the rate of convergence in the multivariate CLT // Ann. Probab. 1991. V. 19. P. 724-739.
Sunklodas J. Convergence rate estimate in central limit theorem for m-dependent random vectors // Lithuanian Math. J. 1978. V. 18(4). P. 566-575.
Goldstein L. and Rinott Y. Multivariate normal approximations by Stein's method and size bias couplings // Appl. Probab. 1996. V. 33. P. 1-17.
Reinert G. and Rollin A. Multivariate normal approximation with Stein's method of exchangeable pairs under a general linearity condition // Ann. Probab. 2009. V. 37. P. 2150-2173.
Rinott Y. and Rotar V. I. A multivariate CLT for local dependence with n-1/2 log n rate and applications to multivariate graph related statistics // J. Multivariate Analysis. 1996. V. 56. P. 333-350.
Волгин А. В. Оценка скорости сходимости в многомерной центральной предельной теореме // Прикладная дискретная математика. Приложение. 2013. №6. С. 11-12.
Волгин А. В. Об оценке точности многомерной нормальной аппроксимации сумм локально зависимых случайных векторов // Обозрение прикл. и промышл. матем. 2015. Т. 22(4). С.11-30.
Зорич В.А. Математический анализ. Ч.1. М.: МЦНМО, 2002. 664с.
Ширяев А.Н. Вероятность-1. М.: МЦНМО, 2007. 552с.
 Улучшение оценки скорости сходимости в многомерной центральной предельной теореме для сумм локально зависимых случайных векторов | ПДМ. 2017. № 36. DOI: 10.17223/20710410/36/2

Улучшение оценки скорости сходимости в многомерной центральной предельной теореме для сумм локально зависимых случайных векторов | ПДМ. 2017. № 36. DOI: 10.17223/20710410/36/2