Эргодические оценки стационарных вероятностей состояний марковской цепи с непрерывным временем
Рассматриваются статистические характеристики оценки стационарной вероятности состояния дискретной марковской цепи с непрерывным временем в виде отношения времени пребывания цепи в этом состоянии к общему времени наблюдения. Показывается, что эта оценка асимптотически несмещенная, находится ее асимптотическая дисперсия и строится оценка этой дисперсии. Доказывается также асимптотическая нормальность этой оценки.
Ergodic estimates of the stationary probabilities of states of a marcovian chain with continuous time.pdf Одним из больших разделов теории вероятностей являет-ся так называемая эргодическая теория [1, 2], согласно кото-рой временные средние вероятностных характеристик слу-чайных процессов при определенных условиях совпадают сосредними по ансамблю его реализаций. Это открывает воз-можность построения оценок параметров случайных процес-сов по временным средним на конечном интервале наблюде-ния. Однако в реальности такими оценками пользуются оченьредко, потому что неизвестны их статистические свойства, вчастности, как правило, непонятно, как находить доверитель-ные интервалы для значений неизвестных параметров. В дан-ной работе делается попытка найти такие характеристики дляоценок стационарных вероятностей состояний дискретноймарковской цепи с непрерывным временем.ПОСТАНОВКА ПРОБЛЕМЫПусть имеется однородная неразложимая цепь Мар-кова k(t) с непрерывным временем t и конечным мно-жеством состояний k(t) = 1, N .Обозначим через Ti сумму длин всех интерваловвремени из [0, T], в течение которых цепь k(t) находи-лась в состоянии i. Оценку ˆ (i) стационарной вероят-ности (i) = P{k(t) = i} можно брать в видеˆ (i) = Ti T. (1)Целью данной работы является нахождение стати-стических характеристик этой оценки.АСИМПТОТИЧЕСКАЯНЕСМЕЩЕННОСТЬ ОЦЕНКИНайдем математическое ожидание этой оценки приусловии, что для цепи задано ее начальное состояниеk(0) = j, т.е. траектория движения по состояниям начи-нается из состояния j. Обозначим⎩ ⎨ ⎧= =0, если ( ) .1, если ( ) ,( ( ), )k t ik t ik t i (2)Тогда= TTi k t i dt0( ( ), ) . (3)Отсюда= = =T TM Ti M k t t dt Pji t dt0 0{ } { ( ( ), )} ( )T i [P t i ]dtT= + ji − 0( ) ( ) ( ) , (4)где Pji (t) = P{k(t) = i | k(0) = j} есть вероятность пере-хода из состояния j в состояние i за время t.Обозначим f ji (t) = Pji (t) − (i). Тогда{ }= + Ti f ji t dtTM T T i0( ) 1 ( ) . (5)Но, как известно [1], j fji(t) при t экспоненциальносходится к нулю. Поэтому интеграл, стоящий в (5), огра-ничен, и второе слагаемое стремится к нулю при t ,что и говорит об асимптотической несмещенностиоценки вероятности (i).АСИМПТОТИЧЕСКАЯ ДИСПЕРСИЯ ОЦЕНКИПокажем теперь, что дисперсия оценки (1) убываеткак 1/T. Имеем{ ( ) , ( ) | (0) } .{ } { ( ( ), ) ( ( ), )}0 00 02P k t i k s i k j dtdsM T M k t i k s i dtdsT TT Ti = = = == =Обозначим P{k(t) = i, k(s) = i⎢k(0) = j} как Pj(i, t, i, s).Тогда можно записать ⎪⎭⎪⎬ ⎫⎪⎩ ⎪⎨ ⎧= +T t TtM Ti Pj i t i s ds Pj i t i s ds dt0 0{ 2} ( , , , ) ( , , , ) .Учитывая марковость рассматриваемого процесса,преобразуем этот интеграл к виду= − + − =T Ttji iiT tM Ti dt Pji s Pii t s ds dt P t P s t ds0 0 0{ 2} ( ) ( ) ( ) ( ) −=T t TPji t dt Pii s ds0 02 ( ) ( ) . (6)Переходя к функции fji(t), получим( ) ( )−= + +T tTM Ti i f ji t dt i fii s ds0 0{ 2} 2 ( ) ( ) ( ) ( ) .С другой стороны, как это следует из (5),= + TM Ti T i f ji t dt0{ } ( ) ( ) .Опуская преобразования, приведем результат:{ } = { 2}− 2{ } =D Ti M Ti M Ti= T i f s ds − i s(f s + f s )ds +Tii jiTii0 02 ( ) ( ) 2 ( ) ( ) ( ) ⎟⎟⎠⎞⎜ ⎜⎝⎛+ −T − TjiT tf ji t dt fii s ds f t dt020 02 ( ) ( ) ( ) . (7)Таким образом,{ } ⎟⎠⎞⎜⎝+ ⎛= Tf s ds oTD T T iTi ii2 ( ) ( ) 10, (8)и первое слагаемое, определяющее основной член асимп-тотики, убывает как 1/T и не зависит от стартового со-стояния j. Отсюда также следует, что оценка ˆ (i) схо-дится к истинному значению стационарной вероятно-сти (i) в среднеквадратичном смысле.ОЦЕНКА ДИСПЕРСИИДля построения доверительного интервала для вероятно-сти (i) необходимо иметь оценку величины D{Ti/T}. Для еепостроения необходима более подробная информация.Пусть интервал наблюдения есть [0, T]. Далее, пустьв течение этого времени система побывала в состоянииi n раз и времена пребывания в этом состоянии были{T1, T2, T3,..., Tn}. Интервалы времени между пребыва-ниями системы в состоянии i обозначим как {V1, V2,V3,..., Vn}. Тогда очевидно, что==nkT i Tk1) ( , =− =nkT T i Vk1( ) . (9)Из марковости рассматриваемого процесса следует,что k, l величины Tk и Vl независимы. Кроме того, для kвеличины Tk одинаково распределены; аналогично, для lвеличины Vl также одинаково распределены.Оценку (1) можно записать в виде = =Tˆ (i) T(i)( )[( ) ( )]=+ + − + −+ −===nkk k k k k knkk k kn M T M V T M T V M VnM T T M T11( { } { }) { } { }{ } { }==+ + + + = nkk knkkT VnT VTnT1`0 01`01 ( )1, (10)где T0 = M{Tk}, V0 = M{Vk}, Tk = Tk − T0, Vk = Vk − V0.В силу усиленного закона больших чисел [2, 3],средние арифметические в (10) являются при n бесконечно малыми величинами; поэтому с точностьюдо o(1/N) можно (10) переписать в виде=+ + ++⋅+===nkknkkT VT VnTTnT VTTT i1 0 001 00 001 11 1( )⎟⎠⎞⎜⎝+ ⎛⎭ ⎬ ⎫⎩ ⎨ ⎧⎟ ⎟⎠⎞⎜ ⎜⎝⎛ −⋅+++= =noVVTTT V nVT VT nk1 1 k k 10 0 1 0 000 00 .Отсюда имеем( ) ( )0 00 iT VTTM T i = +=⎭ ⎬ ⎫ ⎩ ⎨ ⎧,=⎭ ⎬ ⎫⎩ ⎨ ⎧+ ⎟⎟⎠⎞⎜ ⎜⎝⎛+ ⎟⎟⎠⎞⎜ ⎜⎝⎛+=⎭ ⎬ ⎫⎩ ⎨ ⎧202020 0020 0( ) 0 1 { } { }VD VTD TT V nVT VTTD T i k k⎭ ⎬ ⎫⎩ ⎨ ⎧= − + 20202 ( )(1 ( ))2 1 { } { }VD VTD Tni i k k . (11)Так как Tk имеют экспоненциальное распределение[1], то 2D{Tk } = T0 и поэтому=⎭ ⎬ ⎫⎩ ⎨ ⎧= − +⎭ ⎬ ⎫⎩ ⎨ ⎧20( ) 2 ( )(1 ( ))2 1 1 { }VD Vni iTD T i k2022 ( )(1 ( ))2 { }nV= i − i ⋅ M Vk . (12)Это выражение и позволяет построить оценкуD{ˆ (i)} = D{T(i) T}. Действительно, (i) = M{T(i)/T}.Оценкой { 2}k V M является величина =nkVkn 11 2 , а оценкойV0 - величина 1 ( ) .1 nn V T T inkk−= =Заменяя эти величиныих оценками, мы и получаем оценку D{ˆ (i)} := =nkVkTD i T i124ˆ{ˆ ( )} 2 ( ) . (13)Для ее практического использования надо измерять ещевеличину =nkVk12 .Приведем еще другой вид формулы (12). Имеем T=.1 1 = == +nkknkTk V Поэтому, в силу усиленного законабольших чисел, при n = == + ⎯⎯nkknkk VnTn nT1пр11 10 0 .⎯⎯пнT +V Но так как = −++ −=+ 10 00 0 00 00T VT V TT VV1 ( )0 0T 0V iT = − +− , то при n ⋅ ⎯⎯− п.н.01 ( )nTVi1 ( ) ( ) 1.0 00пр ⋅ + =− ⎯⎯ T VViИспользуя это соотношение, можно утверждать, чтопри T имеет место{ }{ }( ) 1 ( )(1 ( )) { }22kkM Vi i M VTD T i T = ⋅ − , (14)т.е. при больших T дисперсия оценки стационарнойвероятности (i) убывает как 1/T.АСИМПТОТИЧЕСКАЯНОРМАЛЬНОСТЬ ОЦЕНКИПокажем теперь, что построенная оценка являетсяасимптотически нормальной.Для проведения исследования рассмотрим случай-ный процесс I(t), значением которого является суммар-ное время из интервала [0, t], в течение которого цепьнаходится в состоянии i. Очевидно, чтоT(i) = I (T) , ˆ (i) = I (T) T .Пусть⎩ ⎨ ⎧==0, если ( ) .1, если ( ) ,( )k t ik t iv t (15)Известно, что время пребывания однородной цепи Мар-кова в каждом состоянии имеет экспоненциальное распре-деление с заданным параметром. Величину этого параметрадля состояния i обозначим как 1/T. Время возвращения в i-есостояние для цепи Маркова является случайной величиной,функцию распределения которого обозначим как V(s).Если v(t) = 0, то определим случайную величину z(t),равную длине интервала времени от момента t до мо-мента возвращения цепи Маркова в состояние i.Случайный процесс {v(t), I(t), z(t)} с переменнымчислом компонент является марковским. ОбозначимP{v(t) = 1,u ≤ I (t) < u + du}= P1(u,t)du ,P{v(t) = 0, u ≤ I (t) < u + du, z(t) < z}= P0 (u, z,t)du .Тогда имеют место равенства( , ) 1 1 ( , ) 0 ( , , ) ( )01 P u t P u t t o tTt t t t u P + + ⎟⎟⎠⎞⎜ ⎜⎝⎛ + + = − ,( , ) ( ) ( ).( , , ) ( , , ) ( , , )100 0 0P u t V z o tTtP u z t t t P u z t P u t t+ +− + = − +Отсюда имеем следующую систему уравнений:( ,0, ) 1 ( , ) ( ).( , , ) ( , , ),( ,0, )( , ) ( , ) 1 ( , )1000 00101 1P u t V zz TP u tzP u z ttP u z tzP u tP u tu TP u ttP u t+−−=+ =+, (16)Решение полученной системы определяет распреде-ление вероятностей процесса I(t), что позволяет найтивсе характеристики оценки ˆ (i) .Найдем решение этой системы в асимптотическом слу-чае T . Для этого в (16) выполним замену 1/T = , t = ,u = x , 1 ( , , ) = ( , , ,)Pr u z t r x z . Тогда получаем1 ( , , ) ( ).( , , , ) ( , , , ) ( ,0, , )( ,0, , ) ,( , , ) ( , , ) 1 ( , , )100 0 00101 1T x V zzxzx z x zzxx T xx x+ + − = =+ = + (17)Эту систему будем решать в два этапа.Этап 1. Делаем предельный переход 0 и обо-значаем r(x, z, , 0) = r(x, z, ) Тогда система (17) при-нимает вид1 ( , )(1 ( )).( , , ) ( ,0, ) 1 ( , ) ( )1 ( , ) ( ,0, ) ,10100 0010T x V zz T x V zxzx zzT x x= −− = = =(18)Следовательно, = −zx V s dsTx z0100 ( , , ) 1 ( , ) (1 ( )) ,( , ),( , ) lim ( , , ) 1 ( , ) (1 ( ))1000100 0= = − = = x TVx x z T x V s dsz (19)где = − =0 0V0 (1 V(s))ds sdV (s) .Обозначим (x, ) = 0 (x, ) + 1 (x, ) . Тогда⎪ ⎪⎩⎪ ⎪⎨⎧ + = + =( , ) ( , ) .( , ) ( , ) ,0 0010 000xT Vx TxT Vx V(20)Этап 2. В системе (17) положим z и сложим обауравнения. Тогда получим ( , , ) 1( , , ) = 0 + x x ,откуда можно записатьxxT VTxx x += − = −( , ) ( , ) ( , )0 01 0 .Следовательно, для (x, ) имеем вырожденное урав-нение Фоккера−ПланкаxxT Vx T += −( , ) ( , )0 00 (21)с равным нулю коэффициентом диффузии и тогда0 0( ) 0T Vx T+ = , + =0 0( ) 0T Vx T . (22)Возвращаясь к исходным переменным, получим,что при T TtT Vx TTI t ⋅+= =0 0( ) ( ) 0 , так чтоlim ( ) ( ) ( )0 00 iT VTTI TTI iT= += =, (23)что еще раз говорит об асимптотической несмещенно-сти оценки ˆ (i) .Для доказательства асимптотической нормальности оце-нки в исходной системе (16) выполним замены переменных:1 = 2T, t2 = , u2 = x() + y, 1 ( , , ) = ( , , , ) Pr u z t Hr y z .Тогда система (16) примет вид( , , , ) ( ,0, , ) 1 ( , , ).( , , , ) ( ) ( , , , )1 ( , , ) ( ,0, , ) ,( , , ) ( ) ( , , ) ( , , )200 02 0 00102 1 1 1+ − == − + =+ + − z T H yH yzH y zyH y z x H y zzT H y H yH yyH y x H y(24)Полученную систему будем решать в три этапа.Этап 1. Сделаем предельный переход 0 и обозначимHr(y, z, , 0) = Hr(y, z, ). Тогда система (24) примет вид1 ( , ) 0 ( ,0, ) ,10 zH y H yT =1 ( , )(1 ( )).( , , ) ( ,0, ) 1 ( , ) ( )10100 0H y V zTH y V zz TH yzH y z= −− = = Тогда = −zH y V s dsTH y z0100 ( , , ) 1 ( , ) (1 ( )) .При z получим = =0 ( , ) lim 0 ( , , ) H y H y zz1 ( , ) (1 ( )) ( , ).100010 = − = y H TVT H y V s dsОбозначив H( y, ) = H0 ( y, ) + H1( y, ) , получим⎧+ =+ =( , ) ( , ),( , ) ( , ),0 0010 000H yT VH y TH yT VH y V −+ =zH y V s dsT VH y z0 0 00 ( , , ) 1 ( , ) (1 ( )) . (25)Этап 2. Решение системы (24) будем искать в виде( , , ) ( , ) (1 ( )) 0 ( , , ) ( ),0 0 00 − + + + = V s ds h y z oT VH y z H yz( , ) ( , ) 1 ( , ) ( ).0 001 + + + = H y h y oT VH y TПодставляя эти разложения в систему (24) и произ-водя упрощающие преобразования, получим1 ( , ) ( ,0, ) ( ( ) 1) ( , ) ,0 00 010 yH yT Vx Tzh y h yT += − −+ = − ( , , ) ( ,0, ) 1 ( , ) ( )100 0 h y V zz Th yzh y z( ) ( , ) (1 ( )) .0 0 0 − ⋅+ = −zV s dsyH yT Vx (26)Решение этой системы относительно функций h1(y, )и h0(y, z, ) будем искать в видеyh y h H y 1( , ) = 1 ( , ) ,yh y z h z H y 0 ( , , ) = 0 ( ) ( , ) .Тогда, подставляя это решение в систему (26), послеряда преобразований получим,( )(0) 20 00 0010 T VT VTh h+ = +( ) 1 1 (1 ( )) .( ) (1 ( ))0 0 020 00 00 010T V V V s ds dyT VT V s dsh z hz yz ⎭ ⎬ ⎫⎩ ⎨ ⎧− −++= − +(27)Найдем отсюда значение h0(). Преобразуя повтор-ный интеграл, можно получить0220 00 01000 ( ) 2( )VVT Vh T VTh V ⋅+ = + , (28)где ( )02V2 s dV s= . Отсюда, в частности, следует, что0220 00200 0 0 1 ( ) 2( )VVT VT h V h T V ⋅+ − = . (29)Этап 3. В системе (24) перейдем к пределу z исложим получившиеся уравнения:2 ( , , ) ( ) ( , , ) 1 ( , , ) = 0 + − yH yyH y x H y .Переходя к функциям h1(y, ) и h0(y, z, ), получимпосле ряда преобразований следующее уравнение:220 0( , ) 0 0 ( ) 0 1 ( , ) + −= H yT VH y T h V h .Обозначив 32 0 0202 = T V (T +V ) , с учетом (29) имеем22 2 ( , )2( , ) ⋅=H y H y . (30)Решение (30) имеет вид⎟ ⎟⎠⎞⎜ ⎜⎝⎛ − = 222 2exp2H( y, ) 1 y . (31)В силу замены u2 = x() + y можно утверждать, чтовеличина I(t)/T = x() + y имеет асимптотически нор-мальное распределение с математическим ожиданием идисперсиейTtT Vx TTM I t ⋅+= =⎭ ⎬ ⎫⎩ ⎨ ⎧0 0( ) ( ) 0 ,TtT TD I t ⋅=⎭ ⎬ ⎫⎩ ⎨ ⎧( ) 2 .Поэтому и оценка стационарной вероятностиˆ (i) = I (T) T при T имеет асимптотически нор-мальное распределение с параметрами0 0{ˆ ( )} 0T VM i T+ = , 30 02202( ){ˆ ( )} 1T VT VT TD i+= ⋅ = ,что совпадает с тем, что было получено ранее.
Скачать электронную версию публикации
Загружен, раз: 316
Ключевые слова
Авторы
ФИО | Организация | Дополнительно | |
Гладких Борис Афанасьевич | Томский государственный университет | доцент, кандидат физико-математических наук, профессор кафедры прикладной информатики факультета информатики Академик международной академии информатизации | gladkikh@inf.tsu.ru |
Назаров Анатолий Андреевич | Томский государственный университет | профессор, доктор технических наук, заведующий кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики | nazarov@fpmk.tsu.ru |
Ссылки
