Робастный наблюдатель состояния неоднородной цепи Маркова с непрерывным временем
Решается задача построения оценки состояния неоднородной конечной цепи Маркова с непрерывным временем. Цепь Маркова рассматривается как линейная динамическая система с неполной информацией о состоянии и параметрах системы. Измерению доступна линейная комбинация переменных состояния. Предполагается, что интенсивности переходов в цепи Маркова точно не известны. Оценка состояния строится на основе классического наблюдателя полного порядка Люенбергера. Определены условия существования наблюдателя, описан алгоритм синтеза наблюдателя, исследованы условия робастности наблюдателя, приведен численный пример. Результаты работы могут найти применение в системах диагностики состояния и управления техническими объектами, в системах принятия оптимальных решений в области экономики и финансов.
Robust state observer of continues-time inhomogeneous Markov chain.pdf Конечные цепи Маркова как случайные процессы с дискретным и непрерывным временем хорошо изучены и находят применение в математическом моделировании, в процессах принятия решений, в теории систем массового обслуживания, в управлении сложными системами [1-3]. Конечную цепь Маркова можно рассматривать как линейную динамическую систему. Соответственно, можно применять методы теории линейных систем для анализа и синтеза цепей Маркова с заданными характеристиками. Одной из основных задач теории динамических систем является задача построения оценки состояния системы на основе измерений выхода системы. Актуальными являются задачи оценивания состояния системы в условиях неопределенности, когда модель системы точно не известна. Такого рода системы оценивания получили название робастных наблюдателей [4-9]. В работе [10] решается задача синтеза оптимального наблюдателя для частично наблюдаемой конечной цепи Маркова с дискретным временем. Синтез наблюдателя осуществляется на основе решения задачи линейного программирования. В данной работе решается задача построения оценки состояния неоднородной конечной цепи Маркова с непрерывным временем на основе классического наблюдателя Люенбергера. Предполагается, что интенсивности переходов в цепи Маркова точно не известны. Определены условия существования наблюдателя, описан алгоритм синтеза наблюдателя, исследованы условия робастности наблюдателя, приведен численный пример. Результаты работы могут найти применение в системах диагностики состояния и управления техническими объектами, в системах принятия оптимальных решений в области экономики и финансов. 1. Математическая модель Рассмотрим систему, поведение которой описывается неоднородной конечной цепью Маркова с непрерывным временем. Обозначим через s, i = 1,n, состояния системы, через qtj (t) - интенсивности перехода системы из состояния s в состояние s, через pt (t) - вероятность нахождения системы в состоянии s в момент времени t. 74 Робастный наблюдатель состояния неоднородной цепи Маркова с непрерывным временем Будем считать, что интенсивности переходов q (t) могут быть представлены в следующем виде: qtJ (t) = а + by (t)• Здесь постоянные значения а - 0 известны, значения b (t) - ~ау неизвестны. Значения b (t) будем называть возмущениями интенсивностей переходов. При этом предположении динамика системы описывается системой уравнений Колмогорова [1]: p(t) = p(t)Q(t), (1) где /К0 = [а(0 •• рЛ 0], Q(t) = A + B(t), аи ... аы - bln(t) A = ат ••• аш_ , B(t) = Лі(0 - bm(t)_ n а.. =- X а.. И Z_l V V=1, V o' II о i = 1, n. Матрицу B(t) будем называть матрицей возмущений. В теории цепей Маркова с непрерывным временем матрица Q(t) называется генератором цепи Маркова [Ibid.]. Генератор называется неприводимым, если при любом t - 0 система уравнений n p(t)Q(t) = 0, X Р• (t) =1 i=1 имеет единственное решение p(t) > 0. Далее будем считать, что генератор цепи Маркова (1) неприводим. Из неприводимости генератора следует, что при любой постоянной допустимой матрице возмущений B(t) = B существует lim p(t) = p, и этот предел не зависит от начального распределения вероятностей p(0). Если матрица B известна, то предельное распределение вероятностей находится как решение системы уравнений n p(A + B) = 0, X pi = 1. (2) i=1 В нашем случае матрица B неизвестна и может меняться во времени. Поэтому мы не можем найти p из системы уравнений (2). Тем более мы не можем найти p(t) как решение системы (1) при неизвестной матрице B(t) и неизвестном начальном распределении вероятностей p(0). Систему (1) рассмотрим как линейную динамическую систему с неполной информацией о состоянии. Будем считать, что измерению доступны значения n y(t) = X cipt (t). i=1 Уравнение (1) дополним уравнением измерений y(t) = p(t )c, (3) где с - вектор-столбец, с = [q ... сп ] . Например, если измерению доступна вероятность нахождения системы в состоянии si, то все коэффициенты вектора c равны 0 за исключением ct = 1. К уравнениям (1), (3) добавим уравнение выхода z(t) = p(t)h, где h - также вектор-столбец, /z = [/Zj ... hn] . Необходимо построить оценку состояния р(і) системы (1), (3) такую, что ошибка оценки e(t) = p(t) - p(t) обладает свойством lim e(t)h = 0 независимо от начальных значений p(0) и p (0). 75 Е.А. Перепелкин 2. Наблюдатель Для оценки состояния системы (1), (3) применим наблюдатель Люенбергера [11]. Уравнение наблюдателя имеет следующий вид: p(t) = p(t)A-(y(t)-p(t)c)d. (4) Здесь d - вектор-строка коэффициентов наблюдателя. Ошибка оценки удовлетворяет уравнению e(t) = e(t)(A + cd) + p(t)B(t). Коэффициенты наблюдателя определим из условия устойчивости матрицы A + cd. Матрица называется устойчивой, если все ее собственные числа имеют вещественные части меньше нуля. Обозначим через {а, : а,:...: ав} спектр матрицы А. Из неприводимости матрицы А как генератора цепи Маркова (1) при B(t) = 0 следует [1], что одно собственное число матрицы A равно нулю, остальные имеют вещественные части строго меньше нуля. Для определенности будем считать, что ^ = 0, Re < 0, i = 2, n. Обозначим через ѵі левый собственный вектор матрицы A, отвечающий собственному числу ^ = 0. Этот вектор является вещественным и определяется однозначно с точностью до множителя. Далее будем считать, что vlc ф 0. Вектор ѵі можно найти как решение системы уравнений уА = 0, yc = 1. Пусть р есть некоторое вещественное число. Рассмотрим матрицу A + pcy. Обозначим через W правые собственные векторы матрицы A, отвечающие собственным числам 'ki, i = 2, n. Заметим, что эти векторы ортогональны вектору ѵі. Следовательно, (А + pcy)w = Aw = 'kiw, i = 2,n. С другой стороны, у (A + pcy) = ру. Таким образом, мы показали, что спектр матрицы А + pcy состоит из чисел {цД2,...А}. Выберем р< 0. Зададим вектор коэффициентов наблюдателя равным d = ру. Спектр матрицы A + cd равен {р: А..}. При этом матрица A + cd будет устойчивой. Таким образом, алгоритм синтеза наблюдателя для системы (1), (3) сводится к нахождению левого собственного вектора матрицы A, отвечающего собственному числу ^ = 0. Пусть B(t) = 0. Тогда из устойчивости матрицы A + cd следует lime(t) = 0 и, следовательно, t^tt lime(t)h = 0 при любом h независимо от начальных значений p(0) и p(0). t^tt Рассмотрим условие робастности наблюдателя. Пусть матрица возмущений является постоянной, B(t) = B. Если B( A + cd )-1 h = 0, то lim e(t)h = 0 независимо от начальных значений p(0) и p (0). t^tt Действительно, силу неприводимости генератора цепи Маркова (1) существует limp(t) = p, и этот t^tt предел не зависит от p(0). Из условия устойчивости матрицы A + cd следует, что существует lime(t) = e , такой что t^tt e (A + cd) + pB = 0, p(A + B) = 0. Матрица A + dc невырожденная. Следовательно, e = - pB( A + cd )-1, eh = - pB( A + cd )-1 h = 0. 76 Робастный наблюдатель состояния неоднородной цепи Маркова с непрерывным временем 3. Численный пример Рассмотрим цепь Маркова с матрицами -а а 0 0 0 " -y(t) y(t) 0 0 0" 0 -2а а а 0 0 0 0 0 0 а 0 -а - р р 0 , в = 0 0 0 0 0 0 0 0 -р р 0 0 0 0 0 1 “СО 0 Р 0 -2Р_ 0 0 0 0 0 Предположим, что а > о, р > 0. Возмущение y(t) может быть любым при условии, что y(t) > -а. Пусть вектор c = [0 0 1 0 0]Т. Это означает, что измерению доступна вероятность нахождения системы в состоянии S3. Левый собственный вектор матрицы A, отвечающий нулевому собственному числу и условию vc = 1, равен у = 2(2а + р) 2а + р 1 2(2р + а) 2р + с 3а 3а 3р зр Вектор коэффициентов наблюдателя d = цу. Проверим условия робастности. Матрица 1 0 0 0 0 а 0 0 0 0 0 B( A + cd)-1 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Следовательно, B( A + dc) 1 h = 0 при h = [О h h h4 h Г. При оценки обладает свойством lime(t)h = 0 независимо от начальных h = [1 0 0 0 0] получим t у _ lim e(t)h = р. t^m а Рис. 1. Оценка вероятности р4 Fig. 1. Estimate of probability p4 Рис. 2. Результаты имитационного моделирования Fig. 2. Simulation results 77 Е.А. Перепелкин На рис. 1, 2 показаны результаты моделирования системы с наблюдателем. Расчеты и моделирование выполнялись при а = 3, Р = 5, у (t) = 100, ц = -10, с = [0 0 1 0 0]Т, h = [0 0 0 1 0]Т. p(0) = [1 0 0 0 0], p (0) = [0,2 0,2 0,2 0,2 0,2]. На рис. 1 показаны результаты, полученные при решении уравнения Колмогорова (1) и уравнения наблюдателя (4). Здесь p4 (t) - оценка вероятности p4 (t) в момент времени t, p4 - предельное значение вероятности p4 (t) соответственно при значениях возмущения у (t) = 0 и у (t) = 100. На рис. 2 представлены результаты имитационного моделирования, которые также подтверждают справедливость представленных в работе условий робастности наблюдателя. Заключение В работе решена задача синтеза наблюдателя состояния неоднородной конечной цепи Маркова с непрерывным временем в предположении, что интенсивности переходов в цепи Маркова точно не известны. Цепь Маркова рассмотрена как линейная динамическая система с неполной информацией о состоянии. Описан алгоритм синтеза наблюдателя. Показано, что синтез наблюдателя сводится к нахождению собственного вектора матрицы генератора цепи Маркова, отвечающего нулевому собственному числу этой матрицы. Рассмотрены условия робастности наблюдателя. Приведены численный пример и результаты моделирования.
Ключевые слова
робастный наблюдатель Люенбергера,
оценка состояния,
цепь Маркова с непрерывным временемАвторы
Перепелкин Евгений Александрович | Санкт-Петербургский государственный университет аэрокосмического приборостроения | профессор, доктор технических наук, профессор кафедры прикладной математики | eap@list.ru |
Всего: 1
Ссылки
Sontag. E. Mathematical Control Theory: Deterministic Finite Dimensional Systems. Springer, 1998. 531 p.
Clempner J.B., Poznyak A.S. Observer and control design in partially observable finite Markov chains // Automatica. 2019. V. 110, December. Article 108587.
Nguyen C.M., Pathirana P.N., Trinh H. Robust observer design for uncertain one-sided Lipschitz systems with disturbances // International Journal of Robust and Nonlinear Control. 2018. V. 28, № 4. P. 1366-1380.
Zemzemi A., Kamel M., Toumi A., Farza M. A new robust observer design for nonlinear systems with application to fault diagno sis // Transactions of the Institute of Measurement and Control. 2018. V. 40, № 13. P. 3696-3708.
Pourasghar M., Puig V., Ocampo-Martinez C. On robust interval observer design for uncertain systems subject to both timeinvariant and time-varying uncertainties // International Journal of Control. 2020. V. 93, № 11. P. 2577-2595.
Coutinho D., Schons S., Couto L.D., Kinnaert M. Robust observer design for discrete-time locally one-sided Lipschitz systems // European Journal of Control. 2020. V. 53, May. P. 43-51.
Mera M., Salgado I., Chairez I. Robust observer-based controller design for state constrained uncertain systems: attractive ellip soid method // International Journal of Control. 2020. V. 93, № 6. P. 1397-1407.
Battilott S. Robust observer design under measurement noise with gain adaptation and saturated estimates // Automatica. 2017. V. 81, July. P. 75-86.
Kim K.S., Smagin V.I. Robust filtering for discrete systems with unknown inputs and jump parameters // Automatic control and computer sciences. 2020. V. 54, № 1. P. 1-9.
Yin G., Zhang Q. Continuous-Time Markov Chains and Applications. A Two-Time-Scale Approach. Springer, 2013. 427 p.
Ching W.-K., Ng M.V. Markov Chains: Models, Algorithms and Applications. Springer, 2006. 205 p.