Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 40. DOI: 10.17223/19988605/40/1

Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях

Рассматривается задача управления с прогнозированием по квадратичному критерию для линейных дискретных систем с марковскими скачками и сериально коррелированными параметрами. Синтезированы стратегии управления при наличии явных ограничений на управляющие воздействия. Алгоритм синтеза прогнозирующей стратегии сводится к решению последовательности задач квадратичного программирования.

Model predictive control for stochastic systems with Markovian jumps and serially correlated parameters under constraint.pdf Моделями с марковскими скачкообразными параметрами описывается широкий класс реальных систем [1]. Примерами могут служить сложные производственно-технологические, энергетические и технические системы. Гибридные системы с марковским режимом переключений также широко используются в финансовой инженерии для описания поведения инвестиционного портфеля на финансовом рынке с переключающимися режимами [2]. В таких моделях предполагается, что смена структуры системы осуществляется в соответствии с эволюцией марковской цепи с конечным пространством состояний. Решению различных задач управления и оценивания для таких систем посвящено значительное количество работ [3-9]. Эффективным подходом к синтезу систем управления с ограничениями, получившим широкое признание и применение в практике управления сложными технологическими процессами, является метод управления с прогнозирующей моделью (управление со скользящим горизонтом) [10, 11]. В работе [12] рассматривается задача синтеза прогнозирующего управления системами с марковскими скачками и мультипликативными шумами при ограничениях на управляющие воздействия, при этом предполагается, что матрица динамики системы не зависит от состояния цепи Маркова. В [13] синтезированы стратегии управления такими системами по критерию «mean-variance». В работе [14] рассматривается задача управления системами с марковским переключением режимов при условии, что матрицы динамики и управления зависят от скачков. Задача прогнозирующего управления системами с сериально коррелированными параметрами при ограничениях рассмотрена в работе [15]. В настоящей работе рассматривается задача синтеза стратегий управления с прогнозированием для дискретных линейных систем с марковскими скачками и сериально коррелированными параметрами, для которых известны только первые и вторые моменты распределений. Динамика системы определяется состоянием однородной марковской цепи с известной матрицей переходных вероятностей. Получены уравнения синтеза оптимальных стратегий управления с учетом «жестких» ограничений на управляющие переменные. 1. Постановка задачи Пусть объект управления описывается уравнением x( k +1) = A[ a(k +1), k +1] x(k) + £[a( k +1), ц{к +1), k + 1]u(k), (1) где x(k) е M«x - «^-мерный вектор состояния, u(k) е Ми" - «„-мерный вектор управления; A[a(k), k] е M"xx«x, B[a(k),n(k),k] е M"xxn" - матрицы соответствующих размерностей; -q(k) е К9 - последовательность сериально коррелированных случайных величин; B[a(k),n(k),k] зависит от n(k) линейно; a(k) (k = 0,1,2,..,v) - однородная дискретная марковская цепь с конечным множеством состояний {1,2,... ,v}, известной матрицей переходных вероятностей: P = [P],(i, j = 1"V), P = P{a(k +1) = a j |a(k) = a,}, £ Pt] = 1, j=1 и известным начальным распределением p, = P{a(0) = i},(i = iTV), £ p, = 1. i=1 Матрицы A[a(k),k] и B[a(k),n(k),k] определяются состоянием ai марковской цепи a(k) из множеств A[a(k),k] е [A(l)(k) е Kn: i = 1"V}, B[a(k), n(k), k] е {B(i)[n(k),k] е Mn*xn„ : i = 1V}. Предполагается, что состояние марковской цепи в момент времени k доступно наблюдению. Последовательности a(k) и n(k) независимы. Пусть F =( Fk )т - поток о-алгебр, где каждая о-алгебра порождается последовательностью {n(s): s = 0,1,.,k} и интерпретируется как доступная информация до момента времени k включительно. Для процесса n(k) предполагаются известными условные моменты распределений E {n(k + i)/ Fk } = n(k + i), (2) E {n(k + i)nT(k + j)/ Fk } = ©j (k), (3) (k = 0,1,2,...),(i, j = 1,2,..., l). На управляющие воздействия накладываются ограничения вида Umin(k) < S(k)U (k) < Umas (k), (4) где S(k)е Кpxn„ ; u^k),„mas(k) е Kp . Необходимо определить закон управления системой (1) при ограничениях (4) из условия минимума критерия со скользящим горизонтом управления m J (k + m / k) = £ E{xT (k + i) R1 (k + i) x(k + i) / x(k), a(k), Fk} i=1 (5) m m-1 . -£ R2 (k + i) E{x(k + i) / x(k), a(k), Fk} + £ E{uT(k + i / k) R(k + i)u (k + i / k) / x(k), a(k), Fk}, i=1 i=0 где E{.../...} - оператор условного математического ожидания; m - горизонт прогноза; k - текущий момент времени; R1(k+i) > 0, R2(k+i) > 0 и R(k+i) > 0 - весовые матрицы соответствующих размерностей. Для решения сформулированной задачи используем методологию управления с прогнозирующей моделью. Данный подход позволяет получить стратегии управления с обратной связью с учетом явных ограничений на управляющие воздействия. Стратегии управления с прогнозированием определяются по следующему правилу. На каждом шаге k минимизируем функционал (5) по последовательности прогнозирующих управлений u(k/k),...,u(k+m- 1/k), зависящих от состояния системы в момент времени k. В качестве управления в момент времени k берем u(k) = u(k/k). Тем самым получаем управление u(k) как функцию состояний x(k) и a(k)=a.j, т.е. управление с обратной связью. Чтобы получить управление u(k+1) на следующем шаге, процедура повторяется для следующего момента k + 1 и т.д. 2. Синтез стратегий прогнозирующего управления Цепь Маркова с дискретным временем допускает следующее представление в пространстве состояний [16]: 9(k +1) = P9(k) + u(k +1), (6) где 9(k)=[5(a(k),1),...,5(a(k),v)]T, 5(a(k)j) - функция Кронекера (j = 1,v); u(k+1) - мартингал-разность с характеристиками E |u(k +1)/ 9(k )} = 0, C (k +1) = E{u( k +1) uT (k +1) / 9(k)} = diag{P9( k)} - Pdiag{9(k )}PT. С учетом (6) систему (1) можно представить в следующем виде: x(k +1) = A[0(k +1), k + 1]x(k) + B[0(k +1), n(k +1), k + 1]u (k), (7) где матрицы A[9(k),k] и B[9(k),n(k),k] имеют вид A[9(k), k ] = (k) A(i)(k), (8) i=1 B[9(k), n(k), k ] = £9, (k) B(i)[n(k), k ], (9) i=1 где 9i(k) (i = 1, v) - компоненты вектора 9(k). Критерий (5) будет иметь вид m . J(k + m / k) = £ E{xT (k + i)R1 (k + i)x(k + i) / x(k), 9(k),Fk} i=1 (10) m m-1 . -£R2(k + i)E{x(k + i) / x(k),9(k),Fk} + £E{uT(k + i / k)R(k + i)u(k + i / k) / x(k),9(k),Fk}. i=1 i=0 Теорема. Пусть динамика системы описывается выражением (1) с учетом ограничений (4). Тогда стратегия прогнозирующего управления с горизонтом прогноза m минимизирующая критерий (5) на каждом шаге k равна u (k) = [ I„u 0Иц ... 0Иц ] U (k), (11) где In - единичная матрица размерности nu; 0n - квадратная нулевая матрица размерности nu; U(k) = [uT(k/k),...,uT(k+m-1/k)]T - вектор прогнозирующих управлений, который определяется из решения задачи квадратичного программирования с критерием вида Y(k + m / k) = [2 xT (k )G(k) - F (k )]U (k) + UT(k)H(k)U(k) (12) при ограничениях Umin(k) < S(k)U(k) < UmaX(k), (13) где S(k) = diag(S(k),...,S(k + m -1)), T 1- -,"r Umin(k) = ^ ),...,umin(k+m-1)] ,Umax(k) = [urL(k),...,umax(k+m-1) H(k),G(k),F(k) - блочные матрицы вида H(k) = {Hts(k)}, G(k) = {Gt(k)}, F(k) = {Ft(k)}, 5,t = 1,m , блоки которых определяются выражениями Htt(k) = £ E{(B(i)[^(k +1),k + t])TQ(i)(k)Bj>h(k +1),k +1] / Fk} + R(k +1 -1), (14) h=1 Hts(k) = £ £ ... £ E{(B(it)[n(k +1),k + t])T(A(it+1)(k +1 + 1))T... (A('5\k + 5))T X t=1 h+1=1 h=1 (15) 5,t xQ,...,i-)(k)B(i-)[n(k + 5), k + 5]/ Fk }, 5 > t, H,,t (k)=hT (k), 5 < t, (16) Gt(k) = £ ... £ (A(i1)(k + 1))T...(A(it)(k +1))TQCi1,i2,...,it}(k)E{B(t}[n(k +1),k +1]/ Fk}, (17) 1 =1 it =1 F(k) = i $\k)E{B(l>)[n(k +1),k +1]/Fk}. (18) =1 Последовательность матриц Q(i",.,'s),q2'" ), s,t = 1,m, представляет собой обратную рекурсию: Q(-'s}(k) = ©(,...,'s}(k)R1(k + s) + i (A's+!(k + s +1)) Q",..,'s+1 (k)A's+1(k + s +1), W1=1V ' (19) t = 1, m - 2, t < s < m, Q("" \k) = elPt0(k)R1(k +1) + i (a(+1)( k +1 + 1))T Q

Ключевые слова

стохастические системы, марковские скачки, зависимые параметры, прогнозирующее управление, ограничения, stochastic systems, Markovian jumps, serially correlated parameters, model predictive control, constraints

Авторы

ФИООрганизацияДополнительноE-mail
Домбровский Владимир ВалентиновичТомский государственный университетпрофессор, доктор технических наук, заведующий кафедрой информационных технологий и бизнес-аналитики Института экономики и менеджментаdombrovs@ef.tsu.ru
Объедко Татьяна ЮрьевнаТомский государственный университеткандидат физико-математических наук, доцент кафедры информационных технологий и бизнес-аналитики Института экономики и менеджментаtatyana.obedko@mail.ru
Всего: 2

Ссылки

Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М. : Физматлит, 1994.
Dombrovkii V., Obedko T. Portfolio Optimization in the Financial Market with Regime Switching under Constraints and Transaction Costs Using Model Predictive Control // European Control Conference (ECC). July 2015. P. 3371-3376.
Пакшин П.В., Ретинский Д.М. Робастная стабилизация систем случайной структуры с переключаемой статической обратной связью по выходу // Автоматика и телемеханика. 2005. № 7. C. 135-147.
Смагин В.И., Поползухина Е.В. Синтез следящих систем управления для объектов со случайными скачкообразными пара метрами и мультипликативными возмущениями // Вестник Томского государственного университета. 2000. № 271. С. 171-175. URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/vtls:000320510
Blackmore L., Bektassov A., Ono M., Williams B.C. Robust optimal predictive control of jump Markov linear systems using parti cles // Lecture Notes in Computer Science. 2007. V. 4416. P. 104-117.
Costa O.L.V., Okimura R.T. Discrete-time mean-variance optimal control of linear systems with Markovian jumps and multiplicative noise // International Journal of Control. 2009. V. 82, No. 2. P. 256-267.
Costa O.L.V., Oliveira A. Optimal mean-variance control for discrete-time linear systems with Markovian jumps and multiplicative noises // Automatica. 2012. V. 48, No. 2. P. 304-315.
Dragan V., Morozan T. The Linear Quadratic Optimization Problems for a Class of Linear Stochastic Systems with Multiplicative White Noise and Markovian Jumping // IEEE Transactions on Automatic Control. 2004. V. 49, No. 5. P. 665-675.
Li X., Zhou X.Y. Indefinite stochastic LQ control with Markovian jumps in a finite time horizon // Communications in Information and Systems. 2002. No. 2. P. 265-282.
Mayne D.Q. Model predictive control: Recent developments and future promise // Automatica. 2014. V. 50. P. 2967-2986.
Rawlings J. Tutorial: Model Predictive Control Technology // Proc. Amer. Control Conf. San Diego. California. June 1999. P. 662676.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96-112.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозирующей моделью линейными системами с марковскими скачками по критерию «mean-variance» при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 4 (21). С. 5-13. URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/vtls:000439971
Домбровский В.В., Самородова М.В. Управление с прогнозированием по квадратичному критерию линейными дискретными системами с марковскими скачками при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1 (34). С. 4-10. URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/vtls:000528061
Dombrovslii V., Obedko T. Model predictive control for constrained systems with serially correlated stochastic parameters and portfolio optimization // Automatica. 2015. V. 54. P. 325-331.
Elliott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin : Springer-Verlag, 1995.
 Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. №  40. DOI:  10.17223/19988605/40/1

Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 40. DOI: 10.17223/19988605/40/1