Оптимальные стратегии прогнозирующего управления системами со случайными параметрами, описываемыми многомерной регрессионной моделью с марковским переключением режимов | Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2019. № 48. DOI: 10.17223/19988605/48/1

Оптимальные стратегии прогнозирующего управления системами со случайными параметрами, описываемыми многомерной регрессионной моделью с марковским переключением режимов

Рассматривается класс дискретных стохастических систем с параметрами, эволюция которых описывается уравнением многомерной регрессии с марковскими скачками. Динамика экзогенных факторов описывается векторной авторегрессионной моделью с марковским переключением режимов порядка p (MS-VAR(p) модель). Синтезированы оптимальные стратегии прогнозирующего управления с учетом явных ограничений на управляющие переменные по обобщенному критерию, представляющему собой линейную комбинацию; a) ожидаемых значений квадратичных форм по состоянию и управлению; b) квадратичной формы ожидаемых значений состояний системы; c) линейной части - ожидаемого значения состояния системы.

Optimal predictive control strategies for systems with random parameters described by multidimensional Markov switching .pdf Моделями со случайными параметрами описывается широкий класс реальных динамических систем [1]. Одной из важных областей применения является финансовая инженерия, где такие модели используются для описания эволюции инвестиционного портфеля (см.: [2] и данный там обзор). Эффективным подходом к синтезу стратегий управления такими системами при ограничениях на состояния и / или управления является метод управления с прогнозированием, (прогнозирующее управление, управление с прогнозирующей моделью) [3, 4]. Прогнозирующему управлению дискретными системами, параметры которых изменяются в соответствии с эволюцией марковской цепи, посвящены работы [5-13]. В настоящей работе рассматривается класс дискретных стохастических систем с параметрами, эволюция которых описывается уравнением многомерной регрессии с марковскими скачками. Динамика экзогенных факторов описывается векторной авторегрессионной моделью с марковским переключением режимов порядка p (MS-VAR(p) модель [14]). Данный класс систем ранее в литературе не рассматривался. Синтезированы оптимальные стратегии прогнозирующего управления с учетом явных ограничений на управляющие переменные по обобщенному критерию, представляющему собой линейную комбинацию: a) ожидаемых значений квадратичных форм по состоянию и управлению; b) квадратичной формы ожидаемых значений состояний системы; c) линейной части - ожидаемого значения состояния системы. Изменяя весовые матрицы в обобщенном критерии, можно получать различные критерии управления: квадратичный критерий; критерий «mean-variance». 1. Постановка задачи Пусть объект управления описывается уравнениями: (1) x(k +1) = Ax(k^)+B [η(k +1)] м(к), Оптимальные стратегии прогнозирующего управления системами со случайными параметрами η(k +1) = β[θ(k +1)] Y(k) + λ[θ(k + 1)]ω(k +1), Y(k +1) = α[θ(k +1)] Y(k) + σ[θ(k + 1)]^(k +1), α[θ(k)] = ∑θi(k)α^i), λ[θ(k)] = ∑θ,(k)λ(i^, і=1і=1 β[θ(k)] = ∑ θi(k)β(i'), σ[θ(k)] = ∑θi(k)σ^i^, i=1 i=1 где x(k) nχ - вектор состояния, и (k) є RПи - вектор управления, η(^) є R^η раметров, Y(k) = Γyτ(k),√(k - 1),...,yτ(k - p +1)1 , y{k) єК"у, L J niyp×1 (2) (3) (4) - вектор случайных па- W(k)=Г Wτ(k),0,o,...,o1 t L J nyp×1 w(k) Пу, ω(k) nη - векторы белых шумов с нулевым средним и матрицами ковариаций {» 0 -весовые матриц^і соответствующих размерностей, R3(k + i) - весовой вектор соответствующей размерности. В качестве управления в момент времени k берем u(k) = u(k/k). Тем самым получаем управление u(k) как функцию состояний θ(k), x(k), η(k) и Y(k), т.е. управление с обратной связью. Чтобы получить управление u(k + 1) на следующем шаге, процедура повторяется для следующего момента k + 1 и т.д. Изменяя весовые матрицы R1(k + i), R2(k + i), R3(k + i) в выражении (7), можно получать различные критерии управления системой (1)-(4). Задача 2.1. Полагая R2(k + i) = 0, имеем задачу прогнозирующего управления по квадратичному критерию: J(k + m / k) = ∑M {xτ (k + i)R1 (k + i)x(k + i) i=1 -R3(k+i)x(k+i)+uT(k+i-1/k)R(k+i-1)u(k +i-1/k)/ x(k),η(k),Y(k),θ(k)}. Данный критерий представляет собой линейную комбинацию квадратичной и линейной частей. При R3(k + i) = 0 имеем классический квадратичный критерий. Задача 2.2. Пусть скалярный выход системы (1)-(4) z(k) = c(k)x(k), где c(k) - вектор соответствующей размерности. Полагая R1(k+1) = R2(k+i) = p1(k+ι)c^(k + i)c(k+i), R^(k + i) = p2(k + i)c(k + i), i = 1,m, где ρ1(k + i) ≥ 0, ρ2(k + i) ≥ 0 - скалярные величины, имеем задачу управления по критерию «mean-variance»: J(k + m / k) = ∑p1(k + {(z(k + i) -M {z(k + i) / x(k),η(k), Y(k),θ(k)})2 / x(k),η(k), Y(k),θ(k)} i=1 -∑P2(k + i)M {z(k + i) / x(k),η(k),Y(k),θ(k)} + i=1 +∑M {uτ(k + i / k)R(k + k)u(k + i / k)/ x(k), η(k), Y(k), θ(k)}. i=0 Весовые коэффициенты ρ1(k + i), ρ2(k + i) характеризуют склонность к риску (risk-aversion) и задают соотношение между ожидаемым значением и вариацией выхода системы в момент времени k + i. 2. Синтез стратегий прогнозирующего управления Рассмотрим следующие выражения: J(1)(k + m / k) = M{∑ xτ(k + i)Rγ(k + i)x(k + i} -R3(k + i)x(k + i} + i =1 13 +mt (k+i -1/ k)R(k+i - 1)u(k+i -1/ k')/ x(k), η(k), Y (k), θ(k)}, (8) J(2)(k + m / k) = ∑M {xτ(k + i) / x(k), η(k), Y(k),θ(k)}R2(k + i)M {x(k + i)/ x(k), η(k), Y(k), θ(k)}. (9) Очевидно, что J (k + m / k) = J ^('^(k + m / k) - J ^^'^(k + m / k). (10) Оптимальные стратегии прогнозирующего управления системами со случайными параметрами Лемма 1. Выражение (8) для J(1)(k + m / k) может быть представлено в виде J(1)(^ + m / k} = С(1) [ x(k}, k] + [2xτ (k)G(1) (k) - F (k )]G(k) + U'^ (k)H(1) (k)U(k), (11) где С(1) [x(k), k] = xτ (k) AtQi (m-1) Ax(k Q2 2m -1) Ax(2'), (12) блоки матриц H(1)(k), G(1) (k ), F(k) удовлетворяют уравнениям: (k) = R(k +1 -1) + (13) + ]∑ ... :E 5T[β(it)a(it-1)...a('‘)y(k)i(m-t)Q^i1,..,it)(k)5[β(it)a(it-1)...a('‘)y(k)] + i1=1it =1 1 + ]∑ M {bt [X(it')(a2k +1)]Q (m -1)©(it')2k)B[X(it)ro(k +1)]} + it =1 1 + ∑ ∑ ...∑ M{Bτ[β' Hf∖k) = ]∑ ... ]∑ 5T[β(it)a(i'-1) tf i1=1 if=1 t-1 V :(it )a(it-‘)...a(^^^)a(^^ )W(k + J)]Q (m- t+j ,..,it ")2k') ^∣β'i^ )a(i^‘)...a(^^ ^)a(^^^ 1(k + J)]}, (к)](At )- Q^(m - fІ ^{k)5[β(if ^i^'f-1)...а('‘)У(к)]+ (14) +∑ Σ... Σ Mfsτ[β' у=1/, =1 if =1 >(i t, Σ(∙) = 0, у=1 Hf(k) = ( Hf ^(k ))t, f < t, Gf^ (k) = (At )t Q,,^(m - ^) :E ... ]∑ 5[β(it )a(it-1)...a(i1)y (k)]∂^i^,..,it ^(k), t 1 i1=1 it =1 Ft(k) = Q^(m -^) ]∑ ... ∑ 5[β(it)a(it-1)...a(i1)y(k)]∂^i1,..^t}(k)^ t 2 i1=1 it =1 Последовательности матриц Qι(t), Q2(t) (t = 1,m), Θ^it^(k~), 0(it^(k) (t, f = 1,m, деляются уравнениями: Q1(t} = R1(k + m-1)+AτQ1(t-1)A, t = 1,m, Q1(O) = Rj(k+m), Q2(t) = R3(k + m-1) + Q2(t-1)A, t = 1,m, Q2(O) = R3(k+m), ©(it,..,f ')(k) = P^^ Pi ...P>^ θi (k +1 / k), t = 1,m -1, f > t, t)определяются уравнениями (20)-(21). Выражение (22) можно записать в матричной форме (11), где матрицы G(1)(k), H(1)(k), F(k) имеют вид (13)-(17), C(1)[x(k),k] имеет вид (12). Лемма доказана. Лемма 2. Выражение (9) для J(2)(k + т/k) может быть представлено в виде: J (^')(k + т / k) = С(^^^ [x(k), k] + 2xτ (k)G(^') (k)U(k) + U^t (k)H (k )U(k), (23) где C(2)[x(k), k] = xτ (k)ΨτΔ(k + 1)Ψx(k), G^^')(k) = ΨτΔ(k + 1)Φ(k), (24) (25) (26) (27) (k) = Φτ (k)Δ(k + 1)Φ(k), Δ(k + 1) = diag{R2(k + 1),..., R2(k + m)}, блоки матриц Φ(k), Ψ имеют вид: Φ t(k) = Af-t ]i ... 5[p(it)a(it-‘)...a(i1)Y(k)]0(i1,...,it')(k), t, f = 1,m, f ≥ t, ft i1=1 it =1 Ф А (k) = 0, f < t, ψ t=At, t=1,m, где @^'i1,-’i>(k) определяется выражениями (20)-(21). Доказательство. Используя уравнения (1)-(4), получим M{x(k +1) / x(k), η(k), Y (k), Q(k)} = Atx(k) + + ІA-^ І... І ^∣P'i^)a(i''-’)...a(i1)Y(k)]0(i”...,i''^(k)u(k + j -1 / k), t = 1^m, j=1 i1=1 ij =1 где матрицы 0(i1,...,ij'(k} (j = 1,m) определяются уравнениями (20)-(21). (28) (29) (30) Оптимальные стратегии прогнозирующего управления системами со случайными параметрами Введем вектор M{x(k+1)/ x(k),η(k),Y(k),θ(k)} M {x(k + m)/ x(k), η(k ),Y (k), θ(k)} С учетом (30) динамика вектора X(k + 1) может быть записана в матричном виде: X (k +1) = Ψx(k) + Φ(k )U (k), где матрицы Φ(k), Ψ имеют вид (27)-(29). Выражение (9) для J(2)(k + m/k) может быть записано в виде: J(2) (k + m / k) = Xt (k + 1)∆(k +1) X(k +1), где ∆(k +1) = diag{R2(k + 1),..., R2(k + m)}. Подставляя (31) в (32), получим J(2) (k + m / k) = xτ (k)Ψt∆(k + 1)Ψx(k) + +2 xτ (k )Ψt ∆(k + 1)Φ(k )U (k) + U t (k )Φt (k )∆(k + 1)Φ(k )U (k). (31) (32) (33) Выражение (33) можно записать в виде (23), где матрицы C(2)[x(k),k], G(2)(k), H(2)(k) имеют вид (24)-(26) соответственно. Лемма доказана. На основе лемм 1 и 2 можно показать, что задача прогнозирующего управления системой (1)(4) по критерию (7) при ограничениях (6) сводится к задаче квадратичного программирования. Теорема. Вектор прогнозирующих управлений U(k) системой (1)-(4), минимизирующий критерий (7) при ограничениях (6), на каждом шаге k определяется из решения задачи квадратичного программирования с критерием вида: (34) Z(k +m/ k) =I2xT(k)G(k)-F(k)]U(k)+UT(k)H(k)U(k), при ограничениях Umin (k) ≤ 5(k)U(k) ≤ umax (k), (35) где S(k) = diag{5(k'),...,S(k + m - Γ)}, umin (k) = I u,!,rn (k),•••,uΣin (k)]T, umax(k) = [umax(k),•••,u^iax(k)]T, G(k)=G(1)(k)-G(2)(k), H(k)= H(1)(k)- H(2)(k). Оптимальное управление со скользящим горизонтом m в каждый момент времени k равно u(k) = [^u 0^u ... 0^u ]u(k), (36) nu где In - единичная матрица размерности nu, 0n - квадратная нулевая матрица размерности nu. Доказательство. Из (10), (11) и (23) следует, что критерий (7) может быть представлен в виде: J(k +m/k)=C(1)Ix(k),k]-C(2)Ix(k),k]+ (37) +2xτ (k) [g(1) (k) - G(2) (k)] U(k) - F(k)U(k) + Ut (k) [я(1) (k) - H^^')(k)] U(k). Очевидно, что задача минимизации критерия (37) эквивалентна задаче минимизации критерия (34), где удалены слагаемые, не зависящие от управлений. Таким образом, получаем, что задача минимизации критерия (7) по последовательности прогнозирующих управлений U(k) эквивалентна задаче квадратичного программирования с критерием (34). Теорема доказана. Заключение В данной работе предложен метод синтеза стратегий прогнозирующего управления по обобщенному критерию для дискретных стохастических систем, динамика которых зависит от случайного процесса, описываемого уравнением многомерной регрессии с экзогенными факторами и парамет- В.В. Домбровский, Т.Ю. Пашинская рами, зависящими от состояния цепи Маркова. Динамика экзогенных факторов описывается MS-VAR(p) моделью. Изменяя весовые матрицы в обобщенном критерии, можно получать различные критерии управления: квадратичный критерий, критерий «mean-variance». Синтезированы оптимальные стратегии управления с учетом явных ограничений на управляющие воздействия.

Ключевые слова

стохастические системы, марковские скачки, многомерная модель регрессии, прогнозирующее управление, ограничения, stochastic systems, Markov jumps, multidimensional regression, model predictive control, constrains

Авторы

ФИООрганизацияДополнительноE-mail
Домбровский Владимир ВалентиновичТомский государственный университетпрофессор, доктор технических наук, заведующий кафедрой информационных технологий и бизнес аналитики Института экономики и менеджментаdombrovs@ef.tsu.ru
Пашинская Татьяна ЮрьевнаТомский государственный университеткандидат физико-математических наук, доцент кафедры информационных технологий и бизнес аналитики института экономики и менеджментаtatyana.obedko@mail.ru
Всего: 2

Ссылки

Costa O.L.V., Fragoso M.D., Marques R.P. Discrete-time Markov jump linear systems. New York : Springer, 2005. 286 p.
Dombrovskii V., Obedko T. Feedback predictive control strategies for investment in the financial market with serially correlated returns subject to constraints and trading costs // Optimal control applications and methods. 2017. V. 38, No. 6. P. 908-921.
Mayne D.Q. Model predictive control: Recent developments and future promise // Automatica. 2014. V. 50, No.12. P. 2967-2986.
Farina M., Giulioni L., Scattolini R. Stochastic model predictive control with chance constraints : a review // Journal of Process Control. 2016. V. 44, No. 8. P. 53-67.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96-112.
Henandez-Medjias M.A., Sala A., Querol A., Arino C. Multiple-Horizon predictive control for Markov/switched linear systems // IFAC-PapersOnLine. 2015. V. 48 (23). P. 230-235.
Tonne J., Jilg M., Stursberg O. Constrained Model Predictive Control of High Dimensional Jump Markov Linear Systems // American Control Conference. Palmer House Hilton. July 1-3, Chicago, IL. 2015. P. 2993-2998.
Chitraganti S., Aberkane S., Aubrun C., Valencia-Palomo G., Dragan V. On control of discrete-time state-dependent jump linear systems with probabilistic constraints: a receding horizon approach // Systems & Control Letters. 2014. V. 74. P. 81-89.
Lu J., Xi Y., Li D. Stochastic model predictive control for probabilistically constrained Markovian jump linear systems with additive disturbance // Int. J. Robust Nonlinear Control. 2017. P. 1-15.
Sala A., Henandez-Medjias M.A., Arino C. Stable receding-horizon scenario predictive control for Markov-jump linear systems // Automatica. 2017. V. 86. P. 121-128.
Patrinos P., Soparasakis P., Sarimveis H., Bemporad A. Stochastic model predictive control for constrained discrete-time Markovian switching systems // Automatica. 2014. V. 50, No. 10. P. 2504-2514.
Dombrovskii V.V., Obyedko T.Yu., Samorodova M. Model predictive control of constrained Markovian jump nonlinear stochastic systems and portfolio optimization under market frictions // Automatica. 2018. V. 87, No. 1. P. 61-68.
Домбровский В.В., Пашинская Т.Ю. Прогнозирующее управление системами с марковскими скачками и авторегрессионным мультипликативным шумом с марковским переключением режимов // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2018. № 44. С. 4-9.
Krolzig H.-M. Markov Switching Vector Autoregressions. Modelling, Statistical Inference and Application to Business Cycle Analysis. Berlin : Springer, 1997. 357 p.
Elliott R.J., Aggoun L., Moore J.B. Hidden Markov models: Estimation and control. Berlin, Heidelberg, New York : Springer, 1995. 382 p.
 Оптимальные стратегии прогнозирующего управления системами со случайными параметрами, описываемыми многомерной регрессионной моделью с марковским переключением режимов | Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2019. № 48. DOI: 10.17223/19988605/48/1

Оптимальные стратегии прогнозирующего управления системами со случайными параметрами, описываемыми многомерной регрессионной моделью с марковским переключением режимов | Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2019. № 48. DOI: 10.17223/19988605/48/1