Управление с прогнозированием по квадратичному критерию линейными дискретными системами с марковскими скачками при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1(34).

Управление с прогнозированием по квадратичному критерию линейными дискретными системами с марковскими скачками при ограничениях

Рассматривается задача управления с прогнозированием по квадратичному критерию для линейных дискретных систем со скачкообразно меняющимися параметрами. Синтезированы стратегии управления при наличии явных ограничений на управляющие воздействия. Алгоритм синтеза прогнозирующей стратегии сводится к решению последовательности задач квадратичного программирования.

Model predictive control with quadratic criterion for jump Markov discrete linear systems under constraints.pdf Моделями с марковскими скачкообразными параметрами описывается широкий класс реальных систем [1]. В этих моделях предполагается, что смена структуры системы осуществляется в соответствии с эволюцией марковской цепи с конечным пространством состояний. Решению различных задач управления и оценивания для таких систем посвящено значительное количество работ [2-13]. Эффективным подходом к синтезу систем управления с ограничениями, получившим широкое признание и применение в практике управления сложными технологическими процессами, является метод управления с прогнозирующей моделью (управление со скользящим горизонтом) [14, 15]. Применению данного метода к управлению дискретными системами с марковскими скачками посвящены работы [3, 5, 11-13]. В работах [3, 11-13] рассматривается задача управления по квадратичному критерию дискретными системами при условии, что от состояния марковской цепи зависит только матрица управления системы при «жестких» ограничениях на управляющие переменные. В настоящей работе рассматривается более общий случай, когда от состояния цепи зависит не только матрица управления, но и матрица динамики системы. Получены уравнения синтеза оптимальных стратегий управления с учетом «жестких» ограничений на управляющие переменные. 1. Постановка задачи Пусть объект управления описывается уравнением x(k +1) = Л[а(к + 1)]х(к) + Б[а(к + 1)]и(к), (1) где х(к) е R"x - вектор состояния, и(к) е R"и - вектор управления, а(к) (к = 0,1,2,..,v) - однородная дискретная марковская цепь с конечным множеством состояний {1,2,..., v}, известной матрицей переходных вероятностей Р = [PUj] (i, je{1,2,...,v}), = P{а(к+1)=аj|а(к)=аг}, £ j = 1, J=i и известным начальным распределением Pi = Р{а(0)=i}( i = VV), £ pi = 1. v ' i=1 Матрицы динамики Л[а(к)] и управления Б[а(к)] выбираются в соответствии с состоянием а марковской цепи а(к) из множеств Л = {Л е R"хХ"х : i = 1, v } и Б = {Б1 е R"хх"и : i = 1, v } соответственно. Предполагается, что состояние марковской цепи в момент времени к доступно наблюдению. На управляющие воздействия наложены ограничения: UmB(k) < S(k)u(k) < UmaX(k), (2) где S(k) е Rрхп", umm(k),umax(k) e Rp. На каждом шаге k будем определять закон управления системой (1) при ограничениях (2) из условия минимума критерия со скользящим горизонтом управления: J(k+m/k) = E jf xT (k+i)R1x(k+i) + uT(k+i-1/k)Ru(k+i-1/k)/x(k),a(k)=aj}, (3) где E{.../...} - оператор условного математического ожидания; m - горизонт прогноза, R1 >0, R >0 -весовые матрицы соответствующих размерностей. 2. Синтез стратегий прогнозирующего управления Для решения сформулированной задачи используем методологию управления с прогнозирующей моделью. Данный подход позволяет получить стратегии управления с обратной связью с учетом явных ограничений на управляющие воздействия. Стратегии управления с прогнозированием определяются по следующему правилу. На каждом шаге k минимизируем функционал (3) по последовательности прогнозирующих управлений u(k/k),..., u(k+m-1/k), зависящих от состояния системы в момент времени k. В качестве управления в момент времени k берем u(k) = u(k/k). Тем самым получаем управление u(k) как функцию состояний x(k) и a(k) = aj, т.е. управление с обратной связью. Чтобы получить управление u(k+1) на следующем шаге, процедура повторяется для следующего момента k+1 и т.д. Дискретная марковская цепь с конечным множеством состояний {1,2,...,v} и матрицей переходных вероятностей P допускает следующее представление в пространстве состояний [9]: 0(k +1) = P0(k) + u(k +1), (4) где 0(k) = [5(a(k),1),...,5(a(k),v)]T, 5(a(k)j) - функция Кронекера; {u(k)} - последовательность мартингал-разностей с условными моментами: E {u(k+1)/0(k )} = 0, (5) E{u(k+1)uT(k+1)/0(k)} = diag {P0(k)}- Pdiag{0(k)}PT . С учетом (4) систему (1) можно представить в следующем виде: x(k +1) = A[0(k + 1)]x(k) + B[0(k + 1)]u(k), (6) где матрица динамики A[0(k+1)] и матрица управления B[0(k+1)] имеют вид A[0(k + 1)] = ff 0i (k+1)A', B[0(k + 1)] = £0,. (k+1)B' , (7) i=1 i=1 здесь 0i (k +1) (i = 1,2,..,v) - компоненты вектора 0(k + 1). Теорема 1. Вектор прогнозирующих управлений U(k) = [uT(k/k),...,uT(k+m-1/k)]T, минимизирующий критерий (3) при ограничениях вида (2), на каждом шаге k определяется из решения задачи квадратичного программирования с критерием вида Y(k+m/k) = 2xT (k)G(k)U(k)+UT (k)H (k)U(k), при ограничениях Umm(k) < S(k)U(k) < Umax (k). (8) Оптимальное управление равно u (k ) = [ 1Пи 0„u ... 0»u ] U (k ), где S(k) = diag(S(k),...,S(k + m -1)), г ~|Т Umin (k) = (k• Л in (k + m -1) _ , г пТ Umax(k) = Lumax(k),...,umax(k + m -1)_ , In - единичная матрица размерности nu, 0n - квадратная нулевая матрица размерности nu, H(k) и G(k) - блочные матрицы, блоки которых равны: Htt (k) = £( )Т Q(t \k)B1' + R, t = 1m, (9) Ht,s (k) = z- z z (вг- )Т(,4г'+1 )Т - (a )Т Q(t\k)B's, s > t, (10) 's =1 't +1=1'' t =1 Hs,t (k) = HtT (k), s < t, (11) Gt(k) = £ •••)T(a JQ('1, .,'t)(k)B't, t = . (12) Последовательность матриц Q(')(k) (s,t = 1,m) определяется рекуррентными уравнениями Q(t,...,'s)(k) = ©.,...,. (k)R1 + z ((+1 )q('t, .,'s+1)(k)A's+1, t = 1,m-2, s > t, (13) ^ 's+1 =1 Q(')(k) = E^P9(k)R1 + £ (a ' t+1 )q('t,'t+1)(k)A+1, t = 1,m-1, (14) t t +1 =1 Q('m )(k) = EmPmQ(k )R1 (15) c граничными условиями Q, .,'m)(k) = © m(k)R1, t = 1,m-1, (16) t' ' m где ®i,,...,'s(k) = E,pdiag{pdiag[••Pdiag{pdiag{Pdiag{{eCkJ}El1}El2 -J }e^, (17) Eh =[0,...,0,1,0,...,0]1xv , lt = 1V, t = 1m. (18) Доказательство. Критерий (3) можно записать следующим образом: J (k+m/k) = E {хТ (k +1) R1x(k +1) + ul (k / k) Ru(k / k) + +E {xТ (k+2) R1x(k+2) + ul (k +1/ k) Ru(k +1/ k) +... + E {xТ (k + m) R1x(k + m) + +u Т (k + m -1/ k) Ru(k + m -1/ k)/x(k + m -1), e(k + m - 1)}.../ x(k+1),e(k+1)}/ x(k ),e(k)}. Введем обозначение Jk+s = E{xl (k + s +1)R1x(k + s +1) + ul (k + s / k)Ru(k + s / k) + E{xl (k+s+2)R1x(k+s+2)+ +u Т (k + s +1/ k )Ru(k + s +1/ k) +... + E {xl (k+m)R1x(k+m) + u Т (k + m -1/ k) x xRu(k + m -1/ k)/x(k + m -1), e(k + m -1)} / x(k+s+1),e(k+s+1)}/x(k+s),e(k+s)}. Очевидно, что Jk+s = E {xl (k+s+1) Rx(k+s+1) +u Т (k + s / k)Ru (k + s / k) + Jk+s+1/x(k + s), e(k + s)} (19) и J (k+mlk) = Jk. (20) Рассмотрим Jk+m-1 = E {xl (k+m) R1x(k+m)+ul (k + m -1/ k )Ru(k + m -1/ k)/x(k + m -1), e(k + m -1)}. (21) Выражая x(k +m) через x(k +m-1) с учетом (6) и (7), будем иметь x(k + m) = £ 0t (k + m)[ A'mx(k + m -1) + B'-u(k + m -1)] . (22) m=1 m [ ] Подставляя (22) в (21) и взяв условное математическое ожидание с учетом (4) и (5), получим Jk+m-1 = xT (k + m -1) £ (A'" )T Em P0(k + m -1) x im =1 m x R1 Aim x(k + m -1) + 2 xT (k + m -1) £ (a1- ) EtJ0(k + m - 1)R1B'mu(k + m -1) + im =1 +uT (k + m -1) j £ (m TT EmP0(k + m - 1)R1Bim + R ju(k + m -1). Предположим далее, что для некоторого q верно Jk+m-q = xT (k + m - q) £ (A'm-q+1 )T Q{'m-q+1)(k + m - q)A'"-q+1 x(k + m - q) + im-q+1 =1 +2xT(k + m-q) £ £ ••• £ (A1"-q+1 f •••(a''TT Q(lm-9+1,.",1/)(k + m-q)B''u(k +t-1/k) + t=m-q+Ц=1 i„-?+1=Л ' £ (b'' TT Q(i')(k + m - q)B'' + R u(k +1 -1/ k) + t=1V ' m-1 m т V V / . \T / . \T / . \T . .. +2 ^ £ uT (k +1 -1/k) £ • £(B'' j (A''+1 j • (A'- j Q('t ,...,l' )(k + m - q)B'*u (k + s -1/k), (23) m + £ uT (k +1 -1/k) t=m-q+1 последовательность матриц Q('',. ,'s)(k + m - q) (s, t = m -q+1,m) определяется рекуррентными уравнениями Q(it,...,is )(k + m - q) = 0it,...,is (k + m - q)R1 + £ (a's+1 jT Q(it,,is+1)(k+m - q)A's+1 , t = m - q+1,m - 2, s > t, (24) 's+1 =1 Q(i' )(k + m - q) = EtPq-m+t0(k + m - q)R1 + ^ (a''+1 jT Q(i' ,i'+1)(k+m - q)A''+1 , (25) it+1 1 Q(im) (k + m - q) = E^Pq0(k + m - q)R1, (26) c граничными условиями: q., ,'m) (k + m - q) = ©'',...,' (k + m - q)R1, t = m - q+1,m-1, (27) где }ET }x ®lt ,...,ls (k + m - q) = Els Pdiag {Pdiag{-Pdiag{Pdiag{Pdiag{Pq-m+t 0(k+m-q)} }i x ET }• ET }eT . (28) 't+ 2 ) 's-2 ) 's-1 Покажем, что данная формула верна и для q + 1. Действительно, из (19) следует, что Jk+m-(q+1) = E {xT (k + m - q)R1x(k + m - q) + +u T (k+m - (q+1)/ k) Ru( k+m - (q+1)/k)+Jk+m-q/x(k+m - (q+1)), 0(k+m - (q+1))}. (29) Подставим в (29) вместо Jk+m-q его выражение через (23)-(28), вместо x(k+m - q) - его выражение через x(k+m - (q + 1)), используя (6) и (7); вместо 0(k+m - q) - его выражение через 0(k+m - (q + 1)), используя (4); возьмем условное математическое ожидание и, преобразовав выражение, получим, что Jk+m-( q+1) =xT (k + m - (q +1)). £ (a1-^- )T x 1m-( q+1)+1=1 x Q(lm-(q+i)+i)(k + m - (q +1)) -(q+1)+1 x(k + m - (q +1)) + £ (A'm-( q+1)+1 )T - (A1' )T 1 1m-( q+1)+1=1 x Q((q+1)+1.....''T (k + m - (q +1)) B''u(k +1 -1 / k) + +2x1 (k + m-(q +1)) £ £ ••• £ |A'm-(q+1)+1 t=m-(q+1)+1''=1 im-(?+1)+1 £ (b1' )T Q('t)(k + m - (q + 1))B't + t,=1V ' + £ uT (k +1 -1/k) t=m-( q+1)+1 u(k +1 -1/ k) + R (k +1 -1/ k) £ - £ (B't) (a''+1 ) - (a's ) Q('t,. .,'s)(k + m - (q + 1))B''u(k + s -1/ k), (30) 's ^ 11 =1 последовательность матриц Q(l',.,ls)(k + m-(q +1)) (s,t = m-(q+1)+1,m) определяется рекуррентными уравнениями Q(it,...,'s)(k + " - (q +1)) = @t t (k + m - (q + 1))r1 + £ (a's+1 )T Q(lt,.. ,ls+1)(k + m - (q + 1))A's+1 , (31) s is+1=1v ! t = m - (q+1)+1, m-2, s > t, Q(l' )(k + m - (q +1)) = EtP( q+1)-m+t 0(k + m - (q + 1))R1 + £ (a''+1 )T Q(l' ,i'+1)(k + m - (q + 1))A''+1 , (32) + 1 =1 (33) (34) t = m - (q+1)+1,m-1, Q('m )(k + m - (q +1)) = Et Pq+10(k + m - (q + 1))R1 c граничными условиями Q('t,...,'m )(k + m - (q +1)) = ©'. ...'. (k + m - (q + 1))R1, t = m - (q+1)+1,m-1, где ®t, ,...,ls (k + m - (q +1)) = Els Pdiag {Pdiag{-Pdiag{Pdiag{Pdiag{P(q+1)-m+t 0(k+m - (q+1))}x xEl}ET }ET }-ET }EtT . (35) 't+^ 't+ 2) 's-2 j л-1 v ' Формулы (30)-(35) совпадают с (23)-(28), если в (23)-(28) q заменить на q + 1, а значит, согласно принципу математической индукции, формулы (23)-(28) верны для всех q = 1, m. Из (23)-(28) и (20) следует, что J(k + m / k) = xT (k) ££ (A'1 )T Q(l1)(k)A'1 x(k) + '1=1V У m v V/ \ T / \T m -1 m + 2 £ £ i t=1 s=t+1 +2xT(k)£ £ ... £ (a'1 ) ... (A1') Q(l1,.. ,tt)(k)B''u(k + t-1/k) + t=1 i, =1 '1=1 £(' )T Q(lt )(k) B1' i,=1 v ' + £ uT (k +1 -1/k) u (k +1 -1/k) + R t=1 +2 £ £ u T (k +1 -1/k) £ ... £ (В1') (A1'+1) ...(A's) Q(l' ,,ts )(k)B''u (k + s -1/k) t=1 s=t+1 , , _л /V > \ > последовательность матриц Q(l',. ,ls)(k) (s,t = 1,m) определяется рекуррентными уравнениями (13)-(18). Выражение (36) можно записать в матричной форме: J(k + m / k) = xT (k) £ (A'1 )T Q(l1)(k)A'1 x(k) + '1=1V У (36) +2 xl (k )G(k )U (k) + UТ (k) H (k )U (k), (37) где G(k) и H(k) определяются соотношениями (9)-(18). Таким образом, имеем задачу минимизации критерия (37) при ограничениях (8), которая эквивалентна задаче квадратичного программирования с критерием (3) при ограничениях (2). Заключение В данной работе предложен метод синтеза стратегий прогнозирующего управления по квадратичному критерию для линейных дискретных систем со скачкообразно меняющимися параметрами в матрицах динамики и управления. Данный подход позволяет в явном виде учесть ограничения на управления. Алгоритм синтеза прогнозирующей стратегии включает решение последовательности задач квадратичного программирования. Синтезированы стратегии управления с учетом явных ограничений на управляющие воздействия.

Ключевые слова

линейные системы с марковскими скачками, прогнозирующее управление, марковские скачки, ограничения, Markov linear systems, model predictive control, constraints

Авторы

ФИООрганизацияДополнительноE-mail
Домбровский Владимир ВалентиновичТомский государственный университетрофессор, доктор технических наук, заведующий кафедрой математических методов и информационных технологий в экономике экономического факультетаdombrovs@ef.tsu.ru
Самородова Мария ВладимировнаТомский государственный университетаспирант кафедры прикладной математики факультета прикладной математики и кибернетикиsamorodova21@gmail.com
Всего: 2

Ссылки

Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М. : Физматлит, 1994.
Пакшин П.В., Ретинский Д.М. Робастная стабилизация систем случайной структуры с переключаемой статической обратной связью по выходу // Автоматика и телемеханика. 2005. № 7. C. 135-147.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96-112.
Смагин В.И., Поползухина Е.В. Синтез следящих систем управления для объектов со случайными скачкообразными пара метрами и мультипликативными возмущениями // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2000. № 271. С. 171-175.
Blackmore L., Bektassov A., Ono M., Williams B.C. Robust optimal predictive control of jump Markov linear systems using particles // Lecture Notes in Computer Science. 2007. V. 4416. P. 104-117.
Costa O.L.V., Okimura R.T. Discrete-time mean-variance optimal control of linear systems with Markovian jumps and multiplicative noise // International Journal of Control. 2009. V. 82, No. 2. P. 256-267.
Costa O.L.V., Oliveira A. Optimal mean-variance control for discrete-time linear systems with Markovian jumps and multiplicative noises // Automatica. 2012. V. 48, No. 2. P. 304-315.
Dragan V., Morozan T. The Linear Quadratic Optimization Problems for a Class of Linear Stochastic Systems With Multiplicative White Noise and Markovian Jumping // IEEE Transactions on Automatic Control. 2004. V. 49, No. 5. P. 665-675.
Elliott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin : Springer-Verlag, 1995.
Li X., Zhou X.Y. Indefinite stochastic LQ control with Markovian jumps in a finite time horizon // Communications in Information and Systems. 2002. No. 2. P. 265-282.
Домбровский В. В., Объедко Т. Ю. Управление дискретными динамическими системами со случайными зависимыми параметрами при ограничениях // Вестник Томского государственного университета: управление, вычислительная техника и информатика. 2011. № 3. С. 5-12.
Домбровский В. В., Объедко Т. Ю. Управление с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 3. С. 5-12.
Домбровский В. В., Самородова М. В. Управление с прогнозированием нелинейными стохастическими системами с марковскими скачками при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2015. № 3. С. 14-22.
Rawlings J. Tutorial: Model Predictive Control Technology // Proc. Amer. Control Conf. San Diego. California. June 1999. P. 662676.
Dombrovskii V., Obyedko T. Model predictive control for constrained systems with serially correlated stochastic parameters and portfolio optimization // Automatica. 2015. No. 54. P. 325-331.
 Управление с прогнозированием по квадратичному критерию линейными дискретными системами с марковскими скачками при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1(34).

Управление с прогнозированием по квадратичному критерию линейными дискретными системами с марковскими скачками при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1(34).