Управление с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 3(20).

Управление с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при ограничениях

В работе рассматривается задача синтеза оптимальных стратегий управления с прогнозирующей моделью для гибридных систем, состоящих из подсистем, с учетом ограничений на управляющие переменные. Параметры каждой из подсистем изменяются в соответствии с эволюцией марковских цепей, состояния которых взаимосвязаны между собой.

Model predictive controlof interconnected hybrid systems with Markov jumps under constraints.pdf Широкий класс реальных систем имеет непрерывно-дискретную природу. Ди-намика таких систем описывается уравнениями, включающими непрерывные пе-ременные, в то время как структура системы (параметры) изменяется в соответст-вии с эволюцией переменных, принимающих дискретный набор значений из не-которого множества. Динамические системы, имеющие такую непрерывно-дискретную природу, называются гибридными системами [1, 2].В [3, 4] рассматриваются задачи управления линейными гибридными систе-мами, структура которых зависит от состояния однородной марковской цепи.В этих работах не учитываются ограничения на управляющие переменные, в товремя как на практике такие ограничения часто присутствуют.Эффективным подходом к синтезу стратегий управления при ограниченияхявляется метод управления с прогнозирующей моделью [5]. В [6−8] рассматрива-ется задача управления с прогнозированием для гибридных систем, параметрыкоторых изменяются в соответствии с эволюцией одномерной марковской цепи, сучетом ограничений на управления. Важной областью приложений таких системявляется финансовая инженерия, где подобные модели используются для описа-ния инвестиционного портфеля на финансовом рынке с переключающимися ре-жимами [8].Современные системы управления, как правило, состоят из взаимодействую-щих подсистем неоднородной непрерывно-дискретной природы. В частности, ин-вестиционный портфель представляет собой сложную систему и может содержатьрисковые финансовые активы разных классов, динамика доходностей которыхменяется скачкообразно в соответствии с эволюцией состояний взаимосвязанныхмарковских цепей, характеризующих, например, поведение различных секторовэкономики [9].В данной работе получены уравнения синтеза оптимальных стратегий управ-ления с прогнозирующей моделью для гибридных систем, состоящих из подсис-тем, с учетом явных ограничений на управляющие переменные. При этом пара-метры каждой из подсистем изменяются в соответствии с эволюцией марковскихцепей, состояния которых взаимосвязаны между собой.1. Постановка задачиПусть система состоит из совокупности подсистем, состояния которых описы-ваются уравнениями( ) ( ) ( ) ( ) xq(k+1)=Aqxq(k)+Bq[ƒ(q)(k+1),k+1]u(q)(k),q=1,2,...s, (1)где x(q)(k) - (q)nx -мерный вектор состояния q-й подсистемой, u(q)(k) - (q)nu -мерныйвектор управления q-й подсистемой; A(q), B(q)[ƒ(q)(k),k] - матрицы соответствую-щих размерностей; ƒ(q)(k) - скалярная однородная цепь Маркова с конечным мно-жеством состояний {1, 2,…,ƒq}. Таким образом, каждая из подсистем может нахо-диться в ƒq состояниях, определяемых скалярным случайным процессом с дис-кретным множеством значений (состояний).Между подсистемами существует взаимосвязь: состояние цепи ƒ(q)(k) q-й под-системы (q = 1,2,…,s) в k-й момент времени зависит от состояний цепей ƒ(r)(k−1)(r = 1,2,…,s) в момент времени k−1. Таким образом, динамика системы в целомзависит от дискретного векторного случайного процесса ƒ(k) = [ƒ(1)(k),ƒ(2)(k),…,ƒ(s)(k)]T с конечным множеством состояний {q, jq} (q = 1,2,…,s; jq = 1,2,…,ƒq) идискретным временем. Случайный процесс ƒ(k) представляет собой векторнуюодносвязную цепь Маркова.Для векторной цепи вероятности перехода за один шаг определяются в виде{ } 1 1 1 11 11,..., ; ,..., 1 1 1 1,..., ; ,...,,...,ƒ( 1) ƒ ,..., ƒ ( 1) ƒ ƒ ( ) ƒ ,..., ƒ ( ) ƒ ,1s s s ss ssi i j j j s sj i s sii i j jj jP P k k k kP= + = + = = =ƒ =с начальным распределением{ } 1 11,..., 1 1 1 1 ,...,,...,ƒ (0) ,..., ƒ (0) , ( 1, ;...; 1, ), 1. s ssj j s s s s j jj jp =P =j =j j= ƒ j= ƒ ƒp =Предполагается, что состояние векторной марковской цепи в момент времениk доступно наблюдению.На управляющие воздействия каждой из подсистем накладываются ограни-чения:( ) ( ) ( ) ( )umqin(k)≤Sq(k)uq(k)≤umqax(k),q=1,2,...,s, (2)где S(q)(k) - матрицы соответствующих размерностей.Необходимо определить закон управления системой, состоящей из подсистемвида (1), при ограничениях (2) из условия минимума критерия со скользящим го-ризонтом управления}( ) ( ) ( ) ( ) ( )1 21 1( ) ( ) ( ) ( )( / ) { ( ( )) ( ,) ( ) ( ,) ( )( ( 1/ )) ( , 1) ( 1/ ) ( ),ƒ( ) ,s mq T q q q qq iq T q q qJ k m k M x k i R kix k i R kix k iu k i k R ki u k i k x k k= =+ = + + − + ++ + − − + −ƒƒ(3)где( )( / ), 0,1,..., ( 1) q u k l k l m + = − - последовательность прогнозирующих управ-лений q-й подсистемой, u(q)(k) = u(q)(k/k), M{a/b} - оператор условного математи-ческого ожидания, ( )1 ( , Rq ki) ≥0, ( )R2q (k,i) ≥0,R(q)(k,i) >0- весовые матрицысоответствующих размерностей, m - горизонт прогноза, k - текущий момент вре-мени.2. Синтез стратегий управления с прогнозированиемДля решения сформулированной задачи используем методологию управленияс прогнозирующей моделью. Данный подход позволяет получить стратегииуправления с обратной связью с учетом ограничений на управляющие воздейст-вия.Стратегии управления с прогнозированием определяются по следующему пра-вилу. На каждом шаге k минимизируем функционал (3) по последовательностипрогнозирующих управлений u(q)(k/k), …,u(q)((k+m−1)/k), q = 1,2,...,s, зависящих отсостояния подсистемы в момент времени k, при ограничениях (2). В качествеуправления в момент времени k берем u(q)(k) = u(q)(k/k). Тем самым получаемуправление q-й подсистемой u(q)(k) как функцию состояний x(q)(k) и ƒ(k), т.е.управление с обратной связью. Чтобы получить управление u(q)(k+1) на следую-щем шаге, процедура повторяется для следующего момента k + 1 и т.д.Если цепи Маркова ƒ(q)(k) (q = 1,…,s) независимы между собой (состоянияподсистем не зависят от состояний других подсистем), то есть представляют со-бой однородные скалярные цепи Маркова, то каждая из них допускает следующеепредставление в пространстве состояний [10]:ƒ(q)(k+1)=P(q)ƒ(q)(k)+ ƒ(q)(k+1), (4)где ƒ(q)(k) = [ƒ(ƒ(q)(k),1),…,ƒ(ƒ(q)(k),ƒq)]T, ƒ(ƒ(q)(k),j) - функция Кронекера(j = 1,…ƒq); P(q) - матрица переходных вероятностей для q-й цепи; ƒ(q)(k) - мартин-гал-разность.Обобщим соотношение (4) для скалярных цепей на случай векторных одно-родных цепей Маркова.Введем мультииндексы i = (i1,i2,…,is), j = (j1,j2,…,js). Тогда матрицу вероятно-стей перехода за один шаг векторной цепи Маркова можно представить в видеP = (Pij), где1,..., ;1,..., ;( 1 1, 1;...; 1, ; 1 1, 1;...; 1, ). Pij=Pi isj js i = ƒ is= ƒs j = ƒ js= ƒsМатрица P обладает свойствомij 1, .jƒP= iВведем вектор ƒ(k) = [ƒ(ƒ(k),1),…,ƒ(ƒ(k),ƒ)]T, ƒ = ƒ1.ƒ2.....ƒs. Значение вектораƒ(k) соответствует комбинации состояний одномерных цепей Маркова.Тогда для многомерной цепи можно записать представление в пространствесостояний, аналогичное (4):ƒ(k+1)=Pƒ(k)+ ƒ(k+1). (5)Мартингал-разность ƒ(k) имеет следующие условные характеристики [10]:M{ƒ(k+1)/ƒ(k)}=0, (6)C(k +1)=M{ ƒ(k +1) ƒT(k +1)/ƒ(k)}=diag{Pƒ(k)}−Pdiag{ƒ(k)}PT. (7)С учетом (5) уравнения для подсистем (1) можно представить в следующемвиде:( ) ( ) xq(k+1)=Aqx(q)(k)+B(q)[ƒ(k+1),k+1]u(q)(k),q=1,2,...s, (8)гдеƒ( ) ( )1[ƒ( ), ] ƒ ( ) ( )=q = ƒ qi iiB k k kB k. (9)Здесь ƒi(k), i = 1,2, …,ƒ, - компоненты вектора ƒ(k), {Bi(q)}, i = 1,…,ƒ, - множествозначений матрицы B(q)[ƒ(k),k].Критерий (3) примет вид}( ) ( ) ( ) ( ) ( )1 21 1( ) ( ) ( ) ( )(( ) / ) { ( ( )) ( , ) ( ) ( , ) ( )( (( 1) / )) ( , 1) (( 1) / ) ( ),ƒ( ) .= =+ = + + − + ++ + − − + −ƒƒs mq T q q q qq iq T q q qJ k m k M x k i R kix k i R kix k iu k i k R ki u k i k x k k (10)Теорема. Векторы прогнозирующих управлений( )( )=⎡⎢⎣( ( )( / )) ,( ( )(( +1) / )) ,,( ( )(( + −1) / ))⎤⎥⎦, = 1,2,..., ,Uq k uq k kT uq k kT uq k m k T T q sминимизирующие критерий (3) при ограничениях вида (2), на каждом шаге k опре-деляются из решения задачи квадратичного программирования с критерием вида(( + )/ )=⎡⎣2 ( ) ( )− ( )⎤⎦ ( )+ ( ) ( ) ( )Y k m k xTk G k F k U k UTk H k U k (11)при ограничениях( ) ( ) ( ) ( )min( ) ( ) ( ) max( ). Uq k ≤Sq kUq k ≤Uq k (12)Оптимальное управление для q-й подсистемы равно( ) ( ) ( )( )( ) 0 0 ( )( ), uq uq u qq qu k =⎡⎢⎣In n

Ключевые слова

constraints, vector simple connected Markov chain, interconnected hybrid systems, hybrid systems, model predictive control, ограничения, векторная односвязная цепь Маркова, взаимосвязанные гибридные системы, управление с прогнозирующей моделью

Авторы

ФИООрганизацияДополнительноE-mail
Домбровский Владимир ВалентиновичНациональный исследовательский Томский государственный университетпрофессор, доктор технических наук, заведующий кафедрой математических методов и информационных технологий в экономикеэкономического факультетаdombrovs@ef.tsu.ru
Объедко Татьяна ЮрьевнаНациональный исследовательский Томский государственный университетаспирантка факультета прикладной математики и кибернетикиtani4kin@mail.ru
Всего: 2

Ссылки

Elliott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin: Springer-Verlag, 1995.
Billio M., Pelizzon L. Value-at-Risk:a multivariate switching regime approach // J. Empirical Finance. 2000. No. 7. P. 531−554.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96−112.
Blackmore L., Bektassov A, Ono M., Williams B.C. Robust optimal predictive control of jump Markov linear systems using particles // Hybrid systems: Comput. and Control / A. Bemporad, A. Bicchi, G. Buttazzo, Eds. New York: Springer-Verlag, 2007. V. 4416, Lecture Notes in Computer Science. P. 104−117.
Bernardini D., Bemporad A. Scenario-based model predictive control of stochastic constrained linear systems // Proc. 48th IEEE Conf. Decision and Control. Shanghai. P.R. China. December 2009. P. 6333−6338.
Rawlings J. Tutorial: Model predictive control technology // Proc. Amer. Control Conf. San Diego. California. June 1999. P. 662−676.
Dragan V., Morozan T. The Linear quadratic optimization problems for a class of linear stochastic systems with multiplicative white noise and Markovian jumping // IEEE Transactions on Automatic Control. 2004. V. 49. No. 5. P. 665−675.
Bemporad A., Di Cairano S. Model-predictive control os discrete hybrid stochastic automata // IEEE Transactions on Automatic Control. 2011. V. 56. No. 6. P. 1307−1321.
Costa O.L.V., Paulo W.L. Generalized coupled algebraic riccati equations for discrete-time Markov jump with multiplicative noise systems // European J. Control. 2008. No. 5. P. 391−408.
Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М: Физматлит, 1994.
 Управление с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 3(20).

Управление с прогнозированием взаимосвязанными гибридными системами с марковскими скачками при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 3(20).

Полнотекстовая версия