Управление с прогнозированием системами с марковскими скачками и мультипликативными шумами при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 3(12).

Управление с прогнозированием системами с марковскими скачками и мультипликативными шумами при ограничениях

Рассматривается задача управления с прогнозирующей моделью для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами. Параметры уравнений меняются в соответствии с эволюцией марковской цепи с конечным пространством состояний и известной матрицей переходных вероятностей. Предполагается, что состояние цепи не наблюдается. Определена стратегия управления с учетом явных ограничений на управляющие переменные.

?.pdf Эффективным подходом к синтезу систем управления, получившим широкое признание и применение в практике управления сложными технологическими процессами, является метод управления с прогнозирующей моделью (управление с прогнозированием, управление со скользящим горизонтом) [1 - 8].Преимуществом этого подхода является возможность достаточно просто учи-тывать явные ограничения на переменные состояния и управления. При этом по-лучается стратегия управления с обратной связью, но удается избежать так назы-ваемого «проклятия размерности», которое препятствует синтезу управлений с обратной связью при ограничениях, если применять традиционные подходы с ис-пользованием метода динамического программирования. Синтез стратегий управ-ления с прогнозированием сводится к последовательности задач математического программирования, обычно линейного или квадратичного. Обзор работ, посвя-щенных проблеме управления с прогнозирующей моделью, приведен в [1, 2].В [7] предложен метод синтеза стратегий управления с прогнозирующей мо-делью для дискретных систем с мультипликативными шумами и случайными па-раметрами, представляющими собой последовательность независимых случайных величин, для которых известны только первый и второй моменты распределения. В [8] рассматривается задача управления с прогнозирующей моделью для дис-кретных систем с зависимыми параметрами, динамика которых описывается раз-ностным стохастическим уравнением.В настоящей статье рассматривается задача управления с прогнозирующей моделью для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами. Параметры уравнений меняются в соответствии с эволюцией марковской цепи с конечным пространством состояний и известной6В.В. Домбровский, Т.Ю. Объедкоматрицей переходных вероятностей. Предполагается, что состояние цепи не на-блюдается.Решению различных задач управления и оценивания для систем со случайны-ми скачкообразными параметрами посвящено значительное количество работ [9 - 14]. Проблема синтеза регуляторов для систем с мультипликативными шумами и скачкообразными параметрами без учета явных ограничений на управления рас-сматривалась в [10, 14].В данной работе для таких систем получены уравнения синтеза оптимальных стратегий управления с прогнозирующей моделью с учетом явных ограничений на управляющие переменные.1. Постановка задачиПусть объект описывается уравнениемx(k + 1) = Ax(k) +u(к), (1)B0 [α(k +1), k +1] + £ Bj [α(k + 1),k + 1]ωj (k +1) j=1 где x(k) - nx-мерный вектор состояния, u(k) - nu-мерный вектор управления, ω j(k) - независимые между собой дискретные белые шумы с нулевым средним и единичной дисперсией, α(k) (k = 0, 1, 2…) - однородная дискретная марковская цепь с конечным множеством состояний {1,2,…,ν}, известной матрицей переходных вероятностейP = [Pij],(i, je{1,2,...,ν}),Pji = P{α(k +1) = αj \α(k) = α i}, ν Pji = 1 , и известным начальным распределениемpi=P{α(0) = i},(i = 1,2,...,ν); i pi=1.Предполагается, что состояние марковской цепи не наблюдается. Последовательности ωj(k) и α j(k) независимы. A, Bj [α(k),k] (j = 1, …,n) - матрицы соответствующих размерностей.На управляющие воздействия накладываются ограничения:umin (k) < S(k)u (k) < u max (k),(2)где S(k) - матрица соответствующей размерности.Для управления системой (1) синтезируем стратегии с прогнозирующей моделью по следующему правилу. На каждом шаге k минимизируем критерий со скользящим горизонтом управленияJ(k+m/k)=M\^xT(k+i)R1(k, i)x(k+i)+uT(k+i-1/k)R2(k, i-1)u(k+i-1/k) / x(k) (3)на траекториях системы (1) по последовательности прогнозирующих управлений u(k/k), …, u(k+m -1/k), зависящих от состояния системы в момент времени k, при ограничениях (2), где M{a/b} - оператор условного математического ожидания, R1(k,i) ≥ 0 и R2(k,i) > 0 - весовые матрицы соответствующих размерностей, m - горизонт прогноза, k - текущий момент времени. В качестве управления в моментУправление с прогнозированием системами с марковскими скачками7времени k берем u(k)=u(k/k). Тем самым получаем управление u(k) как функцию состояний x(k), т.е. управление с обратной связью. Чтобы получить управление u(k+1) на следующем шаге, процедура повторяется для следующего момента k + 1 и т.д.2. Синтез стратегий управления с прогнозированиемЦепь Маркова с дискретным временем допускает следующее представление в пространстве состояний [13]:θ ( k + 1) = P θ ( k) + υ(k + 1),(4)где θ(k)=[δ(α(k),1), …,δ(α(k),ν)]T, δ ( α (k)j) - функция Кронекера (j=1, … ν); υ - мартингал с характеристикамиM {υ(k + 1)} = 0;(5)C(k + 1) =M{ о(k + 1) DT(k + 1)} = diag(PM{Q(k)})-Pdiag(M{Q(k)})P . (6) При этомL1(k)=M{θ(k)} = Pkp(0) = p(k);(7)L2 (k) = M{θ(k)θT (k)} = diag(p(k)),(8)где p(0) = \p p2,...…, p ]T - начальное распределение состояний цепи Маркова, p(k) = [p1(k),2(k),pv(k)]T - распределение состояний цепи в момент времени k. С учетом (4) систему (9) можно представить в следующем виде:x(k + 1) = Ax(k) +B0 [ θ (k + 1),k +1] + £ Bj [ θ (k + 1),k + 1]ωj (k +1)u (к), (9)j=1v(10)гдеBj [ θ (k),k] = i =1 θi(k)Bj ( i) (k),(j = 0,n).Здесь θi(k) (i=1,2, …,ν) - компоненты вектора θ(k), {Bj ( i )} (j=0, …,n), (i=1, …,ν) -множество значений матрицы Bj[θ(k),k].Y(k + m/k) = 2xT (k)G(k)U(k) + UT (k)H(k)U(k) S(k) = diag(S(k),...,S(k + m-1)),(11) (12)Теорема. Вектор прогнозирующих управлений U(k)=[uT(k/k), …,uT(k+m-1/k)] T, минимизирующий критерий (3) при ограничениях вида (2), на каждом шаге k оп-ределяется из решения задачи квадратичного программирования с критерием вида(13)при ограничениях гдеU min ( k )=[um T in(k) (k+m-1)] T,Umax(k) = [uTтаАk),..., u m T ax(k + m-1)]T;H(k), G(k) - блочные матрицы вида"H 11(k) H12(k) ... H1m(k)H(k) =H21(k) H22(k) ■■■ H2m(k)Hm1(k) Hm2(k) ... Hmm(k)_8В.В. Домбровский, Т.Ю. ОбъедкоG(k) = [G1(k) G2(k) Gm(k)],(14)блоки которых равныHtt(k) = R2(k,t-1) + Y\i£(Bs (q) (k + t))TQ( m-t)Bs (q) (k+t)pq(k + t) ; (15)s=0 [q=1JννHtf(k) = T.H(B0(q)(k+t )) T(A(f-t))TQ(m-f)B0(r) (k+t)Prq(f-t)pq(k + t),t f;(17)Gt(k) = (At)TQ(m-t) qJB0(q) (k + t)pq(k + t);(18)Q(t) = ATQ(t -1)A + R1 (k, m -t), (t = 1,m);(19)Q(0) = R1(k,m);(20)Prqf-t - элемент матрицы Pf-t . Оптимальное управление равноu(k) = [In 0nu 0 ]U(k),(21)где Inu - единичная матрица размерности nu, 0nu - квадратная нулевая матрицаразмерности nu.Оптимальная стратегия прогнозирующего управления системой (9) без учета ограничений определяется уравнением (21), гдеU (k) = -H-1 (k)GT (k)x(k).(22)При этом оптимальное значение критерия (10) определяется выражениемJopt(k + m/k) = xT(k)[Q(m)-R 1 (k,0)-G(k)H-1(k)GT(k)]x(k).(23)Доказательство. Выражая последовательно все x(k+i) (i=1,2,… ,m) через x(k) с использованием уравнения системы (1) и подставляя результат в критерий (3), получимJ(k + m/k) = xT (k)AT Q(m-1)Ax(k) +(24)m+2xT (k)AT £ (Ai-1 ) T Q(m - i)M {B0 [ θ (k + i) ,k + i]} u (k + i -1 / k) +i=1m( nЛ+i=1U=0m-1 mYuT (k+i-1/k) YjM{bsT [θ(k+i),k+i]Q(m-i)Bs [θ(k+i),k+i]}+R2 (k,i-1) \u(k+i-1lk)++2^^uT(k+i-1/k)M{B0 T[θ(k+i),k+i](Aj- i)TQ(m-j)B0[θ(k+j),k+j]}u(k+j-1/k).i=1 j=i+1Используя (7), (8), (10), определим математические ожидания, входящие в (24):ννM {B0 [ θ (k + i), k + i]} = YJ\_EqL1(k + i)~\B0(q) (k + i ) = X B0(q) (k + i)pq (k + i); (25)q=1q=1Управление с прогнозированием системами с марковскими скачками9M { BsT [θ(k + i),k + i]Q(m - i)Bs[θ(k + i) ,k + i ]} = = νν (Bs(q) ( k + i )) T [ErL2 (k + i)EqT ]Q(m - i)Bs ( r ) (k + i ) =q=1 r=1V= q =1 (Bs(q) ( k + i )) T Q(m - i)Bs(r) (k + i)p (k + i);(26)M{B0T[θ( k+i ), k+i](A ( j-i))TQ(m-j)B0[θ(k+j), k+j]} == νν (B 0(q) (k + i )) T [ErM {θ(k + j ) θT (k + i)}EqT ]Q(m - j)B0( r ) (k + j), (27)q=1 r=1гдеEq=[0 0 10 0],(q = 1,ν),(j = i+1,m). Далее, определим M{θ(k+j)θT(k+i)} для j=i+1, …,m:M { θ(k+j)θ T (k+i )}=M {θ(k+i+(j - i )) θ T (k+i )} =M\ \Pj -iθ(k + j) + j i Plυ(k + j-l)1лl=0θ T(k + i)Тогда (27) примет видM{B0T[ θ (k + i),k+i](A( j-i)) TQ(m-j)B0[ θ (k + j),k + j] == 1 1 (B 0(q) (k + i )) T [Er P j-i L 2 ( k + i)EqT ~\( Aj - i ) T Q(m - j)B0(r)(k + j)q= r== Z Z (B0q) (k + i )) T (Aj-i ) T Q(m - j )B0(r) ( k + j) Prq j - i pq ( k + i ),( j=i + 1,m). (28)q=1 r=1С учетом (25), (26), (28) критерий (24) перепишем в видеJ(k + m/k) = xT (k)AT Q(m-1)Ax(k) +(29)mI ν1+2xT (k)AT £ (Ai-1 )TQ(m- i) \ q B0(q) (k + i)pq (k + i)\u(k + i-1/k) +i=1U=1JmI n^ _νj+ 1 uT (k+i-1/k ) Z1 (Bs (q) ( k+i ))T Q(m-i)Bs(r) (k+i)pq (k+i)+R2 (k,i-1) \u(k+i-1/lk)+i=\s=0q=Jm-1 m\J^J^I+2£ X uT (k+i-1 /k) ZZ(B 0(q)( k+i )) T (Aj - i ) T Q(m-j)B0( r ) (k+j)Prqj - ipq (k+i)\u(k+j-Vk\i=1 j=i+1lq=1 r=1Jгде pq(k) - q-й элемент вектора p(k), Pr jqi - элемент (r,q) матрицы Pj-i . Выражение (29) можно записать в матричном виде:J(k + m/k) = xT (k)ATQ(m - 1)Ax(k) + 2xT (k)G(k)U(k) + UT (k)H(k)U(k), (30) где матрицы H(k),G(k) имеют вид (13) - (20).10В.В. Домбровский, Т.Ю. ОбъедкоТаким образом, имеем задачу минимизации критерия (30) при ограничениях (2), которая эквивалентна задаче квадратичного программирования с критерием (11) при ограничениях (12).Очевидно, что если ограничения на управляющие воздействия отсутствуют, то оптимальный вектор прогнозирующих управлений U(k), минимизирующий кри-терий (3) на траекториях системы (1), определяется уравнением (22). Нетрудно показать, что при этом оптимальное значение критерия (3) имеет вид (23).ЗаключениеПредложен метод синтеза стратегий прогнозирующего управления для систем с марковскими скачками и мультипликативными шумами при условии, что со-стояние цепи не доступно наблюдению. Данный подход позволяет в явном виде учесть ограничения на управления. Алгоритм синтеза прогнозирующей стратегии включает решение последовательности задач квадратичного программирования.Отметим, что предложенный подход без принципиальных затруднений может быть обобщен на следующие случаи:•·когда матрица A в уравнении (1) зависит от времени;•·когда уравнение (1) содержит аддитивные шумы с характеристиками, зави-сящими от состояния цепи Маркова;•·когда матрица A в уравнении (1) зависит от последовательности независимых случайных параметров, не зависящих от состояния цепи;•·когда ограничения на управляющие воздействия задаются нелинейными со-отношениями. В этом случае синтез стратегий управления сведется к решению последовательности задач нелинейного программирования.

Ключевые слова

мультипликативные шумы, марковские скачки, ограничения, управление с прогнозирующей моделью

Авторы

ФИООрганизацияДополнительноE-mail
Домбровский Владимир ВалентиновичТомский государственный университетдоктор технических наук, профессор, зав. кафедрой математических методов и информационных технологий в экономике экономическогофакультетаdombrovs@ef.tsu.ru
Объедко Татьяна ЮрьевнаТомский государственный университетстудентка факультета прикладной математики и кибернетикиtani4kin@mail.ru
Всего: 2

Ссылки

Elliott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin: Springer-Verlag, 1995.
Dragan V., Morozan T. The Linear Quadratic Optimization Problems for a Class of Linear Stochastic Systems With Multiplicative White Noise and Markovian Jumping // IEEE Transactions on Automatic Control. 2004. V. 49. № 5. P. 665 - 675.
Пакшин П.В., Ретинский Д.М. Робастная стабилизация систем случайной структуры с переключаемой статической обратной связью по выходу // АиТ. 2005. № 7.
Борисов А.В., Стефанович А.И. Оптимальная фильтрация состояний специальных управляемых систем случайной структуры // Изв. РАН. Теория и системы управления. 2007. № 3. С. 16 - 26.
Costa O.L.V., Paulo W.L. Generalized Coupled Algebraic Riccati Equations for Discrete-time Markov Jump with Multiplicative Noise Systems // European J. of Control. 2008. No. 5. P. 391 - 408.
Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М: Физматлит, 1994.
Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозирующей моделью системами со случайными зависимыми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // АиТ. 2006. № 12. С. 71 - 85.
Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозированием системами со случайными параметрами и мультипликативными шумами и применение к оптимизации инвестиционного портфеля // АиТ. 2005. № 5. С. 84 - 97.
Seron M.M., De Dona J.A., Goodwin G.C. Global Analitical Model Predictive Control with Input Constraints // 39th IEEE Conf. Decision Control. 2000. Sydnej. Australia, 12 - 15 December. P. 154 - 159.
Cuzzola A.F., Geromel J.C., Morari M. An impoved approach for constrained robust model predictive control // Automatica. 2002. V. 38. No. 7. P. 1183 - 1189.
Bemporad A., Morari M., Dua V., Pistikopoulos E.N. The explicit linear quadratic regulator for constrained systems // Automatica. 2002. V. 38. No. 1. P. 3 - 20.
Mayne D.Q., Rawlings J.B., Rao C.V, Scokaert P.O.M. Constrained model predictive control: Stability and optimality // Automatica. 2000. V. 36. No. 6. P. 789 - 814.
Bemporad A., Borrelli F., Morari M. Model Predictive Control Based on Linear Programming - The Explicit Solution // IEEE Trans. Automat. Control. 2002. V. 47. No. 12. P. 1974 - 1985.
Rawlings J. Tutorial: Model Predictive Control Technology // Proc. Amer. Control Conf. San Diego.California. June 1999. P. 662 - 676.
 Управление с прогнозированием системами с марковскими скачками и мультипликативными шумами при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 3(12).

Управление с прогнозированием системами с марковскими скачками и мультипликативными шумами при ограничениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 3(12).

Полнотекстовая версия