Получено решение задачи стохастического робастного H
/H
-управления динамической системой с внутренними шумами, мультипликативными по состоянию и управлению, на конечном интервале времени. Задача сводится к нахождению решения системы двух связанных матричных дифференциальных Риккати-подобных уравнений относительно матричных переменных P
(t)≤0, P
(t)≥0.
Extension of one known result in stochastic H
/H
-control theory.pdf Рассмотрим многомерную стохастическую систему dxt = (A(t) xt + B (t )vt + B2 (t )ut )dt + (A0 (t) xt + B10 (t )vt + B20 (t)ut )dwt, zt = C(t)xt + D(t)ut, x0 = a, t e [0, T], T < да, (1) где xt - вектор состояния, vt - внешнее возмущение, ut - управляющий сигнал, zt -управляемый выход. Винеровский случайный процесс (wt ), не теряя в общности, считаем скалярным. Вектор x0 не случайный. Процесс v = ( vt ), детерминированный или случайный неупреждающий, предполагается имеющим конечную энерfT 2 гию E I | vt I dt Говоря формально, v есть элемент гильбертова пространства 0 L2f([0,T], L2(Q,Rl)), где Q - пространство элементарных событий, F- поток а-алгебр Ft. Норму процесса v определяем как|| v ||= (E| vt |2 dt)1/2. Энергия || u ||2 процесса u = (ut) также предполагается конечной, тогда существует единственное решение xt = x(t,u,v,x0) уравнения (1) с конечной энергией [1] . Ясно, что в этом случае энергия процесса z тоже конечна. Считаем также выполненными условия D'C = 0, D D = I, названные в [2] условиями регулярности, они не слишком ограничительны. Заметим, что в ряде работ управляемый выход определяется как сумма z=C x+D u, тогда z'z = x 'C 'Cx + u'D'D u + x' C'D u + u'D' Cx . В других работах полагают z = (^), и тогда z' z = x' C' Cx + u'D'D u. 2013 № 2(23) Управление, вычислительная техника и информатика Условие C'D = 0 снимает различие этих двух определений. Условие же D'D = I вообще ограничением не является, если D - неособенная матрица. Пусть L : v ^ z - оператор передачи внешнего возмущения на управляемый выход. Предположим, что существует число y> 0, такое, что ||z|| < y ||v||. Нормы ||v||, ||z|| индуцируют норму ||L|| оператора L по формуле ||L|| = sup (|| z || 11| v ||). v* 0,x0 = 0 Норма ||L|| < y является мерой максимально негативного (наименее благоприятного) влияния, которое при заданном Y может иметь возмущение v на управляемый выход z. Пусть супремум по v * 0, x0 = 0 достигается на элементе v* e Lp ([0,T], L2(Q,Rl)), тогда можно показать [2], что v* минимизирует функционал J\ (v) = E[T (y2v;vt - z'tzt )dt. (2) Тем самым трудная задача вычисления нормы ||L|| < y сводится к традиционной задаче минимизации функционала. 1. Постановка задачи Сформулируем стохастические задачи HM-управления и H2IHw-управления для системы (1). Задача HM-управления состоит в следующем [3]: 1) Для заданного вещественного числа y > 0 найти такое управление u* e Lp ([0, T ], L2(Q, Rm)), что || L ||< y, где L(v)=C x(. , u, v, 0) + D u; при этом 2) управление u* стабилизирует замкнутую систему, например, в следующем смысле: limE | x(t,u ,0,x0)|2 = 0. t ^w Постановка задачи ^Направления включает те же требования 1), 2) и дополнительное требование: 3) если в уравнении (1) положить v = v*, то u = u* минимизирует функционал энергии || z ||2: J2(u) = E fT (x'tC'Cx't+ u'ut)dt. (3) 0 Управление u, удовлетворяющее требованиям 1) -3), обозначаем через u*. Оно решает H2IHw-задачу. В следующих двух разделах перейдем к решению задач Hw и H2IHw для системы (1), внутренние шумы которой представлены суммой случайных процессов, мультипликативных - один по состоянию, другой по управлению. Случайную составляющую B10 vt dwt, мультипликативную по внешнему возмущению v, считаем отсутствующей (B10 = 0). Задача H2IHw-управления для системы с внутренним шумом, мультипликативным по состоянию, упомянута (по-видимому, впервые) в работе [3] как теоретически интересная и практически значимая. Аналогичная задача для системы (1) с коэффициентами * 0, B10 * 0, но с B20 = 0 решена в работе [2]. 2. Задача подавления внешнего возмущения Замкнем систему (1) (считая B10 = 0) обратной связью ut (x) = K2(t)xt с переменным во времени коэффициентом передачи K2 (t), пока не определенным. Получим замкнутую систему (нижний индекс «с» - от английского closed (замкнутый)) dxc(t) = (Ac(t) xc(t) + B1(t) vt )dt + A0c(t) xc(t) dwt , zc(t) = Cc(t) xc(t), xc(0) = a, t e [0,7], (4) где xc (t) - вектор состояния замкнутой системы и приняты обозначения Ac (t) = A(t) + B2 (t) K2 (t), A 0c (t) = A0 (t) + B20 (t) K2 (t), Cc (t) = C(t) + D(t) K2 (t). (5) Сначала, задавшись числом у > 0 , рассмотрим Я^-задачу гашения внешнего возмущения. Формально считая vt управлением, задачу гашения будем интерпретировать как задачу минимизации по vt функционала J (v) = E|0T (у2v; vt - zc (t)zc (t))dt. (6) Необходимое и достаточное условие существования решения Ям-задачи дается фундаментальной леммой об ограниченности нормы оператора Lc : v ^ zc для стохастической системы (4). Сформулируем здесь эту лемму [3]. Лемма об ограниченности. Для стохастической системы (4) и для заданного Y > 0 условие || L ||< у выполняется тогда и только тогда, когда дифференциальное уравнение Риккати P + A P + PAc + A0c PAqc - у'2PBlB[ - Cc Cc = 0, P(T) = 0 (7) имеет единственное решение P(t) < 0 на [0, T]. Наименее благоприятное возмущение v* дается формулой v*( x) = -у-2 B[(t) P(t) x. В подробной записи уравнение (7) представляется в виде (см. (5)) p + (A + B2 K 2) ' р + p (A + B2 K 2) - (A0 + B20 K 2)' P (A0 + B20 K2) - (8) T (8) -у-2PBB[PX - K'2K2 - C'C = 0, P(T) = 0. Значение матрицы K2 все еще не определено (оно будет определено ниже формулой (10)). 3. Оптимизация системы при наихудшем внешнем возмущении * Подставив в (5) v = v , получим систему dxt = ((A(t) - у-2B (t)Bj' (t)Pl (t))xt + B2 (t)ut )dt + (Aq (t)xt + B20 (t)ut )dwt, zt = C(t)xt + D(t)ut, x0 = a, t e [0, T]. (9) Минимизируя функционал J2(u) в формуле (3) при ограничении (9), получим оптимальное управление u* при наименее благоприятном возмущении v*. При B20(t) = 0 решение этой оптимизационной задачи представлено в [3]. В нашем * случае, когда B20(t) * 0 , решение u также известно [4]. Оно получено с использованием теории FBSDE-решений систем прямого (forward) и обратного (backward) стохастических дифференциальных уравнений [5] и имеет вид u*(t) = K2(t) xt = -{B'2 P2 + B'20M) xt, (Ю) где P2 (t) > 0, t e [0, T] - единственное решение следующей дифференциальной системы: P + (A-y-2B1B1'P1)'P2 + P2(A-y-2 BlB{Pl) + A0 M - P2 B2 B'20M - -P2 B2B2 P2 + C 'C = 0, P? (T) = 0, m = P2 A - P2B20 B2P2 - P2 B20 B20M. (11) Система (11) включает дифференциальное уравнение типа Риккати и алгебраическое уравнение связи матриц P2 и M . Полученную в работе систему уравнений (8), (11) можно считать обобщением результата работы [3]. В самом деле, при B20 = 0 (когда нет шума, зависящего от * управления) имеем M = P2A , см. (11), и, следовательно, ut (x) = -B2P2x, где P2 > 0 - решение (существующее по доказанному в [6]) уравнения Риккати P + (A-Y-2BB1'P1)'P! + P2(A-Y-2BlB[Pl) + A0P2A -P2B2B'2P2 + CC = 0, P2(t) = 0. (12) Система уравнений (11), (12) совпадает с аналогичной системой уравнений (43), (45), полученной впервые в [3]. Подставив в (8) значение K2 = -B'2P2 + B'20M из (10), получим запись уравнения (8) в следующем виде: P + (A - B2B2 P2 - B2B20M) 'P + p(A - B2 B2P2 - B2 B20M) - -(A0 - B20 B2 P2 - B20 B20 M)' P( A0 - B20 B2 P2 - B20 B'20 M) - -Y-2PJBJBJ'PJ - K2K2 - C'C = 0, P (T) = 0. (13) Решая систему уравнений (11), (13), получим затем искомые функции v* (x), u*(x). Заключение В работе получено решение задачи стохастического робастного ЯУНтуправ-ления для случая, когда диффузионная компонента стохастического дифференциального уравнения, описывающего систему управления, содержит внутренние шумы системы, мультипликативные по состоянию и по управлению. Задача свелась к нахождению решения системы двух связанных дифференциальных уравнений (11), (13) относительно матричных переменных P (t) < 0, P2 (t) > 0.
Булинский А.В., Ширяев A.H. Теория случайных процессов. М.: Физматлит, 2003. 399 с.
Hinrichsen D, Pritchard A.J. Stochastic Hw II SIAM J. Control Optim. 1998. V. 36. No 5. P. 1504-1538.
Chen B.S. and Zhang W. Stochastic H2IHw-control with state-dependent noise II IEEE Trans. Automat. Control. 2004. V. 49. No. 1. P. 45-56.
Wu Zhen. Forward-backward stochastic differential equations, linear quadratic stochastic optimal control and nonzero sum differential games // J. Systems Science and Complexity. 2005. V.18. No. 2. P. 179-192.
Ma Jin, Protter Philip, Yong Jiongmin. Solving Forward-Backward Stochastic Differential Equations Explicitly - A Four Step Scheme. Probability Theory and Related Fields. 1994. V. 98. P. 339-359.
Bensoussan A. Lecture Notes in Mathematics. Springer Verlag, 1983. V. 972. P. 3-39.