О необходимых условиях существования седловой точки в задаче оптимального управления для систем разностных уравнений типа Вольтерра | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 59. DOI: 10.17223/19988605/59/2

О необходимых условиях существования седловой точки в задаче оптимального управления для систем разностных уравнений типа Вольтерра

Изучается задача оптимального управления для объектов, описываемых системой разностных уравнений типа Вольтерра. Доказаны необходимые условия существования седловой точки. Вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.

On necessary conditions for the existence of a saddle point in the problem of optimal control for systems of difference .pdf В работах [1-2] и других найдены условия существования седловой точки в процессах, описываемых системами интегро-дифференциальных уравнений типа Вольтерра. В предлагаемой работе, применяя модификацию методов, предложенных в работах [3-6], найдены различные необходимые условия существования седловой точки в задаче оптимального управления для систем, модели которых описываются системами нелинейных разностных уравнений. 1. Постановка задачи Пусть Rr, Rq, Rn - линейные пространства r-, q- и n-мерных векторов соответственно, (u (t), v (t)) - т^-мерный дискретный вектор управляющих воздействий со значениями из заданного непустого и ограниченного множества U (V), т.е., u(t)eU cff', t eT = {t0,t0 +1, - - -, f j}, v(t)eV c Rq, t e T, (1) (2) где t0, tj - заданные числа, причем разность ^ -10 есть натуральное число. Пару (u° (t), v0 (t)) с вышеприведенными свойствами назовем допустимой парой. На решениях системы нелинейных разностных уравнений типа Вольтерра t x{t) = X f (t,t,x(x),u (t),v(x)), t e T, (3) T=t0 определим терминальный функционал J (u,v) = ф( , )). (4) Здесь f (t, t, x, u, v) - заданная n-мерная вектор-функция, непрерывная по ( x, u, v) при всех (t, t) вместе с частными производными по х, ф(x) - заданная дважды непрерывно дифференцируемая скалярная функция. Ясно, то функционал (4) определен для всех совокупностей (пар) (u(t), v(t)) , для которых соответствующее решение x (t) уравнения (3) определено на T. Перейдем к постановке следующей игровой задачи. Предположим, что управлением u (t) распоряжается игрок А, стремящийся минимизировать функционал (4), а управлением v(t) распоряжается игрок В, стремящееся максимизировать функционал (4). Рассмотрим следующую игровую задачу: среди всех допустимых пар (u(t),v(t)) , на которых определен функционал (4), найти такую допустимую пару (u0 (t), v0 (t)) чтобы при любых (u(t), v(t)) 14 Мансимов К.Б., Чырахова М.У. О необходимых условиях существования седловой точки J(и0,v)< J(и0,v0)< J(и,ѵ0) . (5) Пару (и0 (t),v0 (t)) , удовлетворяющую условию (5), следуя принятой терминологии, назовем седловой точкой функционала (4). 2. Аналог принципа максимума Понтрягина для существования седловой точки Пусть (и0 (t), v0 (t)) - седловая точка функционала (4). Это означает, что для любых (и(t), v(t)) J (и, v0 )> J (и0, v0), J (u0, v)< J (u0, v0). (6) Предположим, что x0 (t) - решение уравнения t x0 (t) = Z f (t,T x0 (T),и (T), v0 (t)), (7) T=t а множества f (t,t,x0 (t),U) = {a : a = f (t,t,x0 (t),и0 (t),v0 (t)),и(t) e U}, (8) f (t,t,x0 (t), V) = {a : a = f (t,t,x0 (t),и0 (t),v0 (t)),v(t) e V} (9) выпуклы при всех (t, t) . Пусть se[0,l], pe[0,l], и (t )eU, t e T, v (t )eV, t e T, - произвольные числа и произвольные допустимые управляющие функции соответственно. В силу выпуклости множеств (8), (9) следует, что существуют допустимые процессы (и(t;s), v0 (t), x(t;s)), (и0 (t), v0 (t; p), x(t; p)) , такие что t x (t; s) = Z f (t, t, x (t; s), и (t; s), v0 (t)) = T=L t (10) Z[sf (t,t,x(t;s),m(t),v0 (t)) + (1-s)f (t,t,x(t;s),и0 (t),v0 (t))], T=0 t x (t;p) = Z f (t, t, x (t; p), и 0 (t) , v (t; p)) = T=t t г -I : (t,T,x Cpp^ и° (T), v OO)^1 -p)f (t, T, x (T;p), и 0 (^ v° (T))j Введем обозначения a (t ) = dx (t; s) 5s , b (t ) = 5 2 x (t; s) s=0 5s2 s=0 5x (t; p) 52 x (t; p) z (t ’ У (t )= .2 5p p= x° (т) , U° (т), V° (т)) Z (т) + (27) +V°' (t) Аи(т/(^ ^ x° (т) , U0 (т) , V° (т))) Zv°') у(t 'Z t=t t=t Z(v° (t) fx (t, ^ x° (т),U 0 (т) , V° (т)) У (т) + + 2у°' (t) Аи{т)/(t, т, x° (т) ,U0 (т), V0 (т)) z (т) + z'(T) V° (т) fxx (t, т, x° (т),U0 (т), V0 (т)) Z (т)]. (28) Используя дискретный аналог формулы Фубини (см., напр.: [7, 8]), доказывается справедливость тождеств _. Г t (t) f (t, т, x0 (т),U (т), V0‘ (29) (30) Zv°' (t) fx ^т, x° (т), u° (т), v° (т))a (т)= f ° Z V°' (т) fx (т, t, x° (t) , U° (t), V° (t)) a (t), x=t° Z v°' (t Жі/ ^ т x°(т), и 0 (т), v° (т))= D Z V°' (т)Аu(t)/(^ t, x° (t) , U° (t), V° (t)), T=t° Z(v°' (t) fx (t, т, x° (т) , U (т) , V° (т)) a (т) + T=t° + 2V°' (t) Аи(т)/(t, T, x° (т) ,U° (т), V° (т)) + a'(-0 V° (т) fxx (^ т, x° (т) ,U° (т), V° (т))a (т) -1 Z Z(v°' (т) L (тt, x° (t), U° (t), V° (t))a (t) _т=_ + 2V°' (t) Аи{%)/^ т, x° (т),и° (т) , V° (т)) + a'(t) V° (t)/x (т, t, x° (t),U° (t) , V° (t))a (t) Далее из соотношений (16), (19) следует, что t г -| a(ti) = Z_ (_ _ _),_ _), V° _))a _) + _(t1, _ x° (t),U0 (t), _ (t))] t=_° t Ъ(_i) = Z_L (tl,t,x° (_),U (_), V° (_))Ъ(_) + + (31) (32) +2 А U(tу x fx (t1, ^ x° (_), U0 (_) , V° (_)) a (_) + a' (_) Xx (_Xt, x° (_) ,U0 (_), V° (_)) Z (_) (33) 17 Полученные разложения (36), (37) позволяют сформулировать необходимые условия оптимальности типа принципа максимума Понтрягина, а также исследовать случай их вырождения. 3. Необходимые условия оптимальности для существования седловой точки По предположению (u0 (t), v0 (t)) является седловой точкой в рассматриваемой задаче. Поэтому из разложений (36), (37) следует, что t1 -sZAu(t) H (t, X0 (t), u0 (t), v0 (t), V0 (t)) + о (s) > 0, (38) t=t( t (39) Управление динамическими системами / Control of dynamical systems Z (*1) = Z[fX (tL t, X (t), u° (t), V0 (t)) Z (t) + t=t0 +Av(t )f (t1.t. X° (t).U 0 (t). V° (t))]. t У (tl ) = Z[f (tl.t. X° (t). U° (t). V° (t)) У (t) + t=t0 +2Av(t )fx (t1.t. X° (t) .U 0 (t) . V° (t)) Z (t)] • (35) Учитывая выражение аналога функции Гамильтона-Понтрягина, сопряженную систему (24) и тождества (25)-(35), после некоторых преобразований специальные приращения (22), (23) функционала (4) по управляющим функциям (u0 (t),u (t; s)) и ( V° (t).V (t; a)) соответственно представляются в виде AuJs (u (t). V° (t))=J (u (t;s). V° (t)) - J (u (t). V° (t))= t1 2 = -SZAu(t)H (t. X° (t). U° (t). V° (t). V0 (t ))+ - \\_a'(h )Фхх ( X° (t)) a (tl ) t=t0 2 tl -Z a'(t) Hxx (t. X° (t). u° (t). V° (t). V0 (t)) a (t1) t=to t1 ] -2ZAu(t)HX (t. X (t) .u0 (t) . V° (t) . V0 (t)) a (t) + О (s2 ). t=t„ (34) (36) A, J_ (u0 (t), v0 (t)) = J (u0 (t), v (t; a)) - J (u0 (t), v0 (t)) ^ZAv(t)H (t. X (t).u0 (t). V° (t). V0 (t))+^[Z (tl )ф** (X° (t))Z (tl ) 2 L Z z'(t)HX (t.X (t).u° (t). v° (t). V0 (t))z (t) - -zz t=t 2Z Aa(t)HX (t.X (t).u° (t). v° (t). V0 (t)) z (t) + О (^ ). (37) aZ Av(t )H (t. X° (t). u° (t). v° (t). V0 (t))+о (а)^ 0 Из неравенств (38), (39) в силу произвольности s и а получаем справедливость утверждения. Теорема 1. В случае выпуклости множеств (8), (9) для существования седловой точки (u0 (t), v0 (t)) в рассматриваемой задаче необходимо, чтобы неравенства 18 Мансимов К.Б., Чырахова М.У. О необходимых условиях существования седловой точки (40) (41) Уу )H (t> x° (t),u° (t), v° (t) , v0 (t ))^ o, t=to ZAv(t)H ^ x° (t), u° (t), v° (t), V0 (t)) ^ 0 выполнялись для всех u(t) e U, t e T, v(t) e V, t e T соответственно. Неравенства (40), (41) представляют собой необходимые условия оптимальности первого порядка, причем первое из них - типа принципа максимума Понтрягина, а второе - типа принципа минимума Понтрягина. Известно (см., напр.: [3, 6]), что часто различные необходимые условия оптимальности первого порядка вырождаются. Подобные случаи называются особыми, а соответствующие управления -особыми управлениями. В этом случае для исследования рассматриваемой задачи надо иметь новые содержательные условия оптимальности. Изучим случай вырождения необходимых условий оптимальности (40), (41). Определение. Допустимое управление (u0 (t), v0 (t)) назовем особым первого порядка управлением, если для всех u (t)e U, t e T и v (t) e V, t e T (42) (43) TAu(t)H (^ x° (t) ,u° (t) , v° (t), V0 (t)) = 0, t=t0 ZAv(t)H ^ x° (t) , u° (t), v° (t), V0 (t)) = 0 соответственно. Из введенного определения ясно, что для особого управления необходимые условия оптимальности теряют свое содержательное значение. Из разложений (36), (37) сразу следует Теорема 2. Пусть множества (8), (9) выпуклы. Тогда для того, чтобы особое допустимое управление (u0 (t), v0 (t)) было седловой точкой, необходимо, чтобы неравенства t1 a'(tl )Фхх ( x° (t)) a (tl )-У a'(t) Hxx (t, x° (t), u° (t), v° (t), V0 (t ))я (t )t=?0 t1 - 2У Au(t)HXx (^ x° (t) , u0 (t), v° (t), V0 (t))a (t) ^ 0, (44) t=t0 tl (tl )ф** ( x° (t)) Z (t1 )-У z'(t) Hxx (t, x° (t), u 0 (t), v° (t), V0 (t ))* (t )iAv(t) H'x (t, x° (t) , u° (t), v° (t), V0 (t ))z (t) ^ 0 (45) - 2y A.. t =?0 выполнялись для всех u(t) eU, t e T, v(t) e V, t e T соответственно. Неравенства (44), (45) являются довольно общими, но вместе с тем неявными необходимыми условиями оптимальности для особых седловых точек (u0 (t), v0 (t)) . Однако с их помощью при некоторых предположениях можно получить необходимые условия оптимальности, явно выраженные через параметры рассматриваемой задачи. Пусть R (т, t)-(n х n) - матричная функция, являющаяся решением разностного матричного уравнения типа Вольтерра 19 Управление динамическими системами / Control of dynamical systems R (Х’t) - Z R (Х’ 5 )(f (s,x° (t) ,u (t) ,v (t)) - fx (s,t , x 0 (t),u 0 (t), v° (t))), t0 ^t ^ x (46) S=t Матричная функция R (x, t) называется резольвентой уравнения (18) (см., напр.: [7, 8]). Следуя [7, 8], можно показать, что резольвента R (x, t) является также решением уравнения (47) R(xt) = ZR(x5)(fx (x,Sx° (5),u0 (5),v° (5)) - fx (x,t,x° (t),u0 (t),v0 (t)))• Уравнения (46), (47) называются уравнениями резольвенты. Решения a (t) и z (t) уравнений (16), (18) допускают соответственно представления t X a (t) - Z Au(x)f (^ x x° (x), u 0 (x) , V° (x)) -Z Z R (t, x)Au( s)f (X, S x° (5 ), u 0 (5 ), V° (5 )) x=t0 t x-10 _ S-10 t z (t) - Z Av(x)f (t, X, x° (x), u 0 (x) , v° (x)) -Z Z R (t, X)Av(s)f (X, У x° (S ), u 0 (S ) , v° (S )) (48) (49) X-10 X-10 _ S-10 Далее, принимая во внимание тождество 2 из [5. С. 45], представления (48), (49) записываются в следующей форме: t t Г t a(t)-Z v/(t, x,x°(x),u°(x),v0 (x))-Z ZR(t,sКң/(у xx°(x),u°(x),v°(x)) x-?0 t z (t) - ZAv(x)/ (t, x, x° (x), X 0 (x), V0 (x))-Z Z R (^ S K(x)/ (s, x x° (x), X (x), V0 (x)) x-t (50) (51) Предположим, что f (t, X, x, u, v) - A(t, x) g (x, x, u, v), (52) где A (t, x) - заданная (n x n) дискретная матричная функция, а g (x, x, u, v) - заданная n-мерная вектор-функция, непрерывная по ( x, u, v) при всех т. Пусть по определению t Q (t, x) - a (t, x) -Z R (t, s ) A ( s, x). s-x Тогда представления (50), (51) примут вид: (53) (54) a (t) - Z Q(t, x)Au(x)g (x x° (x), X (x), v° (x)), x-t) t z (t) - Z Q(t, x)Av(x)g (X, x° (x), X (x), v° (x)), x-t С помощью представлений (53), (46)-(54) убеждаемся в справедливости тождеств 20 a'(t1 )ф*х (x° (t))a(t1) - Z Z Au(a)g'(«,x° (a),u° (a), v° (a))Q(t1,a)9xx (x° (t1)) X a=?0 p-f0 X Q(tl,P)Au(Wg (P. x0 (P),u0 (P), v0 (P)), tl ZAu(t)Hx (t, x°(t), u (t), v°(t), v0 (t))a (t)- t-t„ Z Au(t )H'x (t, x° (t), u 0 (t) , v° (t), V0 (t)) Q (^ x) Au(x) g (X, x° (x) , u 0(X), v° (x)) (55) *1 :Z t-t„ (56) Мансимов К.Б., Чырахова М.У. О необходимых условиях существования седловой точки a=t0 р=?о Zа'({)' (' Х° '),М° '), Ѵ° '), ' '))а ') = Z Z Лы(а)'' Х° (а),u0 (а), Ѵ° (а)) Х t=t Л,,т« (М0 (Р), u0(P),v0 (Р)), (57) Z в'(t,а)Hxx (t,x° (t),u0 (),V» ((), V0 (t))Q(t,p) max(ap) Z'( t1 )ф*х ( x° (t)) z(t1) = Z Z Лѵ(а) g'(^ x° (а) ,u° (а) , V° (а)) Q (tl, а)фхх (x° (t)) а=0 p=t0 x Q(t^A^g(p,x0 (p),u° (p), v0 (p)), ti Z^x° (а),u° (а), V° (а)) (58)

Ключевые слова

разностное уравнение Вольтерра, седловая точка, терминальный функционал, аналог дискретного принципа максимума

Авторы

ФИООрганизацияДополнительноE-mail
Мансимов Камиль Байрамали оглыБакинский государственный университет; Институт систем управления НАН Азербайджанадоктор физико-математических наук, профессор, заведующий кафедрой математической кибернетики; руководитель лаборатории «Управление в сложных динамических системах»kamilbmansimov@gmail.com
Чырахова Махнура Узеир кызыИнститут систем управления НАН Азербайджанадиссертант лаборатории «Управление в сложных динамических системах»kmansimov@mail.ru
Всего: 2

Ссылки

Васильев Ф.П. Об условиях существования седловой точки в детерминированных интегро-дифференциальных играх с за паздыванием при наличии параметров // Журнал вычислительной математики и математической физики. 1970. № 1. C. 15-25.
Васильев Ф.П. Об условиях существования седловой точки в детерминированных интегро-дифференциальных играх для интегро-дифференциальных систем с запаздыванием нейтрального типа // Автоматика и телемеханика. 1972. № 2. C. 40-51.
Габасов Р., Кириллова Ф.М. и др. Методы оптимизации. Минск : Четыре четверти, 2011.472 с.
Дымков М.П. Оптимальное управление дискретной системой Вольтерра по квадратному функционалу // Доклады НАН Белоруссии. 1997. Т. 41, № 3. С. 10-16.
Дымков М.П. Экстремальные задачи в многопараметрических системах управления. Минск : БГЭУ, 2005, 313 с.
Мансимов К.Б. Особые управления в системах с запаздыванием. Баку : ЭЛМ, 1999. 176 с.
Goo Yoon Hoe, Koo Nam Jip. Asymptotic behavior of nonlinear Volterra difference systems // Bull. Korean Math. Soc. 2007. № 1. P.177-184.
Колмановский В.Б. Об асимптотических свойствах решений некоторых нелинейных систем Вольтерра // Автоматика и телемеханика. 2000. № 4. С. 42-50.
 О необходимых условиях существования седловой точки в задаче оптимального управления для систем разностных уравнений типа Вольтерра | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 59. DOI: 10.17223/19988605/59/2

О необходимых условиях существования седловой точки в задаче оптимального управления для систем разностных уравнений типа Вольтерра | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 59. DOI: 10.17223/19988605/59/2