Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества | Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2017. № 38. DOI: 10.17223/19988605/38/1

Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества

Рассмотрена одна дискретная задача оптимального управления с негладким критерием качества. Установлено необходимое условие оптимальности в терминах производных по направлениям.

Necessary optimality condition in one discrete control problem from nondifferentiable control cost.pdf В работах [1-3] изучена задача оптимального управления, представляющая собой дискретный аналог одной из задач, рассмотренной в работах А.И. Москаленко (см.: [4, 5]) и занимающей промежуточное положение между задачами оптимального управления с сосредоточенными и распределенными параметрами. Установлен аналог дискретного принципа максимума, уравнения Эйлера, выведен аналог линеаризованного условия максимума. В предлагаемой статье рассматривается задача, аналогичная задаче из [1-3], но при предположении недифференцируемости функционала качества. Выведено необходимое условие оптимальности в терминах производных по направлениям. 1. Постановка задачи Пусть управляемый объект описывается системой разностных уравнений z(t +1,x) = fit,x,z(t,x),u(t)), t = to,to + 1,...,tx -1; x = xo,xo +1,...,xx, (1) с начальным условием z(io,x) = y(x), x = xo,xo +1,...,xx, (2) где y(x) - «-мерная вектор-функция, являющаяся решением задачи y(x +1) = g(x,y(x),v(x)), x = xo,xo +1,...,xx -1, (3) y(xo ) = yo. Здесь f ((, x, z, u) (g(x, y, v)) - заданная n -мерная вектор-функция, непрерывная по совокупности переменных вместе с частными производными по z (y); yo - заданный постоянный вектор; to, tj, xo, xx - заданные числа, причем разности tx - to и x1 - xo есть натуральные числа; u(t) (v(x)) -г (q) -мерный вектор управляющих воздействий со значениями из заданного непустого, ограниченного множества U (V), т.е. u(()eU с Rr, t e T = {to,to +1,...,tx -1}, v(x)eV с Rq , x e X = {xo , xo +1,..., x1 -1}. (4) Пару (u((), v(x)) с вышеперечисленными свойствами назовем допустимым управлением. Рассмотрим задачу о минимуме функционала Л1 -1 S v) = Ф1 (у (x1)) + ZФ2 ((z (ti,x)) (5) при ограничениях (1)-(4). Здесь ф1 (y) (ф2 (x,z)) - заданная скалярная функция, удовлетворяющая условию Липшица по y (z) и имеющая производные по y (z) по любому направлению. Допустимое управление (u° (t), v° (x)), доставляющее минимум функционалу (5) при ограничениях (1)-(4), назовем оптимальным управлением, а соответствующий процесс (u°(t), v°( x), z° (t, x), y°( x)) -оптимальным процессом. 2. Вспомогательные факты Пусть (u °(t), v°( x), z°( t, x), y °(x)) - фиксированный допустимый процесс. Через (u (t) = u°(t) + Au (t), v (x) = v° (x) + Av (x), z (t, x) = z°(t, x) + Az (t, x), y (x) = y°(x) + Ay (x)) обозначим произвольный допустимый процесс. Тогда приращение (Az((, x), Ay(x)) состояния (z°(t, x), y°(x)) будет решением задачи Az( +1, x) = f (t, x, z(t, x), u(t)) - f (t, x, z° (t, x), u° (t)), (6) Az(t0, x) = Ay(x), (7) Ay(x +1) = g (x, y(x), v(x))- g (x, y°(x), v°(x)), (8) Ay(xo ) = 0. (9) Используя формулу Тейлора из (6)-(9), получаем, что приращение (Az(, x), Ay(x)) состояния (z° (t, x), y ° (x)) является решением линеаризованной задачи Az (t +1, x) = f2 (t, x) Az (t, x) + A_(()f (t, x) + r|1 (t, x; Au), (10) Az(to, x) = Ay(x), (11) Ay (x +1) = gz (x) Ay (x) + A_(x)g (x) + Г2 (x; Av (x)), (12) Ay(xo ) = 0, (13) где по определению Г1 (t, x; Au) = A-{t fz (t, x) Az(t, x) + 01 (|Az (t, x)||), Г2 (x;Av (x)) = A v (x )gy (x) Ay (x) + °2 (|Ay (x)). Здесь и в дальнейшем для простоты изложений используется обозначения типа I (t, x) = f (t, x, z°(t, x), u°(t)), gy (x ) = g (x, y °(x), v°( x)), Aut)f (t, x) = f (t, x, z° (t, x), u (t)) - f (t, x, z° (t, x), u° (t)), Av(x )g (x) = g (x, y ° (x), v (x)) - g (x, y ° (x), v° (x)). Уравнение (10), (12) можно интерпретировать как линейное неоднородное разностное уравнение относительно Az((, x) (Ay(x)). Поэтому на основе формулы о представлении решений линейных неоднородных разностных уравнений (см. например, [6, 7]) решения задач (10), (11) и (12), (13) соответственно можно представить в виде t-1 Az(t,x) = F(t,t0 -1; x)Az(0,x) + XF(t,t; x)A.(x^f (x,x) + r3 (t,x; Au(t)), (14) T=t„ Ay(x) = £ °(x,s) A^)g(s) + r (x; Av(x)), (15) s= x где по определению t-1 x-1 Г (t,x; Au(t)) = £F(t,t; x)r (x,x; Au(x)), r (x; Av(x)) = £0(x,s)r (s; Av(s)) . ||Az (t, x ))< L4 где L4 = const > o . 3. Необходимое условие оптимальности Предположим, что множества f (t, x, z0 (t, x ),U ) = {a: a = f (t, x, z0(t, x), u), u eU }, (23) (22) x=to T=o Здесь F (t, x; x), o(x, s) - (n x n) матричные функции, являющиеся решениями уравнений F (t, x-1, x) = F (t, x; x) fz (x, x), F(t, t -1, x) = E, 0(x, s - 1)=0(x, s )gy (s), 0(x, x -1) = E, (E - (n x n) единичная матрица). Поскольку Az((o,x) = Ay(x), то, учитывая (15), представление (14) решения Az((,x) задачи (1o), (11) записывается в виде x-1 t-1 Az(t,x) = £ F(t,to -1; x)0(x,s)A_wg(s) + £F(t,x; x)A.(x)f (x,x) + r5 (t,x; Au(t),Av(x)), (16) s=xo x=to где по определению r5 (t, x; Au (t), Av(x)) = r3 (t, x; Au (t)) + F(t, to -1; x)r4 (x; Av(x)) . В дальнейшем нам понадобится оценка нормы приращения траектории. Ясно, что t x Az (t +1, x ) = £ (Az (x +1, x)- Az (x, x)) + Az (to, x), Ay(x +1) = £ (Ay(s +1) - Ay(s)). x=to s=xo Отсюда с учетом задач (Ю)-(13) будем иметь t Az(t +1,x) = £[f (x,x,z (x,x),u (x)) - f (x,x,z0 (x,x),u0 (x))J + Ay(x), (17) x=to Ay (x +1) = £ [ g (s, y (s ), v (s ))-g (s, y0 (s ), v0(s ))] . (18) s= Переходя к норме в обоих частях этих соотношений и используя условия Липшица, после некоторых преобразований получим ||Az(t + ^x|Au(x^^f (Тx) + L £||Az(т,x) + |Ay(x)||, (19) x=to x=to ||Ay(x +1)!< ±\Ans)g(s)| + L2 £|Ay(x)|. (2o) Здесь Lt = const > o, i = 1,2, - некоторые постоянные. Применяя дискретный аналог леммы Гронуолла-Беллмана (см. например, [7, 8]) к неравенству (2o), получим ||Ay (x)|< L3 £|A,)g (s)| (L3 = const > o) . (21) s=xo Далее, учитывая оценку (21) в (2o), а затем применяя лемму Гронуолла-Беллмана приходим к оценке £|| Au wf (Т, x ) + :g| Av (s )g (s ) g (x, y°(x),v) = {p: p = g (x, y°(x),v), v eV] (24) выпуклы. Перейдем к выводу необходимого условия оптимальности в рассматриваемой задаче. Считая (u° (t), v° (x)) оптимальным управлением, его специальное приращение определим по формуле \&uB(t) =u(t; в)-u°(t), teT, (25) [Ave(x) = 0, xeX, где ee [0,1] - произвольное число, а u (t; e)eU , t e T, - произвольная допустимая управляющая функция, такая, что Au(t; B)f (t, x )=eK(t )f (t, x ) . Здесь u(t) - произвольная допустимая управляющая функция, соответствующая u (t; в) . Это возможно в силу выпуклости множества (23). Через (Aze (t, x), Aye (x)) обозначим специальное приращение траектории (z°(t, x), y°(x)), отвечающее приращению (25) управления (u°(t),v°(x)) . Из оценок (21), (22) сразу следует, что ||AZe(t, x)|| ~ в , IIAye (x)|| = 0. Поэтому из (14) следует, что 4 -1 AZe (tl, x) = в X F (t1, t) Au(tf (t, x) + °(e) . t=to Полагая 4 -1 I (u ) = eX F (^t )Au(t )f (t, x ), t=to эта формула записывается в виде Aze (t1,x) = ef (u) + °(e) . (26) Вычислим специальное приращение критерия качества (5), соответствующее приращению (25) управления (u°(t), v°(x)) . Имеем AS в (u °, v ° ) = S (u ° + Aue, v ° ) - S (u °, v ° ) = X [ф2 (x, z (t1, x) + AZe (t1, x)) - ф2 (x, z (t1, x))] = x -1 Х[ф2 (x, z (t1, x ) + e t (u ) + °(в))-ф2 (x, z (t1, x ))]^ X [ф2 (x,z(t1,x) + et(u) + °(e) ) - ф2 (x,z(t1,x) + et(u) ) -(ф2 (x, z (t1, ^ + et (u) ) -ф2 (x, z (t1, x) ) ) ]. x -1 + Поскольку ф2 (x, z) удовлетворяет условию Липшица по z и имеет производные по направлениям, то из последнего соотношения получаем, что вдоль оптимального процесса (u° (t), v° (x) ) X ^2( x,z (t1,x)) +°(e) > o. ^ at(u) v ' e Отсюда при достаточно малых ee[0,1] следует, что x1-1 аф2 ( x, z (t1, x) ) 5-4^ >0. (27) Теперь специальное приращение оптимального управления (u° (t), v° (x)) определим по формуле ДнД t) = 0, t е T, Av^(x) = v(x, ц)- v°(x), x e X. (28) Здесь це[0,1] - произвольное число, а v (ц, x) - произвольная допустимая управляющая функция, та- (29) (30) (31) кая, что Av{x^g(x ьц^* )g(x), где v(x) - соответствующая v(x; ц) произвольная управляющая функция. Через (Az^t, x), Дуц( x)) обозначим специальное приращение оптимальной траектории, соответствующее приращению (28) управления (u° (t), v° (x)) . Из оценок (21), (22) следует, что 1Ыt, x)| ~ ц, K( x )\\ ~ ц. С учетом (29) из представлений (15), (16) следует, что x-1 Ч (^x) = ц X F (tl, to-1;x)ф (x, s) Дч, )g (s)+° (ц), дф (y°(x,)) + X ^Ф2 (x, z°(t1, x)) x -1 A>v(x1 ^X^^ x )Av(,)g (x ) + °(ц). Полагая x -1 ^ ( x) = X F (t1, t0 - 1 x) ф (x s) Av(s)g (s) , 42 (v) = X ф (xl, x) Av(x)g (x), представление (30), (31) запишем соответственно в виде A>V(x1 ) = s41 (v) + °(ц) , (32) Az^ (t1,x) = sq2 (v,x) + °(ц) . (33) С помощью (32), (33) вычислим специальное приращение функционала качества, соответствующее приращению (28) оптимального управления (u° (t), v° (x)). Имеем Л^ц(u°,v°) = S(u°,v°+AvJ-S(u°,v°) = [ф (y°(x1) + y^))-ф (y°(x ))] + x -1 + X [ф2 ( z (t1, x) + AZV (t1, x)) - Ф2 (x, z (t1, x))] = = [ф (y° (x0 + ц41 (v) + °(ц)) - ф (y° (x1) + ц41 (v))] + [ф (y° (x ) + ц41 (v)) - ф (y° (x))] x -1 |- -X (ф2 (x,z°(t1,x) + ц42 (v,x) + °(ц))-ф2 (x,Z°(t1,x) + ц42 (v,x))) + +(ф2 (x, z ° (t1, x) + ц42 (v, x)) - Ф2 (x, z ° (t1, x))) Следовательно, имеет место разложение ^(u °, v °) = ц (34) °(ц). ^ (v) x=x0 ^q2 (x,v) Из разложения (34) в силу произвольности ц е [0,1] следует, что дф(y°(x)) 5ф2(x,z°(t1,x))

Ключевые слова

directional derivative, necessary optimality conditions, increment the cost functional, discrete optimal control problem, производная по направлениям, необходимое условие оптимальности, приращение критерия качества, дискретная задача оптимального управления

Авторы

ФИООрганизацияДополнительноE-mail
Гараева Эсмира Акиф кызыИнститут систем управления НАН Азербайджананаучный сотрудникesmira.qarayeva@mail.ru
Мансимов Камил Байрамали оглыБакинский государственный университетдоктор физико-математических наук, профессор, заведующий кафедрой математической кибернетикиmansi-movbkamil@gmail.com
Всего: 2

Ссылки

Демьянов В.Ф., Виноградова Т.К. и др. Задачи теории оптимизации и управления. Л. : Изд-во ЛГУ, 1982. 324 с.
Демьянов В.Ф., Рубинов А.М. Основы негладкого анализа и квази-дифференциальное исчисление. М. : Наука, 1990. 482 с.
Демьянов В.Ф. Минимакс: Дифференцируемость по направлениям. Л. : Изд-во ЛГУ, 1974. 112 с.
Мансимов К.Б. Дискретные системы. Баку : Изд-во Бакин. гос. ун-та, 2013. 131 с.
Васильев Ф.П. Методы решения экстремальных задач. М. : Наука, 1981. 400 с.
Габасов Р., Кириллова Ф.М. Оптимизация линейных систем. Минск : Изд-во БГУ, 1973.
Москаленко А.И. Некоторые вопросы теории оптимального управления : автореф. дис.. канд. физ.-мат. наук. Томск, 1971. 20 с.
Москаленко А.И. Об одном классе задач оптимального регулирования // Журнал вычислительной математики и мат.-физики. 1969. № 1. С. 69-95.
Гараева Э.А., Мансимов К.Б. Об одной дискретной задаче оптимального управления // Вестник БГУ. Сер. физ.-мат. наук. 2014. № 1. С. 15-21.
Гараева Э.А., Мансимов К.Б. Об одной дискретной задаче оптимального управления // Вестник БГУ. Сер. физ.-мат. наук. 2014. № 1. С. 35-41.
Гараева Э.А., Мансимов К.Б. Необходимые условия оптимальности в одной дискретной задаче оптимального управления // Материалы Международной конференции, посвященной 55-летию ИМ и М НАН Азербайджана. Баку, 2014. С. 236-238.
 Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества | Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2017. № 38. DOI: 10.17223/19988605/38/1

Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества | Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2017. № 38. DOI: 10.17223/19988605/38/1