Об одной дискретной задаче управления, описываемой разностным уравнением типа Вольтерра и негладким критерием качества | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 61. DOI: 10.17223/19988605/61/1

Об одной дискретной задаче управления, описываемой разностным уравнением типа Вольтерра и негладким критерием качества

Рассматривается задача оптимального управления процессами, описываемая нелинейным разностным уравнением типа Вольтерра и негладким критерием качества. Доказаны необходимые условия оптимальности в терминах производных по направлениям. Отдельно изучена задача на минимакс. Получены дискретные аналоги принципа максимина и линеаризованного принципа максимина. Автор заявляет об отсутствии конфликта интересов.

On the one discrete control problem described by Volterra type difference equation and non-smooth quality criterion.pdf В работе [1] изучена одна задача оптимального управления, описываемая системой разностных уравнений типа Вольтерра с гладким терминальным критерием качества, доказан ряд необходимых условий оптимальности типа принципа максимума Л.С. Понтрягина и также исследован случай их вырождения [2-5]. В работе [6] установлен ряд необходимых условий для существования седловой точки. В предлагаемой работе изучается случай негладкого функционала качества. Доказаны необходимые условия оптимальности в терминах производных по направлениям. Отдельно изучена задача на минимакс. 1. Постановка задачи Пусть T = {t0,t0 +1,...,} - заданный дискретный отрезок времени, U сRr - заданное непустое и ограниченное множество, u (t) - r-мерная дискретная управляющая функция, удовлетворяющая ограничению u (t)e U, t е T, (1) которую назовем допустимым управлением, а Ф(х) - заданная скалярная функция, удовлетворяющая условию Липшица и имеющая производные по любому направлению. Предположим, что управляемый процесс описывается системой нелинейных разностных уравнений типа Вольтерра t x(t) = Х f (t,x,x(x),u(x)), t е T. (2) T=t) Здесь f (t, x, x, u) - заданная n-мерная вектор-функция, непрерывная по (x, u) с частными производными по x при всех (t, т). Задача оптимального управления заключается в нахождении минимального значения терминального функционала S (u ) = Ф( х (ti)) (3) при ограничениях (1), (2). Допустимое управление u (t), доставляющее минимальное значение функционалу (3) при ограничениях (1), (2), называется оптимальным управлением. 2. Необходимые условия оптимальности в терминах производных по направлениям Пусть (u (t), х (t)) - фиксированный допустимый процесс, множество f (t, x, x(x), U) = {a: a = f (t, x, x(x), v), v e U} (4) выпукло при всех (t, x) , а se [0,1) - произвольное число. Через х (t; s) обозначим произвольное допустимое управление, такое что t t t x(t; s) = X f (t, x, x(x; s), u(x; s)) = £[(1 -s)f (t, x, x(x; s), u(x))] + Jsf (t, x, x(x; s), v(x)), (5) x=t) 1=t0 1=t0 где v(t) - произвольное допустимое управление. Это возможно в силу выпуклости множества (4). 5 Управление динамическими системами / Control of dynamical systems Введем обозначение: У (t) = dx(t; s) de (6) s=0 Из (5), в силу условий гладкости, наложенных на правую часть уравнения (2), следует, что вектор-функция y(t), определяемая формулой (6), является решением уравнения в вариациях t y(t) = X[[ (t,т,x(t),u (т)) y (т) + ([ (t,т,x(x),ѵ(т))- f (t,T,x(t),u (t)))]. (7) T=t0 Из (6) ясно, что x(t; s) = x(t) + sy(t) + o(s; t). (8) Вычислим специальное приращение функционала качества (3), соответствующее допустимым управлениям u(t: s), u(t) . Имеем S (u(t; e)) - S (u(t)) = ф( x (tx; s)) -ф( x (tx)) = [ф( x (tx) + sy(tf) + o(tx; s) ) - - ф(x (ti) + sy(ti))] - [ф(x (ti) + sy(ti)) -ф(x (ti))]. По предположению функция ф( x) удовлетворяет условию Липшица. Поэтому получаем, что |ф( x (ti) + sy(ti) + o(s)) - ф( x (ti) + sy (ti) )| < Oi(s). (10) Далее, используя определение производной по направлениям, получаем, что ф( x (ti ) + sУ(tl))-ф(x (ti )) = s ^ ) )) + O2(s). (11) Если предполагать, что допустимое управление u (t) оптимальное, то из (11), учитывая соотношения (10), (11), получаем 5ф( x (ti)) дУ (ti) ■ + o3 (s) > 0. (12) Из этого неравенства следует Теорема 1. Если множество (4) выпуклое, то для оптимальности допустимого управления u (t) необходимо, чтобы неравенство 5ф( x (ti)) (ti) > 0 (13) выполнялось для всех v(t) е U, t е T. Неравенство (13) является общим необходимым условием оптимальности и носит неявный характер. Перейдем к конкретизации полученного необходимого условия оптимальности. Уравнение в вариациях является линейным неоднородным разностным уравнением. Из результатов работ [7, 8] следует, что решение y(t) уравнения в вариациях допускает представление y(t) = X( f (t, T, x(T), v(T) ) - f (t, T, x(T), u (t) ))- T=t t т (14) S X R(t, t) ( f (t, У x(s), v(s)) - f (t, s, x(s),u(s))), T=^0 s=tf) где R(t,t) (n x n) - матричная функция, являющаяся решением матричного разностного уравнения т R(t,т) = XR(t, s)( fx (s, t, x(t),u(t)) - fx (t, t, x(t),u(t))), t0 < t < T. 6 3. Линеаризованное необходимое условие оптимальности Предположим, что вектор-функция f (t, т, x,u) непрерывно-дифференцируема по (x, u), а множество U выпукло. В силу сделанных предположений можно написать «возмущенную» систему вида: t x(t; р) = X f (t, т, x(^ р),u(т: р)) = (19) Чырахова М.У. Об одной дискретной задаче управления По аналогии с [7, 8] можно показать, что матричная функция R (т, t) является также решением уравнения т R(t, т) = X( fx (т, 5, x(s),u(s))R(s, т) - fx (т, t, x(t),u(t))) . (15) s=t С помощью дискретного аналога теоремы Фубини (см., напр.: [8]) представление (14) преобразуется к виду: t y(t) = X [( f (t, т, х(т), ѵ(т)) - f (t, т, х(т), и(т) ))т=0 т -X R(t, s) ( f ( s, т, х(т), ѵ(т)) - f ( s, т, х(т), и(т))) s=t _ (16) Положим L(v) = X ( f (ti, t, x(t), v(t)) - f (ti, t, x(t), u(t))) т=*0 -X R(ti, т) ( f ( т, t, x(t),v(t)) - f (т, t, x(t),u(t))). т=0 (17) С учетом (13), (17) теорема 1 может быть сформулирована в виде: Теорема 2. Если множество (4) выпуклое, то для оптимальности допустимого управления u (t) в рассматриваемой задаче необходимо, чтобы неравенство d°(x(ti)) > 0 Lv) >0 (18) выполнялось для всех v(t )eU, t e T. т=0 t = X (1 - e)f (t, т, x(т; р), рv(т) + (1 - рМт)), т=0 где ре [0,1) - произвольное число, а v(t) - произвольное допустимое управление. Предположим z(t, v) dx(t; р) 5р р=0 (20) Из (19) следует, что z(t, v), определяемое формулой (20), является решением следующего уравнения в вариациях: t z(t, v) = X [fx (t, т, x(т), v(т)) z(^ v) + fu (t, т, x(т), u(т))(v(т) - u(^)]. (21) т=*0 Запишем специальное приращение критерия качества, соответствующее допустимым управлениям u(t^), u(t). Имеем S(u(t;р))-S(u(t)) = [(x[)+ рz(t1,v) + [р))-ф(x[) + рz(t1,v)[] = р _(_ + _. (22) 7 Управление динамическими системами / Control of dynamical systems Из полученного разложения следует Теорема 3. Если множество U выпукло, то для оптимальности допустимого управления u (t) в рассматриваемой задаче необходимо, чтобы неравенство 8ф(х(ti)) >0 8z(tx, v) (23) выполнялось для всех v (t) е U, t е T. Конкретизируем полученное необходимое условие оптимальности. Решение z(t, v) линеаризованного уравнения (21) представимо в виде z(t,v) = X fu (t,x,x(x),u(T))(v(x) -u(x))-^Z[^(t,s)fu (s,x,x(x),u(x))](v(x) -u(x)), (24) x=ti X=to s=t где R (x, t) решение уравнения (15). Введя обозначение t Q(t, x) = fu (t, x, x(x),u(x)) + X[R(t, s)fu (s, x, x(x),u(x))], s=x из (24) получаем, что t z(t, v) = X Q (t, x)( v(x) - u(x)). x=t0 Следовательно, ?1 z(ti, v) = XQ (ti, t )(v(t) - u(t)). x=to Положим Jl L(v) = X Q (ti,t )(v(t) - u(t)). x=to Тогда теорема 3 может быть сформулирована в виде: Теорема 4. Если множество U выпукло, то для оптимальности допустимого управления u(t) в рассматриваемой задаче необходимо, чтобы неравенство 8Ф(x(ti)) >0 8L2(v) (25) выполнялось для всех v (t) е U, t е T. 4. Необходимое условие оптимальности в задаче на минимакс Рассмотрим задачу о минимуме функционала типа максимум S(u) = maxаеЛ ф(x(ti), а), (26) при ограничениях (1)-(5), где ф(x, а) - заданная, непрерывно-дифференцируемая по х скалярная функция, A е Rm - заданное непустое и ограниченное множество. Задачи оптимального управления с функционалом типа (26) обычно называются задачами на минимакс. В работах [2, 9, 10] при различных предположениях изучен ряд свойств функций типа максимум или же минимум. В частности, установлена формула для производной по направлению функций типа максимум. Используя дифференциальные свойства функций типа максимум, получим необходимое условие оптимальности в задаче на минимакс. Пусть u (t) в задаче (1)-(5) является оптимальным управлением. Тогда из теоремы 2 получаем, что вдоль процесса (u (t), x (t)) 8 Чырахова М.У. Об одной дискретной задаче управления ---(max ф(x(t), а}) > 0. -Ц (V)Ѵ ^ ѴіЛ 7 Пусть A(x) - множество максимумов функции фх,а), т.е. A(x(tx)) = \\а е A : ф(x(tx),а) = maxф(x(tx),а)>maxф(x(tx),а). V аеА ) аеА Учитывая известную формулу о производной по направлению функции типа максимум (см., напр.: [9, 10]), из неравенства (18) получаем, что д ( max ф( x(tj), а)) = -Ф'(x(tj), а) ._тѵ-ѵ,^--J= max ' 4 ^-L (v) > 0. д (v)V ае A 4 1 7 ае A( x(t)) -x Принимая во внимание выражение Ц (v) из (17), неравенство (27) записывается в виде: (27) max аеA( x(tj)) -ф'(x(t), а) дx Z( f (ti, t, x(t), v(t))- f (tj, t, x(t), u(t) ))- T=t - Z«(t,T) ( f ( T, t,x(t),v(t)) - f (t, t, x(t),u(t))) z=to (28) > 0. Введем обозначения V, (t)=MxiM ^ , t), -x n H (t, x(t),u(t), v, (t)) = -ф' ('),а)/ ', t, 'u(t)) + Z' (t' (t, t, x(t),u(t)). T=to Тогда неравенство (28) записывается в виде: (29) ^ (H (t, x(t), v(t), va (t) ) - H (t, x(t), u(t), va (t) )) < 0. Сформулируем полученный результат: Теорема 5. Для оптимальности допустимого управления u(t) в рассматриваемой задаче (1), (2), (26) необходимо, чтобы неравенство (29) выполнялось для всех v (t) е U, t е T. Перейдем теперь к доказательству линеаризованного условия максимина при выполнении предположений теоремы 3. При выполнении условий теоремы 3 получаем, что вдоль оптимального управления u(t) выполняется неравенство -L2(v) > 0. max аеЛ( x(tj)) -ф '(x(ti), а) -x Учитывая выражение L (v) , последнее неравенство записывается в виде: max -ф'(а)±Q(t,,t)(v(t)-u(t))>0 -A(x(ti)) -x Z^V1 Л ’ для всех v (t)e U, t е T. Следовательно, учитывая вид функции Гамильтона Понтрягина, приходим к следующему утверждению: Теорема 6. Если множество U выпуклое, а f (t, t, x,u) имеет также по и непрерывную производную, то для оптимальности допустимого управления u(t) в задаче (1)-(2), (26) необходимо, чтобы неравенство min аеA( x(tj)) Hu (t,x(t),u(t), va(t))(v(t) -u(t)) < 0 (30) выполнялось для всех v(t)е U, t еT. 9 Управление динамическими системами / Control of dynamical systems Неравенство (30) является аналогом линеаризованного принципа максимина, доказанный в работе [11], для задачи оптимального управления обыкновенными дифференциальными уравнениями. Заключение В работе рассматривается дискретная задача оптимального управления, описываемая системой разностных уравнений Вольтерра и недифференцируемым функционалом качества. Получены общие необходимые условия оптимальности, которые охватывают задачу в минимакс, также используя дифференциальное свойство функций максимума, доказаны необходимые условия оптимальности в форме принципа максимина и линеаризованного принципа максимина.

Ключевые слова

разностное уравнение, негладкий функционал, производная по направлению, необходимое условие оптимальности, допустимое управление, задача на минимакс, принцип максимина

Авторы

ФИООрганизацияДополнительноE-mail
Чырахова Махнура Узеир кызыИнститут систем управления НАН Азербайджанадокторантmahnuraciraqova@gmail.com
Всего: 1

Ссылки

 Об одной дискретной задаче управления, описываемой разностным уравнением типа Вольтерра и негладким критерием качества | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 61. DOI: 10.17223/19988605/61/1

Об одной дискретной задаче управления, описываемой разностным уравнением типа Вольтерра и негладким критерием качества | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 61. DOI: 10.17223/19988605/61/1