Об оптимальности квазиособых управлений в одной стохастической задаче управления | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 3(36).

Об оптимальности квазиособых управлений в одной стохастической задаче управления

Рассматривается задача оптимального управления нелинейными стохастическими процессами, математическая модель которых описывается стохастическим дифференциальным уравнением Ито. При предположении выпуклости области управления получены необходимые условия оптимальности первого и второго порядков.

On optimal quasi-singular controls in stochastic control problem.pdf Принцип максимума Понтрягина для стохастических задач оптимального управления получен в работах [1-3 и др.]. В работе [4] получено необходимое условие оптимальности в форме принципа максимума Понтрягина в задаче управления стохастическими системами с запаздывающим аргументом и рассмотрен случай вырождения условия максимума (особый случай). Предлагаемая работа посвящена выводу необходимых условий оптимальности квазиособых управлений в задаче оптимального управления, описываемых стохастическими системами. 1. Постановка задачи Пусть (Q, F,P) - полное вероятностное пространство; w(t) - " -мерный стандартный винеровский процесс, определенный на полном вероятном пространстве (Q,F,P); L2F (t0,t1; R") - пространство t1 2 измеримых по (t,ю) случайных процессов х(t,ю): [t0,t1 ]:Q^R" , для которых EJ||x(()2dt < +. t0 Здесь и в дальнейшем знак E - математическое ожидание. Пусть динамика стохастического управляемого процесса на фиксированном отрезке времени T = [\0, t1 ] описывается системой дифференциальных уравнений d*(t) = f (t,х(t),u(t))dt + ct(t,х(t))dw(t), t e T = [t0, t1 ] , (1) с начальным условием х^0 ) = х0, (2) где f (t, х, u)- заданная n -мерная вектор-функция, непрерывная по совокупности переменных вместе с частными производными по (х,u) до второго порядка включительно; о(t, х): T х R" ^ R"x" - (" х ") матричная функция, непрерывная по совокупности переменных вместе с частными производными по х до второго порядка включительно, причем (() e Ud -{u(-)e LF (^ t^ Rr) u(t)e U с Rr}, (3) u(t)e Ud ^ u(')e LF[t0,h;R где U - заданное непустое, ограниченное и выпуклое множество. U d назовем множеством допустимых управлений. В дальнейшем предполагается, что каждому допустимому управлению u(t)e L2F (t0, tx; Rr) соответствует единственное решение x(() системы (1)-(2) с п.н. непрерывными траекториями, определенными на T . Целью управления является минимизация терминального критерия качества I (u ) = E {h{x{ti))}, (4) где h{x) - заданная дважды непрерывно дифференцируемая скалярная функция. Основной задачей является вывод необходимых условий оптимальности первого и второго порядков для выпуклой области управлений. 2. Необходимое условие оптимальности первого порядка Предположим, что (u(f), x{t)) - фиксированный допустимый процесс. Через {({() = u{t) + Au((), x(t) = x{t) + Ax(()) обозначим произвольный допустимый процесс. Запишем формулу для приращения функционала: AI{u) = I(u) -I(u) = E {htx^)) - h(x(t1))}. (5) Приращение Ax(t) траектории x(t) удовлетворяет системе dAxtt) = d [x tt) - xtt)] = t f (t, x tt),u tt)) - f (t, xtt),u (t)))dt + (6) + (a(t, x tt)) - о tt, x tt) ) ) dw tt), t e T, MO = 0. (7) Пусть y(t) e LLf 110, t1; R") - случайный процесс, стохастический дифференциал которого имеет вид d y(t) = at t)dt + P (t)dw tt). Здесь по определению a tt) - n -мерная непрерывная вектор-функция, в tt) e L2F110, t1; Rnxn). Тогда на основании формулы Ито (см. например, [5]) получается d (y'( t) Ax tt) ) = d y'(t) Ax 11) + y'(t) d Ax tt) + в tt) [a(t, x 11) ) - a( t, x 11) )] dt = d y'(t) Ax 11) + +y'(t){{ f 11, x tt), u (t)) - f tt, x (t), u tt))) dt + tat t, x tt ))-a( t, x tt))) dw tt)} + +Ptt )[a(t, x tt)) - о tt, x tt))) dt. Здесь и в дальнейшем ( ') - знак транспонирования. Положим H tt, x,u, y) = yf tt, x,u), Hx [t] = Hx tt, xtt),u tt),¥11)) , Hu [t] = Hu 11,x11),u 11),¥11)), Hx [t]= Hx 11, x tt), u tt), y( t)), Huu [t] = Huu 11, x 11), u 11), v tt)), fx [[] = fx ( x((), u(t)), fu [[]= fu ^ x(t), u(t)) , a x [t ] = Ox (^ x tt)) ,

Ключевые слова

стохастическая система, оптимальное управление, квазиособые управления, линеаризованное условие оптимальности, stochastic system, optimal control, quasi-singular control, linearized optimality conditions

Авторы

ФИООрганизацияДополнительноE-mail
Мансимов Камиль Байрамали оглыБакинский государственный университет; Институт систем управления НАН Азербайджанадоктор физико-математических наук, профессор, заведующий кафедрой «Математическая кибернетика»; руководитель лабораторией «Управление в сложных динамических системах»mansimov@front.ru
Масталиев Рашад Огтай оглыИнститут систем управления НАН Азербайджанадоктор философии по математике, ведущий научный сотрудникmastaliyevrashad@gmail.com
Всего: 2

Ссылки

Аркин В.И., Саксонов М.Т. К теории стохастического принципа максимума в задачах с непрерывным временем // Модели и методы стохастической оптимизации. М. : ЦЭМИ, 1983. C. 3-26.
Kushner H.J. On the stochastic maximum principle: Fixed time of control // J. Math. Anal. Appl. 1965. V. 11. P. 78-92.
Ha/ayed M. Filippov approach in stochastic maximum principle without differentiability assumptions // Electronic j ournal of differen tial equations. 2010. V. 2010, No. 97. P. 1-13.
Агаева Ч.А. Необходимые условия оптимальности особых управлений в стохастических системах с запаздывающим аргу ментом. Баку, 1990. 20 с. Деп.в ВИНИТИ 19.06.1990. № 3495-890.
Гихман И.И., Скороход А.В. Управляемые случайные процессы. Киев : Наукова думка, 1977. 250 с.
Васильев Ф.П. Методы оптимизации. М. : Факториал, 2002. 824 с.
Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М. : Наука, 1973. 256 с.
Bismut J.M. Linear quadratic optimal stochastic control with random coefficients // SIAM. J. Control andoptimization. 1976. V. 14, №>. 3. P. 419-444.
Мансимов К.Б. Особые управления в системах с запаздыванием. Баку : ЭЛМ, 1999. 176 с.
Мансимов К.Б., Марданов М.Дж. Качественная теория оптимального управления системами Гурса - Дарбу. Баку : ЭЛМ, 2010. 336 с.
Абдуллаев А. А., Мансимов К. Б. Необходимые условия оптимальности в процессах, описываемых системой интегральных уравнений типа Вольтерра. Баку : Элм, 2013. 224 с.
 Об оптимальности квазиособых управлений в одной стохастической задаче управления | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 3(36).

Об оптимальности квазиособых управлений в одной стохастической задаче управления | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 3(36).