Прогнозирующее управление с замкнутой обратной связью дискретными системами со случайными коррелированными параметрами | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 39. DOI: 10.17223/19988605/39/2

Прогнозирующее управление с замкнутой обратной связью дискретными системами со случайными коррелированными параметрами

Рассматривается задача управления дискретными динамическими системами со случайными коррелированными параметрами, относительно которых известны только первые и вторые моменты распределения. Определена стратегия управления с прогнозирующей моделью с замкнутой обратной связью на конечном и бесконечном горизонтах управления. Получены достаточные условия устойчивости стратегии управления на бесконечном горизонте.

The closed-loop optimal feedback model predictive control policy for systems with stochastic correlated parameters.pdf Системам со случайными параметрами уделяется значительное внимание в современной научной литературе. Это связано с тем, что такие системы нашли широкое практическое применение при управлении сложными реальными объектами. Проблема синтеза регуляторов для подобных систем при различных предположениях о характере изменения случайных параметров рассматривалась в работах [1-9]. В работе [1] получены уравнения синтеза регуляторов с замкнутой обратной связью для систем со случайными независимыми параметрами и мультипликативными шумами. В [4, 5] рассматривается задача управления линейными системами со скачкообразными параметрами, меняющимися в соответствии с эволюцией дискретной марковской цепи. В работах [6-9] используется методология управления с прогнозирующей моделью (управление со скользящим горизонтом) [10]. Задача синтеза стратегий управления с прогнозированием с замкнутой обратной связью для систем со случайными независимыми параметрами решена в работе [6]. В работе [7] получены уравнения синтеза оптимальных стратегий управления с прогнозирующей моделью с разомкнутой обратной связью для систем со случайными независимыми параметрами и мультипликативными шумами. Дискретные системы со случайными зависимыми параметрами рассматриваются в [8, 9]. В этих работах синтезированы алгоритмы прогнозирующего управления с разомкнутой обратной связью с учетом ограничений на управления. При этом в [8] предполагается, что динамика вектора параметров описывается разностным стохастическим уравнением авторегрессии, в работе [9] предполагается, что известны только первые и вторые моменты распределения параметров. В настоящей работе получены уравнения синтеза оптимальных стратегий управления с замкнутой обратной связью для систем со случайными коррелированными параметрами, относительно которых предполагаются известными только первые и вторые моменты распределения. Даны достаточные условия устойчивости стратегии управления на бесконечном горизонте. 1. Постановка задачи Рассмотрим дискретную линейную систему, заданную на вероятностном пространстве (Q, F ,P): x(k +1) = Ax(k) + Б[ц(к +1), k + 1]u(k), (1) где x(k) - их-мерный вектор состояния, u(k) - ии-мерный вектор управления, n(k) - последовательность ^-мерных случайных векторов, наблюдаемых до момента времени k включительно. A, B[n(k),k] - матрицы соответствующих размерностей, причем B[n(k),k] зависит от n(k) линейно. Пусть на (Q, F ,P) выделен поток о-алгебр F =( F )к>и где каждая из о-алгебр Fk порождается последовательностями {r|(s): s=0,1,2,...,k} и интерпретируется как доступная информация до момента времени k включительно. Будем полагать, что для процесса n(k) известны условные моменты относительно Fk : E {n(k + i)/ Fk } = n(k + i), (2) E {n(k + i)nT (k + j)/ Fk } = ®v (k), (k = 0,1,2,...), (i, j = 1,2,...). (3) Для управления системой (1) синтезируем стратегии с прогнозирующей моделью по следующему правилу. На каждом шаге k минимизируем квадратичный критерий со скользящим горизонтом управления J(k + m / k) = j E {xT(k + i)R1(k, i)x(k + i) / x(k), Fk } m-i '= (4) + E{uT(k + i / k)R(k,i)u(k + i / k) / x(k),Fk } i=0 на траекториях системы (1) по последовательности прогнозирующих управлений u(k/k),...,u(k+m-1/k), зависящих от состояния системы в момент времени k; R1(k,i) > 0, R(k,i) > 0 - весовые матрицы соответствующих размерностей; m - горизонт прогноза; k - текущий момент времени. В качестве управления в момент времени k берем u(k) = u(k/k). Тем самым получаем управление u(k) как функцию состояний x(k), т.е. управление с обратной связью. Чтобы получить управление u(k+1) на следующем шаге, процедура повторяется для следующего момента k+1 и т.д. 2. Синтез стратегий управления с прогнозированием Теорема 1. Оптимальная стратегия прогнозирующего управления с замкнутой обратной связью системой (1), минимизирующая критерий (4), при фиксированном горизонте прогнозирования m, на каждом шаге k определяется уравнением uopt(k) = -K(m)x(k) = -[L22(m -1) + R(k,0)]- L12(m -1)x(k), (5) где Ц2(\) = ATS(l)E{B[n(k + m -1),k + m -1]/ Fk+m-i+1}, (6) L22(l) = E {BT[n(k + m - /), k + m -1 ]S (l) B[n(k + m -1), k + m -1 ]/ Fk+„-.,+1}, (7) S(l) - матрица, определяемая из решения рекуррентного уравнения вида S(l) = R (k,m -1) + S(l -1)A -Ll2(l -1)[L22(l -1) + R(k,m -1)]-1 (Ll2(l -1))T (8) с начальным условием S(0) = R1(k,m). При этом оптимальное значение критерия (4) определяется выражением Jopt (k + m / k) = xT (k) [ S (m) - R1 (k, m)] x(k). (9) Доказательство. Используем метод динамического программирования Беллмана. В момент времени k+m-1 критерий (4) имеет вид J(k + m / k + m -1) = E{xT(k + m)R1(k, m)x(k + m) + ) +uT (k + m -1/ k)R(k, m - 1)u(k + m -1/ k) / x(k + m -1),Fk+m-1}. Выражая x(k+m) через x(k+m-1) с использованием уравнения системы (1) и подставляя в (10), будем иметь J(k + m / k + m -1) = xT(k + m -1) ATR1 (k, m) Ax(k + m -1) + +2xT (k + m -1)ATR1 (k, m)E{B[n(k + m),k + m] / Fk+m-1 }u(k + m -1/ k) + +uT(k + m -1/ k){E{BT[n(k + m),k + m]Rl(k,m)B[n(k + m),k + m] / Fk+m-1} + R(k,m - 1)}u(k + m -1/ k) = = xT(k + m -1)ATS(0)Ax(k + m -1) + 2xT(k + m - 1)L12(0)u(k + m -1/ k) + +uT (k + m -1/ k){L22(0) + R(k, m - 1)}u(k + m -1/ k), (11) где S(0) = R1(k,m); L12(0), L22(0) определяются уравнениями (6)-(7). Оптимизируя (11) по u(k+m-1/k), получаем оптимальное управление на k+m-1 шаге: иopt(k + m -1/ k) = -[L22 (0) + R(k, m -1)]-1 L11(0)x(k + m -1). (12) Подставляя (12) в (11), получим оптимальное значение критерия (4) на k+m-1 шаге: Jopt (k + m / k + m -1) = xT(k + m -1)[ATR (k, m) A - ATR (k, m)M{B[n(k + m), k + m]/ Fk+m-1} x x{E{BT [n(k + m), k + m]R (k, m)B[n(k + m), k + m]/ Fk+m-1} + R(k, m -1)}-1 x xE{BT[n(k + m), k + m]/ Fk+m-1}R1(k, m)A]x(k + m -1) = (13) = xT(k + m -1)[ATS(0)A - L12(0)[L22 (0) + R(k,m -1)]-1 (L12 (0))T ]x(k + m -1) = = xT(k + m - 1)[S(1) - R1 (k, m - 1)]x(k + m -1), где S(1) определяется уравнением (8). Повторяя процедуру на следующем шаге, имеем J(k + m / k + m - 2) = E{xT (k + m - 1)R1 (k, m -1)x(k + m -1) + +uT(k + m - 2/ k)R(k, m - 2)u(k + m - 2/ k) + Jopt(k + m / k + m -1)/ x(k + m - 2),Fk+m-2} = = E{xT (k + m -1)S(1)x(k + m -1) + uT(k + m - 2/ k)R(k,m - 2)u(k + m - 2/ k)/ x(k + m - 2),Fk+m-2} = = xT(k + m - 2) ATS(1) Ax(k + m - 2) + 2xT(k + m - 2)L^ (1)u (k + m - 2 / k) + +uT(k + m - 2 / k){L22 (1) + R(k, m - 2)}u(k + m - 2 / k), L12(1), L22(1) определяются уравнениями (6)-(7). Оптимизируя (14) по u(k+m-2/k), получаем оптимальное управление на k+m-2 шаге: uopt(k + m -1/ k) = -[L22 (1) + R(k, m - 2)]-1 ^2(1)x(k + m - 2). (15) Подставляя (15) в (14), имеем оптимальное значение критерия (4) на k+m-2 шаге: Jopt (k + m / k + m -1) = xT(k + m - 2)[ATS(1) A - ATS(1)E{B[^(k + m -1), k + m -1]/ Fk+m_2 } x x{E{BT [^(k + m -1),k + m - 1]S(1)B[^(k + m -1),k + m -1] / Fk+m-2} + R(k, m - 2)}-1 x xE{BT[r[(k + m -1), k + m -1]/ Fk+m_2}ST(1) A]x(k + m - 2) = (16) = xT(k + m - 2)[ATS(1)A - L12 (1)[L22(1) + R(k,m - 2)]-1 (L12(1))T]x(k + m - 2) = = xT(k + m - 2)[S(2) - R1 (k, m - 2)]x(k + m - 2), где S(2) определяется уравнением (8). На шаге k получаем J(k + m / k) = E{xT (k + 1)S(m -1)x(k +1) + uT(k / k)R(k, 0)u(k / k) / x(k),Fk} = (17) = xT (k)ATS(m -1)Ax(k) + uT(k / k)L11(m - 1)u(k / k) + 2xT (k)L12(m - 1)u(k / k). Нетрудно показать, что при этом оптимальное управление u(k/k) имеет вид (5), оптимальное значение критерия (4) определяется уравнением (9). 3. Управление на бесконечном горизонте Рассмотрим квадратичный критерий на бесконечном горизонте управления (14) m J(k + m / k) = £ E{xT (k + i)R1 x(k + i) / x(k), Fk} + 1 i=1 (18) m-1 . +£ E{uT (k + i / k)Ru (k + i / k)/ x(k), Fk }, m ^ да. i=0 Предположим, что матрица B[n(k),k], первые и вторые условные моменты процесса n(k) не зависят от времени, т.е. B [ n ( k ), k ] = B[n(k)], E {n(k + i)/ Fk } = n(i), E {n(k + i)nT(k + j)/Fk } для всех k, i, j. Данные предположения означают стационарность процесса n(k). Теорема 2. Пусть существует положительно определенное решение Sда уравнения Sда = R + ATSда A - Ц2 [Ц2 + R ]-1 (Ц2 )T, (19) где Ц2 = AT SдаE {B[n(k + m -1), k + m -1]/ Fk+m-i+1}, (20) Г22 = E {BT [n(k + m -1), k + m - l]SдаB[n(k + m -1), k + m -1]/ Fk++1}. Тогда оптимальный закон управления с замкнутой обратной связью, минимизирующий критерий (18) на бесконечном горизонте управления, является стабилизирующим и имеет вид u opt(k) = -Kда x(k) = -[ Г22 +R ]-1 L2 x(k). (21) Доказательство. Предположим, что существует положительно определенное решение Sдауравнения (19). Положим Ri = Sда. Критерий (18) в момент времени k = 0 имеет вид m-1 . m-1 . J(m / 0) = £E{xT(i)R1 x(i) + xT(m)Sдаx(m) / x(0),F0} + £E{uT(i /0)Ru(i /0) / x(0),F0}. ^^^^ i=1 i=0 Так как Sда определяется из решения уравнения (19), то согласно теореме 1 оптимальное значение критерия (22) при любом m (в том числе при m = да) определяется выражением Jopt (да /0) = xT(0) [ Sда- R1 ] x(0). Поскольку матрица Sда - R1 неотрицательно определенная и имеет ограниченные элементы, то очевидно, что значение критерия Jopt (да /0) - конечная величина. Таким образом, последовательности E{xT (k)R1 x(k) / x(0), Fq }, E{uT (k)Ru(k) / x(0), F0 } при оптимальном управлении являются бесконечными последовательностями с конечными суммами, откуда следует, что lim E {xT(k)R1x(k)/ x(0), F0} = 0, k ^да lim E {u T(k)Ru (k)/ x(0), F0} = 0. k ^да Так как R1, R > 0, то x(k),u(k) ^ 0 при k ^да в средне-квадратическом смысле, что доказывает стабилизируемость закона управления. Для доказательства (21) получим оптимальный закон управления при R1=S(X). Используя Теорему 1, нетрудно показать, что оптимальный закон управления с замкнутой обратной связью для любого m (в том числе для m = да) имеет вид uopt (k) = -Kда x(k) = -[ L™ +R ]-1 Ц2 x(k). (23) Тогда можно утверждать, что для случая m = да закон управления (23) оптимален для любой положительно определенной матрицы R1, так как lim E{xT (k + m)R1x(k + m) / x(0), F0} = 0. Заключение Получены уравнения синтеза стратегий прогнозирующего управления с замкнутой обратной связью для стохастических систем со случайными зависимыми параметрами, относительно которых предполагаются известными только условные первые и вторые моменты распределений. Получены достаточные условия устойчивости оптимального закона управления на бесконечном горизонте. Отметим, что предложенный подход без принципиальных затруднений может быть обобщен на следующие случаи: - когда матрица A в уравнении (1) зависит от времени; - когда уравнение (1) содержит аддитивные шумы с характеристиками, зависящими от вектора параметров п; - когда матрица A в уравнении (1) зависит от последовательности независимых случайных параметров, не коррелированных с вектором параметров п.

Ключевые слова

управление с прогнозирующей моделью, замкнутая обратная связь, коррелированные параметры, model predictive control, closed-loop feedback control, correlated parameters

Авторы

ФИООрганизацияДополнительноE-mail
Домбровский Владимир ВалентиновичТомский государственный университетпрофессор, доктор технических наук, заведующий кафедрой информационных технологий и бизнес-аналитики Института экономики и менеджментаdombrovs@ef.tsu.ru
Объедко Татьяна ЮрьевнаТомский государственный университеткандидат физико-математичских наук, доцент кафедры информационных технологий и бизнес аналитики Института экономики и менеджментаtatyana.obedko@mail.ru
Самородова Мария ВладимировнаТомский государственный университетаспирантка кафедры прикладной математики факультета прикладной математики и кибернетикиsamorodova21@gmail.com
Всего: 3

Ссылки

Домбровский В.В. Ляшенко Е.А. Линейно-квадратичное управление дискретными системами со случайными параметрами и мультипликативными шумами с применением к оптимизации инвестиционного портфеля // А и Т. 2003. № 10. С. 50 - 65.
Fisher S., Bhattacharya R. Linear quadratic regulation of systems with stochastic parameter uncertainties // Automatica. 2009. No. 45. P. 2831-2841.
Ghaoui E.L. State-feedback control of systems with multiplicative noise via linear matrix inequalities // Syst. Control Letters. 1995. V. 24. P. 223-228.
Dragan V., Morozan T. The Linear Quadratic Optimization Problems for a Class of Linear Stochastic Systems With Multiplicative White Noise and Markovian Jumping // IEEE Transactions on Automatic Control. 2004. V. 49, No 5. P. 665-675.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96-112.
Lee J.H., Cooly B.L. Optimal feedback control strategies for state-space systems with stochastic parameters // IEEE Transactions on Automatic Control. 1998. V. 43, No. 10. P. 1469-1475.
Домбровский В. В., Домбровский Д. В., Ляшенко Е. А. Управление с прогнозированием системами со случайными парамет рами и мультипликативными шумами и применение к оптимизации инвестиционного портфеля // А и Т. 2005. № 4. С. 8497.
Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозированием системами со случайными зависимы ми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // А и Т. 2006. № 12. С. 71-85.
Dombrovskii V., Obedko T. Model predictive control for constrained systems with serially correlated stochastic parameters and port folio optimization // Automatica. 2015. V. 54. P. 325-331.
Mayne D.Q. Model predictive control: Recent developments and future promise // Automatica. 2014. V. 50. P. 2967-2986.
 Прогнозирующее управление с замкнутой обратной связью дискретными системами со случайными коррелированными параметрами | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 39. DOI: 10.17223/19988605/39/2

Прогнозирующее управление с замкнутой обратной связью дискретными системами со случайными коррелированными параметрами | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2017. № 39. DOI: 10.17223/19988605/39/2