Рассматривается задача локально-оптимального управления по наблюдаемому выходу для дискретных объектов с запаздыванием по состоянию. Для ее решения предлагаются алгоритмы, в основе которых лежит оптимизация локального критерия без использования расширения пространства состояний. Управление определяется как функция измеряемых переменных с памятью и отслеживаемого сигнала. Исследуется асимптотическое поведение замкнутой системы.
Local-optimal output control for discrete systems with state delays.pdf Локально-оптимальные дискретные системы управления являются частным случаем дискретного прогнозирующего управления (Model predictive control) с прогнозом на 1 такт. Основным достоинством метода локально-оптимального управления является существенное упрощение процедуры синтеза. Область применения метода MPC и, соответственно, метода локально-оптимального управления охватывает задачи управления техническими системами, производственными системами, управление запасами и финансовую математику [1-13]. Результаты настоящей работы обобщают [14] на случай управления по выходу объектом с запаздыванием по состоянию. В статье [15] рассмотрена близкая задача для управления объектом с запаздыванием по состоянию при точном измерении компонент вектора состояния с использованием квадратичного критерия. В работе [1] рассмотрена задача синтеза системы управления с учетом запаздываний по управлению для дискретных объектов, которая решается на основе преобразования модели с запаздываниями к расширенной модели без запаздываний, что приводит к значительному увеличению размерности задачи при больших задержках и тем самым к дополнительным вычислительным затратам. В данном исследовании предлагается осуществлять синтез следящих систем управления по выходу на основе оптимизации локального критерия, при косвенных измерениях для дискретных объектов с запаздываниями по состоянию. Управление определяется как функция измеряемых переменных и отслеживаемого сигнала. Исследуется асимптотическое поведение системы, строятся оценки для асимптотической точности слежения. 1. Постановка задачи Пусть управляемый объект с запаздыванием по состоянию описывается разностным уравнением x(k +1) = Ax(k) + A1 x(k - h) + Bu (k) + q(k), x(x) = ф(т), T = -h, 1 -h, 2-h,...,0; k = 0,1,2,..., (1) модель канала измерений имеет вид y (k) = Sx(k) + v(k). (2) В (1), (2) x(k)eR" - вектор состояний; h > 0 - величина временного запаздывания (целое число); u(k)eRm - управление; y(k)eRl - вектор измерений; A,A1,B - матрицы соответствующих размерностей; S - матрица канала наблюдения; х0 - начальные условия (M{x0 } = P^); q(k) - гауссовская случайная последовательность входных возмущений; v(k) - гауссовская случайная последовательность ошибок измерений с характеристиками: M{q(k)} = 0, M{v(k)} = 0, M{q(k)v) (J)} = 0, M{q(k)q)(J)} = Q(k)bj, M{v(k)v)(J)} = V(k)5j (8tJ - символ Кронекера), Q(k) = Q)(k) > 0, V(k) = = V) (k) > 0 - неотрицательно определенные матрицы). Оптимизируемый локальный критерий имеет вид I (k) = M{(w(k +1) - z(k))) C (w(k +1) - z (k)) + u ) (k )Du (k)}, (3) где w(k) = Hx(k) - управляемый выход системы (H - матрица выхода системы); C = C) > 0 и D = D) > 0 - весовые матрицы; z(k) e R" - отслеживаемый вектор, удовлетворяющий уравнению z(k +1) = Fz(k) + qz(k), z(0) = z0, k = 0,1,2,.... (4) В (4) qz (k) - гауссовская случайная последовательность с характеристиками M{qz (k)} = 0, M{qz (k)q) (J)} = 0, M{qz (k)v) (J)} = 0, M{qz (k)qz) (J)} = Qz (k)bk ,j , z0 - начальные условия (M{z0z)} = Pz0, M{z0x) } = Pz0x0, M{x0z) } = P ), F- матрица динамики модели отслеживаемого сигнала. 2. Оптимизация локального критерия Управление объектом (1) при измерениях (2) определим в параметрическом виде u(k) = K (k) y(k) + K2 (к) y(k - h) + K3 (k) z (к), (5) где коэффициенты передачи Kl(k), K2(k), K3(k) подлежат определению. Решение задачи сформулируем в виде следующей теоремы. Теорема 1. Если для объекта (1), канала измерений (2) и локального критерия (3) матрицы C = (B)H)CHB + D) > 0, SPx (k) S)+ V(k) SPx (k - h, k) S) Px (k)S) P(k) = SPx (k, k - h)S) SPx (k - h)S)+ V(k - h) Px (k, k - h)S) SPzAk) SPJk - h,k) P(k) > 0 (6) положительно определены для всех k = 1,2,..., тогда оптимальные в смысле минимума критерия (3) коэффициенты передачи для управления (5) определяются по формулам K*(k) = aK2(k) + bK3(k) + c, (7) K3* (k) = [K3 (k)(bd + e) + cd + f ][E - ad], (8) K3* (k) = [(cd + f)(E - ad)-1 (ag + n) + cg + rn][(1 - bg) - (bd + e)(E - ad)_1 (ag + n)]-1, (9) где E - единичная матрица, a = -SPx (k - h, k )S) [SPx (k )S) + V (k )]-1, b = -Px (k )S) [ SPx (k) S) + V (k )]-1, c = -C-1B) H )C[ HAPx (k) + HAfx (k - h, k) - P^ (k )]S) [ SPx (k) S) + V (k )]-1, d = -SPx (k, k - h) S) [SPx (k - h)S) + V (k - h)]-1, e = -Pzx (k, k - h)S) [SPx (k - h)S) + V (k - h)]-1, f = -C-1B) H )C[ HAP") (k - h, k) + HA1Px (k - h) - P^ (k, k - h)]S) [SPx (k - h)S) + V (k - h)]-1, g = -SPxz (k) P- (k), n = -SPxz (k - h, k P (k), rn = -C-1B) H TC[HAPxz (k) + HAlPxz (k - h, k) - Pz (k)]P- (k). (10) В (10) введены обозначения: Pz(k) = M{z(k)zT(k)}, Px(k) = M{x(k)xT(k)}, Px(k,r) = Pi(r,k) = = M{z(k)xT (r)}, Pxz (k, r) = Pi (r, k) = M{x(k)zT (r)}, Pxz (k) = Pi (k) = M{x(k)zT (k)}, Px (k, r) = = M{x(k) xT (r)}, P'zx (k) = Pi (k) = M{z (k) xT (k)}, которые определяются системой разностных матрич ных уравнений с запаздываниями. Доказательство. Для вычисления локального критерия получим уравнение состояния путем подстановки (5) в (1), в результате получим x(k +1) = Ax(k) + A1 x(k - h) + Bu(k) + q(k) = Ax(k) + A1 x(k - h) + +BK1 (k)Sx(k) + BK1 (k)v(k) + BK2 (k)Sx(k - h) + BK2 (k)v(k - h) + BK3 (k)z(k) + q(k). (11) Учитывая (1), (2), (4) и (5), вычислим значение локального критерия (3): I (k) = M{(w(k +1) - z(k))T C (w(k +1) - z(k)) + uT (k)Du(k)} = = trAT H TC(HA + HBK1 (k )S )Px (k) + +trS T K1T (k) BTC( HA + HBK1 (k )S) Px (k) + trS T K1T (k) DK1 (k) SPx (k) + +trAT H TC (HA + HBK2 (k )S) Px (k - h, k) + trST K1T (k) BT H TC (HA + HBK2 (k )S )Px (k - h, k) + +trSTK1T (k)DK2 (k)SPx(k - h, k) + trATHTC(HBK3 (k) - E)Px (k) + +trS T K1T (k) BT H TC( HBK3 (k) - E) Pzx (k) + +trST K1T (k) DK3 (k) P^ (k) + trAT H TC (HA + HBK1 (k) S) Px (k, k - h) + +trST KT (k) BT H TC (HA + HBK1 (k )S) Px (k, k - h) + trST K2T (k )DK1SPx (k, k - h) + +trAT PTC (HA1 + HBK2(k )S) Px (k - h) + trS T K2T (k) B T H TC (HA + +HBK2 (k )S) Px (k - h) + trST K2T (k) DK2 SPx (k - h) + trA1T H TC (HBK3 (k) - E) Pzx (k, k - h) + +trS T K T (k) BT H TC (HBK3 (k) - E) P^ (k, k - h) + trST K2T (k) DK3 (k) P^ (k, k - h) + +trK3T BT H TC (HBK1 (k )S + PA) Pz (k) - /гС (HA + HBK1 (k )S )Pxz (k) + +trK3T (k )DK1 (k )SPxz (k) + trK3T (k) BT H TC( HBK2 (k) S + HA) Pxz (k - h, k) --trC (HA + HBK2 (k) S) Pxz (k - h, k) + trK3T (k) DK2 (k )SPxz (k - h, k) + +trK3T (k) BT H TC (PBK3 (k) - E) Pz (k) + trC (E - HBK3 (k)) Pz (k) + K3T (k) DK3 (k) Pz (k) + +trK1 (k)(BT H TCHB + D) K1 (k )F (k) + KT (k)(BT H TCHB + D) K2(k )F (k - h) + trH TCHQ(k). (12) Входящие в (12) моменты Px (i, j), Pz (i, j), Pz (i, j), Pzx (i, j) определяются следующими формулами: Px(i+1, j+1) = A(i)Px(i, j)AT(j) + Док(i -h, j)A(j)+Док(i -h, j -h)AT(j)+Q1O, j), Px(0) = Px0, (13) (14) (15) (16) Pz (i +1, j +1) = FPz (i, j)FT + Qz (i, j)5,;., Pz (0) = Pz0 , Px (i +1, j +1) = FPx (i, j)aAt+ FPzX (i, j - h)AT+ FPz (i, j)KT (j)BT,Pz, (0) = P^,., Pz (i +1, j +1) = A(i)Pxz (i, j)FT+ (i)Pxz (i - h, j)FT+ BK3O)Pz (i, j)FT,Pxz (0) = Px0 В (13)-(16) введены обозначения: A (i) = A + BK* (i) S, A (i) = A1 + BK2 (i)S, A (j) = A + BK* (j) S, a41 (j) = A + BK2* (j) S, Q1 (i, j) = Q(i, 7)5,, j + BK3*(i) Pzx (i, j) AT ( j) + A (i) Pxz (i, j) K3*T ( j) B T+ BK3*(i) Pzx (i, j - h) AT (j) + +A (i)Pxz (i - h, j)K*T (j)BT + BK* (i)Pz (i, j)K*T (j)BT + +BK*(i)V(i, j)K;T(j)BT + BK2(i)V(i -h, j -h)K2T(j)BT. Полученный результат (12) можно переписать в виде I (k) = trP1 (k)Px (k) + trP2 (k)Px (k - h, k) + trP3 (k)Px (k) + trP4 (k)Px (k, k - h) + trP5 (k)Pzz (k) + +trP6 (k)P (k - h) + trP7 (k)Px (k, k - h) + P8 (k)P„ (k - h, k) + P9 (k)P (k) + +trK1T (k )CK1 (k ) V (k) + trK2T (k )CK2 (k ) V (k - h) + trH TCHQ(k), (18) где: P (k) = (A + BK1 (k )S )T H TCH (A + BK1 (k )S) + ST K1T (k) DK1 (k) S, P2 (k) = (A + BK1 (k )S )T H TCH (4 + BK2 (k) S) + ST K1T (k) DK2 (k )S, P3 (k) = (A + BK1 (k) S)T H TCH (PBK3 (k) - E) + ST K1T (k)DK3 (k) , P4 (k) = (A + BK2 (k )S )T H TCH (A + BK1 (k )S) + ST K2T (k )DK1 (k )S, P5 (k) = (PBK3 (k) - E)T CH (A + BK1 (k )S) + K3T (k) DK1 (k )S, P6 (k) = (A1 + BK2 (k) S )T H TCH (A1 + BK2 (k )S) + S T K2T (k) DK2 (k) S, P7 (k) = (A1 + BK2 (k) S )T H TC( HBK3 (k) - E) + ST K2T (k)DK3 (k), P8 (k) = (HBK3 (k) - E)T CH (A1 + BK2 (k )S) + K3T (k) DK2 (k) S, P9 (k) = (HBK3 (k) - E )T C (HBK3 (k) - E) + K3T (k) DK3 (k). Вычислим значения градиентов критерия (18) по K1(k), K2(k) и K3(k), используя правила дифференцирования функции tr от произведения матриц по матричному аргументу [16] и приравняв их к нулю, получим уравнения, решения которых несложно представить в следующем виде: K1 (k) = -C 1 (BT H TCHAPx (k )ST + CK2 (k) SPx (k - h, k) ST + CK3 (k) Px (k) ST + +BTHTCHAxPx (k - h, k)ST - BTHTCPx (k)ST )(SPx (k)ST + V(k))-1, (19) K2 (k) = -C-1 (BT H TCH [ APx (k - h, k) + A1Px (k - h)]ST + CK1 (k )SPx (k, k - h)ST + +CK3 (k)Px (k, k - h)ST - BTHTCPx (k, k - h)ST )(SPx (k - h)ST + V(k - h))-1, (20) K3 (k) = -C-1 (C1K1 (k) SPxz (k) + CK2 (k) SPxz (k - h, k) ST + BTH TC[APxz (k) + AxPzz (k - h, k)] - BT H TCPz (k))P-1(k). (21) Представим формулы (19)-(21) в виде следующих соотношений: C[K1 (k)(SPx (k) S T + V (k)) + K2 (k) SPx (k - h, k )S T + K3 (k) P^ (k) S T ] = = -BTHTC[HAPx (k) + H4P (k -h,k) -Px (k)]ST , (22) С[ K1 (k) SPx (k, k - h) ST + K2 (k)(SPx (k - h)ST + V (k - h)) + K3 (k) Pzx (k, k - h)ST ] = = -BT H TC[ HAPx (k - h, k) + HAfx (k - h) - Px (k, k - h)]ST, (23) С^)SPx2(k) + K2(k)SPxZ(k - h,k) + K3(k)P (k)] = -BTHTC[HAPx2(k) + HA,Pxz(k - h,k) - P(k)]. (24) Тогда (22)-(24) в можно записать в следующей компактной форме: QK^k)|K2(k)|K,(k)]P(k) = BTHTC[(HAPx(k) + HA,Px(k - h,k) - Pzx(k))S^ [(HAPx(k - h,k) + HA1 Px(k - h) - Px(k,k - h))ST| (HAPxZ(k) + HAP(k - h,k) - P(k))]. (25) В силу (6) матрицы С и P(k) невырожденные для всех k = 0,1,2,_, следовательно, уравнение (25) разрешимо относительно блочной матрицы [K1(k) |K2(k) |K3(k)] и имеет единственное решение, представленное в виде (7)-(9). 3. Оценки среднеквадратического отклонения Теорема 2. Пусть в описании объекта (1), канала измерений (2), критерия (3) и модели отслеживаемого вектора (4) матрицы A,A1,B,Q,S,V,Н,C,D - постоянные; F = E; qz(k) = 0. Тогда, если выполняется условие (6) теоремы 1, существует установившееся решение уравнений (13), (15), (16), матрицы Px = lim Px (k) > 0; Q1 = lim Q1 (k) > 0 , пара матриц A, JQ стабилизируема, тогда матрица k -^да k -^да динамики замкнутой системы A = A + BK* S асимптотически устойчива для K1 = lim K* (k) . k ^да Доказательство. Если матрица Px > 0 , то из леммы 12.2 [17] при условии, что пара матриц A, yfQ стабилизируема, следует, что матрица A асимптотически устойчива. Применяя теорему 3.6 [Там же], получаем, что если пара матриц A, -JQ стабилизируема, то и пара матриц A, -JQ также стабилизируема. Этим доказывается справедливость теоремы 2. Асимптотическую точность слежения определим, вычислив оценку критерия: VHII x(k) - z\{2л k ^да где У - евклидова норма вектора; z - постоянный отслеживаемый вектор. Построим сначала оценку для критерия J (k) = M{|| x(k) -z||2}. Задавая далее условие, что k ^да, найдем оценку для критерия (26). При этом предположим, что условия теоремы 2 выполняются, а ||А|| =а1, ЦА^ = а2 (здесь Ц-Ц^ спектральная норма матрицы). Введем условие, что а1 +а2 61; j=0 an -1 an -1 +a2 r2r Xafk - 2( j+1) a2 j=0 (33) Jx(k) < aj2kJ1 (0) + a2Xa,2k-j1 J2(j, j -h) + a2Xaf-2''-1 ЛС/ -h, j) + j=0 j=0 k-1 k-1 k-1 a 2 k - 1 a 2 k - 1 +2r2 XarJ) + a 2 Xar2(j+1)M-h) + 2^ ^a^J - h) +V-1 r* + . (34) ;=0 ;=0 ^=0 a 1 a 1 j=0 j=0 j=0 Оценку критерия (26) построим, учитывая неравенства (32)-(34). Тогда при k из (28) получим J < af[- - r22 --Ц-trQ] + ar22 + trQ] + L1 -aj2 2 1 -aj2 (35) L1 -aj2 2 1 -aj2 +2a1a 2^-^r r22 + -Ц- trQQ1] + + r12 + trQ). 1 -a1 1 -a1 1 -a1 Что и требовалось доказать. 4. Результаты моделирования Моделирование выполнено для объекта (1), канала измерений (2), локального критерия (3) и отслеживаемого вектора (4), в которых матрицы и векторы имели следующие значения: ( 0,05 А (0,А ( 0 0 ^ (0,02 0 ^ A = 6= B = v 1 / v0,03 0 0 0,02 J >4 = v-0,025 1 С = 1, D = 0,2, S = (0 1) , H = (1 0) , F = 1, V = 0,16, z = 10. В результате получены графики (пунктирная линия обозначает отслеживаемый сигнал), которые демонстрируют, что при заданных параметрах переменная x1(k) сходится к желаемому поведению z (рис. 1). u(k) 2 1 0 -1 40 60 k 20 40 Рис. 1. Реализации x1(k), x*(k) и управления x1(k) 10 5 20 60 k На рис. 2 и 3 приведены результаты моделирования для отслеживания переменного сигнала z(k). Рис. 2. Реализации x1(k) , x* (k) и управления при кусочно-постоянном отслеживаемом векторе Рис. 3. Реализации x1(k), x*(k) и управлений при возрастающем и убывающем отслеживаемом векторе Заключение Решена задача управления выходом для дискретного объекта с запаздыванием по состоянию на основе синтеза локально-оптимальной следящей системы управления линейным динамическим объектом при косвенных измерениях. Показано, что при практически естественных ограничениях на класс динамических систем метод локально-оптимального слежения при косвенных измерениях с ошибками обеспечивает асимптотическое слежение с точностью, определяемой интенсивностью аддитивных возмущений и ошибок в канале измерений, динамическими характеристиками замкнутой системы, значениями параметров объекта и коэффициентов передачи следящей системы управления.
Уонэм М. Линейные многомерные системы управления. М. : Наука, 1980. 376 с.
Stojanovic S., Debeljkovic D. On the asymptotic stability of linear discrete time delay systems. Mechanical Engineering, V. 2, No. 1. 2004. P. 35-48.
Амосов А.А., Колпаков В.В. Скалярно-матричное дифференцирование и его приложения к конструктивным задачам теории связи // Проблемы передачи информации. 1972. № 1. С. 3-15.
Tang G., Sun H., Liu Y. Optimal tracking control for discrete time-delay systems with persistent disturbances // Asian Journal of Control. 2006. V. 8, No. 8. P. 135-140.
Смагин В.И. Локально-оптимальные следящие системы управления при косвенных измерениях с ошибками // Известия вузов. Авиационная техника. 1995. № 1. С. 26-30.
Dai L., Xia Y., Fu M., MahmoudM. Discrete-Time Model Predictive Control. Advances in Discrete Time Systems. Publisher: InTech, 2012. Ch. 4. P. 77-116.
Приступа М.Ю., Смагин В.И. Прогнозирующее управление выходом нестационарной дискретной системы при ограничениях на управление // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2013. № 3(24). С. 14-23.
Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием гибридными системами с марковскими скачками при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 3(20). С. 5-12.
Мухина О.О., Смагин В.И. Локально-оптимальное управление запасами с учетом запаздываний в поставках и транспортных ограничений // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 2(19). С. 42-50.
Приступа М.Ю., Смагин В.И. Прогнозирующее управление дискретными системами с неизвестным входом и его применение к задаче управления экономическим объектом // Вестник Томского государственного университета. Управление, вычислительная техника и информатика
Киселева М.Ю., Смагин В.И. Управление с прогнозирующей моделью с учетом запаздывания по управлению // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 5-12.
Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозиру ющей модели выхода системы // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2009. № 2(7). С. 24-31
Смагин В.И., Смагин С.В. Адаптивное управление запасами с учетом ограничений и транспортных запаздываний // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2008. № 3(4). С. 19-26.
Conte P., Pennesi P. Inventory control by model predictive control methods // Proc. 16th IFAC World Congress. Prague. 2005. P. 1-6.
Смагин В.И., Смагин С.В. Управление запасами по двум критериям с учетом ограничений // Вестник Томского госу дарственного университета. 2006. № 290. С. 244-246.
Перепелкин Е.А. Прогнозирующее управление экономической системой производства, хранения и поставок товара потребителям // Экономика и математические методы. 2004. Т. 40, № 1. С. 125-128.
Дегтярев Г.Л., Ризаев И.С. Синтез локально-оптимальных алгоритмов управления летательными аппаратами. М. : Машиностроение, 1991. 304 с.
Домбровский В.В., Ляшенко Е.А. Линейно-квадратичное управление дискретными системами со случайными пара метрами и мультипликативными шумами с применением к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2003. № 10. С. 50-65.