Рассматривается алгоритм синтеза следящей системы управления выходом линейного дискретного объекта с неизвестными возмущениями полиномиального вида. Предлагается формировать динамический закон управления с глубиной памяти по вектору состояния.
Syntheses dynamical tracking system on criterion with sliding interval ofoptimization with unknown polynomial disturbances .pdf Задача синтеза систем управления, инвариантных относительно возмущающих воздействий, исследовалась в работах [1 - 4]. В [4] была рассмотрена задача синтеза дискретной следящей системы управления выходом системы при неизвестной постоянной составляющей возмущений.В настоящей работе результат работы [4] обобщается на случай неизвестного возмущения полиномиального типа, при этом в качестве критерия берется критерий со скользящим интервалом оптимизации.Для математической модели производства, сбыта, хранения товаров выполнено моделирование динамической следящей системы управления.1. Постановка задачиРассматривается дискретная система, которая описывается следующими разностными уравнениями:x(k +1) = Ax(k) + Bu(k) + f(k) + q(k), x(0) = x0,(1)где x0 - начальное условие; x(k) - я-мерный вектор состояния (полностью доступен наблюдению); u(k) - да-мерный вектор управления; A - яхя-матрица динамики системы; B - яхда-матрица влияния управляющих воздействий; f(k) - я-мерная детерминированная неизвестная составляющая возмущений, полином степени p относительно времени k:f (k) = fokp + f1kp-1 +... + fp_,k + fp ; (2)q(k) - случайная составляющая возмущения, гауссовский белый шум с характеристикамиM {q(k)} = 0, M{q(k)qT (j)} = ß5k,; . (3)В (1) предполагается, что пара матриц (A, B) управляема. В (3) символ M{} обозначает математическое ожидание, < T > - транспонирование. Вектор выхода системы определяется соотношениемw(k) = Hx(k),где w(k) - r-мерный вектор выхода системы, отслеживающий заданный вектор z(k), H- матрица выхода размерности r*n.Рассмотрим критерий со скользящим интервалом оптимизацииf k+N-1 1J (k) = M J g (w(i +1) - z(i))T C(w(i +1) - z(i)) + uT (i)Du(i)j, (4)где N - длина скользящего интервала оптимизации, C > 0 и D > 0 - весовые матрицы критерия, z(k) - отслеживаемый вектор.Требуется найти управление u(k), минимизирующее критерий (4) при неизвестном возмущении вида (2).2. Синтез управления для локального критерия (N = 1)Рассмотрим случай оптимизации локального критерия [4, 5], который будет соответствовать критерию (4) при N = 1. Пусть сначала в системе (1) детерминированная составляющая возмущений f(k) линейна относительно времени k:f (k) = fok + f1. (5)Найдем управление u(k), минимизирующее критерий при неизвестном возмущении вида (5).Для решения задачи осуществляется преобразование объекта (1) и критерия (4) при N = 1. Для этого исключается постоянная составляющая возмущений f из описания объекта посредством вычитания из уравнения (1) такого же уравнения, но со сдвигом на один такт. Результатом является следующее уравнение:x(k +1) = (A + En)x(k) - Ax(k -1) + Bu{k) - Bu{k -1) + f0 + q(k) - q(k -1) . (6)В (6) и далее En - единичная матрица размерности nxn.Расширение пространства состояния системы осуществляется посредством добавления к уравнению (6) тождества видаx(k) = x(k) .(7) Вводятся следующие обозначения:x (k)=( :k % ], q(k)=(q(k) - :(k -1)fo =(f0 ), -1) = (-Bu0k» Тогда система (6) и (7) в векторно-матричной форме примет видX (k +1) = AX (k) + Bu(k) + f0 +T (k -1) + q (k), (9)где матрицы А и В имеют следующую блочную структуру:- (A + En -A) - (B)Аналогично исключается постоянная составляющая возмущений f 0 из описания объекта посредством вычитания из уравнения (9) такого же уравнения, носо сдвигом на один такт. Результатом является следующее уравнение: X (к +1) = (A + E2n) X (к) - AX (к -1) + Bu (к) - Bu (к -1) ++Т(к -1) -4>(к - 2) + q(h) - д(к -1). (11)Расширение пространства состояния системы осуществляется посредством добавления к уравнению (11) тождества видаХ(к) = Х(к). (12)Введем обозначения:Х(к) ( X(к) Л) (q(к)-д(к-1)Х(к) = lx(k -1) J' q (к) = [ 0Р(к -1) = [~2~BU(к - 10-Т(к - 2)] . (13)Тогда система (11) и (12) примет видX(к +1) = AX(к) + Ви(к) + Ч7(к -1) + q(к), (14) где блочные матрицы, входящие в выражение, имеют следующую структуру:A=fA++E2" -A1, B=(BJ. (15)E2„ 0 I[0Критерий (4) при N = 1 и вектор выхода расширенной системы представляются в эквивалентном виде:Js (к) = M {(W(к +1) - z (к))т C(W(к +1) - z(к)) + uт (к)Du (к)} , (16)W (к +1) = HX (к +1),гдеC = diag (C, C, C, C), H = diag (H, H, H, H),z (к) = (z(к), z(к -1), z(к -1), z(к - 2))т . (17) Оптимальное управление объектом (14) по критерию (16) примет вид [4]u (к) = -(BT HТ CHB + D)- BT HТ C(HAX(к) - z (к) + HP (к -1)). (18)Учитывая представление блочных матриц (13), (15), (17), вместо (18) получается следующее выражение для управлений:) = -( Bт H т CHB + D)-1 BT H TC (H (A + 2En) х(к) - H (2A + En) х(к -1) ++HAx^ - 2) - z(к) - 2HBuß -1) + HBuß - 2)). (19)Закон управления u^) является динамическим, он определяется из разностного уравнения второго порядка (19), для его реализации требуется задать начальные условия: u(0) = u0, u(1) = u1. Кроме того, необходимо отметить, что закон управления (19) обладает глубиной памяти по вектору состояния равной 2.Перейдем к рассмотрению дискретной системы (1) с детерминированной составляющей возмущений в форме параболической зависимости от времени. В этом случае /(к) определяется по формулеf (к) = /к + /1к +/2. (20)Найдем управление u(k), минимизирующее критерий (4) при неизвестном возмущении вида (20).Для решения задачи так же, как в предыдущем случае, осуществляется преобразование объекта (1) и критерия (4) посредством исключения постоянной составляющей возмущений f2 из описания объекта. Результатом является следующее уравнение:x(k +1) = (A + En) x(k) - Ax(k -1) + Bu (k) - Bu (k -1) ++2 fo k - fo + f + q(k) - q(k -1). (21)Расширение пространства состояния системы (21) выполняется добавлением к уравнению (21) тождества (7). Учитывая (8) и обозначив*=(fравенства (21) и (7) представляются в векторно-матричной форме:X (k +1) = AX(k) + Bu(k) + 2f 0 k - f1 + f 0 + *P(k -1) + q (k). (22)Далее, исключив постоянную составляющую возмущений f1- f0 из описанияобъекта (22), получим следующее уравнение:X(k +1) = (A + E2n)X(k) - AX(k -1) + Bu (k) - Bu(k -1) +T(k -1)-*P (k - 2) + 2 f0 + q (k) - q (k -1). (23)Расширение пространства состояния системы осуществляется посредством добавления к уравнению (23) тождества вида (12). Введем обозначение:' 2 f 0'Л . 0тогда, учитывая (13), систему (23) и (12) можно представить в видеX(k +1) = AX(k) + Bu (k) + f 0 + *P(k -1) + q (k), (24) где матрицы, входящие в выражение, имеют структуру (13). Далее исключается постоянная составляющая возмущений f0 из описания объекта (24), в результате получается следующее уравнение:X(k +1) = (A + E4n)X(k) - AX(k +1) + Bu (k) - Bu (k -1) ++T(k -1) -T(k - 2) + q (k) - q (k -1). (25)Осуществим расширение пространства состояния системы посредством добавления к (25) тождества видаX(k) = X(k) .(26)Введем обозначения:(X (k) ^ q (q(k) - q(k -1)q (k) = 1 0rT(k -1) - T(k - 2) - Bu(k -1)Л(27)тогда система (25) и (26) примет видX(к +1) = AX(к) + Бы(к) + Ч(к -1) + q(к), (28) где блочные матрицы, входящие в (28), следующие:AA + E4n -A E4n 0ББv 0 j(29)Критерий (4) при N = 1 и вектор выхода расширенной системы представляются в эквивалентном виде:Js (к) = M {(W(к +1) - z (к))т C(W(к +1) - z(к)) + uт (к)Du (к)} , (30)W (к +1) = HX (к +1), где C = diag (C, C, C, C, C, C, C), H = diag (Я, H, H, H, H, H, H, H),Z(к) = (z(к), z(к -1), z(к -1), z(к - 2), z(к -1), z(к - 2), z(к - 2), z(к - 3))т .(31) Оптимальное управление объектом (28) по критерию (30) примет видu (к) = -(BH CHB + D)-1 BH C(HAX(F) - zQi) + H4> (к -1)) . (32)Учитывая представление блочных матриц (27), (28), (31), вместо (32) получается следующее выражение для управлений:u (к) = -(BT HTCHB + D)-1 BT HTC(H(A + 3En)х(к) -- H (3 A + 3En) х(к -1) + H (3 A + En) х(к - 2) - Шх(к - 3) --zß) - 3HBu^ -1) + 3HBu^ - 2) - HBuß -3)). (33)Построенный закон управления (33) является динамическим, для его реализации требуется задать начальные условия: u(0) = u0, u(1) = u1, u(2) = u2. Закон управления (33) имеет глубину памяти по вектору состояния равную 3.Анализируя полученные результаты для управлений вида (19) и (33), можно, применяя метод математической индукции, доказать справедливость следующей теоремы.Теорема. Пусть динамика управляемого процесса описывается уравнением (1), детерминированная неизвестная составляющая возмущений имеет вид (2). Тогда последовательность оптимальных управлений, минимизирующих критерий (4), определится по формулеp+1u (к) = -(BT HTCHB + D)-1 BT HT C(H((-1) C'p+1х(к - i) +i=0p+1p+1+X +1 Cp+1 х(к - i +1) + X Cp+1u(к - i)) - *(к)), (34)где Cmi=1 n!m!(n - m)!Закон управления (34) обладает глубиной памяти по вектору состояния равной p+1 и является динамическим, для его реализации требуется задать начальные условия: u(0) = u0, u(1) = u1, u(2) = u2, u(p) = up.3. Синтез закона управлений по критерию со скользящим интервалом оптимизацииПерейдем к рассмотрению основной задачи, поставленной в п. 1. Для решения задачи выполним преобразование объекта (1) и критерия (4). Из уравнений (1) получим систему матричных уравнений:х(к +1) = Ax(k) + Bu (к) + f (к) + q(к), х(к + 2) = Ax(к +1) + Bu (к +1) + f (к +1) + q(к +1) = A2х(к) + ABu(к) + Bu(к +1) + Af (к) + Aq(k) + f (к +1) + q(k +1),х(к + N) = ANx(k) + AN-1 Bu (к) + AN-1 f (k) + AN-1q(k) + AN-2 Bu (k +1) + +AN-2 f (k +1) + AN-2q(k +1) +... + ABu(к + N - 2) + Bu(k + N -1) ++f (k + N -1) + q(k + N -1).(35)ОбозначимX (k):f x(k) A x(k +1)U (к):f u(к) A u (к +1)x(k + N -1)f f(k) A f (k +1)u(k + N -1)f (к ) =f q(k) A q(k +1)q (k + N -1)ч f (k + n -1) jТогда система (35) в векторно-матричной форме примет видX(k +1) = AX(k) + BB U(k) + A/(k) + Aq(k),(36)(37)f A 00A 0где A - NnxNn-матрица, B - Nn xNm-матрица и A - Nn xNn-матрица имеют следующую блочную структуру:A2 000 Af B 0AB BA--AN 0B(38)AN-1 An-2EnПреобразуем критерий (4) к видуJs (к) = M {(HX (к +1) - ž(k ))T C (HX (k +1) - ž(k)) + U T (к) DD U (k)} .(39)В (39) блочные матрицы имеют видH = diag(H, H,..., H), D = diag(D, D,..., D),C = diag(C, C,C), ž(k) = ( z(k), z(k +1),..., z(k + N -1)). (40) Таким образом, задача сводится к оптимизации локального критерия (39) для объекта (37) с неизвестными возмущениями полиномиального типа Af (k). Из теоремы (см. п. 2) следует, что в нашем случае закон управления будет иметь видp+1и (k) = -( вT H tCHb+D )-1 вT H JC (H (A Y, (-1)' cp+1x (k - i) +i=0p+1p+1+Y (-1)i+1Cp3+1 X(k - i +1) + Y (-1)''C^+1U(k - i)) - Z(k)). (41)i=1i=1Для определения U(k) необходимо задать начальные условия для моментов времени 0, 1, 2,...,p.Управляющее воздействие u(k), минимизирующее критерий со скользящим интервалом оптимизации при неизвестном возмущении вида (2), определится по формулеu(k) = ( Em 0... 0 )U (k). (42)Отметим, что применять алгоритм (41) и (42) необходимо в тех случаях, когда не удается подобрать весовые матрицы C и D критерия (4) при N = 1, обеспечивающие устойчивое слежение за вектором z(k). Подбирая длину скользящего интервала оптимизации, можно определить значение N, такое, чтобы достигалось устойчивое слежение.4. Результаты моделированияРассмотрим применение алгоритма (34) к задаче управления производством, сбытом и хранением для одного вида товара [6, 7] в условиях непредсказуемых изменений параметров модели. В модели объекта используются следующие переменные: z(k) - количество товаров на рынке в момент времени k, u(k) - количество произведенного товара в момент времени k, v(k) - количество товаров у потребителя, w(k) - прибыль, полученная в момент времени k.В частном случае, когда величина потенциального спроса велика (потенциальный спрос неограничен) модель становится линейной:коэффициент про-(43)даж. Выходом системы (43) является прибыль w(k), поэтому выход можно представить в видеw(k) = Fx(k),где F = (0 0 1).Зададим уравнение, определяющее желаемое изменение прибыли, в видеw(k) = (1 + r0)w(k), w(0) = w0,где r0 - желаемый темп роста прибыли.Моделирование управления производством, сбытом и хранением товара по модели (43) выполнено для следующих значений параметров:ki= 0,01; k2 = 0,02; k3 = 0,01; r0 = 0,004; c =■ 5; c0 = 1;= 0,01.z0 = 100; v0 = 150; w0 = 1; C = 1; DВ (43) процесс q(k) имеет характеристики, определяющиеся по формуле (3), где Q = diag(2; 2; 0).При синтезе закона управления полагалось, что n0 =0,6, но в модели значение этого параметра изменялось по формулеn0 = 0,6 + 0,1sin(0,2k). (44)Отметим, что подобная ситуация может возникать при рыночных колебаниях спроса. Введение выражения (44) можно интерпретировать как наличие в моделируемом объекте дополнительных неконтролируемых возмущений в виде следующего вектора:f (k )■Г-0,1в~5 sin(0,2k)z(k)Л 0,1еГ5 sin(0,2k)z(k) 0,5ćT5sin(0,2k) z (k)На рис. 1 - 4 приведены результаты моделирования для динамического закона слежения (N = 1) с глубиной памяти 1 и с глубиной памяти 2 при неточно известном параметре n0.Из графиков, приведенных на рис. 4, видно, что наблюдается устойчивое слежение за желаемой прибылью w(k), причем с большей точностью для управленияс глубиной памяти 2, при этом поддерживается меньший объем производства u(k) (см. рис. 1) и меньший объем количества товаров на рынке z(k) (см. рис. 2).w(k) 1,4 1,2 1,0 0,8Рис. 4. Реализации прибыли (1 - желаемое изменение прибыли; 2 - при управлении с глубиной памяти 1; 3 - при управлении с глубиной памяти 2)ЗаключениеПредложен алгоритм синтеза следящей системы для линейного дискретного объекта при неизвестных возмущениях полиномиального типа. На примере управления для модели производства, сбыта и хранения товара показано, что алгоритм может быть использован для объектов с неизвестным возмущением, обусловленным, например, неопределенностями в задании параметров модели. Предложенный алгоритм позволил обеспечить рост прибыли с желаемым темпом при высокой точности слежения в условиях неполной информации о параметрах модели объекта.
Параев Ю.И. Решение задачи об оптимальном производстве, хранении и сбыте товара // Изв. РАН. Теория и системы управления. 2000. № 2. С.103 - 107.
Горский А.А., Колпакова Н.Г., Локшин Б.Я. Динамическая модель производства, хранения и сбыта товара повседневного спроса // Изв. РАН. Теория и системы управления. 1998. № 1. С. 144 -149.
Смагин В.И., Параев Ю.И. Синтез следящих систем управления по квадратичным критериям. Томск: Изд-во Том. ун-та, 1996. 171 с.
Смагин С.В. Динамические следящие системы управления выходом объекта при неизвестных возмущениях // Вестник ТГУ. УВТиИ. 2008. №1(2). С.28 - 32.
Параев Ю.И., Перепелкин Е.А. Линейные матричные уравнения в задачах анализа и синтеза многосвязных динамических систем. Барнаул: Изд-во АлтГТУ, 2000. 120 с.
Востриков А.С. Синтез нелинейных систем методом локализации. Новосибирск: Изд-во НГУ, 1990. 120 с.
Современные методы проектирования систем автоматического управления / Под ред. Б.Н. Петрова, В.В. Солодовникова, Ю.И. Топчеева. М.: Машиностроение, 1967. 703 с.