Рассматривается задача синтеза адаптивного прогнозирующего управления, построенного на основе слежения за желаемым выходом системы при наличии в описании модели неизвестных параметров и неизвестного входа. Прогнозирование осуществляется на основе вычисления оценок состояний объекта, параметров и неизвестного входа. Рассматривается задача адаптивного управления экономической системой производства, хранения и поставок товара потребителям.
Adaptive model predictive control discrete systems with unknown input.pdf При синтезе управлений широко используется метод управления динамическими объектами с применением прогнозирующих моделей - Model Predictive Control (MPC) [1]. Область применения MPC охватывает задачи управления технологическими процессами, производственными системами, управления запасами, задачи управления портфелем ценных бумаг [1-6] и др. В работе рассматривается задача синтеза адаптивного прогнозирующего управления для динамических объектов с неизвестными параметрами и неизвестным входом, при этом применяются методы идентификации неизвестных параметров объекта [7, 8], методы вычисления оценок вектора состояния объекта, использующие оценки неизвестного входа [9-12]. Дано применение метода к задаче синтеза адаптивного прогнозирующего управления производством, хранением и поставками товара с учетом возможного наличия в модели объекта неизвестного входа. 1. Постановка задачи Модель объекта, наблюдений и выхода описывается следующими линейно-разностными уравнениями: xt+1 = A(0t)xt + B(0t )ut + Irt + wt, xt|t=0 = x0 , (1) Yt = Hxt + vt, (2) yt = Gxt, (3) где xt e Rn - состояние объекта; ut e Rm - управляющее воздействие (известный вход); Yt е Rl - наблюдения; rt е Rq - неизвестный вход; yt е Rp - управляемый выход; 0t- неизвестный вектор; A(9t), B(9t), I, H, G - матрицы соответствующих размерностей. Случайные возмущения wt, шумы измерения vt и вектор начальных условий x0 подчиняются гауссовскому распределению с характеристиками: M{wt} = 0, M{v} = 0, M{wtwl} = W8t k, M{vvT} = V8t k, M{w/k} = 0, M{x0} = x0, M{(x0 -x0)(x0 -x0)T} = PXo. Ограничения на векторы состояния и управления представимы в виде a (t) < S1 xt < a2 (t), Ф1 (xt, t) < S2ut < ф2(xt, t), (4) где Si и S2 - структурные матрицы полного ранга, состоящие из нулей и единиц, определяющие компоненты векторов xt и ut, на которые накладываются ограничения; a1(t), a2(t), ф1(xt, t), ф2(xt, t) - заданные векторы и вектор-функции соответствующих размерностей. Задача состоит в том, чтобы по наблюдениям yt определить стратегию управления в условиях неполной информации о модели, при которой вектор выхода системы yt будет близок к заданному вектору yt. 2. Прогнозирование поведения объекта в условиях неполной информации о модели Прогнозирование поведения объекта и вектора выхода системы осуществляется с использованием экстраполятора Калмана на основе оценок вектора состояния х, , вектора выхода y^ и оценки вектора неизвестного входа rt: xt+i|t = Atxt|t-i + Btut + Irt + Kt (Vt - Hxt|t-i), xo|-i = xo, (5) yt+i|t = Gxt+i|t, (6) Kt = AtPtH T (HPtHT + V)-1 , (7) Pt+i = W + AtPtAj - AtPtHT (HPtHT + V)1 HPtAj , Po = P^ , (8) где At = A(01) и Bt = B(e t) - матрицы, полученные в результате идентификации модели. Идентификацию модели можно осуществить с помощью фильтра Калмана и модифицированного метода наименьших квадратов. 3. Идентификация модели с использованием фильтра Калмана Идентификацию модели осуществим с помощью фильтра Калмана. В этом случае для идентификации необходимо иметь определенный уровень априорной информации о неизвестном векторе e,. Предположим, что закон поведения неизвестного вектора задается следующим уравнением: et+i =©t et + t, ett=o =eo, (9) где ©, - матрица, определяющая динамику неизвестного вектора в момент времени t; т, - случайная гауссовская величина с нулевым средним и ковариацией M{xttJ } = Tt5tk ; eo - случайный вектор начальных условий с известными характеристиками M{eo} = eo, M{(eo -eo)T}=Peo. Будем предполагать, что матрицы A(et) и B(et) линейно зависят от et. Тогда можно представить вектор xt+1 в виде линейной функции от et: xt+1 = A(et)xt + B(et)ut + Irt + wt = Q(xt,ut)et +p(xt,ut) + Irt + wt. (io) Умножив (io) слева на матрицу Н и добавив vt+1 к левой и правой частям (io), получим Vt+i = Hxt+i + vt+i = HQ(xt, ut )et + HP(xt, ut) + Hwt + HIrt + vt+i. (ii) Далее, используя алгоритм фильтрации Калмана к модели (9) и каналу наблюдений (11), при этом заменив в (11) xt и rt на их оценки, получим оценку неизвестного параметра в момент времени t+i, которая определяется из следующих выражений: et+i=©tet + к (vt+i - hqtet - Hpt - r), eo =eo, (12) Kt = PtQT (qtPtQT + hwhT + v) , (13) Pt = ©tP©T + Tt, P+1 = (En - KQt)Pt, Po = Peo, (14) где Qt = Q(xt\,-1, ut), pt = p(xt,t-1, ut). Оценка вектора состояния xt+1|t определяется по формуле х+1к=A(e t) -i+в (e t к+irt = q t e t+p t+ir, (15) где a = ЛФ), в = B(e,). Для построения оценок неизвестного входа будем использовать модифицированный метод МНК [9], в основу которого положена минимизация следующего критерия: j (r_i)=Z {|| v, - +1 \t£R}, (i6) где CR и Dr - симметричные, положительно определенные матрицы. Оптимизация критерия до текущего момента времени t сводится к минимизации критерия в каждый момент времени i = 1, t: J (rt-i) = min mm .. .mm £ {|| v, - Нх^Л 2 +1 ^ ||D }. (17) r0 ri rt-i i=i V s R ) Оптимальная оценка неизвестного входа на шаге t = 1 j (ro)=mm {vi- h|Cr +i I^IIDR }. Учитывая, что x1|0 = Ax0 + Bu0 + Ir0, имеем J(ro) = min{{ -HAx0 -HBu0 -HIf0(CR +||^||Dr }. (18) После преобразований получаем J(r0) = min {r0T (ITHTCRHI + Dr ) r0 - 2r0TITHTCR ( - HAx0 - HBu0) + a0} , где a0 - величина, не зависящая от r0. Оптимальная оценка находится из условия ^^ = 2 (ItHtCrHI + Dr ) r0 - 21THTCR ( - HAx0 - HBu0) = 0, dr0 откуда получаем оптимальную оценку неизвестного входа в момент времени t = 1: Г = SR (^ - HAX0 - HBU0), (19) где SR = (itHtCrHI + Dr) 11THTCR . Подставляя полученное выражение для r0 в (18), вычисляем оптимальное значение критерия в момент времени t = 1: J(Г0) = (^ - HAx0 - HBu0 )T MR (( - HAx0 - HBu0), (20) где MR = CR - 2CRHISR + SRT (lTHTCRHI + DR )sr . В момент времени t = 2 оптимальная оценка неизвестного входящего сигнала находится исходя из оптимизации следующего критерия: J(r1) = mmmm{{ -+ 1^ +||v1 -HX1|0||Cs + 1^ } . Выражение для J (r1) может быть преобразовано следующим образом: J(r1) = mm {||V2 - HX2|11Cs +11С + J(r0)} = = T{|| V2"HAX1|0"HBu1- HIr1 ||CR +1\r1 ||Dr +11V1 - HAX0 -hbU0\(Mr } = = min {rT (ITHTCRHI + Dr )r - 2rfITHTCR (v2 - HAX1|0 - HBu1) + a1} , где a1 - величина, не зависящая от r1. Дифференцируя по r1, по аналогии с операциями, проведенными на первом шаге, имеем r = Sr (V2 - HAX[|0 - hbu,), (21) J(r) = (V2 - HAX1|0 - HBu1 )T Ms (v2 - HAX1|0 - HBu1). (22) Для последующих шагов применяя метод математической индукции, получим rt = Sr (Vt+1 - H4XAt-1 - HBut). (23) 5. Синтез адаптивного управления Реализуем прогнозирование поведения объекта и выхода системы с использованием следующих формул: ' i-1 Л ( k-1 Л ( k-1 t =|П -+ П I в (24) t+i - kUt+ i-kjt l=1 i-1 П At +i-l I Irt+i t+1jt l=1 i-1 I k-1 У,+ijt = G,+i I П A X G+i| П At +i-l I Bt +i - kut +i - kjt + X G + i | П A4' + i-l I IP' + i-k , (25) x k=1 V l=1 . k=1 J k =1 V l=1 где ut+k' - управление, используемое для прогнозирования. Уравнения для прогнозируемых векторов состояния и выхода представляются в векторно- (26) X t = ft = (27) матричной форме XXt= fX,+ц'+ Р Ut+SRt, Yt = AX,+1'+ Ф Ut+QRt, где векторы Xt, Yt, Ut, Rt имеют вид xt+1jt , Yt = y t+1t , Ut = ut+1jt , R = rt+1jt Xt+Njt yt+Njt ut+Njt rt + Njt матрицы ft, At, S, Q определяются следующим образом: ' E" ' Gt+1 At+1 Gt+2 At+1 At+2 At+1 , A t = g A At t+3 t+2 t+1 N-1 N-1 * П At+N-k Gt+N ^T At+N-k _ k=1 _ _ k=1 _ S = 0 0 0 ... 0" " 0 0 0 ... 0 I 0 0 ••• 0 GI 0 0 ••• 0 AI I 0 • •• 0 , Q = gA i GI 0 ••• 0 A N -21 A N-31 •I 0 ga n 21 ga n 31 • GI 0 В случае M < N матрицы p и Фt вводятся следующим образом: 0 0 0 0 в-+1 At+2 Bt+1 0 \ 0 Bt+2 M-2 П -А, k=1 M П А П А k=1 M-1 П -А в в. в. t+M t+M-k+1 V k=1 J M t+1 р, = \ С M -1 t +2 t+M-k+1 V k=1 J M-1 t в t +M+1 t +M в, в t+M-k+1 V k=1 J t+M-k+2 V k=1 J t+1 t+2 IN -M-1 p X П А+N-k V p k=1 J С N-2 П -А С N-3 П А в. в в t+N-k V k=1 J t +1 t +N-k V k=1 J t+2 t+M 0 0 об, + 0 0 ОБ, + GAt+2 Бt +1 О|П At+M-k+1 IБ,+i О|П At+M-k+1 IБ, + 2 ОБi, (28) Ф. = k=1 M GA1+M+1Б1+M k=1 M-I О|П At+M - k + 2 IБ+i О| П At+M-k+1 IБ++2 M-I _p N B. + При M=N: Pt = G| ПA,+N-k IB,+i О| ПA+N-k IБ1+2 • О £ ПA>+N-k V p k=l у 0 0 0 ••• 0 Б1+1 0 0 ••• 0 At+2 БМ Б1+2 0 ••• 0 N-2 ^ Л N-3 П At+N-k ^+1 1 П At+N-k ^t+2 • б1+n-i 0 k=l у V k=1 У 0 0 0 • 0 ^t+i 0 0 • 0 GAt+2 Бг+1 Щ+2 0 • 0 N-3 0Б1+N-I 0 t+2 Ф t = (29) (N-2 Л О П ■rLt+N-k Б,+i О П ■rLt+N-k V k=1 У V k=1 у Л Б Синтез управления осуществляется на основе минимизации критерия 1 N N 2 I M 2 , , пУ, +k|t - Уt+k||c + 2 |Ut+k|t - Ut + k-l|t 2 k=1 2 k =1 J ( X,+щ ,Ut ) = который можно записать в следующем виде: J (X+l|t ,U ) =1 U^ + Ujf +«t (30) где a t - слагаемое, не зависящее от управления, Dut F = ФТСФ + D , f = Г матрицы Си D имеют вид yt+i|t yt+N|t t+i|t 0 ФТСЛ ФТС)) -ФТС Г = Y = 0 2D -D 0 - D 2D -D С 0 0 С С = (31) D = 0 0 ; c Окончательно адаптивное управление примет вид -D 2D -D 0 -D 2D u*m =(E„ 0 ... 0)U\ где U* определяется численно на основе оптимизации критерия (30) с учетом ограничений (4). 6. Применение алгоритма к задаче управления системой производства, хранения и поставок товара потребителям Рассмотрим задачу управления производством, хранением и поставками товаров потребителям [4]. Модель объекта с дополнительно включенными неизвестными составляющими возмущений имеет вид q+1 = А(еН +bt + Ф* , 40 = zt+1 = zt + B(e)rot + dt - Ф* + С , z0 = Z0, (32) где qt еRs, qit - количество товара i-го типа у потребителя в момент времени t (t = 1,T, i = 1,s ); zit -количество товаров i-го типа на складе производителя; roit - объем производства товаров i-го типа; ф^ -объем поставок товаров i-го типа; bt, dt - неизвестные составляющие возмущений; tt, Сt - векторные гауссовские случайные последовательности (M{ tt} = 0, M{ Ct} = 0, M{ttt\} = 25tk, M{CtС1} = E5tk, M{£,ф = 0); A(e) и B(е) - матрицы; et- неизвестный постоянный вектор. В каждый момент времени t должны выполняться ограничения z-
Maciejowski J.M. Predictive control with constraints. Upper Saddle River (NJ) : Prentice Hall, 2002. 331 p.
Перепелкин Е.А. Прогнозирующее управление экономической системой производства, хранения и поставок товаров потре бителям // Экономика и математические методы. 2004. Т. 40, № 1. С. 125-128.
Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозирующей модели выхода системы // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2009. № 2 (7). C. 24-30.
Приступа М. Ю., Смагин В. И. Прогнозирующее управление дискретными системами с неизвестным входом и его применение к задаче управления экономическим объектом // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 1 (18). С. 5-15. URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/vtls:000429574
Smagin V.I., Koshkin G.M., Kim K.S. Locally Optimal Inventory Control with Time Delay in Deliveries and Incomplete Information on Demand // Proceedings Second International Symposium on Stochastic Models in Reliability Engineering, Life Science and Operations Management. February 15-18, 2016. Beer Sheva, Israel, 2016. Р. 570-574.
Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозирующей моделью системами со случайными зависимыми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2006. № 12. C. 71-85.
Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V. 7. P. 123-162.
Рубан А.И. Идентификация и чувствительность сложных систем. Томск : Изд-во Томск. ун-та, 1982. 302 с.
Janczak D., Grishin Yu. State estimation of linear dynamic system with unknown input and uncertain observation using dynamic programming // Control and Cybernetics. 2006. No. 4. P. 851-862.
Hsieh C-S. On the optimality of two-stage Kalman filtering for systems with unknown inputs // Asian Journal of Control. 2010. No. 4. P. 510-523.
Witczak M. Fault diagnosis and fault-tolerant control strategies for non-linear systems. Chapter 2. Unknown input observers and filters. Lecture Notes in Electrical Engineering. Springer International Publishing, Switzerland, 2014. P. 19-56.
Смагин В.И. Оценивание состояний нестационарных дискретных систем при неизвестном входе с использованием компенсаций // Известия вузов. Физика. 2015. Т. 58, № 7. С. 122-127. URL: http://vital.lib.tsu.ru/vital/access/manager/Repository/vtls:000487259