Локально-оптимальное управление дискретными системами с запаздыванием в канале управления при неполной информации о состоянии и возмущениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1(34).

Локально-оптимальное управление дискретными системами с запаздыванием в канале управления при неполной информации о состоянии и возмущениях

Рассматривается решение задачи управления в условиях неполной информации о состоянии объекта и модели возмущений с учетом запаздывания по управлению. Предполагается, что модель, описывающая возмущение, действующее на объект, содержит неизвестные параметры. Для определения оптимального управления используется метод локально-оптимального слежения, реализованный с использованием алгоритмов калмановской фильтрации и экстраполяции с неизвестным входом.

Locally-optimal control of discrete delayed control systems with incomplete information about state and perturbations.pdf Локально-оптимальные дискретные системы управления являются частным случаем дискретного прогнозирующего управления (Model predictive control) с прогнозом на один такт. Задачи управления для объектов с запаздываниями в канале управления исследовались в работах [1-7]. В [1-4] рассматривались задачи управления на основе метода расширения пространства состояний. В работах [5-7] изучались задачи синтеза управлений для объектов с запаздыванием в канале управления и с неполной информацией о возмущениях. В [5, 6] эта задача решалась на основе принципов адаптации, при этом в [6] модель объекта задавалась в непрерывном времени. В работе [7] рассматривалась задача синтеза управления в дискретных стохастических системах с использованием методов калмановской фильтрации с учетом оценок неизвестного входа (возмущений). В настоящей работе решается задача управления в условиях неполной информации о состоянии объекта с запаздыванием по управлению при косвенных наблюдениях за возмущениями. Предполагается, что модель возмущений содержит неопределенные параметры. 1. Постановка задачи Модель объекта с запаздыванием по управлению описывается дискретным уравнением x(k +1) = Ax(k) + Bu(k - h) + Fs(k), x(0) = X0, u(j) = yr(j), j = -h,-h +1,...,(1) где x(k) e Rn - вектор состояния; u(k - h) e Rm - вектор управления; h - количество тактов запаздывания; s(k) e Rn1 - вектор возмущений, y(j) (j = -h,-h +1,...,-1) - заданный вектор; A,B,F - заданные постоянные матрицы. Предполагается, что наблюдению доступен вектор wx (k) e R1 : Wx (k) = HxX(k) + Тд (k), (2) где Hx - матрица канала наблюдений, xx (k) - гауссовская случайная последовательность. Модель возмущений содержит неизвестные переменные параметры и определяется следующим разностным уравнением: s(k +1) = (ад + AR(k))s(k) + f (k) + Af (k) + q(k) , s(0) = S0, (3) где R(k) - известная матрица, f (k)- известный вектор, AR(k) и Af(k) - некоторые неизвестные матрица и вектор, которые можно интерпретировать как ошибки определения параметров модели (3). Модель (3) представим как динамическую модель с неизвестным входом s(k +1) = R(k)s (k) + f (k) + r (k) + q(k), s (0) = s0, (4) где r (k) = AR(k )s(k) + Af (k) - вектор неизвестного входа. Косвенные наблюдения за вектором возмущений описываются следующим соотношением: ra(k) = Os (k) + x(k), (5) где ra(k) e R4 - вектор наблюдений; Ф - m^n-матрица; x(k) - случайные ошибки наблюдений. В (1) и (3) x0, s0 - случайные векторы начальных условий, независимые от q(k), x(k) и xx(k) (M{ x0} = x0, M{( x0 - x,)( x0 - x^} = P0, M{ s0} = s,, M{(s0 - s,)( s0 - ^,)Т} = p0); q(k), x(k), xx(k) - независимые гауссовские случайные последовательности с характеристиками: M{ q(k) } = 0, M{ x(k) } = 0, M{ xx(k) } = 0, M{ q(k)qT (j) } = Qbj, M{ x(k)x(j)T } = Tb^, M{ xx(k)xx(j)T } = Tx5„., (6) - символ Кронекера, Т - символ операции транспонирования. Требуется построить такое управление, чтобы вектор выхода системы w(k) e Rn , w(k) = Hx(k) отслеживал значение заданного вектора z(k) e Rn. 2. Синтез локально-оптимального управления Сначала определим управление, отслеживающее заданный вектор z(k). Предположим, что все компоненты вектора x(k) и s(k) измеряются точно. Тогда оптимизируемый локальный критерий будет иметь вид I(k) = M{(w(k +1) - z(k))TC(w(k +1) - z(k)) + uT (k - h)Du(k - h)/Sk0,X0k}, (7) где C > 0, D > 0 - весовые матрицы; z(k) - заданный отслеживаемый вектор; S0k = {s(0),s(1),...,s(k)}, X 0k = {x(0), x (1),..., x (k)}. Вычислим значение критерия (7): I(k) = u T (k - h)(BTHTCHB + D)u (k - h) + u T (k - h)BTHTC(HAx(k) + +HFs(k) - z(k)) + (HAx(k) + HFs(k) - z(k))T CHBu(k - h). (8) Оптимальное управление определим из условия dI(k) = 0. (9) du(k - h) Тогда, в силу (9), получим уравнение (BTHTCHB + D)u(k - h) + BTHTC(HAx(k) + HFs(k) - z(k)) = 0. (10) Выражая u(k - h) из (10), получаем управление в следующем виде: u(k - h) = -(BTHTCHB + D)-1 BTHTC(HAx(k) + HFs(k) - z(k)). (11) Далее, учитывая (1), имеем равенства x(k) = Ax(k -1) + Bu(k - h -1) + Fs(k -1), x(k -1) = Ax(k - 2) + Bu(k - h - 2) + Fs(k - 2), x(k - h +1) = Ax(k - h) + Bu(k - 2h) + Fs(k - h). (12) Тогда для вычисления вектора x(k) из системы (12) получим следующую формулу: x(k) = Ahx(k - h) + ]Г A'-1 Bu(k - h - i) + ]T Ai-1Fs(k - i). (13) Учитывая (13), локально-оптимальное управление (11) представим в виде u(k - h) = -(Б1 HTCHB + D)1 BTHTC(HAh+1 x(k - h) + h h +£HAiBu(k - h - i) + £HAiFs(k - i) - z(k)). (14) i=1 i=0 Управление (14) формируется в момент времени k - h , и для его реализации необходимо знать состояние x(k - h), возмущение s(k - h) и прошлые значения управлений u(k - h - i), а также необходимо вычислять прогноз возмущений для моментов времени k, k- 1,..., k- h + 1. Построим управление для случая неполной информации об аддитивном возмущении s() и о состоянии объекта x(-). Управление в этом случае определим на основе принципа разделения, используя оценки фильтрации компонент x(-) и s() и оценки прогноза для вектора s(). В результате для текущего времени (k - h) получим h u(k - h) = -(BTHTCHB + D)-1 BTHTC(HAh+1 xf (k - h) + £HAiBu(k - h - i) + i=1 h-1 +HAhFsf (k - h) + £HAlFsp (k - i) - z(k)), (15) i=0 где s f (k - h) и xf (k - h) - оценки фильтрации, которые определяются с помощью алгоритма оптималь ной калмановской фильтрации: sf (k - h) = R(k - h -1)sf (k - h -1) + f (k) + r(k - h -1) + Kf (k - h)[&(k - h) - -Ф( R(k - h-1)sf (k - h-1) + f(k) + r(k - h-1))], sf (0) = S0, (16) Kf (k - h) = P(k - h / k - h - (ФP(k - h / k - h - 1^T+ T)1, (17) P(k - h / k - h -1) = R(k - h -1)P(k - h -1)R(k - h -1)T+ Q, (18) P(k-h) = (E -Kf(k-К)Ф)Р(к-h/k-h-1), P(0) = P0. (19) xf (k - h) = Axf (k - h -1) + Bu (k - 2h -1) + Fsf (k - h -1) + rx (k - h -1) + Kx (k - h)[w(k - h) - -Hx (Axf (k - h -1) + Bu(k - 2h -1) + Fsf (k - h -1) + rx (k - h -1))], x(0) = x0, (20) Kx (k - h) = Px (k - h /k - h -1)HT (HPx (k - h /k - h -1)HT + Tx)-1, (21) Px(k - h/k -h -1) = APx(k - h -1)AT, (22) Px (k - h) = (E^ - Kx (k - h)H)Px (k - h / k - h -1), P (0) = P0, (23) где Erh - единичная матрица размерности щ. В (19) введена оценка вектора неизвестного входа rx (k); так как в исходной модели (1) s(k) точно не наблюдается, то введение в модели (1) аддитивного неизвестного вектора (вектора ошибок) rx (k) и последующая его оценка позволят обеспечить компенсацию ошибок, возникающих в модели объекта (1) из-за использования оценок s(k) при формировании управления. При определении управления (14) требуется вычислять также оценки и в моменты, большие, чем (k - h) (оценки прогноза), поэтому здесь воспользуемся экстраполятором, который позволит найти оценку возмущения с прогнозом на один такт sp (k - h +1): s"p (k - h +1) = R(k - h)sp (k - h) + f (k - h) + r(k - h) + +Kp (k - h)(©(k - h) - Фsp (k - h)) , sp (0) = s0, (24) Kp (k - h) = R(k - h) Pp (k - И)ФТ ^Pp (k - К)ФТ + T)-1, (25) Pp (k - h +1) = (R(k - h) - Kp (k - И)Ф) Pp (k - h)(R(k - h) - Kp (k - h^)T + +Q + Kp (k - h)TKT (k - h), Pp (0) = Ps0 , (26) а оценки sp (k - h + j) для j > 2 определятся по формулам sp (k - h + j) = R(k - h + j - 1)sp (k - h + j -1) + f (k - h + j -1) + f(k - h + j -1). (27) В (16) и (24) оценка r(-) вычисляется по методу наименьших квадратов на основе минимизации критерия [8]: •Л =1 {{ +l|r(i -MIW (28) i=1 где х(') = ®(i) -Ф^О - 1)-?f (i -1) + f(i -1)), p = k - h -1, V > 0, Ж > 0 - весовые матрицы соответствующих размерностей, ||х(')|V = XT (i)Vх('). В этом случае оценка имеет вид r(k - h -1) = VФ + W]-1 ФT V{ю(k - h) - Ф[R(k - h -1)s(k - h -1) + f (k - h -1)]}, (29) которая учитывается при определении оценок sf и s , вычисляемых по формулам (16), (24). Отметим, что в (24) используется оценка r(k - h), которая вычисляется по оценке (29) с использованием прогноза на один такт, здесь можно воспользоваться, например, методами прогнозирования временных рядов. По аналогии с (29) находится оценка неизвестного входа rx (k), минимизируя следующий критерий: •=!{lk (Oil; +1Г (i - €x (30) i=1 где xx (i) = wx (i) -Ф(AX(i -1) + Bu(i - h -1) + F§f (i -1)), Vx > 0, Wx > 0 - весовые матрицы, получим оценку r (k -h -1) = Sx[wx (k -h) -Hx(Axf (k - h -1) + Bu(k - 2h -1) + Fsf (k - h -1)], (31) S = (HTV H + Ж)-1 HrV . X Vxxx X ' XX Отметим, что для построения оценок неизвестных входов можно также использовать методы, предложенные в работах [9-12]. 3. Результаты моделирования Рассмотрим модель объекта для следующих исходных данных: (0,75 0 ^ ( 0 1 ^ , R(k) = R = A = 0,1 0,79 Q = diag{0,05 0,02}, T = diag{0,04 0,06}, v 0,2 0,6 , B = H = F = C = V = P0 = Vx = E2, D = Ж = Wx = 0, z = (20 17)T , '0,4, если 0 < k < 10, Г 0,4, f1(k) = ^-0,4, если 10 < k < 20, f2(k) = J -0,4, 0,4, если 20 < k < 30, [ 0,4, Алгоритм управления исследовался для следующей матрицы AR и компонент вектора Af (k): 0,1sin(k) + 0,1, если 0 < k < 10, если 10 < k < 20, если 20 < k < 30, v0,04 0,05J 4/2 (k) = ( 0 0,03^ AR(k) = AR = , Af1(k) = ^ 0,1sin(k) + 0,1, 0,1sin(k) - 0,1, 0,1sin(k) - 0,1, если 0 < k < 10, 0,1sin(k) + 0,1, если 10 < k < 20, 0,1sin(k) - 0,1, если 20 < k < 30. если 0 < k < 10, если 10 < k < 20, если 20 < k < 30. Рис. 1. Компоненты вектора состояния: 1 - компоненты отслеживаемого вектора; 2 - компоненты вектора состояния для управления (14)-(25); 3 - компоненты вектора состояния для управления (14), когда в фильтрах (14)-(25) не используются оценки неизвестных входов Рис. 2. Компоненты вектора управления: 1 - компоненты вектора управления для алгоритма, использующего оценки неизвестных входов (14)-(25); 2 - компоненты вектора управления для алгоритма (14), не использующего оценки неизвестных входов Результаты моделирования показали, что исключение оценок неизвестных входов в используемых алгоритмах фильтрации и экстраполяции приводит к значительному снижению точности слежения или к срыву слежения. Заключение Предложен алгоритм локально-оптимального управления для дискретной стохастической системы с запаздыванием по управлению, функционирующей в условиях неполной информации о модели возмущений и компонентах вектора состояния. Показано, что применение в алгоритмах фильтрации и экстраполяции с учетом оценок неизвестного входа приводит к повышению точности отслеживания компонент заданного вектора.

Ключевые слова

дискретные системы, локальный критерий, запаздывание по управлению, неполная информация, discrete system, local criteria, delayed control, incomplete information

Авторы

ФИООрганизацияДополнительноE-mail
Ким Константин СтаниславовичТомский государственный университетмагистрант кафедры исследования операцийkks93@rambler.ru
Смагин Валерий ИвановичТомский государственный университетпрофессор, доктор технических наук, профессор кафедры исследования операцийvsm@mail.tsu.ru
Всего: 2

Ссылки

Дегтярев Г. Л., Ризаев И.С. Синтез локально-оптимальных алгоритмов управления летательными аппаратами. М. : Машино строение, 1991. 304 с.
Mohammad S., Modarres S., Karbassi S.M. Time-optimal control of discrete-time linear systems with state and input time-delays // Int. Journal of Innovative Computing, Information and Control. 2009. Vol. 5, No. 9. P. 2619-2625.
Tehrani H.A., Ramroodi N. Eigenvalue assignment of discrete-time linear systems with state and input time-delays // AIJ-MISC. 2013. Vol. 45, No. 2. P. 23-30.
Киселева М.Ю., Смагин В.И. Управление с прогнозирующей моделью с учетом запаздывания по управлению // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2 (11). С. 5-12.
Смагин В.И., Смагин С.В. Адаптивное управление запасами с учетом ограничений и транспортных запаздываний // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2008. № 3 (4). C. 19-26.
Пыркин А.А. Адаптивный алгоритм компенсации параметрически неопределенного смещенного гармонического возмуще ния для линейного объекта с запаздыванием в канале управления // Автоматика и телемеханика. 2010. № 8. С. 62-78.
Kiseleva M.Yu., Smagin V.I. Model predictive control for linear discrete-time systems with time delays and unknown input // Com munications in Computer and Information Science (CCIS-487). Springer International Publishing Switzerland, 2014. P. 181-188.
Janczak D., Grishin Yu. State estimation of linear dynamic system with unknown input and uncertain observation using dynamic programming // Control and Cybernetics. 2006. No. 4. P. 851-862.
Hsieh C.-S. On the optimality of two-stage Kalman filtering for systems with unknown inputs // Asian Journal of Control. 2010. No. 4. P. 510-523.
Witczak M. Fault diagnosis and fault-tolerant control strategies for non-linear systems. Chapter 2. Unknown input observers and filters // Lecture Notes in Electrical Engineering. Springer International Publishing, Switzerland, 2014. P. 19-56.
Смагин В.И., Смагин С.В. Фильтрация в линейных дискретных нестационарных системах с неизвестными возмущениями // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 3 (16). С. 43-51.
Смагин В.И. Оценивание состояний нестационарных дискретных систем при неизвестном входе с использованием компенсаций // Изв. вузов. Физика. 2015. Т. 58, № 7. С. 122-127.
 Локально-оптимальное управление дискретными системами с запаздыванием в канале управления при неполной информации о состоянии и возмущениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1(34).

Локально-оптимальное управление дискретными системами с запаздыванием в канале управления при неполной информации о состоянии и возмущениях | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1(34).