Получено аналитическое решение динамической задачи оптимального управления двухсекторной экономикой на конечном интервале времени. Управление заключается в распределении произведённого продукта на накопление (инвестирование) и непроизводственное потребление. Задача состоит в выборе такого управления, при котором обеспечивается максимум суммарного потребления за планируемый конечный интервал времени. Решение получено с помощью принципа максимума Понтрягина. Найдена магистраль - участок сбалансированного равновесного состояния экономики. Решены задачи оптимального выхода на магистраль и оптимального схода с магистрали. Во всех случаях управления оказываются кусочно-постоянными.
Optimal control two-sector economy.pdf В модели двухсекторной экономики рассматриваются два сектора с различными технологиями производства продукции [1-4]. Обычно в одном из секторов производятся средства производства, а в другом - предметы потребления. Управление экономикой состоит в распределении произведенного продукта на инвестирование секторов экономики и на непроизводственное накопление. Задача заключается в выборе такого управления, при котором обеспечивается максимум непроизводственного накопления за планируемый конечный интервал времени. С помощью принципа максимума Понтрягина получено аналитическое решение задачи. Найдена магистраль - участок сбалансированного равновесного состояния экономики. Решены задачи оптимального выхода на магистраль и оптимального схода с магистрали. На всем интервале времени управления оказываются кусочно-постоянными. 1. Постановка задачи Оба сектора экономики характеризуются следующими величинами: к, - основной капитал, lt - трудовые ресурсы и Yi(ki,li) - производственные функции (i = 1,2). Значение Y = Yi(ki,li) есть валовой продукт, произведенный i-м сектором в единицу времени, т.е. YAt есть валовой продукт, произведенный за время At. В результате получаем систему уравнений, описывающую поведение двухсекторной экономики: к =-^ к +wb к1(0)=kw >о, к2 = - Ц2к2 + W2, к2(0) = к20 >0, (1) С = 5С + W3, С(0) = 0. Здесь C(t) - непроизводственное потребление, ц- (>0) - коэффициенты амортизации, 5 (>0) - норма дисконтирования, W1, W2, W3 - доли произведенного валового продукта, направленные на инвестирование секторов экономики и на увеличение непроизводственного потребления. Если считать, что все трудовые ресурсы постоянны и равны l0, то А = Ш0 и l2 = (1 -S)l0, где S -коэффициент перераспределения. Управление двухсекторной экономикой заключается в выборе величин W1, W2, W3 и S. Возможны два варианта распределения произведенного валового продукта: 1. W1, W2, W3 - доли суммарного валового продукта, произведенного обоими секторами, т.е. Wi = uiY (l = 1,2,3), Y = Y1+Y2, u1+u2+u3 = 1, 0 < ul < 1, u3 = 1-u1-u2. (2) 2. Валовой продукт, произведенный каждым сектором, распределяется раздельно, т.е. Wi = ulXY+ul2Y2 (l = 1,2,3), где где Щк+Щк+Щк = 1, о < uik< 1, u3k = 1-щк -u2k, l = 1,2,3, k = 1,2. Например, в модели, приписываемой К. Марксу, продукт, произведенный в 1-м секторе, идет на инвестирование 1-го и 2-го секторов. Продукт, произведенный во 2-м секторе, идет на инвестирование 2-го сектора и на увеличение непроизводственного потребления. В этом случае u31 = u12 = 0. Далее будем рассматривать только 1-й вариант. При этом для простоты будем предполагать, что трудовые ресурсы постоянны и не перераспределяются между секторами. В этом случае непроизводственное потребление на интервале времени [0,Т] равно Т Т J = J q5(T-t )W3 (t )dt = J e5 (Т-t )(1 - u1 - u2)Y (t )dt. (3) о 0 Основная задача: в течение интервала времени [0,Т] найти такие управления ul (l = 1,2,3) с учетом (1) и (2), при которых функционал (3) максимален. Производственные функции выбираются в форме Кобба-Дугласа Yi (kl , li ) = Alkallfl (l = 1,2). Здесь Al - масштаб темпа производства (Al > 0), al - коэффициент эластичности по основным фондам, pl - коэффициент эластичности по трудовым ресурсам, причем al+pl = 1, al, pl > 0, pl = 1-al. Поскольку трудовые ресурсы предполагаются постоянными, то Yl (kt , lt) = Aikal на всем интервале времени. 2. Применение принципа максимума Понтрягина При применении принципа максимума Понтрягина сначала на основании (1) и (3) составляется функция Гамильтона Н ^^ k2, P2, ul, u2) = = p1( - ц1 k1 + u1Y) + p2( - ц2 k2 + u2Y) - e5(T-t)(1 - u1 - u2)Y, где p1(t) и p2(t) - вспомогательные переменные, которые удовлетворяют уравнениям rlH p, =-- = № -Yl'[u1 p +u2p2 -e5(T-t)(1 -u1 -u2)], p,(T) = 0. (5) dkt dY Здесь Y' = -L = a lAlklal -1, l = 1,2. l 8k, l l ' Удобно ввести новые вспомогательные переменные ql(t) = pl(t)e-5(T-t), l=1,2. Тогда вместо (4) получаем (4) Н (k1, k2, p1, p2, u1, u2) = e-5(T-t} H k, k2, qb q2, u1, u2) = = -q1 M1 k1 - q2 Ц2 k2 + Y[u (q1 +1) + u2 (q2 +1) -1], где согласно (5) переменные ql(t) удовлетворяют уравнениям qt = X,q,q +1) + u2(q2 +1)-1], q,(T) = 0. (7) Здесь Xt = 5+v, t = 1,2. Функция Гамильтона (6) линейна относительно u1 и u2. Поэтому при q1(t)+1^-0 и q2(t)+1^-0 минимум этой функции достигается в угловых точках симплекса (2): u1(t) = u2(t) = 0, u3(t) = 1 при q1(t)> -1 и q2(t) > -1, u1(t) = 1, u2(t) = u3(t) = 0 при q1(t)< -1 и q2(t) > -1, u1(t) = 0, u2(t) = 1, u3(t) = 0 при q1(t)> -1 и q2(t) < -1. 3. Магистраль Согласно общей теории в случае, когда функция Гамильтона линейна относительно управлений, возможно особое управление u1 и u2. Особое управление [5] существует на некотором интервале времени [t\, t2], если на всем этом интервале коэффициент при этом управлении в Н тождественно равен нулю. Согласно (6) особые управления uioc и u2oc существуют на некотором интервале времени [t1, t2], если qi(t) = q2(t) = -1, т.е. функция H не зависит от управлений. Для этого необходимо равенство нулю первой и второй производных функций q1(t) и q2(t). Равенство нулю первых производных функций q1(t) и q2(t) при q1(t) = q2(t) = -1 приводит к условиям Y = X, или kPt = aA, t = 1,2. (8) , , ,oc X, Равенство нулю вторых производных функций q1(t) и q2(t) при q1(t) = q2(t) = -1 и q1 = q2 = 0 приводит к условиям 1с1 = к2 = 0. Отсюда V-ki = t = 1,2. loc Y С учетом (8) можно показать, что u1oc+u2oc < 1, т.е. особое управление всегда удовлетворяет условию (2). Интервал времени [t1, t2], в течение которого имеет место особое управление, соответствует участку сбалансированного равновесного состояния экономики, который называется магистралью. На этом интервале переменные k1 и k2 и управления u1 и u2 постоянны. Непроизводственное потребление на интервале времени [t1, t2] равно J = je5(-T-t}(1 -u1oc -u2oc)Y(t)dt = (1 -u1oc -u2oc)Y h gS(T-h) -es(T-t2) 5 где Y = Y1+Y2 и согласно (8) Yt = a, a (a,A, TPt , t = 1,2. Xt / Возможен еще вариант, когда на некотором интервале [t', t'] одно управление особое (частная магистраль), а другое - неособое. Из (2) следует, что в этом случае неособое управление обязательно равно нулю. Если на интервале [t', t"] управление u1 особое, то u2 = 0. При этом q1(t) = -1, q2(t) > -1 и переменная k2 убывает. Если на интервале [t', t"] управление u2 особое, то u1 = 0. При этом q2(t) = -1, q1(t) > -1 и переменная k1 убывает. Предположим, что на интервале [t1, 12] существует магистраль, т.е. оба управления особые. Тогда остается выбрать управления на интервале [0, t\] - выход на магистраль, и на интервале [t2, Т] -сход с магистрали. 4. Выход на магистраль На интервале времени [0, t1] получается краевая задача для уравнений (1) с граничными условиями М(0) = kw, k2(0) = k2o, (9) k^) = k1oc, k"2(t0 = k2oc. (10) При этом длина интервала [0, t1] неизвестна. Она зависит от условий (9), (10) и параметров задачи. Напомним, что при и, = 1 функция k(t) растет, а при и, = 0 убывает. Среди всех решений уравнений (1) можно выделить такие, которые заканчиваются в конечных точках (10). Более того, можно выделить решения, которые заканчиваются в (10) при управлениях и1 = 1, и2 = 0 или и1 = 0, и2 = 1 на всем интервале [0, t1]. Эти решения можно получить в результате интегрирования уравнений (1) в обратном времени с граничными условиями (10). В результате получаются нижние и верхние траектории: N1(t) и B2(t) в случае, когда и1 = 1, и2 = 0, и N2(t) и B1(t) в случае, когда и1 = 0, и2 = 1. При этом все другие решения лежат между этими кривыми, т.е. N(t) < k,(t) < B,(t) = k^(h-t\ i = 1,2. По аналогии с задачей оптимального быстродействия эти кривые назовем линиями переключения. Очевидно, что в конце интервала [0, t1] система должна двигаться по этим линиям, чтобы попасть в точку (10). Поэтому получается следующее решение. Интервал [0, t1] разбивается на две части [0, t'] и [t', t1]. Далее возможно два варианта. А. Управления выбираются в виде 1 при 0 < t < t', (11) Рис. 1. Выход на магистраль а 0 и2 = 1 t' и2 = 0 б [0 при 0 < t < t', и и =■ [0 при t' < t < t1 [1 при t' < t < t1. В результате получаем решение, представленное на рис. 1, а. При этом k1(t ) = X11(0, t;k10,k2o), k2(t ) = X20(0, t;k20) = k20e ^ , k1(t1) = Xw(t', t1; k1(t')) = k1(t ')e-^ -t'} = k1oC, k2(t1) = X21(t', t1; k1(t'), k2(t')) = k2oC . Здесь Xi1(s,t; k1(s), k2(s)) - решение i-го уравнения (1) на интервале времени (s,t) при и, = 1; Xi0(s,t; k,(s)) = kt (s)e-^' (t-s) - решение i-го уравнения (1) на интервале времени (s,t) при и, = 0. Исключая из этих уравнений k1(t') и k2(t'), получаем два уравнения для нахождения t' и t1. Б. Управления выбираются в виде Г0 при 0 < t < t', Г1 при 0 < t < t', u1 =< и u2 = ^ (12) [1 при t' < t < t1 [0 при t' < t < t1. В результате получаем решение, представленное на рис. 1, б. При этом k1(t ) = X11(0, t;k10,k2o), к2(t ) = X20(0, t;к20) = k20e *2 , k1(t1) = Xw(t', t1; k1(t')) = k1(t ')e-^1(t1 -t,) = кюс, k2(t1) = X21(t', t1; k1(t'), k2(t')) = k2oo . Исключая из этих уравнений k1(t') и k2(t'), получаем два уравнения для нахождения t' и t1. Таким образом, выход на магистраль осуществляется за счет релейного управления с одним моментом переключения. При управлениях (11) или (12) u3 = 0, т.е. накоплений нет и нет оптимизационной задачи. Поэтому переменные q1(t) и q2(t) нас не интересуют. Из решений А и Б следует выбрать то, при котором значение t1 наименьшее. Это связано с тем, что на интервале [0, t1] нет накоплений и его следует взять максимально коротким. 5. Сход с общей магистрали На интервале времени [t2, Т] получается краевая задача для уравнений (1) и (7) с граничными условиями q1(t2) = q2(tl) = -1, M(t2) = k1oc, k2(t2) = k2oc, (13) q1(T) = q2(T) = 0. (14) При этом длина интервала [t2, Т] неизвестна. Пусть u1 = u2 = 0. Тогда из (1) получаем, что на интервале [t2, Т] к, (t) = k^e-*(t-Ч i = 1,2, и с учетом (8) Yi = ajAikai 1 = X, ePi*(-t2). Подставляя последнее в (7), получаем q, = X,q, + X, ePi*(t-t2) = X, (q, + ePi* ("2)), i = 1,2. Поскольку на интервале [t2, Т] -1 < qi 1, то qt > 0 и эти функции растут. Решение этих уравнений с учетом (13) следующее: qt (t) = -eXi(t-t2) + X, J eX (t-x)eP"*(x-2) d x = t2 (15) = -eXi (t-t2 ) | 1 + * /eXi (t-t2) _ePI.*I. (t-t2) \ 5 + a, ' i = 1,2. Поскольку параметры задачи разные, то функции q1(t) и q2(t) растут по разному и достигают значения 0 в разные моменты времени. Поэтому значения t2 должны быть разными. Подставляя (15) в (14), получаем (Т) = 5 + * (eXi(Т^) - epi*(Т^) ), i = 1,2. (16) eX 5 + a,* ^ ' ep,*(Т-t2i) р,* ex,.(Т-t2i), , = 1,2. Решение этого уравнения проводится следующим образом. Из (16) следует P, ц, (T-t2,) = X, (T- t2l) + ln 5 + a, ц, и окончательно ^5 + a,.ц, ^ P, Ц, 1 -ln T - t2l = i = 1,2. 5 + a, ц, Пусть функция q1(t) растет медленнее, чем q2(t), т.е. T- t21 >T- t22. В этом случае должно быть следующее решение задачи. Полагаем t21 = t2. На интервале [t2, Т] управление u1 = 0, а управление u2 строится в виде \и2ос При t2 < t < [ 0 при t22 < t < T. При таком управлении на интервале [t2, t22] функция q2 постоянна и равна -1. На интервале [t22, Т] функция q2 переходит из значения q2(t22) = -1 в значения q2(T) = 0 (рис. 2). Рис. 2. Сход с магистрали Таким образом, при сходе с магистрали одно управление равно нулю, а другое является релейным. Непроизводственное потребление на интервале времени [t2, t22] равно ^22 J = J е5(Т-^ - u2oc)((e-^-'^ + A2k%c)dt, а на интервале [t2, t22] равно Т J = J е5(Т-'} (A1k1ao1ce-a1H'1(t-+ A2k2ao2ce-a^(t-)t. f22 Эти интегралы легко вычисляются. Аналогичное решение получается, когда функция q1(t) растет быстрее, чем q2(t). Заключение Решена задача оптимального управления двухсекторной экономикой на конечном интервале времени. На всем интервале времени управления оказываются кусочно-постоянными. Выделяются три временных интервала: выход на магистраль, магистраль и сход с магистрали. Выход на магистраль осуществляется за счет релейного управления с одним моментом переключения. При этом на этом интервале непроизводственных накоплений нет. На магистрали капитал каждого сектора и управления постоянны. При сходе с магистрали произведенный продукт инвестируется только в один сектор экономики в зависимости от параметров задачи. На основании полученных результатов можно сформулировать необходимые условия существования оптимального управления в рассматриваемой задаче, т.е. ограничения на длину интервала [0, Т], начальные условия и параметры модели. Эти условия связаны с необходимостью выполнения неравенств 0 < ti < t2 < T. В частности, требуется, чтобы интервал [0, Т] был достаточно большим.
Ашманов С.А. Введение в математическую экономику. М. : Наука, 1984.
Колемаев В.А. Математическая экономика. М. : ЮНИТИ, 1998.
Лобанов С.Г. К теории оптимального экономического роста // Экономический журнал ВШЭ. 1999. № 1. С. 28-41.
Минюк С.А., Ровба Е.А., Кузьмич К.К. Математические методы и модели в экономике. Минск : Тетра-Системс, 2002.
Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М. : Наука, 1973.