Разрабатывается численный алгоритм поиска приближенного решения задачи оптимального управления химическим процессом с терминальными ограничениями. Сформулирована в общем виде постановка задачи оптимального управления для химического процесса с ограничениями на параметр управления и фазовые переменные. Для ее решения описан пошаговый алгоритм, в основу которого положены метод штрафов и генетический алгоритм. Проведена апробация алгоритма на примере реакции аминометилирования тиолов. Определены приближенные оптимальные концентрации веществ и приближенный оптимальный температурный режим, обеспечивающий близкий к максимальному выход целевого продукта реакции при выполнении терминальных ограничений. Вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.
Algorithm for finding an approximate solution of the problem of optimal control of a chemical process in the presence of.pdf Одной из важнейших задач математического моделирования химических процессов является задача определения оптимальных условий их ведения, а также создание автоматизированных комплексов для их расчета. Математическую модель химического процесса можно представить системой обыкновенных дифференциальных уравнений [1], включающей в себя фазовые переменные, определяющие состояние процесса, но не поддающиеся непосредственному воздействию, и управляющие параметры, которые можно варьировать и влиять тем самым на течение процесса. В качестве фазовых переменных для химических процессов можно выбрать концентрации веществ, количество веществ, адсорбированных на катализаторе, давление, температуру и т.д. Параметрами управления могут быть температура, скорость подачи или состав реакционной смеси. Поиск оптимальных способов ведения химических процессов приводит к задачам оптимального управления, включающим ограничения на фазовые переменные и управляющие параметры, 5 Управление динамическими системами / Control of dynamical systems поскольку их допустимые значения ограничены технологическими пределами. Если ограничения на переменные состояния заданы в конечный момент времени функционирования системы, то такие ограничения являются терминальными ограничениями. Наличие ограничений на фазовые переменные существенно усложняет поиск решения оптимизационных задач, в том числе и в ходе компьютерной реализации численных методов поиска оптимального управления. Поэтому разработка алгоритмов и программ для решения задач оптимального управления с фазовыми ограничениями является актуальной проблемой и представляет практический интерес. Общая схема вывода условий оптимальности для задач оптимального управления с ограничениями, накладываемыми на фазовые переменные, получена в работах [2, 3]. Однако при практической реализации данного подхода возникают трудности, связанные с исследованием свойств решений и разработкой численных алгоритмов для их расчета. Для построения реализуемых алгоритмов решения задачи оптимального управления с фазовыми ограничениями нередко применяют метод штрафов [4]. Основная идея данного метода состоит в замене задачи с ограничениями на задачу без ограничений путем добавления «штрафа» к критерию оптимальности, последовательность решений которой дает решение исходной задачи. В работе [5] показано решение задачи оптимального управления на основе метода штрафов, при этом решение задачи без ограничений найдено с помощью градиентного метода. Однако решения, найденные градиентными методами, зависят от выбора начальной точки поиска решения, что создает дополнительные трудности, поскольку от исследователя требуется знание некоторого приближения этой начальной точки хотя бы из физических соображений поставленной задачи. Математическое описание химического процесса представляет собой систему нелинейных дифференциальных уравнений, причем высокой размерности, связанной со сложностью процесса. Это создает ряд трудностей для применения некоторых методов оптимизации, например линейного и динамического программирования [6-8]. Наличие ограничений на фазовые переменные и управление затрудняет использование методов вариационного исчисления. Преодолеть перечисленные трудности можно путем применения генетических алгоритмов. Генетические алгоритмы позволяют найти приближенное решение задачи оптимального управления, но которое при этом является приемлемым с практической точки зрения. В процессе поиска решения оптимизационной задачи с помощью генетических алгоритмов обрабатывается одновременно несколько точек пространства поиска, в отличие от традиционных методов, в которых осуществляется последовательный переход от точки к точке [9, 10]. Данная особенность генетических алгоритмов позволяет преодолеть попадание решения в точку локального экстремума полимодальной целевой функции. В процессе работы генетических алгоритмов не требуется вычисления производной целевой функции, а также отсутствуют требования ее непрерывности и непрерывности производных. Важным достоинством генетических алгоритмов является независимость найденного решения от начального приближения. Показателями эффективности работы генетического алгоритма являются скорость и устойчивость поиска. Скорость работы генетического алгоритма определяется временем, затрачиваемым на достижение заданного количества итераций или качества популяции. Устойчивость поиска определяется возможностью преодоления попадания в точки локальных экстремумов, а также способностью из поколения в поколение повышать качество популяции. Кроме того, генетические алгоритмы можно легко модифицировать для разных процессов и задач, изменяя количество фазовых переменных и параметры управления. 1. Постановка задачи Сформулируем задачу поиска оптимального температурного режима химического процесса с терминальными ограничениями. Пусть динамика химического процесса на интервале [0, tend] описывается следующей системой обыкновенных дифференциальных уравнений [11]: dx -x- = fi (x(t ),T (t), t) (1) dt 6 Антипина Е.В., Мустафина С.А., Антипин А.Ф. Алгоритм поиска приближенного решения с начальными условиями xi (0) = x0, i = 1, n, (2) где x(t) = (xr(t),x2(t),...,xn(t))T - вектор концентраций (фазовых переменных), T(t) - температура (параметр управления), t - время, fi(x(t),T(t),t) - непрерывные вместе со своими частными производными функции. Управление T(t) принадлежит классу кусочно-постоянных функций T(t) = Tj, t е [tj, tj+1], j = 0, N, где N - число моментов переключений при разбиении t0 < t1 < t2 0, если ограничения (3) не выполняются. Если ограничения (3) нарушены и qk ^ да при к ^ да, то G(T, qk) ^ да при к ^ да. В качестве штрафной функции рассмотрим функцию вида: G(T, q ) = ^qk f r m V j ПҚ (x)]2 1 + 2 [h+ (x)]2 ' =r+1 где hj (x) - срезка функции, определяемая по правилу: hj (x) = 0, если hj (x) < 0; hj (x) = hj (x), если hj (x) > 0. 7 Управление динамическими системами / Control of dynamical systems Задача оптимального управления (1)-(5) с терминальными ограничениями сводится к задаче оптимального управления без ограничений путем поиска управляющего параметра T*(t), который доставляет минимум критерию оптимальности (6). При этом на каждой итерации метода штрафа найденный вектор T(t) является начальным для следующей итерации. Для решения задачи без ограничений воспользуемся генетическим алгоритмом. Работа генетического алгоритма заключается в последовательной смене поколений особей, при котором наследуются лучшие свойства родителей и приобретаются новые полезные свойства, позволяющие выживать наиболее приспособленным особям. Будем применять генетический алгоритм с вещественным кодированием (Real-Coded Genetic Algorithm, RGGA) [13], поскольку применение вещественного кодирования повышает точность решения и скорость поиска глобального экстремума за счет отсутствия операций кодирования-декодирования. Пусть математическим аналогом особи выступает параметр управления (температура) T = Tn), где T будем называть геном, T = T(11), 11 e[0,tend] (i = 1,N): tl+l > t, Vi = 0,N, t0 = 0, tN+1 = tend. Тогда в качестве популяции из P живых организмов будем рассматривать набор векторов Tj = (Tj0,Tj1,...,TjN), j = 1,P. Функцией приспособленности будет выступать критерий оптимальности (6), для вычисления значения которого необходимо решить систему дифференциальных уравнений (1) с начальными условиями (2). Сформулируем пошаговую работу алгоритма решения задачи поиска оптимального температурного режима химического процесса с терминальными ограничениями. Шаг 1. Задать начальные параметры для метода штрафов: номер текущей итерации k = 0, начальное значение штрафа q0, параметр для увеличения штрафа S (рекомендуется выбрать число от 4 до 10 [14]), положительную константу s для окончания работы алгоритма. Задать начальные параметры генетического алгоритма: P - количество особей в популяции, N - количество генов, G_Max -максимальное количество поколений, номер текущей итерации генетического алгоритма G_k=0. Сгенерировать случайным образом на интервале [Tmm, Tmax] начальную популяцию Tj = (TJ00,Tj)1,..., Tv), j = 1, P. Вычислить для каждой особи значение функции приспособленности. Шаг 2. Селекция. На данном шаге отбираются две особи - a = (a0,a1,...,aN), b = (b0,b^...,bN) -из текущей популяции для последующего скрещивания. Оператор селекции «турнирный отбор» выполняет случайный выбор двух особей из текущей популяции и последующий случайный отбор одной особи из двух особей, выбранных на первом турнире. Шаг 3. Кроссовер. На данном шаге создаются потомки из двух особей-родителей, отобранных на предыдущем шаге. Арифметический кроссовер создает два потомка - c = (c0,c1,.,cN), d = (d0,d1,...,dN) - по правилу [10]: ci = у ai + (1 - y)b,, di = yb, + (1 - y)a,, i = 0, N, где у e (0,1) - случайное число. Шаг 4. Мутация. На данном шаге преобразуются гены потомков с целью приобретения новых генов и повышения приспособленности популяции в целом. Случайная мутация осуществляет случайный выбор гена каждого из потомков c, d и его замену случайным значением из интервала [Tmm, Tmax]. Для каждой особи необходимо вычислить значение приспособленности. Шаг 5. Обновление популяции. Случайным образом выбрать один из потомков-мутантов и поместить в текущую популяцию вместо особи с наихудшей приспособленностью. Для задачи на минимум наихудшая приспособленность есть наибольшее значение критерия оптимальности (6). Шаг 6. Проверка условия окончания работы генетического алгоритма. Если значение текущего номера итерации G_k не превышает максимального количества поколений G_Max, то увеличить счетчик итераций G_k = G_k + 1 и перейти на шаг 2. В противном случае выбрать из последней популяции особь T*(t) с наилучшим значением функции приспособленности. 8 Антипина Е.В., Мустафина С.А., Антипин А.Ф. Алгоритм поиска приближенного решения Шаг 7. Проверка условия окончания поиска решения. Если G(T (t), qk) >s, то положить qk+1 = S• qk, T^(t) = T*(t), j = 1,P, G_k = 0, k = k + 1, и перейти на шаг 2. Иначе остановить поиск. В качестве приближенного решения задачи оптимального управления (1)-(5) принять особь T*(t) из последней популяции с наилучшим значением функции приспособленности. Данный алгоритм реализован в виде программного средства в среде визуального программирования Delphi, которое позволяет пользователю осуществлять настройку параметров метода штрафов и генетического алгоритма. 3. Вычислительный эксперимент Используя сформулированный алгоритм, решим задачу поиска оптимального управления с терминальными ограничениями для реакции аминометилирования тиолов. Азот и серосодержащие органические соединения находят широкое применение в качестве эффективных средств защиты растений, антиокислительных, противокоррозионных, противоизносных присадок к топливам и маслам. Экспериментальные исследования реакции аминометилирования тиолов проводятся с помощью тетраметилметандиамина. Механизм данной реакции описывается совокупностью стадий [14]: X + Х2 -ХЪ,ХЪ + X4 -X2 + Х5 + Х6, (7) где Хі = ЩСНз)4, X2 = Sm, Х3 = ^(CHiMSm], Х4 = HSC5H11, Х5 = (CHO2NSC5H11, Хб = (CH3)2NH. Кинетические уравнения скоростей стадий определяются согласно закону действующих масс и имеют вид: (8) = kxx25 ®2 = k2x3xA где х = (Xj,x2,...,x6)T - вектор концентраций веществ (моль/л), к\\. fc - кинетические константы реакции (л/(мольч)), рассчитываемые исходя из уравнения Аррениуса: kj = ко j exp RT j = 1,2, где kcj - предэкспоненциальный множитель (л/(мольч)), Ej - энергия активации j-й стадии (Дж/моль), T - температура протекания реакции (К), R - универсальная газовая постоянная (Дж/(мольК)). Динамика концентраций веществ описывается системой дифференциальных уравнений (9) (10) j X, 1 =1,6, dxi ( ~± = ^У dt j=1 с начальными условиями X (0) = x0, i = 1,6, где (у,) - матрица стехиометрических коэффициентов веществ реакции (7). В системе дифференциальных уравнений (9) фазовыми переменными являются концентрации веществ xi (i = 1,6), управляющим параметром - температура в реакторе T(t). Целевым продуктом реакции (7) является вещество Х5. В связи с этим критерий задачи оптимального управления - максимальный выход Х5 в конечный момент времени протекания реакции: I(T) = x5(tend) - max. (11) Поскольку выход Х5 зависит от селективности его образования и конверсии веществ Х3, Х4, наложим на решение задачи следующие ограничения: 1) селективность образования Х5 не менее 60%: Sx5 > 0,6; (12) 2) конверсия Х3, Х4 в конце реакции составляет 90%: (13) 1 X3(tend ) + X4(tend ) =Qg x3(0) + x4(0) ’ 9 Управление динамическими системами / Control of dynamical systems Допустимые значения температуры задаются неравенством 293 К < T(t) < 333К. (14) Начальные концентрации веществ заданы значениями [14]: Хі(0) = 0,445, х2(0) = 0,223, х3(0) = 0, х4(0) = 0,367, х5(0) = х6(0) = 0. (15) Необходимо определить оптимальный температурный режим T*(t) реакции (7), описываемой системой дифференциальных уравнений (9) с начальными условиями (15), с учетом ограничений на параметр управления (14) и терминальных ограничений (12), (13), доставляющий максимальное значение критерию оптимальности (11). В ходе поиска решения поставленной задачи система дифференциальных уравнений (9) с начальными условиями (15) решалась методом Рунге-Кутты четвертого порядка. Численные значения кинетических параметров реакции аминометилирования тиолов с помощью тетраметилметандиамина приведены в работе [14]. Время протекания реакции tend = 1 ч. Генетический алгоритм для поиска безусловного экстремума применен со следующими параметрами: количество особей в популяции P = 60, максимальное количество поколений G_Max = 2000, количество генов N = 450. Для метода штрафов установлены следующие параметры: начальное значение штрафа q0 = 0,1, параметр увеличения штрафа S = 10, параметр для окончания работы алгоритма в = 0,01. Результаты расчета показали, что для обеспечения максимального выхода продукта реакции X5 и выполнения ограничений (12)-(14) необходимо на протяжении 0,75 ч удерживать температуру на постоянном уровне 298 К, а затем вести процесс оставшееся время при максимальной допустимой температуре 333 К (рис. 1). 335 330325320 - « 315 - Н ' 310 - 305- Г зоо - 295 -0.0 т-1-,-1-р-1-,-1-1-1-,-1-,-1-1-1-1-1- 0,1 ОД 0,3 0,4 0,5 0,6 0,7 0,8 0,9 t. ч Рис. 1. Субоптимальный температурный режим Fig. 1. Suboptimal temperature regime 1 1.0 Вычислены концентрации веществ, соответствующие субоптимальному температурному режиму. При соблюдении рассчитанного температурного режима концентрация целевого вещества составит 0,34 моль/л, селективность SX5 = 61%, конверсия X3, X4 в конце реакции 89,8%. Результаты расчета показателей реакции аминометилирования тиолов № T, К Селективность образования X5, % Конверсия X3, X4, % Концентрация X5, моль/л 1 293 59,1 89,7 0,217 2 303 59,9 89,9 0,307 3 313 60,1 89,6 0,311 4 323 59,8 90,1 0,317 5 333 60,2 89,8 0,321 10 Антипина Е.В., Мустафина С.А., Антипин А.Ф. Алгоритм поиска приближенного решения Для реакции аминометилирования тиолов решена прямая кинетическая задача при некоторых значениях температуры из допустимого диапазона. На основе ее решения рассчитаны значения селективности образования Х5 и конверсии веществ Хз, X4 (таблица). Видно, что концентрация целевого вещества Х5 меньше соответствующей концентрации, полученной при температурном режиме, рассчитанном с помощью сформулированного алгоритма. Заключение Таким образом, сформулированный алгоритм позволяет находить приближенное решение задачи оптимального управления химическим процессом с терминальными ограничениями и ограничениями на управляющий параметр. В основу работы алгоритма положены два метода: метод штрафов и генетический алгоритм. С помощью метода штрафов исходная задача с терминальными ограничениями сводится к задаче без ограничений на фазовые переменные. Полученная новая задача оптимального управления с новым критерием оптимальности решается с помощью генетического алгоритма. Разработанный алгоритм позволяет преодолеть трудности, возникающие в ходе решения оптимизационных задач для химических процессов, такие как нелинейность математических моделей процессов, требования непрерывности целевой функции и ее производных, большая размерность задачи. При этом найденное решение не зависит от выбора начального приближения. С помощью разработанной на основе алгоритма программы проведен вычислительный эксперимент для реакции аминометилирования тиолов. Рассчитаны субоптимальный температурный режим и соответствующие ему концентрации веществ, при которых выполняются терминальные ограничения. Приведены значения селективности целевого продукта реакции, конверсии веществ и значения критерия оптимальности при некоторых допустимых значениях температуры. Показано, что вычисленная с помощью алгоритма субоптимальная концентрация целевого вещества превосходит значения его концентраций, определенных при других температурных режимах.
Антипина Е.В., Мустафина С.А., Антипин А.Ф. Численный алгоритм идентификации кинетической модели химической реакции // Вестник Технологического университета. 2019. Т. 22, № 9. С. 13-17.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М. : Химия, 1976. 392 с.
Дикусар В.В., Милютин А.А. Качественные и численные методы в принципе максимума. М. : Наука, 1989. 144 с.
Васильев Ф.И. Численные методы решения экстремальных задач : учеб. пособие для вузов. М. : Наука, 1988. 552 с.
Jiang C., Lin Q., Yu C., Teo K.L., Duan G.R. An Exact Penalty Method for Free Terminal Time Optimal Control Problem with Continuous Inequality Constraints // Journal of Optimization Theory and Applications. 2012. V. 154. P. 30-53.
Островский Г.М., Зиятдинов Н.Н., Емельянов И.И. Синтез оптимальных систем простых ректификационных колонн с рекуперацией тепла // Доклады Академии наук. 2015. Т. 461, № 2. С. 189-192.
Santos L., Villas-Boas F., Oliveira A.R.L., Perin C. Optimized choice of parameters in interiorpoint methods for linear program ming // Computational Optimization and Applications. 2019. V. 73. P. 535-574.
Biegler L.T.Integrated Optimization Strategies for Dynamic Process Operations // Theoretical Foundations of Chemical Engineering. 2017. V. 51, № 6. P. 910-927.
Mustafina S., Antipin A., Antipina E., Odinokova E., Tuchkina L., Kolyazov K., Mustafina S. Numerical algorithm for finding optimal initial concentrations of chemical reactions // IIUM Engineering Journal. 2020. V. 21, № 1. P. 167-174.
Пантелеев А.В., Скавинская Д.В. Метаэвристические алгоритмы глобальной оптимизации. М. : Вузовская книга, 2019. 332 с.
Антипина Е.В., Антипин А.Ф. Алгоритм расчета оптимальных начальных концентраций веществ химических реакций // Вестник Технологического университета. 2017. Т. 20, № 13. С. 84-87.
Пантелеев А.В., Летова Т.А. Методы оптимизации в примерах и задачах : учеб. пособие. М. : Высшая школа, 2005. 544 с.
Herrera F., Lozano M., Verdegay J.L. Tackling real-coded genetic algorithms: operators and tools for the behaviour analysis // Artificial Intelligence Review. 1998. V. 12, № 4. P. 265-319.
Новичкова А.В. Численный анализ реакционной способности олефинов и алюминийорганических соединений на основе кинетических моделей частных и общих реакций : дис.. канд. физ.-мат. наук. Уфа, 2015. 110 с.