Рассмотрены две модели оптимального резервирования на бесконечном промежутке времени по критерию среднего времени безотказной работы.
Two problems of dynamic redundancy.pdf Задача повышения надёжности аппаратуры остаётся актуальной, несмотря на значительный прогресс в технологии изготовления отдельных блоков и усовершенствование структуры различных устройств. В данной работе анализируются поведение и свойства оптимальных стратегий включения резервных элементов по критерию среднего времени безотказной работы системы на бесконечном промежутке времени для элементов, характеристики которых остаются постоянными. Другой подход к теории резервированных систем рассматривается в [1-3]. Модель 1 Постановка задачи В работе используется модель системы с управляемым резервом, описанная в работах [4-7]. Пусть система состоит из конечного числа параллельно включенных (в смысле надежности) идентичных элементов. Через фиксированный промежуток времени А в моменты t0 = 0, t1= A, t2= 2А,... производится проверка исправности включенных в работу элементов. Время на проверку и на включение новых элементов считается пренебрежимо малым и в дальнейшем не учитывается. К моменту начала работы системы имеется r исправных элементов. Часть элементов находится в холодном резерве. Выход из строя элемента, включенного в работу, не влияет на исправность других элементов. Отказ системы наступает, если в промежутке между проверками выйдут из строя все элементы, включенные в работу. Обозначим через q вероятность отказа элемента на интервале длиной А, через p = 1 - q - вероятность безотказной работы элемента на этом же интервале А. Всюду в дальнейшем принимаем p > 0,5. Функцию K(r), определённую на множестве натуральных чисел, принимающую натуральные значения и удовлетворяющую неравенству 1 < K(r) < r, назовём стратегией резервирования. Функция K(r) имеет простой смысл: если в момент проверки имеется в наличии r исправных элементов, то в работу следует включить K(r) элементов. 2013 № 5(25) Математика и механика Требуется найти стратегию резервирования, которая максимизирует среднее время безотказной работы системы. Такую стратегию будем называть оптимальной по критерию среднего времени безотказной работы. В дальнейшем под оптимальной стратегией будем понимать стратегию, оптимальную по критерию среднего времени безотказной работы системы. Введём обозначения: K0 - стратегия, оптимальная по критерию среднего времени безотказной работы; K(r) - количество элементов, которое следует включить в работу при наличии r исправных элементов при стратегии K; T(r) - математическое ожидание времени безотказной работы при оптимальной стратегии, если в начальный момент имеется r исправных элементов. T(r,k) - математическое ожидание времени безотказной работы при следующей стратегии: имеется r исправных элементов, в начальный момент в работу включается к элементов, в последующие моменты используется оптимальная стратегия. Пусть в работу включено к элементов. Тогда до момента следующей проверки может произойти одно из к различных событий: E1, E2,..., Ек, где Ei есть событие, состоящее в том, что за время от включения системы до первой проверки выйдет из строя точно i элементов из числа включённых в работу к элементов. Вероятность наступления события Ei равна С'крк-1q'. События Е0, Е1, Е2,...,Ек образуют полную группу. Далее, для 0 < i < к—1 выполнено M(T/E) = (T(r-i) + 1). Наконец, M(TIEk) = 1. Теперь по формуле полного математического ожидания M=M [M( /п)] [8, с. 123, 124], где ^ и п - случайные величины, имеем T (r, к) =§M(T / Et)P(E) + M(T / Ek )qk ; (1) i-0 T(r, к) = |] Скрк-'q' (T(r - i) +1) + qk = £ С'крк-1q'T(r - i) +1. (2) i=0 i=0 Cигма-оператор Оператор ст [1]. В работе исследуются оптимальные стратегии с помощью линейного оператора с, который определяется соотношением ctT(r) = T(r -1). Используя с-оператор, для функции T(r,K) получаем равенство T(r,к) = к£С}срк 'q'CTT(r) +1, i =0 откуда T (r, к ) = [(p + q)k-^ст)к ]T (r) +1. (3) Назовем уравнение, содержащее сигма-оператор, с-уравнением (сигма-уравнением), а линейную комбинацию степеней с-оператора с вещественными коэффициентами - с-многочленом. Так, (3) является примером с-уравнения, а правая часть этого равенства служит примером с-многочлена. Используя с-оператор, можно получить многие свойства оптимальных стратегий резервирования. Основную роль при этом играет определение знаков сигма-многочленов. Лемма 1.1 T(r) монотонно возрастает с ростом r. Лемма 1.2. При фиксированном к < r функция T(r,k) строго монотонно возрастает с ростом r. Доказательство непосредственно следует из (2). Теорема 1. При фиксированном r функция T(r, к): 1) выпукла вверх по к в области 1 < к < к0 (r) +1, 2) принимает наибольшее значение не более чем в двух точках, 3) не возрастает при к0 (r) < к < r . Доказательство. Запишем разность Д = T(r,k+1) - T(r,k) - q[T(r,k) - T(r,k-1)] , переходя к сигма-соотношениям. Получим Д = [(p + qa)k+1 - (qa)k+1 ]T(r) -[ (p + qa)k - (qa)k ]T(r) -- q{[(p + qa)k - (qa)k ]T(r) - [(p + qa)k-1 - (qa)k-1]T(r)} = = q [ (p + qa)k - (qa)k ] (a - 1)T(r) + p(qa)k T(r) -- q2 [(p + qa)k-1 - (qa)k-1 ] (a - 1)T(r) - qp(qa)k-1T(r). Раскроем квадратные скобки и добавим и вычтем слагаемое qp(qa)k-1 (a - 1)T (r): Д = q( p + qa) k (a - 1)T (r ) - q(qa)k (a - 1)T (r) + p(qa) kT (r ) -- q2(p + qa)k-1 (a - 1)T(r) + q2 (qa)k-1 (a - 1)T(r) - qp(qa)k-1T(r) -- qp(qa)k-1 (a - 1)T(r) + qp(qa)k-1 (a - 1)T(r). Производя несложные преобразования, получим q(p - q)[T(r -1,к -1) - T(r,к -1)] + q2[T(r - 2,к -1) - T(r -1,к -1)] + + 2pqk [T(r - к) - T(r - к +1)] < 0, так как по принятому соглашению q 0. Итак, T(r, к +1) - T(r, к) - q [T(r, к) - T(r, к -1)] < 0 . (4) Из этого неравенства следует, что когда T(r, к) - T (r, к -1) > 0, то [T(r, к +1) - T(r, к)] - [T(r, к) - T(r, к -1)] < 0. Это означает, что T(r, к) выпукла по к при 1 < к < k0(r) +1, где k0(r) - значение к, при котором T (r, к) достигает максимума. Из (4) вытекает, что T (r, k) - T (r, к-1) < 0 влечёт T (r, к +1) - T (r, к) < 0. Таким образом, T(r,k) в области 1 < к < k0(r) +1 возрастает по к, а в области к0 (r) < к < r - убывает. Так как T(r,k) как функция от к выпукла на участке [1, k0(r)], то она принимает максимальное значение не более чем в двух точках. Следствие 1. Если T(r, k-1) < T(r,k), то к < k0(r); если T(r,k-1) > T(r,k), то к > k,(r). Теорема 2. Если Kj (r) и K2 (r) - две оптимальные стратегии резервирования, то при всех r выполнено | K1 (r) - K2 (r) | < 1. Доказательство. Пусть K1 и K2 - две оптимальные стратегии резервирования. Если для некоторого r0 имеем K1(r0) = K2(r0), то Ki(r0) - K2(r0)| < 1. Пусть Ki(r0) ^ K2(r0) и, для определённости, K1(r0) < K2(r0). Тогда по определению оптимальной стратегии T(K1(r0),r0) = T(K2(r0),r0). На промежутке [1, K2(r0)+1] функция T(r,k) выпукла. Если бы |K1(r0) — K2(r0)| > 1, то, в силу выпуклости T(r,k), между K1(r0) и K2(r0) нашлось бы натуральное к3, такое, что T(kз,r) > T(K1(r0),r0) = = T(K2(r0),r0) - противоречие. Итак, и в этом случае |K1(r0) — K2(r0)| < 1, что и требовалось. Теорема 3. Имеет место неравенство: K0 (r) > K0 (r +1) -1 Доказательство. Убедимся, что разность [T (r +1, к +1)-T (r +1, к)]- q [T (r, к)- T (r, к -1)] отрицательна. Представим это выражение как сигма-многочлен: [T (r +1, к +1)- T (r +1, к)]- q [T (r, к)-T (r, к -1)] = = [(р + qCT)k+1 - (qCT)k+1 - (р + qCT)k + (qCT)k ]T (r +1) -- qCT [(р + qCT)k - (qCT)k - (р + qCT)k-1 + (qCT)k-1 ]T (r +1) = = [(р + qCT)k+1 - (р + qCT)k ] T (r +1) - q ст[(р + qCT)k - (р + qCT)k-1 ]T (r +1) = = pq(р + qCT)k-1 (ct - 1)T (r +1) < 0. Итак, [T (r +1, к +1)-T (r +1, к)]-q [T (r, к)-T (r, к -1)] < 0 . (5) Подставим в (5) к = K0(r + 1) — 1. Получим [T(r + 1,K0 (r + 1))-T(r + 1,K0 (r + 1)-1)]-q[T(r,K0(r +1)-1)-T(r,K0(r +1)-2)] 0. Теперь по следствию 1 имеем K0(r) > K0(r +1) -1, что и требовалось. Теорема 4. K0(r) не убывает с ростом r. Алгоритм поиска оптимальной стратегии Пусть выбрана некоторая стратегия управления включением резервных элементов K (r) . Найдем стратегию K0, которая максимизирует T(r,k) . Для её нахождения воспользуемся рекуррентным соотношением T (r,k) = ^Скр^^^-i) +1. (6) i=0 В аналогичных задачах в случае конечного промежутка для отыскания оптимальной стратегии эффективен метод динамического программирования Беллма-на [9]. В случае бесконечного промежутка этот метод нуждается в модификации. Зафиксируем значение r и обозначим K0(r) = k0. Имеем kc-1 T(r) = T(k0,r) = £ Ck0 рк0 -q1 T(r - i) +1. i=0 Выделим из суммы слагаемое при i=0: к„-1 гк0^Jrr.. , „к( к0 i=1 k„-1 1 0 отсюда T(r) = - pk0) £ Ck0 pk0 'q'T(r -i) +1. (8) Теперь зададим алгоритм вычисления оптимальных стратегий. 2 p а) Очевидно, что K0(1) = 1, поэтому T (1) = pq + 2p q +... + npnq +... = —. q б) Пусть уже вычислены T(1),T(2),...,T(r-1). Ищем максимум правой части формулы (8) по всем натуральным к0 < r, и этот максимум есть значение T(r). То значение к0, к0 < r, которое доставляет максимум правой части (8), есть K0(r). Модель 2 Постановка задачи. Пусть задана система, в которой через фиксированный промежуток времени А в моменты t = 0, А, 2А, ... производится проверка исправности включённых в работу блоков. Часть блоков находится в холодном резерве. В моменты проверок некоторые блоки из резерва могут быть включены в работу, а блоки, включённые в работу, могут быть переведены в резерв. Элементы, находящиеся в холодном резерве, не меняют своих характеристик, иначе говоря, не расходуют своего резерва. Имеется r резервных исправных элементов, в работу может быть включено не более (к+1) исправных элементов. Система функционирует, если в работу включено не менее к исправных элементов. Вероятность безотказной работы включённого в работу исправного элемента за один шаг равна p (p > 0,5), вероятность отказа исправного элемента за один шаг равна q = 1 - p. Эту модель резервирования обозначим Sk+i. Требуется: 1) найти стратегию управления резервом, оптимальную по критерию среднего времени безотказной работы системы; 2) получить оценку времени безотказной работы системы при оптимальной стратегии управления резервом. Рассмотрим следующие две стратегии управления резервом в модели Sk+1. Стратегия 1: на первом шаге включаем (к+1) исправный элемент, а на следующем шаге переходим к стратегии, оптимальной по критерию среднего времени безотказной работы. Обозначим математическое ожидание времени безотказной работы системы при стратегии 1 через T(k+1,r). Стратегия 2: на первом шаге включаем к элементов, а затем переходим к оптимальной стратегии. Обозначим математическое ожидание времени безотказной работы системы при стратегии 2 через T(k,r). Через T(r) обозначим математическое ожидание времени безотказной работы системы при оптимальной по среднему времени стратегии, если в наличии имеется r исправных элементов. Вычислим среднее время T(k+1,r) работы системы Sk+1 при стратегии 1. Воспользуемся формулой полного математического ожидания [6]: T (к +1, r ) = £ Ck+1 pk+1-У (T (r - i) +1) + Ck+1 pk-1q 2 + Ck3+1 pk-2 q3 +... + qk+1 = i=0 = pk+1T (r) + (k +1) pkqT (r -1) +1. T(r) = £ ск0pk0"V'T(r-i) + pk0T(r)+1, (7) Найдём среднее время работы системы в модели 2 при стратегии 2. T(к,r) = pk(T(r) + 1)+Cpk-1q + C2kpk-2q2 +... + qk , T (k, r) = pkT (r) +1 Теорема: Для всех k и r, таких, что k+1 < r , выполнено T (k +1, r) > T (k, r) Доказательство проведём от противного. Предположим, что оптимальное время работы системы достигается при стратегии 2. Имеем T (k, r) = T(r) = pkT (r) +1 ^ T (r) = —1—. 1 - pk Пусть r > k+2. Так как K0(r - 1) < K0(r), то K0(r - 1) = k. Аналогично предыдущему получим , 1 T (к, r -1) = T(r -1) = pkT (r -1) +1 ^ T (r -1) = 1 - Таким образом, T(r - 1) = T(r) для произвольного r, что неверно. Значит, предположение о том, что K0(r) = к неверно. Итак, K0(r) = к + 1, следовательно, T (к +1, r) > T (к, r). Таким образом, стратегия, при которой в начальный момент включено в работу (к+1) элементов, предпочтительнее. Следовательно, оптимальная стратегия для модели Sk+1 следующая: если имеется не меньше чем (к + 1) исправных элементов, то включаем в работу (к + 1) элемент, если в данный момент имеется только к исправных элементов, то все они включаются в работу. Запишем рекуррентную формулу для T(r). Имеем 1 T(r) = pk+1T(r) + (k +1)pkqT(r -1) +1, откуда t (r)=^k+q t (r -1)+ 1 - p^1 1 - pk+1 Обозначим fl =(k+1)pkq. , =. 1 - pk+1 ' 1 - pk+1 тогда T(r) = aT(r -1) + b . Индукцией по r теперь легко доказать формулу T (r) = ar + b 1 - a Подставляя значения a и b, получим r-1 1 p , и1-a p +_,, q (kq +1)pk -1J 1 - (kq -1)pk f (k +1) pkq ^ r-1 T (r) = 1 - pk+1 Легко видеть, что 0 < (k + У q < 1. 1 - рк+1 С учётом полученного результата, получим предельное значение времени. Итак, при r ^го значение среднего времени безотказной работы системы Sk+1, 1 монотонно возрастая, стремится к величине -- и не превышает ее да- 1 - (kq -1)рк же при сколь угодно большом резерве.
Renyi A. Wahrscheinlichkeitsrechnung. Berlin: VEB Deutscher Verlag der Wissenschaften 1966.
Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М.: Наука, 1965. 458 с.
ТомиленкоВ.А. Об одной задаче динамического резервирования // Изв. АН СССР. Техническая кибернетика. 1975. № 4.
Райкин А.Л. Элементы теории надёжности технических систем. М.: Сов. радио, 1978.
Герцбах И.Б. Об оптимальном управлении включением резервных элементов // Изв. АН СССР. Техническая кибернетика. 1966. № 5.
Пестов Г.Г., Ушакова Л.В. Исследование оптимальных стратегий в задаче динамического резервирования // Изв. АН СССР. Техническая кибернетика. 1973. № 5.
Конев В.В., Овчинников А.В. Оптимальное резервирование группы однотипных элементов // Изв. АН СССР. Техническая кибернетика. 1976. № 4. С. 75—84.
Конев В.В. Об оптимальном программном включении резервных элементов // Изв. АН СССР. Техническая кибернетика. 1975. № 3. С. 109—117.
Конев В.В. Об оптимальном включении резервных элементов // Изв. АН СССР. Техническая кибернетика. 1974. № 4. С. 75—83.