Расчет показателей живучестираспределенных вычислительных систем | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 2(15).

Расчет показателей живучестираспределенных вычислительных систем

Предлагается подход к анализу функционирования большемасштабных распределенных вычислительных систем (ВС) в переходном и стационарном режимах. Анализ осуществляется на основе показателей живучести, использующих моменты случайных величин. Использован метод, позволяющий получить систему дифференциальных уравнений, в которой неизвестными функциями являются моменты случайных величин. В качестве основного математического аппарата используются производящие функции. Метод позволяет с единых методологических позиций исследования функционирования ВС получать расчетные формулы для показателей живучести.

Calculating robustness indices of distributedcomputer systems.pdf Современные средства вычислительной индустрии суть системы массовогообслуживания, работающие с информационными заданиями. Следовательно, ана-лиз эффективности функционирования вычислительных систем (ВС) должен бытьоснован на математическом аппарате теории массового обслуживания [1 - 9].1. Математическая модель функционирования ВСЛюбая распределенная вычислительная система [1, 2] может быть представле-на композицией N связных элементарных машин (ЭМ). Пусть все ЭМ системыоднородны, каждая из них в любой момент времени [t[0,) может находитьсяв одном из двух несовместных состояний: работоспособном или отказа; связьмежду ЭМ будем считать абсолютно надежной.Время безотказной работы ЭМ является случайной величиной, пусть оно под-чиняется экспоненциальному закону распределения, ƒ - интенсивность отказов. Вслучае отказа элементарная машина восстанавливается одним из m ≤ N восста-навливающих устройств (ВУ). Время восстановления каждой ЭМ подчиняетсятакже экспоненциальному закону, ƒ - интенсивность восстановления отказавшихЭМ одним ВУ. В любой момент времени t каждое из ВУ может восстанавливатьне более одной ЭМ. Требуется проанализировать работоспособность ВС.При анализе современных вычислительных систем наиболее востребованы по-казатели живучести, выражаемые через математические ожидания числа исправ-ных ресурсов и другие моменты случайных величин.Пусть также Mi(t) - среднее число ЭМ вычислительной системы, находящихсяв состоянии отказа в момент времени t ≥ 0, при условии, что в начальный моментвремени их было i, Mi (0) = i , iE0N ={0, 1, ...,N}.Обозначим через Pk (i,t) вероятность того, что в момент времени t[0,)ВС имеет k ЭМ в состоянии отказа, 0kEN . В указанных выше условиях функ-ционирование ВС может быть описано процессом «рождения и гибели» [5, 6], тоесть для вероятностей Pk (i,t) будет справедлива система линейных дифференци-альных уравненийk( , ) (k k ) k ( , ) k 1 k 1( , ) k 1 k 1( , )d P i t P i t P i t P i tdt = − ƒ + ƒ + ƒ − − + ƒ + + , (1)1Pr(i,t) 0, r E− EN 1, t [0, )=   − ∪ +  с начальными условиямиPi (i, 0) =1, Pk (i, 0) = 0, ik, i,kE0N (2)и условием нормировки0( , ) 1NkkP i t=ƒ = ;ƒk и ƒk - интенсивности, выражаемые через ƒ и ƒ.Считаем, что восстановительные операции в вычислительной системе осущест-вляют m однородных устройств (ВУ), 1mEN . «Природа» этих ВУ может бытьпроизвольной: это либо специальные аппараты, либо микропрограммные устройст-ва, либо программы, либо композиции из отмеченных средств [1]. Производитель-ность восстанавливающей системы определяется и числом m, и интенсивностью ƒ.Будем исследовать потенциальные возможности ВС, положив в системе (1)ƒk =(N−k)ƒ , mƒk= ƒk⋅ƒ , {, ,, .mkk k mm k m 5 ч:M D=Nƒ/(ƒ+ƒ) Nƒ/(ƒ+ƒ) =104⋅10−3/(1+10−3) 104⋅10−3/(1+10−3)≈103,16 .Исследования показывают, что при скрупулезном анализе эффективностифункционирования современных ВС требуется учитывать дисперсию числа отка-завших ЭМ.Случай 2. Восстанавливающая система имеет невысокую производитель-ность. Следовательно, в этом случае при длительной эксплуатации ВС все восста-навливающие устройства будут заняты. Как следует из предельных теорем теориивосстановления [8, 10], параметр Nƒ −mƒ > 0 можно принять за интенсивностьвходящего потока требований, а за ƒ - интенсивность обслуживания требований.Если учесть, что современные ВС являются большемасштабными (характери-зуются массовым параллелизмом и числом N ЭМ не менее 104−106), то отказыЭМ можно считать независимыми, а N   .Таким образом, имеем систему массового обслуживания с бесконечным чис-лом приборов обслуживания, входящим потоком требований Nƒ −mƒ и интен-сивностью обслуживания ƒ .Тогда можно положить в системе (1)ƒk = k ⋅ƒ , ƒk =Nƒ −mƒ , kE0. (8)Используя введенную производящую функцию и учитывая (8), мы можем сис-тему (1) свести к следующему уравнению в частных производных:F(i, z, t) (1z) F(i, z, t) (N m)(1 z)F(i, z, t),t z − ƒ − = − ƒ − ƒ − а из последнего уравнения получить систему уравнений( 2 ) ( 2 )( ) ( ) ,( ) ( ) ( ) 2 ( ) ( ) 2( ) ( ).i ii i i i i i id M t M t N mdtd D t M t M t D t M t M N m M tdt⎧ + ƒ ⋅ = ƒ − ƒ ⎪⎨⎪+ − + ƒ + − = ƒ−ƒ⎩(9)Решение системы (9) имеет вид2( ) ,( ) .tit tiM t N m i N m eD t N m i N m e i e−ƒ−ƒ − ƒƒ − ƒ ƒ − ƒ ⎧ ⎛ ⎞ = + − ⋅ ⎜ ⎟ ⎪⎪ƒ ⎝ ƒ ⎠⎨⎪⎩⎪ = ƒƒ− ƒ+⎝⎛⎜ − ƒƒ− ƒ ⎠⎞⎟⋅ − ⋅(10)Если i≥m, то решение (10) удовлетворяет условию низкой производительно-сти восстанавливающей системы и является точным. Если i≤m при длительнойэксплуатации ВС (постулируя, что первое событие произойдет при t > 0 ), то ре-шение (11) можно считать «асимптотически» точным [4, 9, 10].Например, при i = 0 получаемM0(t) Nƒ −mƒ (1 e−ƒt)= −ƒ, D0(t) Nƒ −mƒ (1 e−ƒt )= −ƒ.Для стационарного режима функционирования ВС имеемlim i ( )M Mt N m⋅ ƒ − ⋅ƒ= =t ƒ, lim i ( )D Dt N m⋅ ƒ − ⋅ ƒ= =t ƒ. (11)Следует заметить, что если в модели функционирования ВС используютсяпростейшие потоки, то все вероятностные характеристики для стационарного ре-жима, как следует из условия эргодичности, будут независимы от начальных ус-ловий (что и подтверждается формулами (7) и (11)), а результирующие потоки,являющиеся линейной комбинацией исходных, также будут простейшими [5, 8].Скорость вхождения распределенной ВС в стационарный режим функциони-рования при использовании низкопроизводительной восстанавливающей системыиллюстрирует рис. 2.0 20000 40000 60000 80000 t, ч51015M4(t) F1(t)f1(t)f2(t)F2(t)Рис. 2. Среднее число неисправных машин в ВСс низкопроизводительной системой восстановленияМатематическое ожидание M4(t) рассчитано для ƒ = 10−4ч−1, ƒ = 1 ч−1 ,m = 1 . Кривые F2(t)=M4(t)+ƒ(t) , f2(t) =M4(t) соответствуют N = 104 , а кри-вые F1(t)=M4(t)+ƒ(t) , f1(t) =M4(t) - значению N =104+16 , ƒ(t) = D4(t) .Видно, что в этом случае ВС медленно входит в стационарный режим ( t ≈ 6⋅104 ч),и влияние дисперсии на M4(t) не столь существенно, чем при наличии высоко-производительной восстанавливающей системы (рис. 1).ЗаключениеРассмотрены математические модели функционирования восстанавливаемыхраспределенных вычислительных систем. Предложенный подход к анализу живу-чести ВС хорошо согласуется с континуальным подходом [1, 2]. Расчетные фор-мулы позволяют повысить точность анализа живучести вычислительных систем.Полученные результаты применимы в инженерной практике большемасштабныхраспределенных вычислительных систем.

Ключевые слова

распределенные вычислительные системы, показатели живучести, моменты, производящая функция, distributed computer systems, robustness indices

Авторы

ФИООрганизацияДополнительноE-mail
Хорошевский Виктор ГавриловичСибирский государственный университет телекоммуникаций и информатики (г. Новосибирск)член-корреспондент Российской академии наук, профессор, доктор технических наук, заслуженный деятель науки Российской Федерации, заведующий лабораторией вычислительных систем Института физики полупроводников им. А.В. Ржанова СО РАН, директор Центра параллельных вычислительных технологий, заведующий кафедрой вычислительных системkhor@sibsutis.ru
Павский Валерий АлексеевичКемеровский технологический институт пищевой промышленностипрофессор, доктор технических наук, заведующий кафедрой высшей математикиpavvm@kemtipp.ru
Павский Кирилл ВалерьевичСибирский государственный университет телекоммуникаций и информатики (г. Новосибирск)кандидат технических наук, научный сотрудник лаборатории вычислительных системpkv@isp.nsc.ru
Всего: 3

Ссылки

Кокс Д.Р. Теория восстановления. М.: Сов. радио. 1967. 312 с.
Павский В.А., Павский К.В. Оценка показателей осуществимости решения задач на распределенных вычислительных системах // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2008. № 4(5). С. 61−68.
Феллер В. Введение в теорию вероятностей и ее приложения. М.: Мир, 1984. В 2 т. Т. 2. 754 с.
Гнеденко Б.В. Математические методы в теории надежности. М.: Наука, 1965. 524 с.
Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. 432с.
Клейнрок Л. Вычислительные системы с очередями. М.: Мир, 1979. 600 с.
Саати Т.Л. Элементы теории массового обслуживания и ее приложения. Изд. 3-е. М.: Либроком, 2010. 520 с.
Вентцель Е.С. Исследование операций. М: Сов. радио, 1972. 552 с.
Евреинов Э.В., Хорошевский В.Г. Однородные вычислительные системы. Новосибирск: Наука, 1978. 319 с.
Хорошевский В.Г. Архитектура вычислительных систем. М.: МГТУ им. Баумана, 2008. 520 с.
 Расчет показателей живучестираспределенных вычислительных систем | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 2(15).

Расчет показателей живучестираспределенных вычислительных систем | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 2(15).

Полнотекстовая версия