Применение ненадёжных тестов для самодиагностики модульных вычислительных систем при кратных отказах | Прикладная дискретная математика. Приложение. 2010. № 3.

Применение ненадёжных тестов для самодиагностики модульных вычислительных систем при кратных отказах

Self-diagnosing of modular computing systems (CS) is investigatedon the system level at the presence of multiple faults and with the use of unreliabletests. Dependence of self-diagnosing efficiency on properties of the unreliable tests is studiedby the method of imitation-statistical simulation. We compare the self-diagnosing efficiencyfor CS using the unreliable tests corresponding to the known PMC-model and the unreliabletests suggested by the authors, and state conditions under which the use of the last testsis more effective.

Application of unreliable tests for self-diagnostics of modular computing systems with multiple faults.pdf Исследуется возможность децентрализованной диагностики модульных вычислительныхсистем в условиях кратных отказов. Модули с точки зрения диагностикиявляются неделимыми единицами системы. Их функциональные характеристики позволяютим в одиночку осуществить полную проверку других (соседних) модулей иоценить их исправность. Состояние вычислительной системы (ВС) определяется сопоставлениемрезультатов тестирования, полученных разными модулями (самодиагностикаВС). Кратность неисправностей есть предельно допустимое число неисправныхмодулей, при котором ещё существует возможность определения состояния ВС.Используется известная графовая модель диагностирования систем при отказахкратности не более t, предложенная в работе [1]. Диагностической моделью ВС являетсяорграф G = (V, E ), в котором множество вершин V = {1, 2 ,... , N } представляетмодули ВС, а множество E = {(i, j ) : i ,j Е V } дуг - тесты над ними. Для вершинi ,j Е V дуга (i,j) существует, если и только если модуль i может проверитьмодуль j . Вершины графа имеют отметки х, значения которых определяют состояниемодулей: x(i) = 0 при исправности и x(i) = 1 при неисправности модуля i. Результатытестов над модулями соответствуют весам дуг графа. Совокупность вершин, имеющихединичные значения меток x, составляет образ Fk, Fk С V , неисправностей системы,а совокупность значений весов a(i, j), (i, j ) Е E, графа образует его синдром Sk.При заданной кратности неисправностей t допустимое множество F (t) неисправныхсостояний системы составляют все возможные сочетания по k модулей, гдеk = 1, 2 ,... , t. Каждый образ неисправностей мощности k может порождать 2k синдромов.В терминах описанной модели определение состояния ВС заключается в идентификациивершин графа, образующих множество Fk, по заданному синдрому Sk.В каждом конкретном случае результат диагностирования зависит от состояниятестирующего и тестируемого модулей. Поэтому диагностическую модель можно описыватьчетверкой булевских переменных , agb, , a^, каждая из которых представляетвозможное значение исхода тестирования в зависимости от технического состояниямодулей: - оба модуля исправны; - тестирующий модуль исправен, а тестируемыйнеисправен и т.д. При этом исход a(i, j ) теста (i,j) Е E равен нулю, еслимодуль i считает исправным модуль j, и единице в противном случае. Получаемаятестирующим модулем оценка состояния тестируемого модуля достоверна, когда тестирующиймодуль исправен, и ненадёжна, т. е. может не соответствовать фактическомусостоянию тестируемого модуля, в противном случае. В этих терминах исходытестирования, соответствующие известной модели ПМЧ [1], можно описать четверкой(0 ,1,а ,а ). Знак а означает возможность произвольного исхода теста, выполняемогонеисправным модулем.Исходы ненадёжного теста могут быть детерминированными или случайными(недетерминированными). В литературе рассматриваются модели, отличающиеся разнымиусловиями детерминированности исхода ненадёжного теста (см., например, [2]).Исход недетерминированного ненадёжного теста в литературе описывается как величина,не имеющая числового значения.Введем в качестве численной меры полноты и корректности теста, выполняемогонеисправным модулем, пару значений p(0) и p(1), соответствующих вероятностиполучения результата теста a(i, j ) = 0 и a(i, j ) = 1 соответственно; p(0) + p(1) = 1.По соотношению между p(0) и p(1) (p(0) = p(1), p(0) > p(1) или p(0) < p(1)) и по тому,зависит ли это соотношение от состояния тестируемого модуля, ненадёжные тестыразделены на девять классов. В предложенной авторами классификации известнаяПМЧ-модель соответствует классу 1: для ненадёжного теста p(0) = p(1) независимоот технического состояния тестируемого модуля.В данной работе обсуждаются свойства классов ненадёжных тестов. Обосновановыделение класса 9 как наиболее простого в реализации. В этом классе p(0) < p(1)для ненадёжного теста независимо от технического состояния тестируемого модуля.В работе проведено сравнение эффективности систем диагностирования с ненадёжнымитестами классов 1 и 9. Эффективность использования ненадёжных тестовуказанных классов изучена методом имитационно-статистического моделирования напримере описанного в работе [3] децентрализованного алгоритма самодиагностирова-ния «СЧЁТ». Для класса 9 выбрано p(1) = 0,75 при любом техническом состояниитестируемого модуля.Суть алгоритма «СЧЁТ» состоит в последовательном построении подсистем, в которыхвсе модули по результатам взаимного тестирования считают друг друга исправными.Показано, что если число модулей в подсистеме превышает заданное значениекратности неисправностей t, то эта подсистема содержит действительно исправныемодули. Предложены правила, позволяющие идентифицировать исправные модули такойподсистемы. Эти модули используются как диагностическое ядро для определениятехнического состояния остальных модулей.В ходе моделирования собирались данные для определения характеристик эффективностиалгоритма самодиагностирования, которые связаны с процессом формированияподсистем, выделения диагностического ядра и определения технического состояниясистемы в целом. Полученные при моделировании результаты показали, чтоприменение ненадёжных тестов класса 9 позволяет существенно улучшить эффективностьрассматриваемого алгоритма самодиагностирования.Таким образом, на примере показана зависимость функций распределения длясиндромов, совместных с допустимыми образами неисправностей, от надёжностныхсвойств применяемых тестов. Это позволяет адаптировать к ним функционально полныйалгоритм самодиагностирования (т. е. алгоритм, разрабатываемый без учёта указанныхфункций распределения), улучшая эффективность самодиагностирования системы.С другой стороны, проведённые исследования позволяют поставить новую задачув области диагностирования систем с кратными отказами - задачу разработкитеста с заданными характеристиками надёжности.

Ключевые слова

Авторы

ФИООрганизацияДополнительноE-mail
Димитриев Юрий КонстантиновичИнститут физики полупроводников СО РАН, г. Новосибирскдоцент, доктор технических наук, ведущий научный сотрудникdimi@isp.nsc.ru
Задорожный Анатолий ФилипповичНовосибирский архитектурно-строительный университетдоцент, кандидат технических наук, заведующий кафедрой3af@ngs.ru
Всего: 2

Ссылки

Preparata F. P., Metze G. Chien R. J. On connection assignment problem of diagnosable systems / / IEEE Trans. El. Comput. 1967. V. EC-16. No. 12. P. 848-854.
Радойчевски В. Ц., Шалаев А. Я. Параллельная диагностируемость модульных систем при децентрализованной дешифрации синдрома / / Электронное моделирование. 1992. Т. 14. №1. С. 57-63.
Димитриев Ю. К. Самодиагностика модульных вычислительных систем. Новосибирск: ВО «Наука», 1993. 293 с.
 Применение ненадёжных тестов для самодиагностики модульных вычислительных систем при кратных отказах | Прикладная дискретная математика. Приложение. 2010. № 3.

Применение ненадёжных тестов для самодиагностики модульных вычислительных систем при кратных отказах | Прикладная дискретная математика. Приложение. 2010. № 3.