Трёхальтернативная обучающаяся система поддержки принятия решений для автоматизации технологического процесса | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2014. № 4(29).

Трёхальтернативная обучающаяся система поддержки принятия решений для автоматизации технологического процесса

Рассматривается задача информационного синтеза обучающейся системы поддержи принятия решений для управления технологическим процессом выращивания сцинтилляционных монокристаллов из расплава. В качестве критерия функциональной эффективности предложена модификация информационной меры Кульбака для трёхальтернативной системы оценок решений. Выполнен сравнительный анализ функциональной эффективности синтезированной системы с двухальтернативной.

Three-alternative learning rating system for decision support system of process automation.pdf Современный этап развития информационных технологий анализа и синтеза систем поддержки принятия решений (СППР) для управления сложными технологическими процессами в условиях априорной неопределённости характеризуется наделением их интеллектуальной составляющей для моделирования когнитивных процессов принятия решений, свойственных человеку [1-3]. Основной нерешённой проблемой методов интеллектуального анализа данных в технологии Data Mining [4] является обеспечение инвариантности алгоритмов принятия решений от произвольных начальных условий. Одним из перспективных подходов к повышению функциональной эффективности СППР для управления технологическими процессами является использование идей и методов информационно-экстремальной интеллектуальной технологии (ИЭИ-технологии), основанной на максимизации информационной способности системы в процессе её обучения [5-7]. В работе [8, 9] рассматривалась задача информационно-экстремального синтеза обучающейся СППР при двухальтернативной системе оценок решений, основанная на методе «ближайшего соседа» [10]. Одним из путей повышения достоверности оценки функционального состояния технологического процесса является переход от двухальтернативной системы оценок принимаемых решений к трёхальтернативной в форме «Меньше нормы» - «Норма» -«Больше нормы». В статье рассматривается задача оценки функциональной эффективности информационно-экстремального обучения СППР для управления выращиванием сцинтилляционных монокристаллов при использовании трёхальтернативной системы оценок управляющих решений. 1. Формализованная постановка задачи информационного синтеза обучающейся СППР Пусть для заданного алфавита классов распознавания т = 1,...,M}, характеризующих М функциональных состояний СППР, получена многовекторная обучающая матрица НУ^Н типа «объект - свойство», в которой строка {у(()т,г\г = 1,...,N} является вектором-реализацией (далее реализация) класса т; N - количество признаков распознавания, а столбец - случайной обучающей выборкой {у(()т,г\j =1,...,n}, где n - объём выборки. Кроме того, дан структурированный вектор пространственно-временных параметров функционирования g = , влияющих на функциональную эффективность обучающейся СППР, с соответствующими для них ограничениями R = (gb...g,...,gE) < 0. Необходимо в процессе обучения найти оптимальные значения параметров функционирования {g*^}, обеспечивающих максимум информационного критерия функциональной эффективности (КФЭ) обучения системы в рабочей (допустимой) области определения его функции Е*т = max Ет , (1) где Ет - КФЭ обучения СППР распознавать реализации класса X0m; G - рабочая (допустимая) область значений функции КФЭ. При этом решением частной задачи информационного синтеза обучающейся системы является определение оптимального значения параметра g*^: * * g* = arg Em, G где G% - область допустимых значений параметра g^. Таким образом, в рамках ИЭИ-технологии машинное обучение рассматривается как процесс оптимизации пространственно-временных параметров функционирования СППР по информационному КФЭ (1). В режиме экзамена - непосредственного распознавания в рабочем режиме функционирования -СППР должна принять решение о принадлежности распознаваемой реализации одному из классов заданного алфавита. 2. Оценка функциональной эффективности обучения СППР на базе критерия Кульбака Центральным вопросом информационного синтеза обучающейся СППР в рамках ИЭИ-технологии является конструирование общего КФЭ обучения системы. Для построения КФЭ в качестве функции, зависящей от эмпирических значений признаков распознавания, рассмотрим симметрический информационный критерий в виде дивергенции Кульбака-Лейблера [11]: Dkl (p, q) = Z (p(x) - q(x))ln^, (2) xeR q(x) где p(x), q(x) - функции вероятности двух наборов случайной дискретной величины x, принимающей значение во множестве рациональных чисел R; DKL - расстояние между ансамблями {p} и {q}. Практическое применение формула (2) нашла в методах ИЭИ-технологии, где используется для вычисления КФЭ информационная мера Кульбака в виде [6]: P( k) Emk)=pm - pfmj • ^ pm-, (3) Pf ,m где P(k\m - полная вероятность правильного распознавания реализаций класса X°m на k-м шаге обучения; P('k)f,m - полная вероятность неправильного распознавания реализаций классаX°m на k-м шаге обучения. Если за основную априорную гипотезу у1 примем нахождение значения признака распознавания в поле допусков 5, а за альтернативную гипотезу у2 - нахождение признака за пределами поля допусков, то гипотезы ц1 и ц2 будут соответственно апостериорными. Тогда полные вероятности правильного и неправильного принятия решений для двухальтернативной системы их оценок имеют вид pt(mm=p (Mi) p(Yi / Mi)+p (^2) p(y 2 / ^2); k (4) Pf,m = p(Mi)p(Y2 / Mi) + p(M2)p(Yi / M2). Поскольку в формулах (4) условные вероятности p(y2/^) - ошибка первого рода a, p^/цг) -ошибка второго рода в, p(Y1/^1) - первая достоверность D1, p(y2/^2) - вторая достоверность D2, то после их преобразования по формуле Байеса при равновероятных гипотезах и подстановки в формулу (3) получим E (k) = log (2 - («mk v)+pmk)(d)) l.r, - („( k )(d)+R(k )(d))i (5) EKm=log\ amk)(d)+Pmk)(d) L1 (am (d)+^m (d))j. (5) Рассмотрим классификатор с трехальтернативной системой оценок, вычисляемых в процессе анализа реализаций трёх обучающих матриц, каждая из которых соответствует определенному состоянию технологического процесса. В работах [5, 12] получено выражение КФЭ обучения СППР с унимодальным (вложенным) классификатором, графическое представление которого показано на рис. 1. Рис. 1. Схема расположения классов для унимодального классификатора В данном случае основная гипотеза yi будет свидетельствовать о принадлежности признака показателю «Норма», гипотеза y2 - о принадлежности показателю «Меньше нормы» и гипотеза y3 - о принадлежности показателю «Больше нормы». Соответственно, их апостериорные гипотезы: ц1 - значение признака действительно находится в поле допусков 5, ц2 - левее поля допусков 5 и ц3 - правее поля допусков 5. При этом возможные исходы для трёхальтернативного решения можно представить в виде девяти характеристик [5]: 1) первая достоверность D1(к)т = p(y 1/ц1); 2) первая ошибка первого рода а1 3) вторая ошибка первого рода а2 (к) т (к) - РУ2/Ц1); =р(уэ/цО; т 4) вторя достоверность D (к) =р(У2/ц2); (к) т (к) первая ошибка второго рода в =р(У1/ц2); =р(У3/ц2); вторая ошибка второго рода р: 7) третья достоверность D^m = р(у3/ц3); 8) первая ошибка третьего рода о1(к)т = р(у1/ц3); 9) вторая ошибка третьего рода о2(к)т = р(у2/ц3). Согласно принципу Бернулли-Лапласа примем гипотезы равновероятными, и тогда полные вероятности правильного и неправильного принятия решений соответственно равны (6) Р^т = р(мО р(У1/ мО+р (^2) р (y 2/ м,2) + р (мз) р (y 3/ ^3); Pfki = S (р(^1)р(Уi / М + р(^)р(У1 / ^i)) + р(^2)р(У3 / М'2) + р(^3)р(У2 / ^3). i=2 После подстановки выражений (5) в формулу (3) КФЭ СППР с трёхальтернативным унимодальным классификатором принимает вид [12]: Emk =7 {D^m +1 - 2[р: 2D(km+4 - 4[р; (k) , „.(k) (k) j(k) , Лk) ]} log 2 1 - Dm + 2[p; (k k) Таким образом, информационная мера Кульбака является функционалом от точностных характеристик принимаемых решений и поэтому может использоваться в качестве общего КФЭ машинного обучения. 3. Трехальтернативный КФЭ обучения СППР с полимодальным классификатором Унимодальный классификатор является частным случаем полимодального, имеющего не один, а несколько центров рассеивания реализаций образов. Рассмотрим способ формирования КФЭ обучения СППР с трёхальтернативным полимодальным гиперсферическим классификатором для общего случая, когда классы распознавания пересекаются (рис. 2). Класс "Норма" \ 1 Класс "Меньше нормы" Класс "Больше нормы" Рис. 2. Возможные варианты принадлежности распознаваемой реализации к областям классов распознавания В табл. 1 показаны возможные варианты нахождения в пространстве признаков распознавания реализации базового класса А0,, соответствующего функциональному состоянию СППР «Норма». При этом отнесение этой реализации к классу А0, в случае, когда она принадлежит двум и более классам, будем считать неэффективным. Т а б л и ц а 1 Возможные варианты нахождения вектора-реализации класса «Норма» относительно всех классов распознавания Правильное распознавание Вектор-реализация принадлежит только к базовому классу Вектор-реализация принадлежит к базовому классу и классу «Меньше нормы». Неэффективное распознавание Вектор-реализация принадлежит к базовому классу и классу «Больше нормы». Неэффективное распознавание Вектор-реализация принадлежит ко всем классам распознавания. Неэффективное распознавание Неправильное распознавание Вектор-реализация принадлежит к классу «Меньше нормы» Вектор-реализация принадлежит к классу «Больше нормы» Вектор-реализация принадлежит к классам «Меньше нормы» и «Больше нормы» Вектор-реализация не принадлежит ни к одному из существующих классов Таким образом, только в первом случае классификатор распознаёт реализацию класса А0] с максимальной полной достоверностью правильного принятия решений. В случаях 2-4 (рис. 2), где имеет место пересечение классов, распознавание считается неэффективным. Априорные гипотезы у,, у2 и у3 являются такими же, как и в случае унимодального классификатора, а согласно табл. 1 апостериорные гипотезы имеют следующие значения: - ц, - реализация находится в поле допусков 5 класса «Норма» (область 1); - ц2 - реализация находится в поле допусков 5 класса «Меньше нормы» (область 5); - ц3 - реализация находится в поле допусков 5 класса «Больше нормы» (область 6); - ц4 - реализация находится в поле допусков 5 класса «Меньше нормы» и класса «Норма» одновременно (область 2); - ц5 - реализация находится в поле допусков 5 класса «Больше нормы» и класса «Норма» одновременно (см. рис. 2, область 3); - ц6 - реализация находится в поле допусков 5 класса «Меньше нормы», класса «Норма» и класса «Больше нормы» одновременно (область 4); - ц7 - реализация находится в поле допусков 5 класса «Больше нормы» и класса «Меньше нормы» одновременно (область 7). Кроме того, введем дополнительную гипотезу ц8 - реализация находится вне границ существующих классов, т.е. в области 8. Тогда возможные исходы для трёхальтернативных решений будут оцениваться следующими точностными характеристиками: 1) первая достоверность D1(k) =р(у1/ц1); 2) первая ошибка второго рода a2(k) =р(у1/ц2); 3) первая ошибка третьего рода a3(k) = р(у1/ц3); 4) первая ошибка четвертого рода a4(k) = р(у1/ц4); 5) первая ошибка пятого рода a5(k) = р(у1/ц5); 6) первая ошибка шестого рода a6(k) = р(у1/ц6); 7) первая ошибка седьмого рода a7(k) = р(у1/ц7); 8) первая ошибка восьмого рода a8(k) = р(у1/ц8); 9) вторя достоверность D2(k) = р(у2/ц2); 10) вторая ошибка первого рода p2(k) = р(у2/ц1); 11) вторая ошибка третьего рода p3(k) = р(у2/ц3); 12) вторая ошибка четвертого рода p4(k) = р(у2/ц4); 13) вторая ошибка пятого рода p5(k) = р(у2/ц5); 14) вторая ошибка шестого рода p6(k) = р(у2/ц6); 15) вторая ошибка седьмого рода p7(k) = р(у2/ц7); 16) вторая ошибка восьмого рода p8(k) = р(у2/ц8); 17) третья достоверность D3(k) = р(у3/ц3); 18) третья ошибка первого рода o1(k) = р(у3/ц1); 19) третья ошибка второго рода a2(k) = р(у3/ц2); 20) третья ошибка четвертого рода a4(k) = р(у3/ц4); 21) третья ошибка пятого рода a5(k) = р(у3/ц5); 22) третья ошибка шестого рода a6(k) = р(у3/ц6); 23) третья ошибка седьмого рода a7(k) = р(у3/ц7); 24) третья ошибка восьмого рода a8(k) = р(у3/ц8). Таким образом, приведенные 24 точностные характеристики позволяют полностью оценить принадлежность реализаций к одному из трёх классов распознавания. Поскольку для системы распознавания независимо от используемой системы оценок принятия решений базовым является класс - «Норма», то, воспользовавшись формулой (3), полные вероятности правильного и неправильного принятия решений представим в следующем виде: Ptk} = р(^1)р(У1 / Ц0 + р(^2)р(У2 / Ц2) + р(Мз)р(У3 / Мз); f} = р(Ц1)р(У2 / Ц1) + р(Ц1)р(У3 / Ц1) + р(Ц2)р(У1 / Ц2) + р(Ц2)р(У3 / Ц2) + р(Ц3)р(У1 / Ц3) + (7) 8 +р(Ц3)р(У2 / Ц3) + S (р(Ц)р(У1/ Ц) + р(Ц)р(У2 / Ц) + р(Ц)р(У3/ Ц)). i=4 В соответствии с принципом Лапласа-Бернулли сделаем допущение о равных вероятностях попадания реализаций в каждую область, т.е., приняв р(ц1) = р(ц2) = р(ц3) = р(ц4) = р(ц5) = р(ц6) = р(ц7) = =р(ц8) = 1/8, формулу (7) представим в виде P( k) = !(k) + k) + D3( k >); 1 8 i=4 pW = ±(a(k) +a3k) +p(k) +p

Ключевые слова

система поддержки принятия решений, распознавание, обучение, трёхальтернативное решение, критерий функциональной эффективности, информационная мера Кульбака, decision support system, recognition, learning, three-alternative decision, criterion for functional efficiency, Kullback information measure

Авторы

ФИООрганизацияДополнительноE-mail
Довбыш Анатолий СтепановичСумский государственный университетпрофессор, доктор технических наук, заведующий кафедрой компьютерных наук факультета электроники и информационных технологийkras@id.sumdu.edu.ua
Берест Олег БорисовичСумский государственный университетассистент факультета электроники и информационных технологийBerest_Oleg@mail.ru
Всего: 2

Ссылки

Hastie T., Tibshirani R., Friedman J., Hastie T. The Elements of Statistical Learning. Data Mining, Inference, and Prediction. 2nd ed. Springer Series in Statistics, 2009. 745 p.
Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкина Л.Д. Прикладная статистика: Классификация и снижение размерно сти. М. : Финансы и статистика, 1989. 607 с.
Бендат Дж. Прикладной анализ случайных данных : пер. с англ. М. : Мир, 1989. 540 с.
Han J., Kamber M., Pei J. Data mining: concepts and techniques. 3rd ed. Morgan Kaufmann, Elsevier, 2012. 744 p.
Краснопоясовский А.С. Информационный синтез интеллектуальных систем управления: Подход, основанный на методе функционально-статистических испытаний. Сумы : Изд-во СумГУ, 2004. 261 c.
Довбыш А.С. Основы проектирования интеллектуальных систем : учеб. пособие. Сумы : Изд-во СумГУ, 2009. 171 с.
Довбыш А.С., Васильев А.В., Любчак В.А. Интеллектуальные информационные технологии в электронном обучении. Сумы : Изд-во СумГУ, 2013. 177 с.
Берест О.Б., Довбыш А.С., Козьмин Ю.С. Информационно-экстремальный алгоритм обучения системы управления выращи ванием сцинтилляционных монокристаллов // Вестник «ХПИ»: Системный анализ, управление и информационные технологии. 2012. № 30. С. 54-60.
Берест О.Б., Довбыш А.С. Оценка функциональной эффективности обучения автоматизированной системы управления технологическимним процессом // Вестник СумГУ. Сер. Технические науки. 2012. № 2. С. 39-47.
DudaR.O., HartP.E., StorkD.G. Pattern classification. Second ed. N.Y. : John Wiley&Sons, 2001. 738 p.
Довбыш А.С., Джулгам С.А.С.М., Стадник А.А. Информационно-экстремальный алгоритм обучения системы диагностирования патологических процессов // Инновации в науке : сб. статей. Новосибирск : НП «СибАК», 2013. № 23. С. 45-54.
Kullback S., Leibler R.A. On information and sufficiency // The Annals of Mathematical Statistics. 1951. V. 22, No 1. P. 79-86.
Суздаль В.С., Стадник П.Е., Герасимчук Л.И., Епифанов Ю.М. Сцинтилляционные монокристаллы: автоматизированное выращивание. Харкв : ИСМА, 2009. 259 с.
 Трёхальтернативная обучающаяся система поддержки принятия решений для автоматизации технологического процесса | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2014. №  4(29).

Трёхальтернативная обучающаяся система поддержки принятия решений для автоматизации технологического процесса | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2014. № 4(29).