Рассматриваются критерии для оценивания (индексирования) объекта в задачах распознавания с учителем. Значение оценки вычисляется как экстремум критерия по индивидуальному набору информативных признаков объекта. Проверяется истинность гипотезы, что в окрестности каждого объекта существует устойчивая логическая закономерность.
Indexing of objects on the individual sets of informing features.pdf Потребность в индексировании объектов возникает при принятии решений в различных предметных областях. Значения индексов востребованы для мониторинга рынка купли-продажи ценных бумаг, экологического состояния окружающей среды, уровня террористической угрозы, оценки степени социального благополучия общества, цитируемости научных публикаций и т.д. Вычисление значений, как правило, производится по строго фиксированным наборам показателей. Информативные признаки (показатели), определяемые для всей обучающей выборки, не отражают специфику закономерностей, присущих той или иной области признакового пространства. В [1] утверждается, что для каждого объекта существует своя логическая закономерность, для обнаружения которой предлагалось использовать локальные метрики. Применение локальных метрик основано на эвристиках, так как чётких критериев их выбора не существует. Интерес представляет разработка методов отбора информативных признаков инвариантных к масштабам измерений данных, комбинаторная сложность реализации которых позволяет получать результаты за приемлемое время. Самую простую и легко интерпретируемую структуру, задаваемую отношениями на элементах непустого множества, представляет линейный порядок. Как правило, первыми кандидатами для включения в информативный набор являются независимые признаки. Примером использования линейного порядка является отбор наборов признаков с максимально выраженной независимостью, который применялся при синтезе искусственных нейронных сетей с минимальной конфигурацией в [2]. Потребность в использовании индивидуального набора информативных признаков объекта для принятия решений возникает при постановке диагноза болезни, разработке мер по предотвращению техногенных катастроф на конкретной территории. В медицинской практике при одном и том же диагнозе у двух человек причинами (диагностическими признаками) болезни могут быть разные симптомы и синдромы. Метод отбора индивидуальных информативных наборов признаков с помощью локальных метрик объектов описан в [3]. Для отбора использовался критерий на основе максимальной разницы частот встречаемости представителей (объектов) двух классов K и K2 в последовательности, упорядоченной по локальной метрике объекта. Экстремальное значение критерия, полученное по медицинским данным с описанием состояния больных и практически здоровых индивидуумов, предлагалось интерпретировать как индекс здоровья. Индивидуальный набор информативных признаков допустимого объекта позволяет: - выделять логические закономерности в его окрестности; - объяснять процесс принятия решения при распознавании; - определять принадлежность к шумовым (аномальным) объектам классов; - производить выбор опорных множеств признаков в моделях алгоритмов распознавания. В данной работе для отбора индивидуальных наборов информативных признаков предложено два новых критерия, отличных от описанного в [3]. Также как и в [3], при вычислении значений по этим критериям используются функции близости по определяемым наборам признаков. Упорядочение объектов по значениям функции близости в зависимости от поставленных целей позволяет определять: - устойчивость логической закономерности относительно исследуемого объекта; - границу между представителями двух классов, степень истинности гипотезы о компактности при которой максимальна. Свойство инвариантности к масштабам шкал измерений является атрибутом критерия нелинейного отображения групп исходных (сырых) разнотипных (номинальных и количественных) признаков на числовую ось. По аналогии с методом локальной геометрии [1] начало координат размещается в исследуемом объекте. При нелинейном отображении наряду с синтезом латентных признаков по критерию группировки происходит их упорядочение по степени информативности. Существует вывод аналитического представления (формул) для вычисления значений латентных признаков из исходных [4]. 1. Критерии отбора индивидуальных наборов информативных признаков Рассматривается задача распознавания в стандартной постановке. Объекты обучения заданы через множество E0 = {Sb...,Sm}, разделённое на два непересекающихся подмножества (класса) K1 и K2, E0 = K1UK2. Описание объектов производится с помощью набора из n разнотипных признаков X(n) = (х1,. ,xn), из которых измеряются в интервальных шкалах, n-2, - в номинальной. Обозначим через I, J множество индексов соответственно количественных и номинальных признаков. Считается, что заданы критерии для отбора информативных признаков объекта SiE0. Требуется по каждому критерию для указанного объекта SiE0 определить: - информативный набор признаков X(k) = {xi}i£IuJ, к > 1; - оценку объекта S как экстремальное значение критерия на информативном наборе X(k). Описание допустимого объекта в рамках собственного пространства из информативных признаков необходимо для нахождения индивидуальной меры сходства (различия) с другими объектами. Эта мера отражает отношения между объектами и служит средством для принятия решения. Для унификации масштабов измерений значения количественных признаков дробно-линейным преобразованием отображаются в [0,1]. В качестве меры близости между объектами Sa = (xa1,...,xan) и Sb = (xbb...,xbn) используется метрика Журавлёва Р (Sa, Sb) = ZIxa, - xb\ + Z \ 0 Xm x, iel ieJ I0, xai ~ xbi. Положим, что для объекта SdiKp по набору признаков X(k), к < n, построена Sd0,..., Sdm-i, Sd0 = Sd , (1) упорядоченная последовательность объектов E0, отношения между которыми определяются неравенствами вида р (Sd , Sd ) < р (Sd 1, Sd ) . Для оценки объекта SdiKp по (1) используется функционал Zp (i ) Z3-p (i) (2) K3-p nE0 Kp n E0 •>di^p J f (л (л ^ F{Sd, X (k))= mam- 0
Игнатьев Николай Александрович | Национальный университет Узбекистана | д-р физ.-мат. наук, профессор | ignatev@rambler.ru |
Дюк В. А. Методология поиска логических закономерностей в предметной области с нечеткой системологией: На примере клинико-экспериментальных исследований : дис.. д-ра тех. наук. СПб., 2005. 309 с.
Згуральская Е.Н. Выбор информативных признаков для решения задач классификации с помощью искусственных нейрон ных сетей // Нейрокомпьютеры: разработка, применение. 2012. № 2. С. 20-27.
Ignat'ev N.A., Mirzaev A.I. The Intelligent Health Index Calculation System // Pattern Recognition and Image Analysis. 2016. V. 26, Ыо. 1. P. 73-77.
Игнатьев Н.А. Вычисление обобщённых оценок объектов и иерархическая группировка признаков // Вестник Томского гос ударственного университета. Управление, вычислительная техника и информатика. 2015. № 4 (33). С. 31-37.
Касымова Р.И. Клинико-лабораторные особенности острых гнойных и серозных менингитов в зависимости от этиологии : дис.. канд. мед. наук. Ташкент, 2009. 145 с.