Возможности использования дескрипторныех логик в системах управления знаниями
Рассматривается популярный в последнее время подход к манипулированию данными учетом семантической составляющей.Обсуждаются различные варианты применения формализма в сравнении с традиционными. Предлагаются возможные путиразвития рассматриваемого подхода.
Some approaches to use descriptive logics in knowledge based systems.pdf В последние годы большой интерес вызывает возмож-ность использования программно-аппаратных комплексов прирешении проблем автоматизации исследований для предмет-ных областей (ПО), которые принято называть «слабо-фор-мализованными» - последнее, на содержательном уровне, оз-начает отсутствие строгой теории, обеспечивающей алгорит-мическое описание поведения исследуемых объектов. Какправило, слабо формализованными являются модели, соот-ветствующие сверхсложным многофакторным и многосвяз-ным проблемам. К последним можно смело отнести боль-шинство задач, относящихся к физике атмосферы.Целью данной статьи является изложение базовых принциповвесьма перспективного современного формализма, нашед-шегоприменение в системах управления базами знаний (СУБЗ) - фор-мализма дескрипторных (терминологических) логик [1]. Обсу-ждаемый формализм базируется на идеях, сформулированныхР. Брачманом в [2] и воплотившихся в 1978 г. в системеKLONE. Так же как семантические сети и объектно-ориенти-рованные СУБД, дескрипторные логики (ДЛ) основываются нараспространенном интуитивно понятном представлении обокружающем мире, как о состоящем из множества объектов,связанных между собой отношениями и объединенных в клас-сы. Дескрипторные языки (ДЯ) представляют собой удобныйинструмент для описания и управления такими классами.1. ДЕСКРИПТОРНЫЕ ЯЗЫКИДескрипторные логики являются подмножеством мо-дальных логик первого порядка, при этом они дают ис-следователю более мощные и удобные средства дляпредставления знаний об анализируемой предметнойобласти. Речь идет о «классических» дескрипторных ло-гиках. Позднее появились различные их модификации(многозначные, вероятностные, временные и т.д.).Введем несколько понятий, которые понадобятся намв дальнейшем. Как правило, дескрипторные логики рас-сматриваются как специализированные языки, поддер-живающие композицию термов [3]. Все ДЛ обладают,как минимум, двумя видами термов: концептами (клас-сами - элементами домена) и ролями (бинарными отно-шениями на домене). Концепт может также быть комби-нацией ранее определенных концептов и ролей, котораястроится с использованием одного из конструкторов де-скрипторного языка, что позволяет моделировать болеесложные объекты анализируемой ПО. На рис. 1 приведенпример типичного композиционного описания в син-таксисе логики CLASSIC (CLASSification of Individualsand Concepts) [4].(andCOURSE,(at-most 6 takers),(all takers GRADS))Рис. 1. Пример композиционного описанияСмысл его можно сформулировать так: «Курсы с неболее чем 6-ю слушателями, все из которых принадле-жат классу GRADS». Дескрипторные логики позволя-ют расширять набор конструкторов сверх стандартных(конъюнкции, отрицания, квантора всеобщности и т.д.),обеспечивая таким образом лаконичное описание пред-метной области. На рис. 2 представлен практически ис-черпывающий набор не зависящих от конкретного при-ложения конструкторов, предложенный в обзоре [5].Здесь C и D обозначают концепты, p и q - роли, bi - объ-екты. Семантика конструкторов определяется через по-нятие интерпретации. Интерпретация I состоит из доменаI и интерпретирующей функции (отображения) VI. Ото-бражение V сопоставляет каждому концепту подмноже-ство I и каждой роли - бинарное отношение на I. Объ-екты отображаются в единственный элемент I.TOP-CONCEPT INOTHING ∅TOP-ROLE I IIDENTITY {(d,d) | d I }and [C,D] CIDIor[C,D] CIDInot[C] I\CIall[p,C] {d I | pI (d) CI }some[p,C] {d I | pI (d) CI∅}at-least[n,p] {d I | |pI (d)| ≥ n }at-most[n,p] {d I | |pI (d)| ≤ n }at-least-c[n,p,C] {d I | |pI(d) CI| ≥ n }at-most-c[n,p,C] {d I | |pI(d) CI| ≤ n }same-as[p,q] {d I | pI(d) = qI(d) }subset[p,q] {d I | pI(d) qI(d) }not-same-as[p,q] {d I | pI(d) qI(d) }fills[p,b] {d domI | bI pI(d) }not-fills[p,b] {d domI| bI ∉ pI(d) }one-of[b1,...,bm] {bI1,...,bIm}role-and[p,q] pI qIrole-or[p,q] pI qIrole-not[p] I I \RIinverse[p] {(d,d') | (d,d') RI }restrict[p,C] {(d,d') pI | d'CI }compose[p,q] pI qIproduct[C,D] CI DItrans[p] Un>1 (pI)nРис. 2. Набор конструкторов описанийВажнейшей особенностью дескрипторных логик, ихвизитной карточкой, является способность строить ие-рархии на концептах. Говорят, что концепт С являетсяподклассом концепта D (CD), если при любой интер-претации I, CIDI(например, концепт с рис. 1 являетсяподклассом концепта: and COURSE, (at-most 10 takers)).Аналогично, концепты C и D несвязны, если при лю-бой интерпретации I, CIDI=∅ (например, концепт срис. 1 и (and COURSE, (at-least 7 takers))). И, наконец,С согласован, если существует хотя бы одна интерпре-тация I, такая, что CI∅.3. ПРИМЕНЕНИЕ ДЕСКРИПТОРНЫХ ЛОГИКВ СУБЗПроиллюстрируем использование ДЛ в описании дан-ных и запросов на примере, приведенном в [4]. Пред-положим, что мы определили схему небольшой базызнаний, включая некоторые примитивные классы PERSONS,STUDENTS, SUBJECTS, SCIENCES и роли hassubject,teaches, taughtBy, age и takers. Опишем некото-рое состояние системы. Для начала необходимо ввестиновый объект, например Crs431:Crs431:= CREATE-IND().Информация о подобных объектах хранится в базезнаний двумя способами: указанием класса, к которомуони принадлежат («Crs431 есть экземпляр COURSE») иуказанием их связей через роли («Объекту Crs431 пре-подает Смит и Анна посещает объект Crs431»). Дляэтих целей используются операторы INSERT-IN иFILL-WITH, применяемые следующим образом:INSERT-IN(Crs431,COURSE)FILL-WITH(Crs431,taughtBy,Смит)FILL-WITH(Crs431,takers,Анна)3.1. Использование ДЛ в запросахОчевидно, что после некоторого заполнения БДинформацию потребуется извлечь. Запрос к СУБЗ, ос-нованной на ДЛ, представляет собой описание, харак-теризующее искомое множество объектов. Например,если мы захотим получить данные о «всех курсах с неменее чем 10 студентами, на которых преподают пре-подаватели с факультета информатики», запрос долженвыглядеть следующим образом:and (COURSE, at-least (10,takers),all (taughtBy, all (in-dept,Информатика)))Дескрипторные логики хорошо зарекомендовалисебя в ситуациях, когда пользователи слабо знакомы ссодержимым или структурой данных или когда они несовсем уверенны в том, какой запрос сформировать.Помимо этого они очень хорошо подходят к примене-нию в «data-mining» - поиске интересных последова-тельностей и зависимостей в больших объемах данных,накопленных в других целях [6]. В последнем случаеиспользуется возможность построения иерархии за-просов, с помощью которой можно:1. Определять недопустимые запросы, для которыхиз схемы базы знаний вытекает невозможность вернутьхотя бы одно значение и предупреждать о неправиль-ной формулировке запроса [7].2. Плавно обобщать запрос, поскольку довольночасто пустой ответ неудовлетворителен даже для пра-вильно сформулированного запроса. В таких ситуацияхзапрос обобщается до тех пор, пока в ответе не будетполучено непустое значение.3. Оптимизировать запросы на основе семантикиданныхобъект был описан в БД или которые явились резуль-татом дедуктивного вывода. Таким образом, для вы-шеприведенных вопросов мы можем получить ответвида and (FACULTY, fills (department, Ин-форма-тика)) или range(19,25). Эта возмож-ность полезна не только, когда информация неполна,но и когда мы не хотим получить ответ в виде спискаиз-за его большого размера. В [9] было предложено втаких ситуациях давать абстрактные ответы: в случае сДЛ таким ответом является генерирование наименьше-го общего надкласса, описывающего общие свойстванайденных объектов. На рис. 4 для двух описаний (а)представлены их наибольший общий подкласс (б),наименьший общий надкласс (в) и связанное дополне-ние между (в) и первым описанием из (а). Последнеенуждается в дополнительном комментарии: для двухописаний В и С, таких, что ВС, связанным дополне-нием называется такое максимальное описание D, чтоand(C,D)B.and (COURSE,at-most(25,takers),all(taughtBy, one-off(Gauss, Euclid)))and (COURSE, prim(FUNNY-EVENT),at-most(20,takers),all(taughtBy, one-off(Gauss,Marx)))а) Два описанияand (COURSE, FUNNY-EVENT,at-most(20,takers),all(taughtBy, one-off(Gauss)))б) Пересечение двух описаний из а)and (COURSE,at-most(25,takers),all(taughtBy, one-off(Gauss,Euclid,Marx)))в) Объединение двух описаний из а)all(taughtBy, one-of(Gauss,Euclid,Marx)))г) Связанное дополнение в)и первого описания а)??????Рис. 4. Пример дедуктивных операцийнад двумя описаниямиНаконец, когда схема БД очень велика либо когдапользователь не знаком с семантикой БД, находят своеприменение интенсиональные ответы на запросы: онипоказывают, какими свойствами на самом деле долженбыл бы обладать объект, чтобы удовлетворять запросу.Например, такая возможность бывает полезна при ра-боте группы разработчиков над одним очень большимпроектом, содержащим множество ограничений наданные в схеме БД [10]. При добавлении в командунового разработчика, интенсиональные ответы помога-ют ему быстро разобраться в этой скрытой структуре.Существуют довольно развитые логики и приложения [6,7], ориентированные именно на удобство и богатые возмож-н ости работы с запросами и полученными ответами.4. ИСПОЛЬЗОВАНИЕ ДЛВ ОПИСАНИИ И КЛАССИФИКАЦИИГРАФИЧЕСКИХ ДАННЫХДля многих приложений данные могут представлять-ся не только текстовыми и числовыми выражениями, нои графическими объектами (такими как видео или фото-снимки). Типичным примером могут являться геоинфор-мационные системы (ГИС), включающие в себя большоеколичество аэро- и фотоснимков поверхности Земли. Длятого, чтобы эффективно использовать графические дан-ные ([13]), необходимо хранить не только изображениясами по себе, но и некоторые сведения о них, которыеможно разделить на две группы: регистрационные дан-ные - связанные с форматом изображения (размер в пик-селях, способ сжатия, дата создания и т.д.) и метаданные- содержащие семантическую и синтаксическую инфор-мацию об изображении. Регистрационные данные состо-ят обычно из элементарных типов, поддерживаемыхклассическими СУБД, и не доставляют особых трудно-стей в своем хранении и обработке. Существенно болеепроблемными в этом отношении оказываются метадан-ные, которые используются для представления семанти-ческого содержания и структуры (синтаксиса) графиче-ских данных.Синтаксические данные, как правило, могут бытьизвлечены из изображения автоматически (как, напри-мер, спектральные составляющие и пространственныеотношения на свойствах изображения, специфичныхдля носителя и не связанных с реальным миром). За-просы к таким данным основываются на:− вычислимых характеристиках (например, распре-делении цвета, текстурных сигнатурах);− функциях, определенных пользователем (напри-мер, определение изменений распределения цвета ввидеоряде);− нетекстовых описаниях (например, цветовых па-литрах, поиске по примеру);− структурных пространственно-временных отношениях(например, «желтый объект в правом верхнем углу снимка»).Очевидно, что в системах, ориентированных насинтаксические данные, слабо учитывается семантикаизображения, его связь с реальным миром.Напротив, семантические данные отражают смысл изо-бражения. Для этих целей используются аннотации, обыч-но выраженные в виде ключевых слов, привязанных к гра-фическому объекту, организованных в индексы и, как пра-вило, использующих SQL в качестве языка запросов. Клю-чевые слова не заменяют собой синтаксических описаний -довольно сложно описать словами текстуру, форму илицвет. Однако использование их наталкивается на естест-венную преграду: отсутствие стандартного словаря влечетзависимость результата запроса от переименования однихи тех же объектов, а фиксированный словарь делает систе-му нерасширяемой для использования графических дан-ных при другой интерпретации их содержимого.Гораздо более эффективным представляется [11, 12]моделирование отношений между сущностями реальногомира и графическими данными. Именно для этих целейочень хорошо подходят дескрипторные логики, которыепозволяют соединить неинтерпретируемые «голые» гра-фические данные и семантическую модель окружающегомира, автоматически классифицировать описания (и, сле-довательно, изображения) и использовать понятие «кон-цептуальной схожести для неточных запросов, а так жепозволяют рассматривать изображения с различных то-чек зрения в различных ситуациях.5. ЗАКЛЮЧЕНИЕДескрипторные языки представляют удобный инстру-мент для манипулирования данными, нашедший примене-ние практически во всех областях, включая базы данных [8],медицину [11], лингвистику и языки программирования.Область их применения постоянно растет. В настоящее вре-мя, помимо ставших уже «классическими» дескрипторныхлогик, разработаны расширения для вероятностных ДЛ [13],дескрипторных логик, позволяющие строить n-арные отно-шения на домене [14], и другие, увеличивающие вырази-тельность языка и стройность создаваемой с их помощьюмодели предметной области.
Скачать электронную версию публикации
Загружен, раз: 237
Ключевые слова
Авторы
ФИО | Организация | Дополнительно | |
Колтун Павел Николаевич | Томский государственный университет | аспирант кафедры программирования факультета прикладной математики и кибернетики | |
Новосельцев Виталий Борисович | Томский государственный университет | доцент, кандидат физико-математических наук, докторант кафедры программирования факультета прикладной математики и кибернетики | vbn@osu.cctpu.edu.ru |
Романчук Елена Александровна | Томский государственный университет | аспирант кафедры программирования факультета прикладной математики и кибернетики | helen@fpmk.tsu.ru |
Ссылки
