Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МУ ПЗ

.pdf
Скачиваний:
17
Добавлен:
09.02.2015
Размер:
1.02 Mб
Скачать

онтологии, и графические элементы SL не несут достаточной информации для полного представления и анализа системы, тем самым они не предназначены для сохранения при конечном этапе проекта. Тщательный анализ, обеспечение полноты представления структуры данных, полученных в результате онтологического исследования, являются задачей применения языка EL.

21

Обозначения классов,

Обозначение взаимосвязей

Обозначение процессов,

отдельных элементов

и изменения состояния

соединений и перекрестков

Обозначение класса:

Обозначение первичных

Обозначение процесса

 

взаимосвязей:

 

 

1)

Взаимосвязь многие со

 

 

многими

 

Обозначение отдельного

 

 

Обозначение соединений:

 

 

 

элемента:

 

 

 

 

2)

Взаимосвязь двух классов

 

 

Обозначение вторичных

 

 

взаимосвязей между двумя

Обозначение перекрестков:

 

классами:

 

 

Обозначения изменения

 

 

состояния:

 

 

1)

Медленное изменение

 

 

2)

Быстрое изменение

 

 

3)

Мгновенное изменение

 

 

 

 

 

Рис. 1. Схематические графические изображения IDEF5 Виды схем и диаграмм IDEF5

Как правило, наиболее важные и заметные зависимости между объектами всегда являются преобладающими, когда конкретные люди высказывают свои знания и мнения, касающиеся той или иной системы. Подобные взаимосвязи явным образом описываются языками IDEF5. Всего существует четыре основных вида схем, которые наглядно используются для накопления информации об онтологии в достаточно прозрачной графической форме.

1. Диаграмма классификации. Диаграмма классификации обеспечивает механизм для логической систематизации знаний, накопленных при изучении системы. Существует два типа таких диаграмм: Диаграмма строгой классификации (Description Subsumption - DS) и диаграмма естественной или видовой классификации (Natural Kind Classification - NKC). Основное отличие диаграммы DS заключается в том, что определяющие свойства классов высшего и всех последующих уровней являются необходимым и достаточным признаком принадлежности объекта к тому или иному классу. На рис. 2 приведен пример такой диаграммы, построенной на основе тривиальной возможности классификации многоугольников по количеству углов. Из геометрии известно точное математическое определение многоугольника, суть определяющих свойств родительского класса. Определяющим свойством каждого дочернего класса дополнительно является количество углов в многоугольнике. Очевидно, зная это определяющее свойство для любого

22

многоугольника, можно однозначно отнести его к тому или иному дочернему классу. С помощью диаграмм DS, как правило, классифицируются логические объекты.

Диаграммы естественной классификации или же диаграммы NKC, наоборот, не предполагают того, что свойства класса являются необходимым и достаточным признаком для принадлежности к ним тех или иных объектов. В этом виде диаграмм определение свойств класса является более общим. Пример такой диаграммы также приведен на рис. 2.

2.Композиционная схема. Композиционные схемы (Composition Schematics)

являются механизмом графического представления состава классов онтологии и фактически представляют собой инструменты онтологического исследования по принципу "Что из чего состоит". В частности, композиционные схемы позволяют наглядно отображать состав объектов, относящихся к тому или иному классу. На рис. 3 изображена композиционная схема шариковой ручки, относящейся к классу шариковых автоматических ручек. В данном случае шариковая ручка является системой, к которой мы применяем методы онтологического исследования. С помощью композиционной схемы мы наглядно документируем, что авторучка состоит из нижней и верхней трубки, нижняя трубка в свою очередь включает в себя кнопку и фиксирующий механизм, а верхняя трубка включает в себя стержень и пружину.

3.Схема взаимосвязей. Схемы взаимосвязей (Relation Schematics) позволяют разработчикам визуализировать и изучать взаимосвязи между различными классами объектов в системе. В некоторых случаях схемы взаимосвязей используются для отображения зависимостей между самими же классовыми взаимосвязями. Мотивацией для развития подобной возможности послужило то тривиальное правило, что все вновь разработанные концепции всегда базируются на уже существующих и изученных. Это тесно согласуется с теорией Новака и Гоуэна (Novak & Gowin, 1984), суть которой в том, что изучение любой системы часто происходит от частного к общему, то есть, происходит изыскание и исследование новой частной информации, влияющее на конечные характеристики более общей концепции, к которой эта информация имела прямое отношение. Исходя из этой гипотезы, естественным образом изучения новой или плохо понимаемой взаимосвязи является соотнесение ее с достаточно изученной взаимосвязью, для исследования характеристик их сосуществования.

4.Диаграмма состояния объекта. Диаграмма состояния объекта (Object State Schemantic) позволяет документировать тот или иной процесс с точки зрения изменения состояния объекта. В происходящих процессах могут произойти два типа изменения объекта: объект может поменять свое состояние или класс. Между этими двумя видами изменений по сути не существует принципиальной разницы: объекты, относящиеся к определенному классу K в начальном состоянии в течение процесса могут просто перейти к его дочернему или просто родственному классу. Например, полученная в процессе нагревания теплая вода, уже относится не к классу ВОДА, а к его дочернему классу ТЕПЛАЯ ВОДА. Однако при формальном описании процесса, во избежание путаницы, целесообразно разделять оба вида изменений, и для такого разделения используется обозначения следующего вида: "класс:состояние". Например теплая вода будет описываться следующим образом: "вода:теплая", холодная - "вода:холодная" и так далее. Таким образом, диаграммы состояния в IDEF5 наглядно представляют изменения состояния или класса объекта в течение всего хода процесса. Пример такой диаграммы приведен на рис. 4.

Пример(ы)

23

parent

parent

Рисунок 1. Семантическая сеть для предметной области «Семья»

24

25

Выводы: В ходе практического занятия были получены практические навыки построения графов для визуализации знаний онтологии.

26

5. Представление знаний на языке дескрипционной логики

Цель работы: Получение практических навыков записи знаний онтологии на одном из языков дескрипционной логики.

Исходные положения

Дескрипционная логика - семейство языков представления знаний, позволяющих описывать понятия предметной области в недвусмысленном, формализованном виде.

ДЛ можно рассматривать как разрешимые фрагменты логики предикатов, синтаксически же они близки к модальным логикам.

Свое современное название ДЛ получили в 1980-х. Прежние названия:

терминологические системы, логики концептов. В настоящее время ДЛ являются важным в концепции Семантической паутины, где их предполагается использовать при построении онтологий.

Базовые понятия

Атомарные концепты:

соответствуют 1-местным предикатам (как правило, задают объявление экземпляра класса)

концепт Person (X: Person) соответствует предикату Person(X), или type(X, Person)

концепт Man (X: Man) соответствует предикату Man(X), или type(X, Man)

концепт Woman (X: Woman) соответствует предикату Woman(X), или type(X, Woman)

концепт Male (X: Male) соответствует предикату Male(X)

концепт Female (X: Female) соответствует предикату Female(X)

Атомарные роли:

соответствуют 2-местным предикатам (как правило, задают отношения между классами и экземплярами классов)

роль hasChild (X hasChild Y) соответствует предикату parent(X, Y)

Составные концепты

Дополнение концепта:

A

объекты, не принадлежащие концепту A

Woman - объект не является женщиной (т.е. является мужчиной)

Пересечение концептов:

С D

объекты, принадлежащие обоим концептам

Person Male - объект является человеком мужского пола (т.е. является мужчиной)

Объединение концептов:

С D

объекты, принадлежащие хотя бы одному концепту

Man Woman - объект является или мужчиной, или женщиной (т.е., в общем случае, человеком)

Ограничение на значения роли:

R.C

все атрибуты роли R принадлежат концепту C

hasChild.Female - все дети объекта женского пола

Экзистенциальное ограничение:

27

R.C

хотя бы один из атрибутов роли R принадлежит концепту C

hasChild.Female - среди детей объекта есть хотя бы одна девочка

Численные ограничения на значения роли:

nR, nR, nR.C, nR.C

у некого субъекта существует не меньше (не больше) n элементов с ролью R (и значением, равным концепту C)

3hasChild - у некого субъекта имеется не меньше 3-х детей

Синтаксис логики ALC

Дескрипционная логика ALC (от Attributive Language with Complement) была введена в 1991 году и является одной из базовых ДЛ, на основе которой строятся многие другие ДЛ. Пусть заданы непустые конечные множества атомарных концептов и атомарных ролей. Тогда следующее является индуктивным определением составных концептов логики (для краткости, в этом определении будем называть их просто концептами):

атомарные концепты;

универсальный концепт (всѐ множество): T;

пустой концепт (пустое множество): ;

дополнение концепта: A;

пересечение концептов: С

D;

объединение концептов: С

D;

квантор всеобщности: R.C;

квантор существования: R.C.

Связь с логикой предикатов

Многие ДЛ, включая ALC, можно рассматривать как фрагменты логики предикатов при "естественном" переводе концептов в предикатные формулы. Если в ALC имеются атомарные концепты A1, ..., Am и атомарные роли R1, ..., Rn, то для перевода вводятся одноместные предикатные символы P1, ..., Pm и двуместные предикатные символы S1, ..., Sn,

асам перевод задается индуктивно следующим образом:

атомарные концепты Ai переходят в формулы Pi(x);

дополнение , пересечение и объединение концептов переходит в

 

соответствующие булевы связки: отрицание , конъюнкцию и дизъюнкцию ;

выражение

Rj.C переходит в

y(Sj(x, y)

C'(y));

выражение

Rj.C переходит в

y(Sj(x, y)

C'(y)).

В последних двух пунктах переменная y - свежая (не встречавшаяся ранее), а C' есть перевод концепта C (который уже построен по предположению индукции).

Структура базы знаний на основе ДЛ

Аксиомы TBox:

словарь и определение основных терминов (концептов и ролей)

Mother Woman hasChild.Person - мать - это женщина, имеющая детей (класса «Человек»)

Утверждения ABox:

описание мира, объектов этого мира в терминах концептов и ролей

BEN: Man - BEN является мужчиной;

(BEN, TOM): hasChild - у BEN есть ребѐнок TOM;

BEN hasChild JANE - JANE является ребѐнком BEN.

ДЛ-архитектура

28

Расширения ALC

Существуют многочисленные расширения логики ALC дополнительными конструкторами для построения концептов, ролей, а также дополнительными видами аксиом в TBox. Имеется неформальное соглашение об именовании получающихся при этом логик - обычно путѐм добавления к имени логики букв, отвечающих добавленным в язык конструкторам. Наиболее известными расширениями являются:

F - Функциональность ролей: концепты вида ( 1R), означающие: существует не более одного R-последователя;

N - Ограничения кардинальности ролей: концепты вида ( nR), означающие: существует не более n R-последователей;

Q - Качественные ограничения кардинальности ролей: концепты вида ( nR.C), означающие: существует не более n R-последователей в C;

I - Обратные роли: если R есть роль, то R- тоже является ролью, означающей обращение бинарного отношения;

O - Номиналы: если a есть имя индивида, то {a} есть концепт, означающий одноэлементное множество;

H - Иерархия ролей: в TBox допускаются аксиомы вложенности ролей R S;

S - Транзитивные роли: в TBox допускаются аксиомы транзитивности вида Tr(R);

R - Составные аксиомы вложенности ролей в TBox (R S R, R S S) с условием ацикличности, где R S есть композиция ролей;

(D) - Расширение языка конкретными доменами (типами данных).

Связь с языком OWL

Официальной рекомендацией W3C от 10 февраля 2004 года является версия языка OWL 1.0. Данная спецификация языка OWL подразделяется на следующие варианты:

OWL-Lite - соответствует дескрипционной логике SHIF(D);

OWL-DL - соответствует дескрипционной логике SHOIN(D);

OWL-Full - не соответствует какой-либо ДЛ, более того, является неразрешимым. Находящаяся в стадии рабочего черновика новая версия языка OWL 1.1 покрывает

дескрипционную логику SROIQ(D), включающую в себя логику SHOIQ(D), составные аксиомы вложенности ролей в TBox (буква R в названии логики), а также аксиомы непересекаемости, рефлексивности, иррефлексивности и асимметричности ролей, универсальную роль, конструктор концепта R.Self (интерпретируемый как множество элементов, являющихся R-последователем самих себя) и допускает утверждения R(a, b) в

ABox.

Одновременно с этим разрабатывается следующая версия языка OWL 2.0, которая, помимо перечисленного, даст возможность формулировать онтологии в языке, соответствующем дескрипционной логике EL (преимущество которой в том, что она имеет полиномиальную вычислительную сложность); привнесѐт синтаксические улучшения,

29

позволяющие легче составлять запросы к базам знаний и выдавать ответы на них; а также будет содержать механизмы для формулировки правил логического вывода.

ДЛ-ризонеры

Имеется множество программных систем (машин вывода), позволяющих совершать логический анализ в дескрипционных логиках (проверять онтологию на непротиворечивость, строить таксономии, проверять выполнимость и вложенность концептов, делать запросы к базам знаний и т.п.). Подобные системы различаются по поддерживаемым ими дескрипционным логикам, по типу реализованной в них разрешающей процедуры (например, табло-алгоритм, резолюция и т.п.), по поддерживаемым форматам данных, языку программирования, на котором они реализованы, и другим параметрам. Среди наиболее известных можно перечислить системы:

CEL - поддерживает логику EL+, имеющую полиномиальную сложность, написан на

LISP;

FaCT++ - поддерживает логику sROIQ(D), а также OWL 2.0, реализует таблоалгоритм, написан на C++;

KAON2 - поддерживает логику SHIQ, расширенную специальными правилами вывода, реализует алгоритм, основанный на резолюции, написан на Java;

Pellet - поддерживает логику sROIQ(D), а также OWL 1.1, реализует табло-алгоритм, написан на Java;

RacerPro - поддерживает логику SHIQ(D), реализует табло-алгоритм, написан на

LISP.

Создан единый ресурс - список машин ДЛ-вывода, постоянно поддерживаемый в

актуальном состоянии и описывающий основные аспекты этих и других программных систем, обеспечивающих логический вывод в ДЛ.

 

 

Пример(ы)

Предметная область: семья.

Аксиомы TBox:

 

Woman

Person

Female - женщина - это человек женского пола

Mother

Woman

hasChild.T - быть матерью означает в точности быть женщиной и иметь

ребѐнка (любого пола)

Person

hasChild.Person - у всякого человека всякий ребенок есть тоже человек

Doctor

Person - всякий доктор является человеком

Утверждения ABox:

MARY: Woman Doctor - MARY является женщиной, но не доктором MARY: hasChild.Male - у MARY есть ребѐнок мужского пола

MARY hasChild BEN - BEN является ребѐнком MARY

BEN: Doctor hasChild.T - BEN является доктором и имеет детей (любого пола)

Выводы: В ходе практического занятия были получены практические навыки записи знаний онтологии на одном из языков дескрипционной логики.

30