Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л 12 5-1.doc
Скачиваний:
4
Добавлен:
09.08.2019
Размер:
114.18 Кб
Скачать

5. Системы баз знаний

    1. Общее представление.

Более детальное описание позволяет подразделить информацию, хранящуюся в базе данных, на информацию, характеризующую структуры пользовательских данных (описание структурной части схемы базы данных); информацию, представляющую собственно наборы пользовательских данных; правила, определяющие ограничения целостности базы данных, триггеры базы данных, представляемые (виртуальные) отношения и т.п.

Информация первого и второго вида описывает объекты (сущнос­ти) реального мира, моделируемые в базе данных, т.е. явные факты, предоставленные пользователями для хранения в БД. Эту часть базы данных принято называть экстенсиональной.

Информация третьего вида используется СУБД при выполнении раз­личного рода операций, задаваемых пользователями. Ограничения целос­тности могут блокировать выполнение операций обновления базы данных, триггеры вызывают автоматическое выполнение специфицированных действий при возникновении специфицированных условий. Эту часть базы данных принято называть интенсиональной, и она содержит не непосредственные факты, а информацию, характеризующую семантику предметной области.

В большинстве баз данных наиболее важную роль играет экстенсиональная часть, а интенсиональная часть играет вспомогательную роль.

В системах баз знаний обе части — экстенсиональная и интенсиональная — являются равноправными.

Появление систем баз знаний (по аналогии с системами баз дан­ных) или систем, основанных на знаниях (knowledge-based systems), обусловлено ведущей ролью знаний в том направлении компьютерной науки, которое принято называть искусственный интеллект. Способ­ность системы использовать в нужный момент релевантные знания считается показателем ее интеллектуальности. Системами, осно­ванными на знаниях (СОЗ), будем называть программные компьютерные системы, использующие обработку знаний как один из основных способов решения задач. Наиболее популярным и используемым клас­сом СОЗ являются экспертные системы (ЭС). Под ЭС понимается программная система, имитирующая действия человека-эксперта по до­стижению удовлетворительного и эффективного результата при решении задачи в узкой предметной области (ПО). Многие теоретические и практические достижения по обработке знаний в ЭС могут быть обобще­ны и для других классов СОЗ.

Что же такое знания! Когда речь идет об автоматизированной об­работке знаний, т.е. об использовании знаний, представленных в компьютере, это понятие используется в узком, прикладном смысле. Наиболее конструктивным представляется подход к определению этого термина, предложенный в ряде работ Д.А. Поспеловым. Суть подхода — рассмотрение знаний в сравнении с традиционным, устоявшимся (хотя также не имеющим строгого определения) термином данные. Среди свойств, отличающих знания от данных, наиболее существенными являются следующие:

высокая степень структурированности: выделение в общем массиве знаний разнообразных блоков, фрагментов, узлов и других единиц знаний, перекрывающихся и вкладывающихся друг в друга;

сложная структура связей между единицами знаний;

активность, т.е. уникальное свойство знаний определять и инициировать алгоритмы собственной обработки.

Научные, методологические и технологические аспекты построения автоматизированных систем, использующих знания, исследует инженерия знаний или компьютерная когнитология.

В инженерии знаний ведется работа по следующим основным направ­лениям:

приобретение знаний;

представление знаний;

поддержка системы знаний.

5.2. Приобретение и представление знаний

Для приобретения знаний нужно последовательно решить две задачи:

выяснить, какие знания требуются СОЗ для эффективного решения за дачи;

определить, как наполнить систему релевантными знаниями.

Проблеме приобретения знаний в последние годы уделяется значительное внимание.

Представление знаний охватывает проблему разработки структуры и архитектуры базы знаний. База знаний (БЗ) — это совокупность фактических единиц, правил и средств их представления, описывающая предметную область (ПО) и вместе с процедурами обработки позволяющая отвечать на вопросы об этой ПО, ответ на которые в явном виде не присутствует в базе.

Для представления знаний чаще всего используются следующие моде­ли знаний:

модели, основанные на правилах (логическая или продукционная);

фреймы;

семантические сети.

Однако понятие представление знаний (ПЗ) должно трактоваться гораздо шире. Следует выделить, по крайней мере, четыре уровня ПЗ:

концептуальный;

формальный;

внутренний;

внешний.

Совокупность выбранных на всех уровнях форм ПЗ образует систему ПЗ.

Концептуальный уровень описывает модель ПЗ, которая, в свою очередь, определяет общую структуру БЗ и принципы построения СОЗ. Кроме того, модель ПЗ связывает все остальные уровни ПЗ в единую, целостную систему.

Формальный уровень ПЗ дает возможность выработать единый взгляд на принятую систему знаний. Удачно выбранный или введенный формализм позволяет разработчику СОЗ:

оценить полноту и целостность используемых форм ПЗ;

обосновать правомочность применяемых алгоритмов манипулирования знаниями;

с единых позиций подойти к разработке БЗ, решателя, интеллектуаль­ного интерфейса и других компонентов СОЗ;

обобщить полученные при проектировании БЗ результаты с целью дальнейшего использования в исследовательской и практической дея­тельности.

Поэтому формальный уровень ПЗ является необязательной, но желательной частью законченных систем представления знаний.

Внутренний уровень ПЗ задает реальную логико-физическую организацию данных в рамках концептуальной модели. Очевидно, что одна и та же модель в зависимости от выбранных критериев, пристрастий и фантазии разработчиков реализуется по-разному. Например, во фреймовой модели [58] фреймы могут представлять собой последовательные файлы, файлы реляционных баз данных или иметь какую-либо другую организацию.

Внешний уровень ПЗ определяет язык общения пользователя с БЗ (интеллектуальный интерфейс). Точнее, развитый интеллектуальный интерфейс обеспечивает не одну, а несколько моделей пользователя с одной и той же БЗ: модель пользователя-неспециалиста, пользователя-новичка, пользователя-профессионала и т.п. Внешний уровень обеспечивается комплексом средств, позволяющих пользователю воздействовать на БЗ: как правило, изменять (удалять, добавлять) содержащуюся в ней информацию, а иногда и модифицировать структуру БЗ.

Дополнительно знания могут быть разделены на:

процедурные,

декларативные.

5.3. Модели знаний, основанные на правилах

Простейшее представление знаний, основанное на правилах, построено на использовании продукционных правил или продукций вида :

ЕСЛИ (условие) ТО (действие).

Если некоторые факты удовлетворяют или согласуются с условием час­ти ЕСЛИ, тогда выполняется действие, определенное в части ТО продук­ционного правила.

В общем виде продукцию записывают следующим образом:

ЕСЛИ условие 1, условие 2,..., условие NТО действие 1.

Такая запись означает, что если все условия 1, ...,N выполняются, то сле­дует выполнить действие 1.

Сопоставление условий правил с фактами порождает цепочку вывода, а методы сопоставления называются методами вывода.

Пример 5.4

Пусть заданы: продукционное правило 1: ЕСЛИ Z является отцом X,Z является отцом Y, X и Y не являются одним и тем же лицом, ТО Х и Y являются братьями;

продукционное правило 2:

ЕСЛИ Y является отцом X,

Z является братом Y, ТО Y является дядей X.

где X, Y, Z — переменные, на место которых подставляются значения фактов.

Пусть также задано множество фактов: Иван является отцом Виктора; Иван является отцом Николая; Виктор является отцом Сергея.

Из знаний, заданных правилами 1 и 2, на основе вышеприведенных фактов можно формально вывести заключения, что: Виктор является братом Николая, Николай является дядей Сергея.

Другой формой представления знаний, основанных на правилах, является логика предикатов.

Среди постреляционных БД существуют дедуктивные БД, использующие модели, основанные на правилах. Дедуктивные БД состоят из двух частей: экстенсиональной, содержащей факты, и интенсиональной, содержащей правила для логического вывода новых фактов. Вывод осу­ществляется на основе экстенциональной части и запроса пользова­теля.

Основным отличием дедуктивной СУБД от любой другой является то, что правила интенсиональной части БД формируются с помощью продукций или логики предикатов и соответствующих правил вывода. Обыч­но языки запросов и определения интенсиональной части БД являются логическими (поэтому дедуктивные БД часто называют логически­ми). Имеется прямая связь дедуктивных БД с базами знаний (интенсиональную часть БД, как, впрочем, и всю дедуктивную БД можно рассматри­вать как БЗ).

Последовательность создания СОЗ применительно к использованию знаний изложена не случайно. Исторически сложилось так, что до недавнего времени специалистами по инженерии знаний уделялось значительно большее внимание первым этапам разработки СОЗ, чем предпоследнему и, особенно, последнему. Это, вероятно, объясняется многообразием про­блем и материала для исследований еще на первых стадиях проектирования. Однако пренебрежение процессом наполнения и ведения БЗ может привести к тому, что созданная по всем правилам программистского искусства оболочка СОЗ так и останется красивой игрушкой. И если в после­дние годы важность задач извлечения знаний и наполнения БЗ стала при­знаваться специалистами, то вопросы поддержки (или даже улучшения) качества БЗ в процессе эксплуатации СОЗ прорабатываются явно недостаточно.

Обобщенные требования, которым должны удовлетворять эксплуати­руемые БЗ, на наш взгляд, выглядят так:

Релевантность. БЗ можно считать релевантной поставленной задаче, если она содержит ту и только ту информацию, которая необходима для решения поставленной задачи.

Обоснованность [59]. БЗ будем считать обоснованной, если содержа­щиеся в ней знания являются надежными, с точки зрения источника информации:

знания внесены авторитетным экспертом, имеющим полномочия на добавление информации;

при наличии полномочий на добавление информации у нескольких экспертов, добавляемые знания согласованы с ними (при другом подходе знания авторизованы, т.е. в БЗ вносится информация об источнике);

знания прошли входной формально-логический, а по возможности, и семантический контроль;

Согласованность. БЗ обладает свойством согласованности по отноше­нию к некоторой совокупности пользователей, если в любой момент времени все пользователи этой группы на конкретный запрос получают одинаковый ответ [60].

Полнота. БЗ должна быть полной: она должна содержать ответы на все возможные вопросы в предварительно очерченной и структурированной ПО [59]. Полнота создаваемой БЗ должна, как минимум, достигать полноты знаний специалиста в данной ПО [6].

Непротиворечивость [59, 61]. БЗ должна быть непротиворечивой: она должна содержать непротиворечивые ответы на любые заданные вопросы.

Динамичность. Под динамичностью БЗ понимается ее способность к модификации. Если БЗ подвержена интенсивным изменениям, выполнение процедур включения и удаления единиц знаний становится вопросом первоначальной важности при проектировании физической организации БЗ. Необходимость изменения БЗ может быть вызвана: устареванием существующих знаний; появлением новых или дополнительных сведений; выявлением несоответствий, противоречий в БЗ;

Расширяемость. БЗ должна обладать способностью к расширению. Возможны случаи, когда единиц знаний добавляется значительно боль­ше, чем уничтожается, что увеличивает объем БЗ. Поэтому нужна фи­зическая организация, которая позволяет обрабатывать подобное расширение.

Целостность. БЗ обладает свойством целостности (устойчивости), если она сохраняет правильный результат решения ранее решенных задач при любых изменениях БЗ.

Безопасность. Под безопасностью БЗ понимается защита знаний от преднамеренного или непреднамеренного доступа, модификации

или разрушения. Основной задачей поддержания безопасности является запрещение несанкционированного доступа к знаниям при минимальных затратах.

Учет эксплуатационных ограничений. Под эксплуатационными ограничениями, накладываемыми на БЗ, понимаются, как правило:

необходимый состав технических средств для эксплуатации БЗ; программные средства, обеспечивающие среду эксплуатации БЗ (например, операционная система);

ограничения на требуемый размер внешней и оперативной памяти для хранения и разворота БЗ во время сеанса работы; ограничения на максимальное время отклика и т.д.

Указанные ограничения определяются требованиями пользователей, стоимостью и доступностью технических и программных средств, соста­вом и квалификацией разработчиков.

Для того чтобы БЗ удовлетворяла перечисленным требованиям и не снижала качества функционирования в процессе эксплуатации, раз­рабатываются специальные программные средства отладки и коррекции БЗ. Отладка БЗ направлена на поиск ошибок и пробелов в знаниях и их устранение, а коррекция БЗ — на ее развитие. Наиболее распространенным названием таких средств является редактор баз знаний (РБЗ).

Список функций, выполняемых развитым РБЗ, выглядит следующим образом:

отображение полной структуры БЗ на экране компьютера для оценки целостного образа знаний; при этом происходит преобразование знаний из внутреннего представления во внешний формат отображения, максималь­но дружественный для пользователя;

навигация но структуре БЗ с отображением отдельных фрагментов БЗ;

поиск фрагментов БЗ по формальным и содержательным призна­кам;

добавление новых знаний;

удаление фрагментов знаний из БЗ;

модификация фрагментов знаний, изменение связей между фрагментами; входной контроль вносимой информации;

поддержка семантической целостности БЗ после выполнения операций добавления, удаления, модификации;

инициализация тестовых примеров для проверки полноты и непротиворечивости БЗ;

контроль, регистрация и авторизация изменений, вносимых в БЗ;

объяснение выполняемых действий.

Прямое использование знаний из базы знаний для решения задач обеспечивается механизмом получения решений — процедурой поиска, плани­рования, решения. Механизм решения дает возможность извлекать из базы знаний ответы на вопросы, получать решения, формулируемые в терминах понятий, хранящихся в базе.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]