Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

630_Poletajkin_A.N._Sotsial'nye_iehkonomicheskie_informatsionnye_sistemy_

.pdf
Скачиваний:
7
Добавлен:
12.11.2022
Размер:
2.53 Mб
Скачать

Таблица 8.1. Основные характеристики моделей представления знаний

Модель

 

Достоинства

Недостатки

Логическая

1.

Возможность

1. Существенные ограничения,

 

непосредственного

связанные с невозможностью

 

программирования механизмов

представить специфических

 

логического вывода и

видов знаний в языке логики

 

манипулирования знаниями.

предикатов.

 

2.

Наличие четкого синтаксиса

2. Сравнительно большое

 

и формальной семантики.

время на логический вывод.

 

3.

Возможность определения

 

 

причин неудачных решений.

 

Продукционная

1.

Наглядность и понятность

1. Трудности управления

 

знаний.

продукционным выводом из-за

 

2.

Возможность реализации

сложности оценки целостного

 

немонотонного логического

образа знаний и отсутствия

 

вывода и обработки

гибкости в логическом выводе.

 

противоречивых фактов.

2. Низкая эффективность

 

3.

Возможность введения

обработки знаний из-за

 

различных модификаций в

длительной

 

интерпретацию правил в

непроизводительной проверки

 

соответствии с особенностями

применимости правил.

 

решаемых системой задач.

3. Возможность легкого

 

Возможность легкого

внесения серьезных искажений

 

наращивания базы знаний

в базу знаний.

 

путем добавления новых

 

 

правил.

 

Сетевая

1.

Легкость отображения

1. Отсутствие формального

 

отношений абстракции и

аппарата для описания и

 

единство представления для

представления модели.

 

всех видов знаний.

2. Ограниченные возможности

 

2.

Наглядность и понятность.

логического вывода.

 

3.

Допускает

 

 

целенаправленный поиск.

 

Фреймовая

1.

Структурированное

1. Относительно высокая

 

описание сложных понятий и

сложность, увеличивающая

 

решения задач с различными

трудоемкость внесения

 

способами вывода в виду явной

изменений в родо-видовую

 

вырожденности родо-видовых

иерархию и снижающая

 

связей.

скорость работы механизма

 

2.

Возможность экономии

вывода.

 

рабочей памяти компьютера.

2. Затрудненные процессы

 

3.

Допустимость вычисления

обработки исключений, а также

 

значения любого слота с

управления завершенностью и

 

помощью соответствующих

постоянством целостного

 

процедур либо эвристически.

образа знаний.

181

8.3 Экспертные системы поддержки принятия решений

Экспертные системы поддержки принятия решений представляют собой отдельный класс экспертных систем, характерной особенностью которых является способность накапливать знания в данной предметной области и управлять этими знаниями при принятии решения. Данная ЭС включает в себя два модуля – модуль накопления и управления знаниями экспертов (конструктор методик принятия решений) и модуль вывода. Структура экспертной системы поддержки принятия решений представлена на рис. 8.1. В ее центре находится информационно-программная база знаний, с которой работает механизм логического вывода. База знаний (БЗ) представляет собой ядро экспертной системы, совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и пользователю. Существует также БЗ во внутреннем «машинном» представлении. Инженер знаний взаимодействует с БЗ, используя компонент приобретения знаний. Пользователь оперирует с ЭС на языке, приближенном к естественному, при помощи лингвистического процессора. Неотъемлемой подсистемой ЭС является Компонент объяснений, обеспечивающий по запросу пользователя выдачу информации о ходе и исходе логического вывода, что принципиально отличает ЭС от всех других программных систем.

Пользо-

 

 

 

 

Компонент

Система,

 

База

 

 

приобрете-

ватель

основанная

 

знаний

 

 

 

ния знаний

 

 

 

на знаниях

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Механизм

 

 

Лингвисти-

 

 

Рабочая

 

 

 

 

 

 

логическо-

 

 

ческий

 

 

память

 

 

Инженер

 

 

 

го вывода

 

процессор

 

 

 

 

 

 

знаний

 

 

 

 

 

 

 

 

 

 

 

 

Компонент объяснений

Экспертная система

Рис. 8.1. Структура экспертной системы поддержки принятия решений

Традиционно основным поставщиком знаний для ЭС является специалист, компетентный в данной ПрО предметный эксперт. Исходя из накопленного опыта в области создания систем автоматизированной обработки информации, известно, что большая часть знаний в конкретной ПрО остается лич-

182

ной собственностью эксперта. Причиной является принципиальная неспособность эксперта передать свой опыт и знания ввиду доказанного когнитивной психологией факта – человек знает гораздо больше, чем сам осознает [46]. Данное высказывание констатирует существование так называемых неформальных, или неявных, знаний, связанное с рядом факторов:

-часть экспертных знаний носит неосознаваемый характер;

-эксперт не всегда способен оценить важность тех или иных знаний для принятия решения, а иногда и вообще не в состоянии их выразить;

-опыт, накопленный экспертом, сложно вербализовать и представить в формализованном виде.

Значительная часть знаний может быть обнаружена в нестрого определенных условиях, в которых актуализируются неосознаваемые семантические связи. Такими условиями могут быть, например, вербальный или невербальный стимул, несущий соответствующую семантику, возникновение ситуации, имеющей косвенное отношение к данному знанию, или случайно увиденный предмет. Так знания выводятся на уровень сознания предметного эксперта, после чего могут быть извлечены и формализованы инженером по знаниям.

Таким образом, основной задачей инженерии знаний является извлечение

иформализация знаний с использованием специальных приемов и методов с целью их последующего использования в качестве информационного ресурса СОЗ, которая в функциональном отношении синонимична понятию ЭС [50].

Из обзора источников [4, 47, 51] известны экспертные системы, основанные на правилах, на примерах, на принципах, на разработке моделей и др. В частности, выявлено множество фирм-разработчиков классических экспертных систем, основанных на правилах, из которых наиболее известные три: EQUIS (семейства Meta Stock и Down Loader), Omega Research (семейство Super Charts, Wall Street Analyst и Trade Station) и Market Arts (семейство Windows on Wall Street и Wall Street Money). Общие их черты – построение прогнозных графиков

итрендов, набор экономических индикаторов, набор графических инструментов, возможность разработки торговых стратегий как описания правил принятия решений, возможность формирования портфелей, поддержка разных поставщиков деловой информации. Классические экспертные системы, основанные на правилах, имеют большие функциональные возможности, но требуют, во-первых, наличия экспертов, причем не только квалифицированных, но и способных явным образом формулировать свои знания, во-вторых, подготовленных специалистов, которые умеют с такими системами работать, и в- третьих, большого времени для создания баз знаний. Наиболее известный продукт в данной области – система NExpert Object фирмы NEURON DATA. Многоплатформенное средство с набором библиотек для разработки, элементами управления базами знаний и оригинальным механизмом двунаправленного вы-

183

вода с обработкой исключительных ситуаций, путем различения "сильных" и "слабых" связей.

Из нейросетевых ЭС наиболее известна система Ward фирмы WARD SYSTEM. Помимо собственно нейросетевых алгоритмов (их в системе 15) присутствуют также возможности: обработки текстовых данных, задание правил в явном виде, работы с техническими индикаторами, обработки циклических событий, решение оптимизационных задач с помощью генетических алгоритмов, создание независимых (в т.ч. сетевых) приложений. Все перечисленные свойства можно считать фактическим стандартом для качественных систем с элементами нейросетей.

Нечеткие ЭС начали разрабатываться после появления в конце 1960-х лет области математики с названием нечеткая логика (fuzzy logic). Она разрешает сводить описание сложных предметных областей к набору основных принципов, способных управлять всей ПрО в некоторых заданных рамках. Исходя из того, что знания человека-эксперта о решении задач в условиях неполноты, нечеткости исходной информации и достигаемых целей также имеют нечеткий характер, логично применить для их формализации аппарат теории нечетких множеств и нечеткой логики [43]. Нечеткие понятия в данном случае формализуются в виде лингвистических переменных, а нечеткость действий в процессе принятия решения – в виде нечетких алгоритмов [19].

Наиболее известная из нечетких систем – пакет CubiCalc фирмы HyperLOGIC, похожий на классическую ЭС за исключениям случая, когда правил и объектов становится настолько много, что управлять ими тяжело. Другой

программный продукт с элементами нечеткой логики – таблица FuzziCalc

фирмы FuzziWare. В классический табличный процессор добавлены элементы нечеткой математики, которая разрешает проводить "приблизительные" вычисления с высокой степенью точности.

Экспертные системы, основанные на имитационных моделях, занимают свое место в задачах из области системного анализа, связанных с оценкой сложных систем с большим количеством прямых и обратных связей. Суть подхода в представлении сложных систем в виде наборов простых элементов и задание параметров их взаимосвязей. Программные продукты, которые реализуют имитационные модели, например пакет iThink фирмы High Performance System, разрешают реализовать создаваемые модели динамично.

Масштабы разработки ЭС предопределили создание специальных инструментальных средств, систематизация которых представлена на рисунке 8.2. Первоначально разработка ЭС осуществлялась на традиционных алгоритмических языках программирования с реализацией на универсальных ЭВМ. В дальнейшем были созданы специализированные аппаратные и программные средства. Появились оболочки ЭС, которые, однако, не оправдали возложенных на них надежд в связи с принципиальной сложностью использования конкретной

184

ЭС (даже весьма эффективной в своей предметной области) для решения совершенно других задач. Еще более проблематичной представляются попытки создания так называемых универсальных оболочек, пригодных для применения

«во всех» предметных областях.

Инструментальные средства разработки ЭС

Аппаратные

Интеллектуальные рабочие станции

Последовательные символьные ЭВМ (ЛИСП-машины; ПРОЛОГ-машины)

Параллельные символьные ЭВМ

Программные

Алгоритмические языки программирования

(С, Visua Basic, JAVA и др.)

Символьные языки программирования

(ЛИСП, SmallTalk и др.)

Языки инженерии знаний

(ПРОЛОГ, OSP-5, LOOPS и др.)

Системы автоматизированной разработки ЭС

(KEE, ART, AGE и др.)

Оболочки ЭС

(EMYSIN, EXPERT и др.)

Рис. 8.2. Инструментальные средства разработки ЭС

Таким образом, на сегодняшний день наиболее надежным способом разработки ЭС можно считать современные интегрированные системы, поддерживающие алгоритмический язык высокого уровня, включающие средства автоматизации программирования и взаимодействия с базами данных и использующие методы, модели и алгоритмы поддержки принятия решений, эффективные в сложных слабоструктурированных предметных областях.

185

8.4 Представление данных и знаний в социальных и экономических ИС

Рассмотрим методику представления данных и знаний применительно к предметной области прогнозирования потребительского спроса на товары народного потребления. Динамика спроса, как и всей экономической системы в России, значительна. В таких условиях эффективное планирование возможно осуществить лишь базируясь на эффективных экономических прогнозах. ИС должна решать задачи прогнозирования, планирования, а также включать в себя элементы самообучения, позволяющие ей эффективно адаптироваться в неустойчивой и нестабильной внешней среде. Привлечение к обучению компетентных специалистов – экспертов позволяет говорить о создании экспертной системы поддержки принятия решений при прогнозировании спроса.

На начальной стадии предусматривается разработка тестовой версии ЭС, предназначенной для проверки правильности кодирования фактов, связей и стратегий рассуждения экспертов. Она также дает возможность привлечь экс-

перта к активному участию в процессе разработки системы. Жизненный цикл разработки ЭС можно разделить на семь стадий, которые наряду с текущими результатами сведены в таблицу 8.2 [1]. Эта схема представляет собой грубое приближение к сложному итеративному процессу согласно спиральной модели проектирования. Эта модель не требует от разработчика разделения работы и больших временных затрат, что немаловажно в данной задаче. Рассмотрим спиральную модель ЖЦ ЭС подробнее (рис. 8.3). Суть её состоит в том, что отдельные фазы процесса прокручиваются на постепенно повышающихся уровнях иерархии.

Степень завершенности продукта

Выпуск первой версии

время…

Тестирование

Анализ ПрО

Реализация

Идентификация

Формализация

Извлечение знаний

Структурирование

Рис. 8.3. Спиральная модель процесса разработки ЭС

186

Таблица 8.2 Стадии разработки прототипа ЭС

Стадия разработки

Результат

 

 

 

1

Получение представления о предметной области

Представление

 

 

 

2

Идентификация (переопределение) проблемы

Проблема

 

 

 

3

Получение (дополнительное извлечение) знаний

Знания

 

 

 

4

Структурирование (коррекция поля) знаний

Поле знаний

 

 

 

5

Формализация (коррекция базы) знаний

База знаний

 

 

 

6

Реализация (перепрограммирование)

Программа-прототип

 

 

 

7

Тестирование прототипа

 

 

 

 

Методика анализа ПрО во многом аналогична подобной процедуре при построении ИС и рассмотрена в подразделе 2.2. Далее следует рассмотрение этапов жизненного цикла разработки ЭС (пункты 1 – 6 в таблице 8.2). Все рассматриваемые методы взяты из [4] и [20], и с некоторыми коррективами, в основном определяющимися особенностью ПрО, использованы при проектировании и детально представлены в данном разделе.

8.4.1 Методы извлечения знаний

Извлечение знаний – процедура получения инженером по знаниям наиболее полного из возможных представлений о предметной области и способах принятия решений в ней. На данной стадии происходит перенос компетентности от эксперта к инженеру по знаниям с использованием различных методов. Эти методы базируются на взаимодействии эксперта с источником знаний, в результате которого становится ясным процесс рассуждений специалистов при принятии решения и структура их представлений о ПрО. Среди таких методов можно выделить анализ текстов, диалоги, лекции, дискуссии, интервью, наблюдения и другие. Рассмотрим некоторые особенности предметной области социально-экономического характера, существенные для выбора методов.

Первая особенность – структурированность знаний ПрО. Под структурированностью здесь будем понимать степень теоретического осмысления и выявления основных закономерностей и принципов, действующий в предметной области. Поскольку как теории, так и эмпирики в социально-экономической среде достаточно, можно определить данную ПрО, как средне структурированную, то есть с определившейся терминологией, развивающейся теорией и явными взаимосвязями между явлениями.

Вторая особенность – степень документирования. Эта классификация связана соотношением двух видов знаний: личного экспертного знания и обще-

187

го знания, вербализованного в книгах, документах. По степени пересечения этих областей в ПрО можно сделать вывод о документированности. Как экспертные знания, так и знания из вербальных источников достаточно богаты, однако в некоторых случаях они идут вразрез c действующей экономической системой, а порой и вовсе противоречат друг другу. С учетом динамичности отечественной экономики, социально-экономическая среда характеризуется как средне документированная ПрО, следовательно, основной упор в извлечении знаний должен делаться на теорию.

Сами методы извлечения знаний делятся на коммуникативные и тексто-

логические. Последние ориентированы на анализ учебников, литературы и документов. Совершенно очевидно, данные методы в социологии и экономике должны использоваться довольно активно, так как во многом предусматривается работа с теорией. Коммуникативные методы предусматривают контакт аналитика с экспертом и делятся на пассивные и активные. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения отводится эксперту. Активные методы относятся к классу индивидуальных коммуникативных: анкетирование – наиболее жесткий, стандартизованный метод; интервью – используется серия заранее подготовленных вопросов; свободный диалог – наиболее непринужденный метод.

Текстологические методы извлечения знаний используют основные по-

ложения текстологии – науки из отрасли филологии, целью которой является критика, изучение и интерпретация литературных текстов для подготовки к изданию. Однако они отличаются принципиально от её методологии. Во-первых, характером и природой своих источников (профессиональная, специальная литература, а не художественная, живущая по своим особым законам), а вовторых – жестокой прагматической направленностью извлечения конкретных профессиональных знаний.

Среди методов извлечения знаний эта группа является наименее разработанной, по ней практически нет библиографии, поэтому дальнейшее изложение является как бы введением в методы изучения текста в том виде, как это изложено в [4].

Задачу извлечения знаний из текста можно сформулировать, как задачу понимания и выделения его смысла. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат лишь во вторичной структуре (смысловой структуре или макроструктуре текста), надстраиваемой над естественным текстом. При этом можно выделить две такие смысловые структуры (см. рис. 8.4): М1 смысл, который пытался заложить автор это его модель мира; и М2 смысл, который постигает читатель, в данном случае инженер по знаниям, в процессе первой стадии интерпретации I. При этом Т словесное одеяние М1, то есть результат вербализации V.

188

Модель мира

V

Текст книги

I

 

Т

Модель мира

Вербализация

Понимание

эксперта

аналитика

М1

 

 

М2

 

 

 

Рис. 8.4. Схема извлечения знаний из специальных текстов

Сложность процесса заключается в принципиальной невозможности совпадения знаний, образующих М1 и М2, из-за того, что М1 образуется за счёт всей совокупности представлений, потребностей, интересов и опыта автора, лишь малая часть которых находит отражение в тексте Т. Соответственно и М2 образуется в процессе интерпретации текста Т за счёт привлечения общенаучного и человеческого багажа читателя. Таким образом, два инженера по знаниям извлекут из одного Т две различные модели.

В общем случае может быть применен следующий алгоритм извлечения знаний из текста:

1)составление базового списка литературы для ознакомления с ПрО и чтения по списку;

2)выбор текста для извлечения знаний;

3)первое знакомство с текстом (беглое прочтение); для определения значения незнакомых слов консультации со специалистами или привлечение справочной литературы;

4)формирование первой гипотезы о макроструктуре текста;

5)внимательное прочтение текста с выписыванием ключевых слов и выражений, то есть выделение «смысловых вех» (компрессия текста);

6)определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или сжатого текста (реферата);

7)формирование поля знаний на основе макроструктуры – задача структу-

рирования знаний.

Пункты 6 и 7 являются переходными от стадии извлечения к стадии структурирования знаний. Далее рассмотрим подробно задачу построения поля знаний экспертной системы.

8.4.2 Алгоритм построения поля знаний экспертной системы

Построение поля знаний тесно связано с базовой операцией структури-

рования знаний, полученных на этапе извлечения. Структурирование знаний – процедура разработки неформального описания знаний о предметной области

в виде графа, таблицы или текста, которое отражает основные концепции и

189

взаимосвязи между понятиями ПрО. На данной стадии выявляется структура полученных знаний, то есть определяется:

-терминология;

-перечень основных понятий и их атрибутов;

-отношения между понятиями;

-структура входной и выходной информации;

-стратегия принятия решений;

-ограничения стратегий и т. д.

Результатом стадии структурирования является поле знаний (ПЗ).

Поле знаний является некоторой семиотической моделью предметной области, которая может быть представлена как граф, рисунок, таблица, формула или текст в зависимости от особенности ПрО. Структура поля знаний представлена на рис. 8.5.

МПО

Sk

Входные

Выходные

данные

данные

 

Sf

Рис. 8.5. Структура поля знаний [4]

Здесь МПО – модель предметной области, на основании которой происходит модификация входных данных в выходные. МПО может быть представлена как совокупность концептуальной модели Sk, отражающей семантическую структуру ПрО, и функциональной структуры Sf, алгоритмизирующей схему рассуждений эксперта. Sk выступает как статическая составляющая поля знаний, а Sf представляет динамическую, изменяемую составляющую, включает понятия ПрО и моделирует основные функциональные связи, либо отношения

190