Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции ИИС.doc
Скачиваний:
24
Добавлен:
24.04.2019
Размер:
3.77 Mб
Скачать

Теоретические аспекты извлечения знаний

Поскольку основной проблемой инженерии знаний является процесс извлечения знаний, инженеру по знаниям необходимо четко понимать природу и особенности этих процессов. Для того чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры (рис. 14.):

А = {А1, А2, A3} = {психологический, лингвистический, гносеологический}.

Рис. 14. Теоретические аспекты инженерии знаний

Психологический аспект извлечения знаний

Из трех аспектов извлечения знаний психологический - А1 - является ведущим, поскольку он определяет успешность и эффективность взаимодействия инженера по знаниям (аналитика) с основным источником знаний - экспертом-профессионалом. Психологический аспект выделяется еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработчиков системы. А в общении психология является доминантной.

Общение, или коммуникация (от лат. communicatio - связь), - это междисциплинарное понятие, обозначающее все формы непосредственных контактов между людьми - от дружеских до деловых. Оно широко исследуется в психологии, философии, социологии, этологии, лингвистике, семиотике и других науках. Существует несколько десятков теорий общения, и единственное, в чем сходятся все авторы, - это сложность, многоплановость процедуры общения. Подчеркивается, что общение - не просто однонаправленный процесс передачи сообщений и не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуляции информации, то есть совместный поиск истины [Каган, 1988] (рис. 15.).

Итак, общение есть процесс выработки новой информации, общей для общающихся людей и рождающей их общность. И хотя общение - первый вид деятельности, которым овладевает человек в онтогенезе, по-настоящему владеют культурой и наукой общения единицы.

Рис. 15. Структура процесса общения

Можно выделить четыре основных уровня общения [Саратовский, 1980].

1. Уровень манипулирования, когда один субъект рассматривает другого как средство или помеху по отношению к проекту своей деятельности.

2. Уровень "рефлексивной игры", когда в процессе своей деятельности человек учитывает "контрпроект" другого субъекта, но не признает за ним самоценность и стремится к "выигрышу", к реализации своего проекта.

3. Уровень правового общения, когда субъекты признают право на существование проектов деятельности друг друга и пытаются согласовать их хотя бы внешне.

4. Уровень нравственного общения, когда субъекты внутренне принимают общий проект взаимной деятельности.

Стремление и умение общаться на высшем, четвертом, уровне может характеризовать степень профессионализма инженера по знаниям. Извлечение знаний - это особый вид общения, который можно отнести к духовно-информационному типу. Согласно работе [Каган, 1988] общение делится на материально-практическое; духовно-информационное; практически-духовное. При этом информационный аспект общения для инженера по знаниям с прагматической точки зрения важнейший.

Известно, что потери информации при разговорном общении велики [Мицич, 1987] (рис. 16.).

Рис. 16. Потери информации при разговорном общении

В связи с этим рассмотрим проблему увеличения информативности общения аналитика и эксперта за счет использования психологических знаний. Можно выделить такие структурные компоненты модели общения при извлечении знаний:

  • участники общения (партнеры);

  • средства общения (процедура);

  • предмет общения (знания).

В соответствии с этой структурой выделим три "слоя" психологических проблем, возникающих при извлечении знаний (рис. 17.):

Al = {Sll, S12, S13 } = {контактный, процедурный, когнитивный}.

Рис. 17. Психологический аспект извлечения знаний

Контактный слой (S11)

Практически все психологи отмечают, что на любой коллективный процесс влияет атмосфера, возникающая в группе участников. Существуют эксперименты, результаты которых неоспоримо говорят, что часто дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности отдельных членов группы [Немов, 1984]. Особенно важно, чтобы в коллективе разработчиков складывались кооперативные, а не конкурентные отношения. Для кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтересованности в успехах друг друга, то есть уровень нравственного общения, а для отношений конкурентного типа - атмосфера индивидуализма и межличностного соперничества (более низкий уровень общения).

В настоящее время прогнозировать совместимость в общении со 100%-й гарантией невозможно. Однако можно выделить ряд факторов и черт личности, характера и других особенностей участников общения, несомненно, оказывающих влияние на эффективность процедуры.

Разработка проблематики контактного слоя позволила выявить следующие параметры партнеров, влияющие на результаты процедуры извлечения знаний:

S11 = {sll_i} = {пол, возраст, личность, темперамент, мотивация и др.}, часть из которых впоследствии вошли в формирование модели пользователя. Значения параметров пола (sll_l) и возраста (sll_2) хотя и влияют на эффективность контакта, но не являются критическими. В литературе [Иванов, 1986] отмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщина) и соотношение:

20 > (Вэ - Ва) > 5,

где Вэ - возраст эксперта; Ва - возраст аналитика.

Под личностью (sll_3) обычно понимается устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые компоненты s11_3 исследованы в работе [Гаврилова, 1990] и дополнены качествами из руководства для журналистов в работе [Schouksmith G., 1978]. s11_3 = (доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, большая собранность, настойчивость, общительность, находчивость).

Со времен Галена и Гиппократа, выделивших четыре классических типа темперамента (sll_4), вошли в научную терминологию понятия

sll_4= (холерик, сангвиник, меланхолик, флегматик).

Известно, что флегматики и меланхолики медленнее усваивают информацию [Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с ними не следует задавать беседе слишком быстрый темп, торопить их с ответом. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации. Последних следует специально наводить на размышление и рефлексию. У меланхоликов часто занижена самооценка, они застенчивы и в беседе их надо подбадривать. Таким образом, наиболее успешными в рамках слоя S11 являются сангвиники и холерики.

На эффективность коллективного решения задач влияет также и мотивация (sll_5), то есть стремление к успеху. Инженер по знаниям в зависимости от условий разработки должен изыскивать разнообразные стимулы для экспертов (включая, разумеется, и материальные). Эксперт передает аналитику один из самых дорогих в мире продуктов - знания. И если одни люди делятся опытом добровольно и с удовольствием, то другие весьма неохотно приоткрывают свои профессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооперативное в коллективе).

Процедурный слой (S12)

Параметры процедурного слоя S12 описывают непосредственно процесс проведения процедуры извлечения знаний. Фактически это профессиональные параметры:

S12 = {s12_i} = {ситуация общения (место, время, продолжительность); оборудование (вспомогательные средства, освещенность, мебель); профессиональные приемы (темп, стиль, методы и др.)}.

Инженер по знаниям, успешно овладевший наукой установления атмосферы доверия и взаимопонимания с экспертом (контактный слой - S11), должен еще суметь воспользоваться благоприятным воздействием этой атмосферы. Проблема процедурного слоя касается проведения самой процедуры извлечения знаний. Здесь мало проницательности и обаяния, полезных для решения проблемы контакта, тут необходимы профессиональные знания.

Остановимся на общих закономерностях проведения процедуры.

s12_l - ситуация общения определяется следующими компонентами:

  • s12_l_l - место проведения сеансов;

  • s12_l_2 - продолжительность проведения сеансов;

  • s12_l_3 - время проведения сеансов.

Беседу с экспертом лучше всего проводить в небольшом помещении наедине (s!2_l_l: место), поскольку посторонние люди нарушают доверительность беседы и могут породить эффект "фасада". Рабочее место эксперта является не самым оптимальным вариантом, так как его могут отвлекать телефонные звонки, сотрудники и пр. Атмосфера замкнутого пространства и уединенности положительно влияет на эффективность.

Американский психолог И. Атватер считает, что для делового общения наиболее благоприятная дистанция от 1,2 до 3 метров [Schouksmith, 1978]. Минимальным "комфортным" расстоянием можно считать 0,7-0,8 метра.

Реконструкция собственных рассуждений - трудоемкий процесс, и поэтому длительность одного сеанса (s12_l_2: продолжительность) обычно не превышает 1,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10 до 12 часов, если эксперт типа "жаворонок" (s12_l_3: время). Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20-25 минут [Ноэль, 1978], поэтому в сеансе нужны паузы.

s12_2 - оборудование включает:

  • s12_2_l - вспомогательные средства;

  • s12_2_2 - освещенность;

  • s12_2_3 - мебель.

Вспомогательные средства (s12_2_l):

  • средства для увеличения эффективности самого процесса извлечения знаний;

средства для протоколирования результатов.

К средствам для увеличения эффективности процесса извлечения знаний прежде всего относится наглядный материал. Независимо от метода извлечения, выбранного в конкретной ситуации, его реализация возможна разными способами. Например, можно учитывать следующий фактор: широко известно, что людей, занимающихся интеллектуальной деятельностью, можно отнести к художественному либо мыслительному типу. Термины тут условны и не имеют отношения к той деятельности, которую традиционно называют художественной или мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может плодотворнее использовать любой из методов извлечения, зная, что люди художественного типа легче воспринимают зрительную информацию в форме рисунков, графиков, диаграмм, так как эта информация воспринимается через первую сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают язык формул и текстовую информацию. При этом учитывается факт, что большую часть информации человек получает от зрения. Совет пользоваться активнее наглядным материалом из работы [Хейес-Рот, Уотермена, Ленат, 1987] можно считать универсальным. Такие методы, как свободный диалог и игры, предоставляют богатые возможности использовать слайды, чертежи, рисунки.

Для протоколирования результатов в настоящее время используются следующие способы:

  • запись на бумагу непосредственно по ходу беседы (недостатки - это часто мешает беседе, кроме того, трудно успеть записать все, даже при наличии навыков стенографии);

  • магнитофонная запись (диктофон), помогающая аналитику проанализировать весь ход сеанса и свои ошибки (недостаток - может сковывать эксперта);

  • запоминание с последующей записью после беседы (недостаток - годится только для аналитиков с блестящей памятью).

Наиболее распространенным способом на сегодня является первый. При этом наибольшая опасность тут - потеря знаний, поскольку любая запись ответов -это уже интерпретация, то есть привнесение субъективного понимания предмета. Значения параметров освещенности (s12_2_2) и мебели (s12_2_3) очевидны и связаны с влиянием внешних факторов на эксперта.

s12_3 - профессиональные приемы аналитика, включают, в частности:

  • s12_3_l - темп;

  • s12_3_2 - стиль;

  • s12_3_3 - методы.

Учет индивидуального темпа (s12_3_l) и стиля (s12_3_2) эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичной ошибкой является навязывание собственных темпа и стиля.

На успешность также влияет длина фраз, которые произносит инженер по знаниям. Этот факт был установлен американскими учеными - лингвистом Ингве и психологом Миллером при проведении исследования о причинах низкой усвояемости команд на Военно-морском флоте США [Gammack, Young, 1985].

Причина была в длине команд. Оказалось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7+2(-2) слова. Это число (7±2) получило название число Ингве-Миллера. Можно считать его мерой "разговорности" речи. Опытные лекторы используют в лекции в основном короткие фразы, уменьшая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [Горелов, 1987]. Большая часть информации поступает к инженеру по знаниям в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи (мышления), которая гораздо богаче и многообразнее. При этом для передачи этой внутренней речи эксперт использует и невербальные средства, такие как интонация, мимика, жесты. Опытный инженер по знаниям старается записывать по возможности в протоколы (в форме ремарок) эту дополнительную интонацию.

В целом, невербальная компонента стиля общения важна и для проблем контактного слоя при установлении контакта, когда по отдельным жестам и выражению лица эксперта инженер по знаниям может установить границу возможной "Дружественности" общения.

Значение параметра методов (s!2_3_3) подробно рассмотрено в следующей главе, исходя из позиции, что метод должен подходить к эксперту как "ключ к замку".

Когнитивный слой (S13)

Когнитивные (от англ, cognition - познание) науки исследуют познавательные процессы человека с позиций возможности их моделирования (психология, нейрофизиология, эргономика, инженерия знаний). Наименее исследованы на сегодняшний день проблемы когнитивного слоя S13, связанные с изучением семантического пространства памяти эксперта и реконструкцией его понятийной структуры и модели рассуждений.

Основными факторами, влияющими на когнитивную адекватность, будут:

S13 = {s13_i} = {когнитивный стиль, семантическая репрезентативность поля знаний и концептуальной модели}.

Под когнитивным стилем (s13_l) человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека. Когнитивный стиль определяет не столько эффективность деятельности, сколько способ достижения результата [Алахвердов, 1986]. Это способ познания, который позволяет людям с разными способностями добиваться одинаковых результатов в деятельности. Это система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности.

Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный стиль, а также стиль эксперта. Особенно важны такие характеристики когнитивного стиля, как:

  • s13_l_l - (полезависимость - поленезависимость);

  • s13_l_2 - (импульсивность - рефлективность (рефлексивность);

  • s13_l_3 - (ригидность - гибкость);

  • s13_l_4 - (когнитивная эквивалентность).

s13_l_l. Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружающего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность к пониманию сути. Очевидно, что помимо того, что самому аналитику необходимо иметь высокое значение параметра s13_l_l, поленезависимый эксперт - это тоже желательный фактор. Однако приходится учитывать, что больше нуждаются в общении полезависимые люди, а потому они и более контактны [Орехов, 1985].

Особенно полезны для общения гетерогенные (смешанные) пары, например "полезависимый - поленезависимый" [Иванов, 1986]. В литературе описаны различные эксперименты, моделирующие общение, требующее понимания и совместной деятельности. Наиболее успешным в понимании оказались поленезависимые испытуемые (92 % успеха), для сравнения полезависимые давали 56 % успеха [Кулюткин, Сухобская, 1971].

Для совместной профессиональной деятельности важна также гибкость когнитивной организации, которая связана с поленезависимостью. Итак, большую способность к адекватному пониманию партнера демонстрируют субъекты с высокой психологической дифференциацией, то есть поленезависимостью. Поленезависимость является одной из характерных профессиональных черт когнитивного стиля наиболее квалифицированных инженеров по знаниям. По некоторым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем женщины.

s13_l_2. Под импульсивностью понимается быстрое принятие решения (часто без его достаточного обоснования), а под рефлексивностью - склонность к рассудительности. Рефлексивность по экспериментальным данным коррелирует со способностью к формирования понятий и продуктивностью стратегий решения логических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль изменяется лишь частично и с большим напряжением.

s13_l_3. Ригидность - гибкость характеризует способность человека к изменению установок и точек зрения в соответствии с изменяющейся ситуацией. Ригидные люди не склонны менять свои представления и структуру восприятия, напротив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может себе позволить ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), то для инженера по знаниям эта характеристика когнитивного стиля явно противопоказана. Увеличение ригидности с возрастом отмечается многими психологами [Кулюткин, Сухобская, 1971; Орехов, 1985].

s13_l_4. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен провести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин. Семантическая репрезентативность (s13_2) подразумевает подход, исключающий традиционное навязывание эксперту некой модели представлений (например, продукционной или фреймовой), и заставляет инженера по знаниям последовательно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например многомерное шкалирование. Проблема семантической репрезентативности ориентирована на достижение когнитивной адекватности поля знаний и концептуальной модели. В настоящий момент она может быть сформулирована как проблема "испорченного телефона" [Гаврилова, Червинская, 1992] (см. рис. 12.) - возможные трансформации и потери в цепи передачи информации:

  • (Оg предметная область или реальный мир) →

  • [Ii интерпретация i-го эксперта] →

  • (Mgi: модель мира эксперта) →

  • [Vi: вербализация модели мира эксперта] →

  • (Ti ε Ci: вербальные и невербальные сообщения i-го эксперта j- му аналитику) →

  • [Ii: их интерпретация j-ым аналитиком] →

  • (Mgj: модель мира j-го аналитика) →

  • [Kj: кодирование при формировании поля знаний с последующей структуризацией в концептуальную модель].

Круглые скобки определяют понятия, квадратные - процессы.