- •В.В. Литвин технології менеджменту знань
- •Розділ 1 основні поняття менеджменту знань
- •1.1. Основні означення менеджменту знань
- •1.1.1. Структура менеджменту знань
- •Маркетинґ Проектування Підготовка виробництва Виробництво Збут
- •1.1.2. Формування знань
- •1.1.3. Введення даних
- •1.1.4. Адміністрування
- •1.1.5. Мотивація
- •1.1.6. Особливості впровадження мз
- •1.2. Менеджмент знань
- •1.3. Базові поняття менеджменту знань
- •1.3.1. Видобування знань
- •1.3.2. Системи пізнання
- •1.3.3. Організація доступу до знань
- •1.3.4. Інновації в області автоматизації
- •1.3.5. Менеджмент знань та інформації
- •1.3.6. Менеджмент знань та Інтернет
- •1.4. Онтологічний інжиніринг
- •1.4.1. Системи керування знаннями
- •1.4.2. Онтологія
- •1.5. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 2 теоретичні аспекти менеджменту та інженерії знань
- •2.1. Поле знань
- •2.1.1. Мова опису поля знань
- •2.1.2. Семіотична модель поля знань
- •2.1.3. “Піраміда” знань
- •2.2. Стратегії одержання знань
- •2.3. Теоретичні аспекти видобування знань
- •2.3.1. Психологічний аспект
- •2.3.2. Лінгвістичний аспект
- •2.3.3. Гносеологічний аспект видобування знань
- •2.4. Теоретичні аспекти структурування знань
- •2.4.1. Історична довідка
- •2.4.2. Ієрархічний підхід
- •2.4.3. Традиційні методології структуризації
- •2.4.4. Об’єктно-структурний підхід (осп)
- •Стратифікація знань предметної області
- •Матриця об’єктно-структурного аналізу
- •Запитання для повторення та контролю знань
- •Розділ 3 технології менеджменту та інженерії знань
- •3.1. Класифікація методів практичного видобування знань
- •3.2. Комунікативні методи
- •3.2.1. Пасивні методи
- •Порівняльні характеристики пасивних методів видобування знань
- •3.2.2. Активні індивідуальні методи
- •Порівняльні характеристики активних індивідуальних методів видобування
- •3.2.3. Активні групові методи
- •3.3. Текстологічні методи
- •3.3.1. Методи структурування
- •Дані концептуалізації
- •3.3.2. Еволюція систем одержання знань
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Розділ 4 прикладні аспекти менеджменту та інженерії знань
- •4.1. Латентні структури знань і психосемантика
- •4.1.1. Семантичні простори і психологічне градуювання
- •Опис зв’язку між поняттями
- •4.1.2. Методи багатовимірного градуювання
- •4.1.3. Використання метафор для виявлення “прихованих” структур знань
- •4.2. Метод репертуарних решіток
- •4.2.1. Основні поняття
- •4.2.2. Методи виявлення конструктів. Метод мінімального контексту
- •4.2.3. Аналіз репертуарних решіток
- •4.2.4. Автоматизовані методи
- •4.3. Керування знаннями
- •4.3.1. Що таке “керування знаннями”?
- •4.3.2. Керування знаннями і корпоративна пам’ять
- •4.3.3. Системи omis
- •4.3.4. Особливості розроблення омis
- •4.4. Візуальне проектування баз знань як інструмент пізнання
- •4.4.1. Від понятійних карт до семантичних мереж
- •4.4.2. База знань як пізнавальний інструмент
- •4.5. Проектування гіпермедіа бд і адаптивних навчальних систем
- •4.5.1. Гіпертекстові системи
- •4.5.2. Від мультимедіа до гіпермедіа
- •4.5.3. На шляху до адаптивних навчальних систем
- •Запитання для повторення та контролю знань
- •Розділ 5 Класифікація даних та знань
- •5.1. Важливість правильної класифікації
- •5.1.1. Класифікація й об’єктно-орієнтовне проектування
- •5.1.2. Труднощі класифікації
- •5.2. Ідентифікація класів і об’єктів
- •5.2.1. Класичний і сучасний підходи
- •5.2.2. Об’єктно-орієнтований аналіз
- •5.3. Ключові абстракції й механізми
- •5.3.1. Ключові абстракції
- •5.3.2. Ідентифікація механізмів
- •5.4. Висновки
- •Запитання для повторення та контролю знань
- •Розділ 6 онтології й онтологічні системи
- •6.1. Поняття онтології
- •6.2. Моделі онтології й онтологічної системи
- •Класифікація моделей онтології
- •6.3. Методології створення і “життєвий цикл”онтології
- •6.4. Мови опису онтологій
- •6.4.1. Види owl
- •6.4.2. Структура онтологій
- •Запитання для повторення та контролю знань
- •Розділ 7 Програмні засоби побудови онтологій
- •7.1. Онтологія як засіб формалізації та алгоритмізації знань в інтелектуальній системі
- •7.1.1. Аналіз підходів до навчання онтологій
- •7.1.2. Загальні принципи проектування онтологій
- •7.1.3. Формати та стандарти подання інформації
- •7.1.4. Засоби для створення онтології
- •7.2. Технологія розроблення онтологій в редакторі Protégé
- •7.2.1. Еволюція Protégé
- •7.2.2. Protégé-owl. Мова Web онтологій owl
- •7.2.3. Основні терміни та поняття у Protégé-owl
- •Терміни та їх синоніми
- •7.2.4. Методика розроблення онтології засобами Protégé
- •Створення й експлуатація онтології
- •7.2.5. Створення онтології
- •Запитання для повторення та контролю знань
- •Завдання для самостійного розв’язування
- •Література
- •Литвин Василь Володимирович технології менеджменту знань
- •V lp.Com.Ua, ел. Пошта: vmr@vlp.Com.Ua
2.3.2. Лінгвістичний аспект
Лінгвістичний (А2) аспект стосується досліджень мовних проблем, тому що мова – це основний засіб спілкування у процесі видобування знань. Область розроблення природно-мовних інтерфейсів і весь спектр проблем, пов’язаних з нею – лексичних, синтаксичних, семантичних, прагматичних тощо, у цій книзі не розглядається.
В інженерії знань можна виділити три етапи лінгвістичних проблем (рис. 2.8):
А2 = {S21, S22, S23} – {“загальний код”, понятійна структура, слова}.
Рис. 2.8. Лінгвістичний аспект видобування знань
“Загальний код” (S21)
“Загальний код” вирішує проблему мовних ножиць між професійною термінологією експерта і повсякденною літературною мовою інженера зі знань і об’єднує такі компоненти:
S21 = {s21_i} = {загальнонаукова термінологія; спеціальні поняття з професійної літератури; елементи побутової мови; неологізми, сформовані за період спільної роботи; професійний жаргон тощо}.
Деталізація схеми спілкування (див. рис. 2.5) дає змогу зобразити засоби спілкування як два потоки [54], у яких нас цікавлять компоненти V1 і V2 – мови, якими говорять аналітик і експерт (V11, V21 – невербальні компоненти). Розходження мов V1 і V2 зумовлює “мовний бар’єр” або “мовні ножиці” у спілкуванні інженера зі знань і експерта.
Ці дві мови є відображенням “внутрішньої мови” експерта й аналітика, оскільки більшість психологів і лінгвістів вважають, що мова – це основний засіб мислення поряд з іншими знаковими системами “внутрішнього користування” (універсальний семантичний код – УСК, мови “змісту”, концептуальні мови тощо). Мова аналітика V1 складається з трьох компонентів:
s21_l – загальнонаукової термінології з її “теоретичним багажем;
s21_2 – термінів предметної області, які аналітик почерпнув зі спеціальної літератури в період підготовки;
s21_3 – побутової розмовної мови, якою користується аналітик.
Мова експерта V2 охоплює:
s21_l – загальнонаукову термінологію;
s21_2 – спеціальну термінологію, прийняту в предметній області;
s21_3 – побутову мову;
s21_4 – неологізми, створені експертом за період роботи, тобто його професійний жаргон.
Якщо вважати, що побутова й загальнонаукова мови у двох учасників спілкування приблизно збігаються (хоча реально обсяг другого компонента в експерта істотно більший), то деяка загальна мова або код, який необхідно виробити партнерам для успішної взаємодії, складатиметься з потоків, зображених на рис. 2.9.
Надалі цей загальний код перетвориться в деяку понятійну (семантичну) мережу, що є прообразом поля знань предметної області. Вироблення загального коду починається з виписування аналітиком всіх термінів, уживаних експертом, і уточнення їхнього змісту. Фактично це складання словника предметної області. Потім відбувається групування термінів і вибір синонімів (слів, що означають те саме). Розроблення загального коду закінчується складанням словника термінів предметної області з попереднім угрупованням їх за змістом, тобто за понятійною близькістю (це вже перший крок структурування знань).
На цьому етапі аналітик повинен уважно розглянути усі спеціальні терміни, намагаючись максимально вникнути в суть розв’язуваних проблем і термінологію. Освоєння аналітиком мови предметної області – перший рубіж на підступах до створення адекватної бази знань.
Рис. 2.9 дає уявлення про процес неоднозначності інтерпретації термінів двома фахівцями. У семіотиці, науці про знакові системи, проблема інтерпретації є однією із центральних. Інтерпретація зв’язує “знак” і “означуваний предмет”. Тільки в інтерпретації знак одержує зміст.
Увага до лінгвістичного аспекту проблеми видобування знань сприяє зближенню між собою двох образів.
Рис. 2.9. Структура загального коду
Отже, етап S21 передбачає вивчення й керування процесом розроблення спеціальної проміжної мови, необхідної для взаємодії інженера зі знань і експерта.
Понятійна структура (S22)
Проблеми формування понятійної структури становлять такий етап S22 лінгвістичного аспекту проблеми видобування знань. Особливості формування понятійної структури зумовлені встановленим постулатом когнітивної психології про взаємозв’язок понять у пам’яті людини й наявності семантичної мережі, що поєднує окремі терміни у фрагменти, фрагменти у сценарії тощо. Побудова ієрархічної мережі понять, “піраміди знань”, – найважливіша ланка в проектуванні інтелектуальних систем.
Більшість фахівців зі штучного інтелекту й когнітивної психології вважають, що основна особливість природного інтелекту і пам’яті зокрема – це зв’язаність всіх понять у деяку мережу. Тому для розроблення бази знань потрібний не словник, а “енциклопедія”, в якій всі терміни пояснені у словникових статтях з посиланнями на інші терміни.
Отже, лінгвістична робота інженера зі знань на цьому етапі проблем полягає в побудові таких зв’язаних фрагментів за допомогою “зшивання” термінів. Фактично ця робота є підготовкою до етапу концептуалізації, де це “шиття” (по Шенку – КІП, концептуальна організація пам’яті [130]) набуває деякого закінченого вигляду. У ретельній роботі аналітика й експерта в понятійних структурах починає проглядатися ієрархія понять, докладно про яку йдеться нижче. Такі структури мають найважливіші гносеологічне і дидактичне значення й останнім часом для них використовується спеціальний термін – онтології. Відзначимо, що ця ієрархічна організація добре узгоджується з теорією універсального предметного коду (УПК), відповідно до якої у мисленні використовуються не мовні конструкції, а їхні коди у формі деяких абстракцій, що в загальному узгоджуються з результатами когнітивної психології. Ієрархія абстракцій – це глобальна схема, що може бути покладена в основу концептуального аналізу структури знань будь-якої предметної області. Лінгвістичний еквівалент ієрар- хії – ієрархія понять, яку необхідно побудувати в понятійній структурі, сформованій інженером зі знань (рис. 2.10).
Підкреслимо, що робота зі складання словника та понятійної структури вимагає лінгвістичного “чуття”, легкості маніпулювання термінами та багатого словникового запасу інженера зі знань, тому що найчастіше аналітик змушений самостійно розробляти словник ознак. Що багатший та виразніший виходить загальний код, що повніша база знань.
Рис. 2.10. Приклад ієрархії
Аналітик змушений постійно пам’ятати про труднощі передавання образів і подань у вербальній формі. Корисними тут виявляються властивості багатозначності слів природної мови. Часто інженерові зі знань доводиться підказувати слова і вирази експертові, і такі нові лексичні конструкції виявляються корисними.
Здатність до словесної інтерпретації залежить і від статі аналітика (параметр s11_1). Встановлено, що традиційно жінки надають перевагу невербальним компонентам спілкування, а вербальні мають більший алфавіт ознак. І взагалі, існують статеві розходження сприйняття не тільки в побутовій сфері, але й у професійній. Отже, в експерта-чоловіка й в експерта-жінки можуть істотно відрізнятися алфавіти для вербалізації ознак сприйнятих об’єктів.
Словник користувача (S23)
Лінгвістичні результати, співвіднесені до етапів загального коду й понятійної структури, спрямовані на створення адекватної бази знань. Однак часто професійний рівень кінцевого користувача не дає йому змоги застосувати спеціальну мову предметної області в повному обсязі.
Для розроблювачів-початківців несподіваними є проблеми формування окремого словника для створення дружнього інтерфейсу з користувачем ЕС, досліджувані в етапі S23. Необхідні спеціальні прийоми, що збільшують “прозорість” і доступність системи. Для розроблення користувальницького інтерфейсу потрібне додаткове доопрацювання словника загального коду з виправленням на доступність і “прозорість” системи.
Так, під час розроблення експертної системи з психодіагностики АВТАНТЕСТ довелося розробити два словники термінів – один для психологів-професіоналів, другий – для неспеціалістів (клієнтів). Оскільки результат психодіагностичного тестування завжди цікавий клієнту, йому видається лістинг з психологічним висновком загальнолітературною мовою без уживання спеціальних термінів. Цікаво, що впроваджуючи систему, використовувався переважно другий словник; навіть професійні психологи віддавали перевагу текстам з повсякденною мовою.