Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
vstyp_ai.doc
Скачиваний:
2
Добавлен:
13.09.2019
Размер:
274.94 Кб
Скачать

426. Індуктивний поріг і можливості навчання (Машинне навчання, засноване на символьному представленні інформації)

Індуктивний поріг - це будь-який критерій, використовуваний навченою системою для обмеження простору понять або для вибору понять в рамках цього простору. У індуктивному навчанні навчальні дані - це лише підмножина всіх примірників області визначення. Отже, для будь-якої навчальної вибірки можливі різні узагальнення. Навчальна система повинна зробити додаткові припущення про "Вірогідних поняттях". У задачах навчання такі припущення найчастіше приймають форму евристик вибору гілок у просторі пошуку. Протиріччя між виразністю і ефективністю - типова проблема навчання. Наприклад, у програмі парні і непарні цілі НЕ розрізняються. Отже, вона не може навчитися евристики, заснованої на цьому відмінності. І хоча в деяких програмах поріг змінюється в Відповідно до даних більшість учнів програм грунтуються на фіксованому порозі спрацьовування. Ефективність і коректність алгоритму можна розглядати як властивість мови подання понять, тобто індуктивного порога, а не конкретного алгоритму навчання. Алгоритми навчання виконують пошук в просторі понять. Якщо цей простір добре структуровано і містить вдалі визначення понять, то будь-який обгрунтований алгоритм навчання буде ефективно працювати на цих визначеннях. Якщо ж простір є дуже складним, то алгоритм не дасть хороших результатів. Це можна пояснити на наступному прикладі. Поняття "м'яч" є досліджуваним. Для його вивчення можна ввести зручний мова опису властивостей об'єкта. Побачивши відносно невелика кількість м'ячів, людина може прийти до висновку, що м'ячі круглі.

427. Інтерпретація контурних малюнків (Комп'ютерний зір)

Був розпроблений Хаффманом і Клоузом також був доповнений Вальцем. Метод інтерпритації сцени по двухмірному конторному малюнку.В цьому випадку мова йде про систему компютерного зору . Вся низькорівнева частина системи не розглядається, але вважається що формує ознаки, на основі яких виконуються необхідні висновки. Висновки (лінії) зображаються разом з геометричними відношеннями в формі контурних малюнків. Необхідно мати знання навколишнього середовищі і про обєкти що знаходяться в ній, а інший - враховувати сильне обмеження: 1) використовувальні контурні малюнки повинні бути конкретні (відсутність розривів лінії, відсутність вільних кінців лінії); 2) обєкти на малюнках повинні бути чітко зображенні; 3) обєкти повинні бути багатакутними, в кожному кутку обєкта перетинаються 3 поверхні(площини).Задача розвязується методом розповсюдження обмежень. Елементами 2-D зображення є лінія, зєднення, зона. Елементами 3-D край(ребро), вершина, поверхність. Інтерпретація малюнків несуперечить в тому випадку, коли лінія, що звязує 2 зєднення, має одну мітку з кожною із сторін. Хаффман і Клоуз найшли спосіб не супеперечливій розмітці малюнків шляхом повного перерахунку всіх можливих ковбінацій міток і провіркою сумісності кожного випадку.

428. Компоненти навчання з підкріпленням (Машинне навчання, засноване на символьному представленні інформації)

Навчання з підкріпленням. У процесі навчання з підкріпленням виробляється обчислювальний алгоритм переходу від ситуації до дій, які максимізують винагороду. Агенту не повідомляється безпосередньо, як вчинити або яку дію зробити. Він сам на основі свого досвіду дізнається, які дії приводять до найбільшого винагороді. Дії агента визначаються не тільки миттєвим результатом, але і наступними діями і випадковими винагородами. Ці дві властивості (Метод "проб і помилок" і підкріплення з затримкою) є основними характеристиками навчання з підкріпленням. Отже, таке навчання реалізує більш загальну методологію, ніж алгоритми навчання, описані вище в цьому розділі. Навчання з підкріпленням не визначається конкретними методами навчання. Воно характеризується діями об'єкта в середовищі і відгуком цього середовища. Будь-який метод, який реалізує подібна взаємодія, відноситься до навчання з підкріпленням. Без функції винагороди не можна визначити значення цінності, яку необхідно оцінити для одержання більш високого винагороди. Останнім і необов'язковим елементом навчання з підкріпленням є модель зовнішнього середовища. Моделі дозволяють оцінити результати можливих дій без їх реального виконання. Планування на основі моделей - це сучасне додаток до парадигми навчання з підкріпленням, оскільки в ранніх системах значення винагороди і цінності визначалися тільки пробними діями та помилками агента.

430. Концептуальна кластеризація (Машинне навчання, засноване на символьному представленні інформації) Для вирішення задачі кластеризації (clustering problem) потрібні набір некласифікованих об'єктів та засоби вимірювання подібності об'єктів. Метою кластеризації є організація об'єктів в класи, задовольняють деякому стандарту якості, наприклад на основі максимальної подібності об'єктів кожного класу. Концептуальна кластеризація (conceptual clustering) дозволяє вирішити ці проблеми за рахунок використання методів машинного навчання для створення загальних визначень понять і застосування базових знань при формуванні цих категорій. Гарним прикладом реалізації цього підходу є система CLUSTER / 2. У ній для подання категорій використовуються базові знання у формі мовних порогів. У системі CLUSTER / 2 формуються до категорій на базі до опорних об'єктів, де к - це параметр, настроюється користувачем. Програма оцінює отримані кластери, вибирає нові опорні об'єкти і повторює цей процес до тих пір. поки не буде досягнутий критерій якості. Цей алгоритм має наступний вигляд. 1. Вибрати до- опорних об'єктів з безлічі існуючих. Це можна зробити за допомогою генератора випадкових чисел. 2. Для кожного опорного об'єкта, використовуючи його в якості позитивного прикладу, а всі решта - як негативних, створити найбільш загальне визначення, що охоплює всі позитивні і жодного негативного прикладу. Зауважимо, що при цьому може утворитися декілька класів, пов'язаних з іншими (не відносяться до опорних) об'єктами. 3. Класифікувати всі об'єкти відповідно до цими описами. Замінити кожне максимально загальне визначення максимально конкретним, покриває всі об'єкти цієї категорії. При цьому знижується ймовірність перекриття класів при класифікації нових, невідомих раніше об'єктів. 4. Класи можуть перекриватися навіть для об'єктів навчальної множини. У систему CLUSTER / 2 включений алгоритм настроювання перекриваються визначень. 5. За допомогою метрики відстані вибрати елемент, найближчий до центру кожного класу. Метрика відстані може нагадувати описану вище метрику подоби. 6. Використовуючи ці центральні елементи в якості опорних, повторити пункти 1-5. Алгоритм завершується після формування прийнятних кластерів. Типовою ме- рій якості є складність загальних описів класів. Наприклад, згідно з принципом "бритви Оккама "слід віддавати перевагу кластерам з синтаксично простими визначеннями, тобто з малим числом кон'юнктів. 7. Якщо кластери неприйнятні, але протягом кількох ітерацій НЕ спостерігається ніяких поліпшень, виберіть нові опорні об'єкти, найближчі до кордону кластерів, а не до його центру.

431. Методи синтезу мовних сигналів (Обробка природної мови) Всі способи синтезу мови можна підрозділити на три групи: 1) параметричний синтез; 2) конкатенативного, або компіляційний (Компілятивний) синтез, 3) синтез за правилами. Параметричний синтез мови є кінцевою операцією в вокодерная системах, де мовний сигнал представляється набором невеликого числа безперервно змінюються параметрів. Параметричний синтез доцільно застосовувати в тих випадках, коли набір повідомлень обмежений і змінюється не дуже часто. Перевагою такого способу є можливість записати мову для будь-якої мови і будь-якого диктора. Якість параметричного синтезу може бути дуже високим (залежно від ступеня стиснення інформації в параметричному уявленні). Проте параметричний синтез не може застосовуватися для довільних, заздалегідь не заданих повідомлень. Компіляційний синтез зводиться до складання повідомлення із заздалегідь записаного словника початкових елементів синтезу. Розмір елементів синтезу не менше слова. Очевидно, що зміст синтезованих повідомлень фіксується об'єк ѐ мом словника. Як правило, число одиниць словника не перевищує декількох сотень слів. Основна проблема в компілятивний синтезі - об'єк ѐ ми пам'яті для зберігання словника. У зв'язку з цим використовуються різноманітні методи стиснення / кодування мовного сигналу. Компілятивний синтез має широке практичне застосування. За кордоном різноманітні пристрої (від військових літаків ѐ тов до побутових пристроїв) оснащуються системами мовної відповіді. У нашій країні системи мовного відповіді до недавнього часу використовувалися в основному в області військової техніки, зараз вони знаходять НД ѐ більше застосування в повсякденному життя, наприклад, в довідкових службах операторів стільникового зв'язку при отриманні інформації про стан рахунку абонента. Повний синтез мови за правилами (або синтез по друкарському тексту) забезпечує управління всіма параметрами мовного сигналу і, таким чином, може генерувати мову по заздалегідь невідомому тексту. У цьому випадку параметри, отримані при аналізі мовного сигналу, зберігаються в пам'яті так само, як і правила з'єднання звуків в слова і фрази. Синтез реалізується шляхом моделювання мовного тракту, застосування аналогової або цифрової техніки. Прич розподіляємо в процесі синтезування значення параметрів і правила з'єднання фонем вводять послідовно через определ ѐ нний часовий інтервал, наприклад 5-10 мс. Метод синтезу мови по друкованому тексту (синтез по правилами) базується на запрограмованому знанні акустичних і лінгвістичних обмежень і не використовує безпосередньо елементів людської мови. У системах, заснованих на цьому способі синтезу, виділяється два підходу. Перший підхід направлений на побудову моделі речепроізводящей системи людини, він відомий під назвою артикуляторного синтезу. Другий підхід - формантний синтез за правилами. Чіткість і таких синтезаторів може бути доведена до величин, порівнянних з характеристиками природної мови. (+ Див. 87)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]