- •1) Визначення ваг для сітки Хопфілда
- •1) Навчання персептрона
- •2) Послідовність створення і реалізація нейро-фаззі-систем
- •1) Правило навчання штучної нейросітки за д.Хеббом.
- •1) Способи навчання нейроних сіток.
- •2) Навчання в нейро-фаззі-системах
- •1) Прямоспрямовані нейронні сітки
- •1) Структура і математичний опис штучного нейрону та нейросітки.
1) Структура і математичний опис штучного нейрону та нейросітки.
Нейрон є процесорним блоком, здатний видавати електричні сигнали
в залежності від дії на його вхід. Вхідні дії надходять в нейрон по дендритам
, а вихідний сигнал видається по єдиному каналу – аксону.
|
Рис. 1.2. Спрощене уявлення функцій нейрона: x1. x1... x5 - вхідні сигнали; w1... w5 - синапси (вагові коефіцієнти); ( - порогова величина; f - активаційна функція; у - вихідний сигнал |
Нейрон може приймати лише два стани: або він збуджений, або пасивний. Тому
для цих двох станів досить використовувати двійкові числа, наприклад, числа 0 і 1.
Входами для нейрона є збудження, які надходять до нього дендритами.Через те, що ці
сигнали є виходами попередніх нейронів, їхні величини також будуть дорівнювати 1 чи 0.
Сигнали дендритів перед надходженням до нейрона підсилюються або послабляються.
Це легко піддається моделюванню, при якому їх перемножують з позитивними чи негативними
дійсними числами: позитивні числа призначаються для посилення, а негативні — для ослаблення сигналів.
Вхідними сигналами штучного нейрона є вихідні сигнали інших нейронів, кожний з
яких взятий із своєю вагою Wi (і = ), аналогічною до синаптичної сили.
Вхідний оператор вх перетворює зважені входи і подає їх на оператор активізації .
Коли оброблені в такий спосіб вхідні сигнали досягають нейрона, вони збуджують
його лише тоді, якщо сума усіх величин потенціалів перевершить деяке граничне значення.
У моделі нейрона формується сума усіх входів, перемножених на значення синапсів, і
порівнюється з граничним значенням . Якщо сума перевищує , вихідний сигнал нейрона (величина
сигналу аксона) встановлюється на 1, в противному випадку - на 0. Формальне подання функцій нейрона
наведено на рис. 1.2, де х1, х2, х3, х4, x5 - вхідні величини; w1, w2, w3, w4, w5 - величини
синапсів (ваг), якщо сума , то нейрон збуджений, тобто y = 1.
При цьому для нейрона справедливі наступні кількісні співвідношення:
вхідні величини x1, х2, х3,..., ха, дорівнюють 1 чи 0;
вагові коефіцієнти w1, w2, w3,..., wa — будь-які дійсні числа.
Ці вхідні сигнали, у сукупності позначені вектором , відповідають
сигналам, що надходять у біологічні нейрони. Аналогічно множину ваг позначають вектором
. Підсумовуючий блок (рис. 1.2), що відповідає тілу біологічного елемент
а (СОМИ), додає зважені входи алгебраїчно, утворюючи вихід, що одержав назву net.
У векторних позначеннях це можна подати у вигляді:
.
У розглянутому прикладі y = f (net—) — вихідний сигнал нейрона, в якому активаційна
функція f(x) може, наприклад, приймати значення:
Тут — алгебраїчна сума зважених входів.
Рис. 1.3. ілюструє поведінку нейрона з трьома входами: у дорівнює точно одиниці,
якщо входи 1, х1, х2, х3, перемножені на ваги — , w1, w2, w3, в сумі перевищують 0, тобто
Для введення граничного значення — у загальну суму на рис. 1.3 передбачений додатковий вхід,
що завжди дорівнює 1. Цей допоміжний вхід спрощує формалізацію, при якій граничне значення —
зараховується до ваг, і опитування нормується на число 0. Цей додатковий вхід зі стандартною величиною
1 і вагою - одержав найменування Bias (зсув).
|
Рис. 1.3. Нейрон з трьома входами x1, x2, x3 ,вагою граничного сигналу - і вагами w1, w2, w3 |
2) Застосування сіток радіальних базисних функцій (RBF)
Для сіток RBF застосовуються наступні базисні функції:
|
|
|
наприклад з f(x) = де
норма інтервалу і — центри базисних функцій. Часто застосовуються
локальні базисні функції, наприклад, дзвін Гаусса .
|
|
|
в якій варіаційна матриця визначає стандартні відхилення і
ротацію функцій RBF у всіх напрямках (рис. 4.14, б). Найчастіше вибирається діагональна матриця
|
=diag(1/12, 1/22,…,1/n2), |
|
яка приводить до еліптичного осевоортогональної функції RBF, або всі відхилення
вибираються стандартні однаковими: σ1= σ2= ... = σn,, що приводить до чисто
радіальних функцій RBF. Усі стандартні відхилення і всі координати центрів можуть бути
об'єднані в одному векторі параметрів wi(h),що забезпечить формальну еквівалентність з формулою (4.58).
У сітках RBF кожен нейрон характеризується центром сi. Аргументом базисної функції служить
дистанція між вхідними даними і цим центром (див. розділ. 3). Тому кожна базисна функція
має розмірність вхідного простору. Оскільки всі області, в яких розташовані дані,
повинні бути охоплені мінімум однією базисною функцією, трудомісткість дуже зростає
зі збільшенням вхідної розмірності ("прокляття" розмірності). Цьому протистоїть перевага
геометричної інтерпретації нелінійних параметрів. Завдяки цьому є можливість визначити
центри, наприклад методом кластеризації, а стандартні відхилення розрахувати за принципом
"найближчого сусіда". На кінець потрібно ще оцінити ваги на виході з вихідного шару
методом лінійної оптимізації. Незважаючи на те, що RBF краще інтерпретується у порівнянні
з сітками MLP, доводиться досить абстрактно маніпулювати з базисними функціями
в n-мірному входному просторі.