Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Підр ТАК нов.docx
Скачиваний:
63
Добавлен:
19.11.2019
Размер:
12.53 Mб
Скачать

3.7.11 Теорема про інтервалах.

В задачах оптимальної швидкодії аперіодичними або нейтральними об’єктами го порядку, коли на керування накладаються обмеження , справедлива так звана теорема про інтервалах, яка стверджує, що оптимальне керування є кусковосталим та дорівнює , а число переключень з одного знаку до другого не більш як .

3.7.12 Застосування метода фазової площини для розв’язання задач оптимального за швидкодією керування.

Відомо що для нейтрального об’єкта другого порядку рівняння фазових траєкторії мають вигляд , де - стала інтегрування, яка залежить дів початкових умов. Якщо за лінію переключення обрати траєкторію яка проходить через початок координат , то реалізується алгоритм керування , де ( рис.3.122 )

Рис.3.122 Задача оптимального керування за швидкодією

3.7.13 Метод динамічного програмування. Принцип оптимальності Беллмана.

Метод динамічного програмування (принцип оптимальності Беллмана ) стверджує що будь яка кінцева ділянка оптимальної траєкторії є також оптимальною траєкторією.

Рис.3.123 Принцип оптимальності Беллмана

Якщо є оптимальною траєкторією, допустити що на кінцевої ділянки оптимальною є , а не , то оптимальною повинна бути траєкторія , що неможливо. Отже, стратегія керування на кінцевої ділянці повинна бути оптимальною.

3.7.14 Дискретний варіант динамічного програмування.

Хай об’єкт керування описується диференційним рівнянням і необхідно визначити оптимальне керування при заданих граничних умовах , та критерії оптимальності . Для переходу до дискретного варіанту інтервал керування розбивається на інтервалів, на яких керування вважається сталим. При цьому задача приводиться до задачі визначення оптимальної послідовності керуючих впливів , а рівняння та критерії оптимальності приймають вигляд та .

Задача мірної оптимізації дає можливість визначення керуючих впливів . Для останньої ділянки на інтервалі часу керування обирається із умови оптимальності останньої складової . Отже, якщо позначити через , то . Перехід до наступної ділянки дає можливість визначити . Продовжуючи цю процедуру, за допомогою рекурентної формули , визначаються . На першої ділянці визначаються та у вигляді функції від . Після цього по знаходиться , по якому визначається

і т. д. Таким чином визначається вся послідовність значень оптимальних керувань та траєкторії

.

3.7.15 Неперервний варіант динамічного програмування.

Розглядається задача визначення оптимального керування об’єктом Ю який описується рівнянням при критерії оптимальності , де

. Розглянемо деяку кінцеву ділянку оптимальної траєкторії . Відповідно принципу оптимальності також є оптимальною траєкторією. Тоді на інтервалі оптимальне значення дає . Позначимо його як + , . Якщо має частинні похідні по та , то . Тоді

а з урахуванням незалежності та від витікає рівняння (3.121), яке

зветься функціональним рівнянням Беллмана.