Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОАС.docx
Скачиваний:
9
Добавлен:
12.11.2018
Размер:
2.22 Mб
Скачать
    1. Аналитический синтез оптимальных регуляторов по квадратичному критерию качества.

Пусть мат модель ОУ задана в переменных состояния:

В векторном виде:

X – n-мерный вектор переменных состояния.

A – квадратная матрица

B - n×r матрица

U – r-мерный вектор управляющих воздействий.

Для этого объекта необходимо синтезировать регулятор оптимальный с точки зрения квадратичного критерия:

Q – матрица весовых коэффициентов (gij – коэффициенты при xixj)

R –матрица r×r (rij коэффициенты при uiuj)

Обычно матрицы Q и R диагональные.

Рассмотрим пример.

Задачу (2) и (3) решим с помощью ПМП.

  1. Введем вспомогательную переменную и составим расширенную систему.

  1. Составим функцию Гамильтона.

Функция Н не зависит от , поэтому

  1. Решается задача H→max.

  1. Определим функцию Ψ из системы сопряженных уравнений.

Функцию Ψ будем искать в виде

Уравнение (6) называется алгебраическим уравнение Рикати. Уравнение Рикати позволяет определить элементы матрицы К. Матрица К является симметричной. Уравнение Рикати является нелинейным, поэтому содержит несколько решений. Из этих решений выбирается одно, удовлетворяющее условию Сильвестра.

    1. Дискретная форма вариационной задачи. Принцип оптимальности Беллмана.

Функционал вариационной задачи: при замене подынтегральной функции G ломаной может быть представлен в дискретном виде:

В этом случае задача поиска экстремума J заменяется задачей мат программирования поиска экстремума функций N-переменных . Чем больше N, тем точнее решение. Но с увеличением N возрастает сложность решения задачи, поэтому Беллманом разработана методика решения задач управления многошаговая, мат аппаратом при этом является динамическое программирование. Рассмотрим задачу управления как многошаговую.

На i-том шаге управления под действием управления Ui объект переводится из состояния Xi-1 в состояние Xi.

Эффективность управления на каждом шаге оценивается функцией потери r(xi, u). Эффективность всего управления: . Задача состоит в определении такой стратегии управления U*=(U1…UN), которая переводила бы объект из X0 в XN и при этом обеспечивала бы минимальные функции потерь R.

Введем понятия fk(xk) – минимальные потери, при переходе из состояния xk в состояние xn.

Поставленная задача решается на основе принципа оптимальности Беллмана: не зависимо от того каким образом система пришла в данное состояние, управление на данном шаге должно быть таким, чтобы суммарные потери на данном шаге + минимальные потери на всех последующих шагах были минимальными.

- рекуррентное соотношение Беллмана, которое выражает принцип оптимальности. Это соотношение позволяет решать задачу с последнего шага. Полагаем k=N-1

Для всех состояний XN-1 определяется условно-оптимальное управление UN-1. Затем полагаем k=N-2.

Определяется условно-оптимальное управление UN-2.

Процедура продолжается до начального состояния X0: которая известна.

    1. Непрерывная задача динамического программирования.

Принцип оптимальности Беллмана может быть применен и для решения непрерывных задач управления:

Эта задача при замене dt на Δt может быть представлена в дискретном виде:

Для данной задачи функция минимальных потерь имеет вид:

Минимальные потери при движении системы из в конечное состояние.

В соответствии с принципом оптимальности:

Функцию разложим в ряд вблизи точки :

Подставим (5) в (4):

Подставляем (3) в (6):

Функция в квадратных скобках равна 0, если она минимальна, поэтому последнее выражение эквивалентно системе:

Выражение (7) называется функциональным уравнением Беллмана для непрерывной задачи управления.

Если верхний предел :

Метод динамического программирования позволяет синтезировать системы не только оптимальные, но и устойчивые, поскольку функция минимальных потерь S является функцией Ляпунова.

- знакоопределенная положительная функция.

- знакоопределенная отрицательная функция.