Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
177-220.doc
Скачиваний:
11
Добавлен:
28.04.2019
Размер:
2.01 Mб
Скачать

9.4. Стохастическая система управления при неполной информации

Пусть объект и наблюдение описываются уравнениями

;

и критерий оптимальности имеет вид

.

Шум объекта V0(i) и шум наблюдения VH(i) представляют последовательности независимых гауссовских случайных величин с нулевыми средними, дисперсионными матрицами Q0(i) и R0(i) соответственно. Матрицы F, Q(i), R(i), Q0(i) и R0(i) симметричны, причем F0, Q(i)0, R(i)>0, Q0(i)0, R0(i)>0 при i0iij-1. Начальное состояние x(i0)=x0 является гауссовской случайной величиной со средним значением и дисперсионной матрицей p0 и не зависит от шумов V0(i) и VH(i).

Требуется найти такое управление

,

при котором критерий принимает минимальные значения.

Для этой задачи справедлив принцип разделения, поэтому ее решение имеет вид:

(9.26)

(9.27)

Соотношения (9.26) определяют оптимальное управление с обратной связью. Они совпадают с соотношениями (9.13), (9.9), (9.6), определяющими оптимальный регулятор в случае полной информации, за исключением того, что в (9.26) входит оценка вместо x(i).

Оценка получается на выходе фильтра (9.27), совпадающего с фильтром Калмана (9.20) – (9.24). Таким образом, дискретная оптимальная система управления в случае неполной информации, как и аналогичная непрерывная система управления, состоит из оптимального фильтра и оптимального детерминированного регулятора.

Если шумы или значение фазового вектора в начальный момент не являются гауссовскими, то соотношения (9.26), (9.27) определяют линейную оптимальную оценку только в классе линейных систем.

Приложение 1 п1. Функционал и его экстремумы

Функционалом называется отображение функций заданного класса М на множестве действительных чисел, т.е.:

,

где и класс М определяется свойствами , например класс непрерывных функций, гладких функций и т.п.

Вполне очевидно, что для каждого функционала можно поставить задачу об отыскании такой функции (или некоторого множества функций ), на которой функционал достигает экстремального (минимального или максимального) значения, т.е.

или ,

для глобального экстремума и

или ,

для локального экстремума.

Значение первой вариации функционала равно линейной относительно вариации аргумента частью приращения функционала и является определяющим при отыскании экстремума .

Необходимым условием экстремума функционала является равенство нулю первой вариации функционала

(П1.1)

а знак второй вариации определяет тип экстремума точно так же, как и второй дифференциал для экстремума функции.

Если задан функционал интегрального типа, для которого требуется найти экстремум, т.е.

(П1.2)

причем концы экстремалей функций, на которых достигается экстремум, фиксированы:

, (П1.3)

то условие (П1.1) приводит к уравнению Эйлера

. (П1.4)

Отыскание экстремалей состоит в решении уравнения (П1.4) с граничными условиями (П1.3). Это так называемая простейшая задача вариационного исчисления.

Если концы y(a) и y(b) подвижны, то задача поиска экстремума имеет вид

(П 1.5)

Её решение отыскивается с использованием уравнения Эйлера совместно с условиями трансверсальности

. (П1.6)

Если же не зафиксированы начало х=а и конец х=b, то в этом случае функционал может иметь вид

, (П1.5’)

и для поиска его экстремалей необходимо решать уравнение Эйлера (П1.4) совместно с условиями (П1.6) и дополнительными условиями трансверсальности:

. (П1.7)

Если в (П1.2), (П1.5) и (П1.5’) y(x) есть векторная функция , то уравнение Эйлера (П1.4) является системой уравнений для n координат .

Точно так же векторными являются краевые условия (П1.3) и условия трансверсальности (П1.6). Условия (П1.7) являются скалярными с участием векторов:

, (П1.8)

где Т-символ транспонирования.

В общем n-мерном случае решение задачи поиска вектор-функции , доставляющей экстремум функционалу (П1.2), или (П1.5), или (П1.5’), сводится к следующему:

  • найти общее решение системы n дифференциальных уравнений Эйлера второго порядка (П1.4);

  • если задача с фиксированными концами, то найти 2n неопределенных констант интегрирования из 2n краевых условий (П1.3);

  • если задача с подвижными концами, то константы определяются из 2n условий трансверсальности (П1.6);

  • если не фиксированы концы x=a и/или x=b, то для их определения дополнительно используют условия трансверсальности (П1.7).

В этой схеме решения отсутствие краевого условия по любой i координате в x=a или x=b требует использования соответствующего условия трансверсальности и наоборот. Таким образом, в любой комбинации суммарное число краевых условий и условий трансверсальности должно составлять 2n.

Если в решении допускаются негладкие решения, имеющие конечное число угловых точек (точек разрыва производной y(x)), то в таких точках должны выполняться условия Вейерштрасса-Эрдмана:

,

, (П1.9)

где с [a,b] является угловой точкой траектории.

Пусть ставится задача об отыскании экстремума функционала

(П1.10)

при фиксированных условиях на концах (П1.3), но с дополнительными голономными и неголономными связями в виде систем уравнений:

(П1.11)

(П1.12)

Тогда для решения задачи прежде всего формируется функция Лагранжа

(П1.13)

где - неопределенные коэффициенты или множители Лагранжа, подлежащие в дальнейшем определению. Коэффициенты, стоящие перед уравнениями голономных связей, являются в общем случае функциями переменной а - константами.

Далее решаем вариационную задачу

(П1.14)

где Из (П1.13) и (П1.14) следует, что один из параметров можно выбрать произвольно, т.к. это не повлияет на результат решения задачи (П1.14). обычно фиксируют выбирая в зависимости от вида экстремума.

Таким образом, задача об условном экстремуме функционала (П1.10) - (П1.12) сводится к задаче о безусловном экстремуме функционала (П1.2) – (П1.3).

Для её решения необходимо решить уравнение (П1.4), которое в этом случае называется уравнением Эйлера-Лагранжа

, (П1.15)

с учетом уравнений связи (П1.11) и (П1.12), т.к. вариации по и приводят (с учетом структуры L в выражении (П1.3)) именно к ним.

В многомерном случае, когда - выражение (П1.15) является системой дифференциальных уравнений с краевыми векторными условиями.

Если сделать подвижными концы траектории и переменными значения a и b, то можно сформулировать задачу:

(П1.16)

при условиях:

(П1.17)

(П1.18)

. (П1.19)

тогда, используя функцию Лагранжа (П1.13) и функцию , где обычно , решается задача

(П1.20)

которая соответствует задаче (П1.5)–(П1.7). Решение состоит из интегрирования дифференциального уравнения (П1.15) совместно с условиями трансверсальности

(П1.21)

соответствующими подвижностями границ, и

(П1.22)

которые соответствуют подвижности концов x = a и x = b.

Если рассматривается векторная задача размерности n, и уравнения связи (П1.10) разрешены относительно ,т.е.

(П1.23)

то функция Лагранжа приобретает вид

, (П1.24)

и уравнения (П 1.20)-(П 1.22) принимают вид

, (П1.25) (П1.26)

(П1.27)

где

, (П1.28)

так называемая функция Гамильтона, играющая важную роль в механике и управлении.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]