- •7.5. Основные результаты раздела
- •8. Стохастические оптимальные системы
- •8.1. Метод динамического программирования
- •Достаточное условие оптимальности.
- •8.2. Синтез оптимальной системы при полной информации о состоянии
- •8.3. Синтез оптимальных систем управления при неполной информации
- •Наблюдатель Калмана - Бьюси
- •Наблюдатель при цветном шуме объекта
- •Наблюдатель при цветном шуме наблюдения
- •8.4. Стохастическая линейная оптимальная система управления при неполной информации. Принцип разделимости
- •8.5. Основные результаты раздела
- •9. Оптимальные дискретные системы
- •9.1. Синтез оптимальной линейной системы при квадратичном критерии
- •9.2. Стохастическая оптимальная линейная система при полной информации о состоянии
- •9.3. Наблюдатель (фильтр) Калмана
- •9.4. Стохастическая система управления при неполной информации
- •Приложение 1 п1. Функционал и его экстремумы
- •Приложение 2 п2. Матрицы. Дополнительные сведения
- •Характеристическая матрица, характеристические уравнения и собственные значения
9.4. Стохастическая система управления при неполной информации
Пусть объект и наблюдение описываются уравнениями
;
и критерий оптимальности имеет вид
.
Шум объекта V0(i) и шум наблюдения VH(i) представляют последовательности независимых гауссовских случайных величин с нулевыми средними, дисперсионными матрицами Q0(i) и R0(i) соответственно. Матрицы F, Q(i), R(i), Q0(i) и R0(i) симметричны, причем F0, Q(i)0, R(i)>0, Q0(i)0, R0(i)>0 при i0iij-1. Начальное состояние x(i0)=x0 является гауссовской случайной величиной со средним значением и дисперсионной матрицей p0 и не зависит от шумов V0(i) и VH(i).
Требуется найти такое управление
,
при котором критерий принимает минимальные значения.
Для этой задачи справедлив принцип разделения, поэтому ее решение имеет вид:
(9.26)
(9.27)
Соотношения (9.26) определяют оптимальное управление с обратной связью. Они совпадают с соотношениями (9.13), (9.9), (9.6), определяющими оптимальный регулятор в случае полной информации, за исключением того, что в (9.26) входит оценка вместо x(i).
Оценка получается на выходе фильтра (9.27), совпадающего с фильтром Калмана (9.20) – (9.24). Таким образом, дискретная оптимальная система управления в случае неполной информации, как и аналогичная непрерывная система управления, состоит из оптимального фильтра и оптимального детерминированного регулятора.
Если шумы или значение фазового вектора в начальный момент не являются гауссовскими, то соотношения (9.26), (9.27) определяют линейную оптимальную оценку только в классе линейных систем.
Приложение 1 п1. Функционал и его экстремумы
Функционалом называется отображение функций заданного класса М на множестве действительных чисел, т.е.:
,
где и класс М определяется свойствами , например класс непрерывных функций, гладких функций и т.п.
Вполне очевидно, что для каждого функционала можно поставить задачу об отыскании такой функции (или некоторого множества функций ), на которой функционал достигает экстремального (минимального или максимального) значения, т.е.
или , –
для глобального экстремума и
или , –
для локального экстремума.
Значение первой вариации функционала равно линейной относительно вариации аргумента частью приращения функционала и является определяющим при отыскании экстремума .
Необходимым условием экстремума функционала является равенство нулю первой вариации функционала
(П1.1)
а знак второй вариации определяет тип экстремума точно так же, как и второй дифференциал для экстремума функции.
Если задан функционал интегрального типа, для которого требуется найти экстремум, т.е.
(П1.2)
причем концы экстремалей функций, на которых достигается экстремум, фиксированы:
, (П1.3)
то условие (П1.1) приводит к уравнению Эйлера
. (П1.4)
Отыскание экстремалей состоит в решении уравнения (П1.4) с граничными условиями (П1.3). Это так называемая простейшая задача вариационного исчисления.
Если концы y(a) и y(b) подвижны, то задача поиска экстремума имеет вид
(П 1.5)
Её решение отыскивается с использованием уравнения Эйлера совместно с условиями трансверсальности
. (П1.6)
Если же не зафиксированы начало х=а и конец х=b, то в этом случае функционал может иметь вид
, (П1.5’)
и для поиска его экстремалей необходимо решать уравнение Эйлера (П1.4) совместно с условиями (П1.6) и дополнительными условиями трансверсальности:
. (П1.7)
Если в (П1.2), (П1.5) и (П1.5’) y(x) есть векторная функция , то уравнение Эйлера (П1.4) является системой уравнений для n координат .
Точно так же векторными являются краевые условия (П1.3) и условия трансверсальности (П1.6). Условия (П1.7) являются скалярными с участием векторов:
, (П1.8)
где Т-символ транспонирования.
В общем n-мерном случае решение задачи поиска вектор-функции , доставляющей экстремум функционалу (П1.2), или (П1.5), или (П1.5’), сводится к следующему:
найти общее решение системы n дифференциальных уравнений Эйлера второго порядка (П1.4);
если задача с фиксированными концами, то найти 2n неопределенных констант интегрирования из 2n краевых условий (П1.3);
если задача с подвижными концами, то константы определяются из 2n условий трансверсальности (П1.6);
если не фиксированы концы x=a и/или x=b, то для их определения дополнительно используют условия трансверсальности (П1.7).
В этой схеме решения отсутствие краевого условия по любой i-й координате в x=a или x=b требует использования соответствующего условия трансверсальности и наоборот. Таким образом, в любой комбинации суммарное число краевых условий и условий трансверсальности должно составлять 2n.
Если в решении допускаются негладкие решения, имеющие конечное число угловых точек (точек разрыва производной y(x)), то в таких точках должны выполняться условия Вейерштрасса-Эрдмана:
,
, (П1.9)
где с [a,b] является угловой точкой траектории.
Пусть ставится задача об отыскании экстремума функционала
(П1.10)
при фиксированных условиях на концах (П1.3), но с дополнительными голономными и неголономными связями в виде систем уравнений:
(П1.11)
(П1.12)
Тогда для решения задачи прежде всего формируется функция Лагранжа
(П1.13)
где - неопределенные коэффициенты или множители Лагранжа, подлежащие в дальнейшем определению. Коэффициенты, стоящие перед уравнениями голономных связей, являются в общем случае функциями переменной а - константами.
Далее решаем вариационную задачу
(П1.14)
где Из (П1.13) и (П1.14) следует, что один из параметров можно выбрать произвольно, т.к. это не повлияет на результат решения задачи (П1.14). обычно фиксируют выбирая в зависимости от вида экстремума.
Таким образом, задача об условном экстремуме функционала (П1.10) - (П1.12) сводится к задаче о безусловном экстремуме функционала (П1.2) – (П1.3).
Для её решения необходимо решить уравнение (П1.4), которое в этом случае называется уравнением Эйлера-Лагранжа
, (П1.15)
с учетом уравнений связи (П1.11) и (П1.12), т.к. вариации по и приводят (с учетом структуры L в выражении (П1.3)) именно к ним.
В многомерном случае, когда - выражение (П1.15) является системой дифференциальных уравнений с краевыми векторными условиями.
Если сделать подвижными концы траектории и переменными значения a и b, то можно сформулировать задачу:
(П1.16)
при условиях:
(П1.17)
(П1.18)
. (П1.19)
тогда, используя функцию Лагранжа (П1.13) и функцию , где обычно , решается задача
(П1.20)
которая соответствует задаче (П1.5)–(П1.7). Решение состоит из интегрирования дифференциального уравнения (П1.15) совместно с условиями трансверсальности
(П1.21)
соответствующими подвижностями границ, и
(П1.22)
которые соответствуют подвижности концов x = a и x = b.
Если рассматривается векторная задача размерности n, и уравнения связи (П1.10) разрешены относительно ,т.е.
(П1.23)
то функция Лагранжа приобретает вид
, (П1.24)
и уравнения (П 1.20)-(П 1.22) принимают вид
, (П1.25) (П1.26)
(П1.27)
где
, (П1.28)
так называемая функция Гамильтона, играющая важную роль в механике и управлении.