Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ОиАС-4

.pdf
Скачиваний:
14
Добавлен:
26.03.2016
Размер:
829.78 Кб
Скачать

1

 

Лекция 4

 

 

 

 

 

Пример 2.2.1. Построение оптимального по расходу топлива управления.

Рассмотрим объект управления, описываемый уравнениями

x1 x2

x2 x1 u

Пусть на управление наложено ограничение

|u(t)| 1.

Функционал оптимизации, выражающий расход топлива, имеет вид

t1

J u t dt

t0

Заданы начальное состояние

x1(t0) = x10; x2(t0) = x20

и условие в момент времени t1

x1(t1) = x2(t1) = 0.

(2.2.26)

(2.2.27)

(2.2.28)

(2.2.29)

(2.2.30)

Требуется найти u(t), при котором объект (2.2.26) переходит из состояния (2.2.29) в состояние (2.2.30), при этом выполняются ограничения (2.2.27), а функционал (2.2.28) принимает наименьшее значение.

2

Переходя к определению оптимального управления на основе принципа максимума, сформируем гамильтониан

H = –|u| + ψ1(t) х2 + ψ2(t) (–x1

уравнения для вспомогательных переменных

 

 

 

H ;

 

 

1

 

x1

 

 

 

2

 

 

 

 

H .

 

2

 

x2

1

 

 

 

Управление u(t), доставляющее максимум функции

 

0,

если

 

2 t

 

1;

 

 

 

u t

1,

если

2

t 1;

 

 

 

 

 

 

 

 

 

 

 

1, если

 

t 1.

 

 

 

 

 

 

 

2

 

 

 

+ u)

(2.2.31)

(2.2.32)

(2.2.31), определяется как

(2.2.33)

Уравнения (2.2.26), (2.2.32), (2.2.33) составляют краевую задачу. Переходя к ее исследованию, запишем решение системы (2.2.32):

ψ1(t) = –a cos(t + α); ψ2(t) = a sin(t + α),

(2.2.34)

где а>0; 0 α 2π – неизвестные числа, которые необходимо определить так,

чтобы управление (2.2.33) привело объект (2.2.26) в состояние (2.2.30). Найдем

3

решение системы (2.2.26) при u = 0, u = 1, u = –1.

В первом случае решение этой системы имеет вид x1=–R cos(t + β), x2=R sin(t + β). Оно зависит от постоянных R и β при этом R > 0, 0 β 2π. Фазовые траектории этой системы представляют собой окружности с центром в начале координат.

Фазовые траектории системы (2.2.26) при u= + 1 и u = –1 также являются окружностями, центры которых расположены в точках (1,0) (–1, 0)

соответственно.

4

Пусть некоторым оптимальным управлениям u(t) объект (2.2.26) переводится из начального состояния (x10, х20) в начало координат. Тогда на последнем участке оптимальной траектории управление u(t) равно +1 либо –1. Для определенности будем полагать, что оптимальное управление имеет вид, изображенный на рисунке.

5

В этом случае последний участок фазовой траектории представляет собой дугу величиной η с центром в точке (1, 0) . Управление u(t)=0 при

t [t1 π; t1 η], и поэтому соответствующий участок фазовой

траектории является дугой с центром в точке (0, 0) и центральным углом

π η.

В точке А происходит переключение управления u(t)=0 на u(t) = l, а в точке В – с u(t)=–1 на u(t)=0. Задаваясь различными значениями чисел α и а, получим различные числа η. Строя для каждого числа η траекторию методом «попятного движения, определяем, «попал» ли левый конец этой траектории в точку (x10, х20). Пусть для некоторого η траектория ОАВ прошла через точку (x10, х20). Для такого числа η нетрудно определить числа α и а, а через них начальные условия ψ10, ψ20, которые и разрешают краевую задачу.

6

Задача с подвижными концами и нефиксированным временем

7

Пусть в задаче об оптимальном программном управлении начальное (2.2.3) и конечное (2.2.4) состояния не фиксированы (a t0 и t1 заданы) и могут перемещаться по поверхностям:

левый конец траектории xi(t) (i=l, …, n) по поверхности υ01(х(0), t0)=0,

правый – по поверхности υ11(х(1), t1)=0.

Теорема 2.2.2 (принцип максимума) в этом случае в основном сохраняется (так как управление, оптимальное при подвижных концах траектории xi(t) (i=l, …, n), является оптимальным и в частном случае, когда концы закреплены), однако 2n граничных условий для системы (2.2.24), (2.2.25), решения которой содержат 2n произвольных постоянных, определяются из условий трансверсальности:

 

V

 

 

V

 

 

 

 

(2.2.35)

i t0

;

i t1

i

1, n

xi 0

xi 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

s p

 

 

 

 

V x t0 , x t1 , g g0 0 g j j 0

gi i1

 

 

 

 

 

 

 

 

j 1

i s 1

Если один из концов траектории x(t), например правый, закреплен, то граничные условия имеют вид

x t x ;

 

 

t

 

V

 

i

 

 

 

 

1, n

(2.2.36)

 

xi 0

i 1

 

i 1

 

i

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В случае нефиксированного времени, т.е. когда моменты t0

и t1 не заданы,

добавляются еще два условия трансверсальности:

 

H

 

 

 

V

; H

 

 

 

 

V

 

 

 

(2.2.37)

 

 

 

 

 

 

 

 

 

 

t0

 

 

 

t0

 

 

 

 

t t0

 

t t1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

Пример 2.2.2. Определить оптимальное управление в следующей задаче оптимального управления:

x1

x2 ;

 

u

 

a;

 

x1 0 x2 0 0;

x2 10 0;

 

J x1 10 min

 

 

 

 

x2

u;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Функция H и сопряженные уравнения имеют вид

 

 

 

 

 

 

 

 

H 1 x2

2u

 

 

 

 

 

 

 

 

 

 

 

H 0;

 

H

 

 

 

 

 

 

 

 

 

1

 

x1

 

2

x2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Терминант и условия трансверсальности имеют вид

 

 

 

V g0 0 x1 10 ;

1 10

V

 

 

 

1

 

 

 

 

 

 

 

 

 

 

x1 10

 

 

 

 

 

 

 

 

 

 

 

 

 

Решив сопряженные уравнения и учитывая условия трансверсальности, находим

 

 

 

 

 

 

 

 

1 1; 2 C2 t

 

 

 

 

В условии

 

 

 

 

 

max H x, ,

0 ,u 1 x2 max 2u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u U

 

 

 

 

 

u U

 

максимум достигается, когда управление принимает граничные значения и его

знак совпадает со знаком функции ψ2, т.е. при u = аsignψ2.

9

Так как знак линейной функции может измениться только один раз, то оптимальным может быть управление

 

 

a, 0 t ts ;

 

u

 

 

 

 

a, ts

t 10,

 

или

момент изменения знака функции ψ2

 

 

 

a, 0

t ts ;

 

 

u

a, ts

t 10

 

 

В частности, если ts = 10, то это значит, что функция ψ2 на интервале [0,10] не меняет знака, и управление не переключается. Выбор из двух управлений можно сделать исходя из того, какое из этих управлений обеспечивает выполнение граничных условий. Но в данном примере этот выбор можно сделать на оснований физических соображений. По условию задачи нужно повернуть вал двигателя на максимальный угол и остановить его за заданное время. Поэтому оптимальным может быть только первое из двух приведенных управлений. Остается определить только момент ts переключения управления.

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]