ОиАС-4
.pdfПроинтегрируем уравнения объекта при первом управлении с учетом начальных условий:
x2 |
|
at, 0 t ts ; |
|
at, ts t 10, |
|
|
C2 |
Используя непрерывность x2(t), т.е. равенство ats = С2 – ats, находим С2 = 2ats. Поэтому последнее соотношение можно записать в виде
x2 |
|
at, |
0 t ts ; |
|
|
|
|
|
a 2ts t , ts t 10, |
Из краевого условия на правом конце траектории имеем x2(10) = a(2ts – 10) = 0. Отсюда для момента переключения находим ts = 5. Таким образом, оптимальное управление имеет вид
a, 0 t 5; u a, 5 t 10
11
Задача максимального быстродействия. Теорема об n интервалах
12
Рассмотрим задачу максимального быстродействия, когда объект является линейным:
|
|
n |
|
|
m |
|
|
|
|
|
|
|
|
|
xi |
aik xk |
bij u j , |
i |
1, n |
|
|
|
|
||||||
|
|
k 1 |
|
|
j 1 |
|
|
|
|
|
|
|
|
|
j |
u j |
j , |
j |
0, |
j 0, |
j |
|
(2.2.38) |
||||||
1, m |
||||||||||||||
x t |
x0 , x |
t 0, i |
|
|
|
|
|
|||||||
1, n |
|
|
|
|||||||||||
i |
0 |
|
i |
i |
1 |
|
|
|
|
|
|
|
|
|
J t1 t0 min
Эта задача называется линейной задачей максимального быстродействия. В векторной форме уравнения объекта принимают вид
x Ax Bu |
(2.2.39) |
Предполагается, что эти уравнения являются уравнениями в отклонениях и поэтому конечное состояние, в которое нужно перевести объект, есть начало координат (x(t1) = 0).
Функция H имеет вид
H T Ax Bu |
n |
n |
a x |
m |
b u |
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
i k 1 |
ik k |
j 1 |
ij |
j |
где ψT = (ψ1, ψ2 ,…, ψn) подчиняется сопряженному уравнению
Τ H
x
Согласно принципу максимума оптимальное управление определяется из условия
|
|
n |
|
n |
|
|
|
|
n |
m |
|
|
||
max H i aik |
xk |
max i |
bij u j |
|||||||||||
u U |
|
i 1 |
k 1 |
|
|
|
u U |
i 1 |
j 1 |
|
||||
|
|
|
|
|
|
|
||||||||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
n |
|
|
|
m |
|
|
n |
|
|
|||
max u |
b |
|
max u |
b |
|
|
||||||||
u U |
j 1 j |
i 1 ij |
|
i |
|
j 1 |
u U |
j |
i 1 ij |
|
i |
|
||
где |
U u : j |
|
|
|
|
|
|
|
|
|
|
|
||
|
u j |
j , |
j |
|
|
|
||||||||
|
1, m |
|
|
Если выполняется так называемое условие нормальности, то сумма
n
bij i i 1
обращается в нуль только в изолированных точках.
13
В этом случае из последнего тождества следует, что координаты u*j j 1, m
оптимального управления u*(t) кусочно постоянны и принимают крайние значения αj или βj:
|
|
|
|
n |
|
0, |
|
|
|
|
|
|
|
, |
b |
|
|
|
|
|
|||
|
|
j |
|
i 1 ij |
i |
|
|
|
|
|
|
* |
|
|
|
|
j 1, m |
||||||
u j |
|
|
|
n |
|
0, |
|||||
|
|
, |
b |
|
|
|
|
|
|
||
|
|
j |
|
i 1 ij |
i |
|
|
|
|
|
|
В частном случае, когда βj = –αj, имеем |
|
|
|
|
|
||||||
|
|
|
|
n |
|
|
j |
|
|
|
|
u*j |
j |
sign bij i , |
1, m |
i 1
Для линейных задач максимального быстродействия при выполнении так называемого условия нормальности принцип максимума является не только необходимым, но и достаточным условием оптимальности. Для определения этого понятия введем в рассмотрение n n -матрицы
N[j] = [Bj (AB)j … (An–1B)j],
Bj (AB)j … (An–1B)j – j-е столбцы матриц B (AB) … (An–1B) соответственно.
14
Условие нормальности. Говорят, что для объекта x Ax Bu
выполнено условие нормальности или условие общности положения, если матрицы N[j] невырождены: det N[j] ≠0 (j = 1,2,...,m).
Очевидно, в случае скалярного управления условие нормальности совпадает с условием управляемости. Так как линейный объект всегда может быть представлен в приведенном выше нормальной форме, то о выполнимости или невыполнимости условия нормальности можно говорить для любой линейной стационарной системы. Объект, для которого выполнено условие нормальности, будем называть нормальным объектом или нормальной управляемой системой.
Необходимое и достаточное условие оптимальности. Если в линейной задаче максимального быстродействия объект является нормальным, то для того чтобы пара (u*(t),х*(t)) была ее решением, необходимо и достаточно, чтобы она удовлетворяла принципу максимума.
15
В оптимальном по быстродействию управлении линейным объектом функции u*(t) принимают только граничные значения при любых собственных значениях матрицы А, если объект является нормальным. В общем случае эти функции имеют произвольное число переключений – точек перехода из одного граничного значения на другое. В частном случае справедлива следующая теорема.
Теорема об n интервалах. Если в линейной задаче максимального быстродействия объект является нормальным и характеристическое уравнение
det (A – Is) = 0
имеет только действительные корни, то компоненты оптимального управления
u*j j 1, m
кусочно постоянны, принимают только граничные значения и имеют не более n интервалов постоянства, или не более n – 1 переключений.
16
Впервые теорему об n интервалах для объекта, который описывается уравнением вида
n |
a1 |
n 1 |
an y b0u |
a0 0, b0 0 |
a0 y |
y |
сформулировал и доказал А.А. Фельдбаум. Как было отмечено, условие нормальности для такого объекта всегда выполняется, поэтому для справедливости теоремы об n интервалах необходимо и достаточно, чтобы все корни его характеристического уравнения были действительными.
Если характеристическое уравнение объекта имеет комплексные корни, то число переключений зависит от начальных условий. В каждом конкретном случае оно возрастает при удалении начальной точки от начала координат и может быть сколь угодно большим, но всегда конечным при любом начальном условии.
17
Вырожденные задачи
18
Методы классического вариационного исчисления и принцип максимума не всегда позволяют найти оптимальное управление.
Существуют задачи, в которых необходимые условия оптимальности, даваемые этими методами, выполняются тривиальным образом и им, помимо одного оптимального управления, удовлетворяет множество других управлений, среди которых могут быть как оптимальные, так и неоптимальные управления. Задачи такого типа называют вырожденными.
К числу вырожденных задач относятся линейные задачи максимального быстродействия для которого не выполняется условие нормальности.
Если обнаружится, что внутри интервала [t0, t1] имеется конечный отрезок времени [t*, t**] такой, что на нем вдоль соответствующих управлению u*(t) траектории x*(t) и сопряженной функции ψ*(t) выполняются тождества
H * , x* ,u,t |
0, |
2 H * , x* ,u,t |
0 |
u |
|
u2 |
|
или
E * , x* ,u* ,u,t H * , x* ,u* ,t H * , x* ,u,t 0
то оптимальное управление называют:
•вырожденным в классическом смысле в случае (2.2.40)
•вырожденным в смысле принципа максимума в случае (2.2.41).
(2.2.40)
(2.2.41)
Вообще говоря, условия (2.2.40) и (2.2.41) не всегда выполняются одновременно.
19
В случае вырожденных задач оптимальное управление нельзя найти только из условий (2.2.40) или (2.2.41). Требуются дополнительные условия. Одним из необходимых дополнительных условий для вырожденных скалярных управлений являются неравенства
k |
d 2 k |
H |
|
|
|||
1 |
|
|
|
|
|
0, |
k 1,2, |
|
|
2 k |
|
||||
|
u dt |
|
u |
|
|
При использовании этого условия производится последовательное дифференцирование производной
H
u
по времени, пока в одной из производных не появится u, что и даст возможность найти оптимальное управление. Доказано, что при s последовательных дифференцированиях управление может появиться лишь при четном s = 2k.
Такого рода вырожденные задачи встречаются, в частности, когда гамильтониан линейно зависит от u.
20