§ 8.2. Классическая задача Эйлера
Рассмотрим одну из задач, которые изучались основоположниками
вариационного исчисления [30]. |
|
|
Задача. Требуется найти функции u =u(t) , |
x = x(t) , 0 ≤t ≤T , для ко- |
торых выполняются условия |
|
|
′ |
=u, |
(8.12) |
x |
x(0) = 0 , x(T ) = a |
(8.13) |
и минимизируется функционал |
|
|
T |
|
|
J = ∫(x2 + u2 )dt → min . |
(8.14) |
0 |
|
|
Продемонстрируем на примере этой задачи технику применения принципа максимума.
Решение. Для заданного ДУ первого порядка (8.12) и критерия качества (8.14) запишем функцию Гамильтона (8.4):
H = ψ0 (x2 + u2 )+ ψ1 u .
Поскольку ограничений на значения u нет, то наибольшее значение H может быть только экстремумом (максимумом). Используя необходимое условие экстремума, получаем:
∂∂Hu = 2ψ0 u + ψ1 = 0 .
Учитывая, что ψ0 = −1, получаем:
u* = |
1 |
ψ (t) . |
(8.15) |
|
2 |
1 |
|
Рассмотрим уравнение (8.6) |
для вспомогательной функции |
ψ1 , а |
также уравнение (8.12), в котором u определяется полученным выражени-
ем (8.15):
|
dψ |
|
∂H |
|
|
1 |
|
= − |
|
= 2x, |
|
dt |
∂x |
|
|
|
|
dx |
1 |
|
|
|
|
|
dt = |
2 ψ1. |
|
|
Получили систему взаимосвязанных (сопряженных) уравнений. Продифференцируем второе уравнение, выразим ψ1′ = 2x′′ и подставим
этот результат в первое уравнение:
2x′′ = 2x или x′′− x = 0 .
Для полученного однородного ДУ следует записать характеристиче-
ское уравнение λ2 −1 = 0 . По его корням λ1, 2 = ±1 можно сформировать общее решение этого ДУ:
x(t) = C et + C |
2 |
e−t . |
(8.16) |
1 |
|
|
Произвольные константы в (8.16) следует найти из граничных усло-
вий (8.13):
|
x(0) =C1 +C2 = 0, |
|
|
|
|
|
|
|
x(T ) =C1eT +C2e−T = a. |
|
Отсюда получаем |
|
|
|
|
C1 = |
a |
; C2 |
= −C1 . |
|
eT −e−T |
|
|
|
|
Тогда оптимальный процесс и оптимальное управление будут определяться выражениями
x* = eT −ae−T (et −e−t ), u* = х′= eT −ae−T (et + e−t ).
§ 8.3. Задача оптимального управления с минимизацией затрат энергии на управление
Рассмотрим систему, поведение которой характеризуется фактором y. На него можно влиять с помощью воздействия (управления) u. Модель,
определяющая связь между ними, задана дифференциальным уравнением y′′ = k u, u =u(t), y = y(t) ,
где k – параметр модели.
В начальный момент времени y(0) = y |
0 |
′ |
0 |
|
; y (0) |
= y1 . |
Требуется сформировать управление u = u(t) |
( 0 ≤t ≤tк) так, чтобы: |
1) по окончании процесса управления, т.е. при t =tк, система оказалась в заданном состоянии: y(tк) = 0; y′(tк) = 0 ;
tк
2) показатель качества в виде функционала J = ∫ f0 ( y, y′,u) dt при-
0
нял минимальное значение.
Эта задача имеет простую и наглядную физическую интерпретацию
(рис. 8.1).
m
F
Рис. 8.1
Материальный объект, имеющий массу m, в начальный момент времени находится в точке y = y(0) и имеет начальную скорость v(0) = y0′ . Необходимо найти закон изменения силы F = F(t) , прикладываемой к этому объекту, при котором он оказался бы в точке 0 и оставался в ней, а для этого он должен прийти в эту точку с нулевой скоростью.
При некоторых упрощающих предположениях эта система описывается уравнением, соответствующим второму закону Ньютона в механике:
ma = F .
Учитывая, что y′= v – скорость, а y′′ = v′= a – ускорение, получаем:
где k =1/ m ; u = F .
Приведем модель системы (8.17) к стандартному виду (8.1), полагая
y = x1, y′ = x2 : |
|
|
|
|
x |
′ |
= x |
|
|
|
|
(8.18) |
1 |
2, |
|
x |
′ = k u. |
|
2 |
|
|
|
Рассмотрим эту задачу, оценивая качество процессов управления величиной затрат энергии. Можно показать [31, 34], что эти затраты определяются функционалом
tк |
|
J = ∫u2(t)dt → min . |
(8.19) |
0 |
|
Нетрудно убедиться в том, что решение задачи об оптимальном управлении не изменится, если перед интегралом (8.19) поставить какойлибо числовой множитель. Будем считать, что в качестве такого множите-
ля принят коэффициент, равный 12 .
Тогда показатель качества будет соответствовать общей форме (8.2)
при f0 = 12 u2 (t) . Учитывая то, что управляемая система имеет второй по-
рядок и описывается уравнениями (8.18), вводим вспомогательные функции ψ0, ψ1, ψ2 и формируем функцию Гамильтона (8.4):
H = ψ0 f0 + ψ1 f1 + ψ2 f2 = 12 ψ0u2 + ψ1x2 + ψ2k u .
Записываем уравнения (8.6) для функций ψi :
|
dψ |
|
∂H |
|
|
|
|
1 |
|
= − |
|
|
= 0 |
|
|
dt |
∂x1 |
|
|
|
|
|
|
dψ2 |
|
|
∂H |
|
|
|
|
= − |
|
|
= −ψ |
. |
|
dt |
|
∂x |
|
|
|
|
1 |
|
|
|
|
|
2 |
|
|
|
Нетрудно найти решения этой системы:
ψ =C , |
|
ψ1 |
= −1C t +C ,} |
2 |
1 |
2 |
где C1,2 = const .
В соответствии с ПМ функция H должна быть максимальна при оптимальном управлении, поэтому dH / du = 0 .
Дифференцируя (8.20 ) и учитывая, что ψ0 = −1, получаем:
−u + kψ2 = 0 , |
u =u* = kψ2(t) . |
|
Используя (8.22), находим форму оптимального управления: |
|
u* = k(C |
2 |
−C t) . |
(8.23) |
|
1 |
|
Таким образом, с помощью ПМ нам удалось установить важный результат: для того чтобы осуществить оптимальное по затратам энергии
управление, нужно изменять управляющее воздействие на заданном промежутке времени по линейному закону (рис. 8.2).
u
u(0)
tк t
0
ts s
Рис. 8.2
На промежутке времени [0, ts ] осуществляется «разгон» объекта, хотя интенсивность воздействия постепенно уменьшается, а на промежутке [ts , tк] – «торможение»; при t ≥tк должно быть u = 0 . Для того чтобы
полностью определить управление, необходимо найти пока неизвестные константы C1, C2 .
Из уравнения модели (8.18) для синтезированного управления (8.23) получаем:
|
|
|
|
′ |
|
2 |
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
t2 |
|
|
|
|
|
|
|
|
|
x2 = k (C2 −C1t) , |
|
x2 = k |
|
|
|
|
|
|
|
|
|
|
|
+C3 |
, |
|
|
|
|
|
|
C2t −C1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
′ |
= C |
|
+ k |
2 |
C |
t − |
k 2C |
2 |
, |
x = C |
t + |
|
k 2C |
2 t |
2 |
− |
k 2C |
3 |
+C |
|
. |
|
3 |
|
1 t |
|
|
|
|
|
|
|
1 t |
|
|
4 |
1 |
|
|
|
|
2 |
|
2 |
|
|
1 |
|
3 |
|
|
|
|
2 |
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В полученные выражения подставляем граничные условия: |
при t = 0 |
|
|
|
|
|
|
|
|
|
x1 |
=C4 |
= y0 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при t =tк =T |
|
|
|
|
|
|
|
|
x2 |
=C3 |
= y0′ ;} |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k2T 2 |
|
|
|
|
k2T 3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
′ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
= 0 = y T |
+ |
|
|
|
C |
2 |
− |
|
|
|
|
|
C |
+ y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
0 |
|
2 |
|
|
|
|
|
6 |
|
|
|
1 |
0, |
|
|
(8.24) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k2T |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
′ |
|
2 |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x2 = 0 = y0 + k TC2 |
− |
|
|
|
|
|
C1. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
оси y, а затем – наоборот, т.е. на финальном этапе воздействие должно иметь тормозящий характер.
Кроме того, обратим внимание на следующее свойство полученного оптимального управления: чем меньше выделено времени на переходный процесс (T), тем больше должны быть начальная и конечная величины
управляющего воздействия |
|
6 |
xн |
и круче прямая (см. рис. 8.3), опреде- |
|
|
2 |
|
|
1 |
|
|
|
T |
|
|
|
|
ляющая программу изменения этого воздействия.
§ 8.4. Задача об оптимальном по быстродействию управлении
Задача 1. Рассмотрим задачу управления тем же объектом (8.18), но
сдвумя изменениями:
1)вместо критерия (8.19) будем рассматривать показатель
J =tк −tн = tк → min , |
(8.25) |
который выражает затраты времени на управление; |
|
2) примем условие |
|
u |
|
≤U0 , учитывающее ограниченность |
управ- |
|
|
ляющего ресурса.
Решение. На первый взгляд может показаться, что критерий (8.25) не соответствует общему критерию (8.2), фигурирующему в ПМ. Однако в действительности выражение (8.25) легко получается из (8.2), если принять f0 ≡1. Тогда
tк |
tк |
|
J = ∫ f0dt =∫ dt = tк . |
|
0 |
0 |
|
Запишем выражение для функции Гамильтона в этом случае: |
|
H = ψ0 1+ ψ1x2 + ψ2ku , |
(8.26) |
−U 0 ≤ u ≤U 0 . |
(8.27) |
Как видим из (8.26), в данном случае H линейно зависит от u. Значит, наибольшее значение H может принимать только на концах промежутка
(8.27): |
|
|
|
0 |
|
|
|
|
|
|
|
* |
|
|
,если ψ |
|
|
≥ 0, |
|
u |
+U |
|
2 |
(8.28) |
|
= |
|
|
|
|
< 0. |
|
|
|
−U 0,еcли ψ |
2 |
|
|
|
|
|
|
|
|
|
|
Уравнения для ψ1 и ψ2 остаются теми же, что и в предыдущем слу-
чае, значит
ψ2 =C2 −C1t .
Следовательно, оптимальное по быстродействию управление будет иметь вид, представленный на рис. 8.4.
u*
+U0
0
-U0
Рис. 8.4
Таким образом, в рассмотренном случае получается кусочнопостоянная программа формирования оптимального управления:
−на промежутке [0, ts ] подается максимально возможное воздействие, «разгоняющее» объект;
−на промежутке [ts, tк] – максимально возможное «тормозящее» воздействие;
−при t ≥tк u ≡ 0 .
Для окончательной конкретизации этого оптимального управления нужно найти два момента времени ts и tк, а для этого следует определить константы C1, 2, входящие в ψ2 .
Характер действий, необходимых для этого, остается тем же, что и в предыдущем случае: для получения управления u* (8.28), зависящего от C1,2, нужно найти решения уравнения состояния (8.18) x1(t) и x2 (t) , кото-
рые будут зависеть от дополнительных констант C3 и C4.
Используя граничные условия – два начальных и два конечных условия, можно получить четыре соотношения для отыскания четырех неизвестных Ci.
Интегрируя уравнения (8.18) при постоянном управлении u, можно получить следующие выражения:
238
для u = +U 0 |
|
|
|
|
|
|
|
|
x (t) = x (0) + x |
(0)t + |
A |
t2 |
|
|
, |
(8.29) |
1 |
1 |
|
2 |
|
|
2 |
|
x2(t) = x2(0) + At; |
|
|
|
|
|
|
|
|
для u = −U 0 |
|
|
|
|
|
|
|
|
x (t) = x (0) + x |
(0)t − |
A |
t2 |
|
|
|
, |
(8.30) |
1 |
1 |
|
2 |
|
|
2 |
|
x2 (t) = x2 (0) − At, |
|
|
|
|
|
|
|
|
где A = k U 0 . |
|
|
|
|
|
|
|
|
Будем далее рассматривать следующие краевые условия: |
|
|
н |
|
xx1((ttк)) |
==0,0.} |
|
|
x1(0) = x1 |
, |
|
|
(8.31) |
x (0) = 0; |
|
|
2 к |
|
|
|
|
2 |
|
|
|
|
|
|
|
В этом случае при xн |
> 0 |
нетрудно установить, что на первом этапе |
1 |
|
|
|
|
|
|
|
|
управления воздействие должно быть отрицательным, а на втором – положительным. Из соотношений (8.30) получаем:
1-й этап (u = −U 0 ):
н |
|
A |
|
2 |
|
x1(t) = x1 |
− |
|
t |
|
, |
|
|
|
|
2 |
|
|
|
x2 (t) = −At. |
|
|
|
|
|
|
|
Обозначим t =T1 продолжительность первого этапа. Для него в конечный момент будут получаться следующие значения переменных состояния:
|
|
|
|
|
A |
|
|
|
|
|
|
|
x (T ) = xн − |
|
T 2 |
= xs , |
(8.32) |
|
|
2 |
|
|
1 1 |
1 |
|
1 |
|
1 |
|
|
|
|
|
|
|
s |
|
|
|
|
|
|
x2 (T1) = −AT1 = x2. |
|
|
|
|
|
Их следует рассматривать в качестве начальных условий для второго |
этапа. |
|
|
|
|
|
|
|
|
|
|
|
2-й этап (u = +U 0 ): |
|
|
|
|
|
|
|
|
|
|
x (t ) = xs |
+ xs t + |
A |
t 2 |
|
|
|
|
|
, |
|
|
|
|
|
|
|
1 |
1 |
|
2 |
|
2 |
|
|
(8.33) |
|
|
|
s |
|
|
|
|
|
|
|
+ At , |
|
|
|
|
|
~ |
x2 (t ) = x2 |
|
|
|
|
где |
= t −T1 – время, отсчитываемое от момента переключения. |
|
t |
|