книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdf170 П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА [Гл. 3
метода прогонки. Например, отправляясь от некоторого начального
приближения yo(t), приближения yi{t), ..., yk(t), |
••• можно искать |
||||||||||
как решения линейных краевых задач |
|
|
|
|
|
|
|||||
|
Ук+ 1 = F (Уk, t) + |
Ак (/) (Ук+\ — Ук) у h |
< |
t < |
Т, |
|
|||||
|
v |
|
|
|
|
|
|
|
|
|
|
Pi ( Ш ) Я ( ' Р,' ^ |
У |
, ifcfi (*„)-&(*„))=<>, |
|
|
(11) |
||||||
|
Q i(y k (T )) + |
( |
dQi{ydk {T)) , |
Ук+1 ( Т ) - Ук(Т)) = |
о, |
|
|||||
|
i = l, . . . |
,s, k = |
0, |
1, 2, .. |
|
|
|
|
|
||
и |
|
|
известная матрица, |
dPi |
dQi |
— гради- |
|||||
где Лй(с) — некоторая |
. |
■и —— |
|||||||||
|
|
|
|
|
|
|
ду |
|
ду |
|
|
енты |
функций P i (у) |
и Q i(y ) соответственно. |
К |
сожалению, ника |
|||||||
ких общих правил выбора матриц A k (t) не существует. |
В тех слу |
||||||||||
чаях, |
когда F (y ,t ) гладкая |
функция, |
полезно принять |
-A k (t) = |
|||||||
dF (yk (t),t) ~ |
|
следует сказать, что |
F(y, t) |
лишь в ред- |
|||||||
_ — |
Однако |
||||||||||
|
ду |
|
|
|
|
|
|
|
|
|
|
ких задачах является гладкой функцией. Дело в том, что управле
ние u = u (x , ф, фо, t), определяемое из условия |
max Я (л:, ф, ф0, u, t), |
часто бывает негладким или даже разрывным, |
uev |
и в этом случае от |
правых частей (2.13) и, следовательно, от F(y,t) какой-либо глад кости ожидать не приходится. Матрицы Ak(t) следует выбирать исходя из соображений удобства численного решения краевой за дачи (11) на каждом шаге итераций и условий сходимости итера ций к решению исходной задачи (1) — (3). Выбор Ah(t) в каждой конкретной ситуации является искусством.
2. |
М е т о д с т р е л ь б заключается в |
следующем. |
Из условий |
|||
(2 ) , вообще говоря, можно |
выразить m |
координат |
вектора у (to) |
|||
через остальные |
s = 2 n —m координат. Пусть для определенности |
|||||
первые /п координат у 1(to), |
..., |
ym(to) однозначно выражаются че |
||||
рез |
остальные |
координаты |
у 1 (to) =a>i(ym+I (^0), |
y2n(to)), |
||
i = l , 2 , |
Зададим каким-либо образом |
у™+*у0) = % * ( t= l,...,s ), |
тогда однозначно определяются yi (tQ) = coi(^ 1, ...,-Xs) ( i = l , ..., m). Тем самым каждому набору параметров X— (Я,1, ..., Xs) соответству
ет вектор у (t0) = уо(Х ). |
Решая |
задачу |
Коши для системы |
(1) с |
|||
начальным - условием |
y(to)=yo(X ), |
получим |
вектор-функцию |
||||
y(t,X), t o ^ t ^ T , |
которая |
при |
любом |
выборе |
X удовлетворяет |
||
граничным условиям (2). Подставим у(Т, X) в |
граничные |
усло |
|||||
вия (3) и получим функции |
Q i(y(T ,X ))=(fi(X ), |
i — 1, ..., s, |
пара |
||||
метров Х = (Я,1....... |
Xs). |
Для |
удовлетворения граничным условиям |
||||
(3) параметры X следует выбрать так, чтобы X удовлетворяли сле |
|||||||
дующей, вообще говоря, трансцендентной системе уравнений: |
|
||||||
ФДЯ,) |
= ф , (А,1, — |
, Я.*) = 0 (t = 1, 2, . . . |
, s). |
( 12) |
§ 3] . |
Приближенное решение краевой задачи принципа максимума |
171 |
Тем самым краевая задача принципа максимума оказалась сведенной к задаче отыскания корней системы (12). Для решения системы (12) могут быть применены известные методы [19]. В ча стности, эта система может быть сведена к эквивалентной задаче
S
минимизации функции <р (X) = ^ ф(? (А,), для решения которой
г=1
можно использовать рассмотренные в гл. 2 методы минимизации функций конечного числа переменных.
Следует подчеркнуть, что вычисление значений функций фДА) в некоторой точке А, вообще говоря, достаточно трудоемко, так как
для этого надо решить задачу Коши для системы |
( 1 ) 2 п уравнений |
||
с начальным |
условием y(t0) = уо{Х ). |
Поэтому при отыскании кор |
|
ней системы |
(12) (или минимизации |
введенной |
выше функции |
ф(А)) важно использовать быстро сходящиеся методы, требующие сравнительно небольшого количества вычислений функции ф(А). Здесь часто используют метод Ньютона, применение которо го, как показывает опыт, требует от вычислителя немалого искус ства, в частности, умения.удачно выбрать начальное приближение. Частные производные функций фДА), необходимые при вычисле нии градиента, при этом обычно заменяют соответствующими раз ностными отношениями.
В том случае, когда задача (1) — (3) линейна и имеет вид
(4) — (6), применение метода стрельб существенно упрощается. Для этого систему векторов а и ■■■, От из условия (5) произвольным об
разом |
дополняют |
до |
базиса |
пространства |
Егп |
векторами |
|||||
ат+ь ..., а2п. После чего определяют вектор-функцию z0(t) |
из за |
||||||||||
дачи Коши: |
|
|
|
|
|
|
|
|
|
|
|
|
z0 = |
D{t)z0 + d(t), |
/0 < ^ < Т, |
|
|
|
|||||
(at, zQ(/„)) = a t (i = |
1, |
•■■, m)\ |
(am+i, z0 (*„)) = 0 , |
i = 1, . . . |
, s, |
||||||
а вектор-функции Z\(t), .... zs(t) |
из следующих задач Коши: |
|
|||||||||
|
|
Zj = D (f)zJt |
t0 < t < |
T, |
|
|
|
||||
|
(ah Zj [to)) = |
0 |
(t = |
1, 2, . . . , m), (am+i, zj (g ) = |
6l7, |
|
|||||
|
|
i = |
|
1, . . . ,s, |
/ = |
1, . . . |
,s, |
|
|
|
|
где 6ij — символ Кронекера |
( 6 { j= l |
при |
£=■/ и 6 ij= 0 |
при |
£=#=/). |
||||||
Тогда |
функция |
|
|
|
|
|
|
|
|
|
|
|
■y(t) = |
y(t, |
X) = |
z0{ t ) + ' £ |
Wzj (t) |
|
|
|
|||
|
|
|
|
|
|
|
i=i |
|
|
|
будет |
решением системы |
(4), удовлетворяющим при |
любых |
А = (А 1, |
Xs)' условиям (5). |
Для определения рещения |
задачи |
172 |
|
П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА |
\Гл. 3 |
|||
(4) — (6) теперь остается |
подставить найденную функцию y(t, А,) |
|||||
в (6) |
и определить Я,1, .... |
Xs из получающейся при этом линейной |
||||
алгебраической системы |
|
|
|
|||
|
£ |
V (bh г} (Т)) = |
pf - (bh z0 (Г)) (£ = |
1, 2, . . . , s). |
||
|
/=i |
|
|
|
|
|
Как видим, применение метода стрельб к решению линейной |
||||||
краевой задачи (4) — (6) |
требует решения s + 1 задачи |
Коши (для |
||||
определения z0((), |
..., zs(t)) и s + 2 систем |
линейных |
алгебраиче |
|||
ских |
систем |
(для |
определения Z o(£ o), •••, zs(,£0) и параметров X). |
|||
В нелинейном случае для решения задачи (1) — (3) |
можно при |
менить описанный метод стрельб в сочетании с итерациями, когда на каждом шаге итераций решается линеаризованная задача (см.,
например, задачу (11)). |
|
3. |
Э ф ф е к т « н е у с т о й ч и в о с т и » и п у т и е г о п р е о д |
л е н и я . |
Следует заметить, что практическое применение методов |
стрельб |
и прогонки часто наталкивается на серьезную трудность, |
связанную с быстрым ростом некоторых координат вектор-функции
у (■() |
и переполнением разрядной |
сетки ЭВМ даже в тех случаях, |
||||
когда |
отрезок интегрирования |
невелик. |
Например, если |
|||
исходная система (1.4) имеет вид x=Ax-\-B(u.,t), |
где А — посто |
|||||
янная матрица порядка «Х«> и, |
кроме того, |
f° (х, u, t) = |
f° (и, t) , то |
|||
система (2.1) |
для ф(£) может быть записана |
так: |
ф = |
— Л*ф, где |
||
Л * — матрица, |
полученная транспонированием А. |
Отсюда видно, |
что корни характеристического уравнения матрицы ( —Л *) отли чаются от корней характеристического уравнения матрицы А толь ко знаком и, следовательно, исходной устойчивой системе для х в этом случае будет соответствовать неустойчивая сопряженная си стема уравнений для ф.
Один прием для преодоления эффекта «неустойчивости» был предложен в работе [2J. Впоследствии этот прием был описан и развит в работах [1, 243] с учетом специфики краевой задачи принципа максимума. Для изложения этого приема нам будет
удобнее работать с расширенным вектором ф = (ф0, ф (£)) =
= (фо, фДО, |
•••> Ф п ( 0 ) = Ф (t), удовлетворяющим системе урав |
|||
нений |
|
|
|
|
|
|
S |
d f J ( x , u , t ) |
(13) |
|
|
дх‘ |
||
|
|
|
||
полученной добавлением к системе |
(2.1) еще одного уравнения при |
|||
i = 0 . |
Такое |
расширение |
системы |
(2.1) не меняет существа дела |
и не |
«портит» краевую |
задачу |
принципа максимума (2.13), |
§ 3] Приближенное решение краевой задачи принципа максимума 173
(2.8— 10), |
так |
как |
функция |
Н (и вообще |
вся |
задача) не зависит |
||||||
' |
|
х°, |
|
|
. |
-------- — = |
0, |
т. е. i|)o=const. (Это |
||||
от переменной1 |
поэтому ф0 = |
|||||||||||
|
|
|
|
|
|
|
дх° |
|
|
|
|
|
прежний параметр |
из |
теоремы |
2.1. |
Далее, |
как |
было |
замечено |
|||||
выше,, умножение |
вектора ф(£) = |
(ф0, ф(£)) |
на |
положительную |
||||||||
скалярную |
функцию |
ц ( 0 > 0 |
(в |
силу |
однородности |
функции |
||||||
|
|
П |
|
|
|
|
|
|
|
|
|
|
Н (х , ф, и, |
t ) = |
фjf> (х , и, t) |
по |
переменной |
ф) не меняет |
вида |
||||||
|
|
/=о |
_ |
|
|
|
|
|
|
|
|
|
управления и— и(х, ф, t), определяемого из условия max Н(х, |
ф, и, t), |
|||||||||||
|
|
|
|
|
|
|
|
|
|
u S V |
|
|
а также не влияет на условия трансверсальности. Поэтому вместо вектор-функции ф(/), являющейся решением «неустойчивой» си
стемы |
(13), |
можно |
попытаться |
искать ^другую вектор-функцию |
||||||
р (0 = |
(Ро(0. |
р ( 0 ) = |
р (0 ф (0 . |
ц (0 > ° . которая будет |
опреде |
|||||
ляться из некоторой «устойчивой» системы уравнений |
|
|||||||||
|
|
Pi = |
gi (х , |
Р. 0 |
(/ = |
0, |
1, |
■••,п). |
(14) |
|
В результате краевая задача (2.13), |
(2.8— 10) будет заменена на |
|||||||||
задачу |
|
|
|
|
|
|
|
|
|
|
|
|
х£ = f ‘ (х, и, t), t0 < t < C T , i = 1 , 2 , . . . , п; |
|
|||||||
|
Pi = Si (х, |
и, |
Р, t), f0 < * < 7 \ |
i = |
0, 1, •■■, п, |
|
||||
|
|
x(t0) e s 0(t0), |
x c n e s A T ) , |
(Л5) |
||||||
|
р ( g = ( P |
i ( |
g |
>pnf g ) j _ s 0 ( g |
в точке х ( д , |
|
||||
|
Р (Т) = (Рх (Г), |
•■■, р„ (Т)) J_ |
|
(Т) |
в точке х(Т), |
|
ро(0 <о, lp(0l2= £pf(0^0,
|
|
|
1=0 |
где u— u (x ,ty ,t)= u (x ,p ,t) |
определяется^из (2.11). В силу построе |
||
ния системы |
(14) |
имеет |
р(^)='р,(£)Ф’(0> р ('0 > 0 . Поэтому из |
краевой задачи |
(15) |
можно определить те же самые подозритель |
ные на оптимальность управления и траектории, что и из задачи (2.13), (2.8— 10), с той, однако, разницей, что при удачном выборе системы (14) эффект «неустойчивости» будет отсутствовать или значительно снизится.
1Впрочем, систему (1.8) иногда полезно расширить введением переменной х° посредством условий *°=/°(х, и, V), х°(<о)=0. [195].
174 |
П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА |
[ Г л. 3 |
Таким |
образом, требуется построить систему вида |
(14), кото |
рая |
обладала бы следующими двумя свойствами: 1) любые два |
||||||
решения тр (t) |
и p(i) |
соответственно систем |
(13), |
(14) |
(при од |
||
них |
и тех же |
x = x ( t ) , u = u ( t ) ) , для |
которых |
р(^ о)=аф (М » |
|||
a = c o n s t> 0 , |
связаны |
соотношением |
р ( |
t |
) |
p ,(Q > 0 , |
|
|
2) |p(OI= |
P? ( 0 ) /s — невозрастающая |
функция вре- |
i=о
мени.
Следуя работе [243], укажем некоторые приемы построения системы (14) с требуемыми свойствами. Сначала остановимся на линейном случае, когда система (13) для ф имеет вид
ф *= С (0ф , t0 < t < C T . |
(16) |
Наряду с этой системой рассмотрим^еще систему |
|
р = С ( / ) р + е ( М ) Р , |
(17) |
где е(р, t) некоторая скалярная функция. Оказывается, при подхо
дящем выборе функции е(р, t) система (17) будет обладать |
нуж |
||||||
ными свойствами. Это вытекает из следующих лемм. |
|
|
|||||
Л е м м а 1. |
Если ф (£)— решение |
системы |
(16) с начальным |
||||
условием ф(*0), |
а p jf) — решение системы (17) |
с начальным усло |
|||||
вием р(/о), если р(/о) = аф(^о) фО, |
a — co n st> 0 , |
то существует |
|||||
такая непрерывная функция р (^ )> 0 , что |
|
|
|
|
|
||
Д о к а з а т е л ь с т в о . Обозначим ф0 (0 — |
^ |
, р0 (t) = |
, |
||||
|
|
|
1Ф«)1 |
' |
IР(ОI |
||
где |г |= V(z, z). Так как ф0 = —%- |
|
Ф |
Ф |
то, |
под- |
||
|
Ф |
1Ф1 1ФI |
1Ф1 ’ |
|
|
||
ставляя сюда выражение для ф (t) из |
(16), |
получим ф0 = |
С (t) г]з0 — |
||||
— (С(Лф0, ф0) ф0. |
Аналогично для р0 (/) |
имеем |
|
|
|
|
|
Ро = |
- £ f - £ _ = С ( 0 Р о + е ( р , 0 Р о - |
|
— (Ср0, Ро) Ро— е (р, t) (Ро, р0) р0 =\С (t) р0 — (Ср0, р0) р0
независимо от выбора функции е (р ,t). Таким образом, ф0(t) и р0 (t) являются решением одной и той же системы дифференциальных
уравнений z = Cz — (Cz, z) z при одном и том же начальном условии
S 3]' |
Приближенное решение краевой задачи принципа максимума |
175 |
В силу единственности решения задачи Коши имеем |
|
Ъ Ю - Р о (0 . или - У |
.р Я__, |
М>(*)1 |
I р (О I |
Остается положить р (t) = |
д |
|
|
|
И> WI _ _ |
Л е м м а 2. |
Если е(р, |
t) > |
го решения р (t) |
системы |
(17) величина |
убывающей функцией, а если е(р, t) <•
возрастающей функцией.
Д о к а з а т е л ь с т в о . Так как
т0 для любого непрерывно-
п
|р (7! |= |
^ |
pj |
будет не- |
|
1=0 |
|
|
К С р .р ) |
, |
то |р (t) |будет не- |
|
2 |
(Р 2) |
= (Р . Р) |
= Ш |
р Г р ) + е(р, |
t)\р , Р) = |
|
|
at |
|
|
|
|
|
|
|
|
|
= Р2 |
(С р ,р ) |
, е (Р, О |
|
|
|
|
|
р2 |
|
|
||
то "в |
первом |
случае |
будем |
иметь |
(р2) > |
0, |
во втором случае— |
“■ |
— |
|
|
|
dt |
|
|
j. wi |
откуда и следует^справедливость |
леммы. А. |
|||||
—— (Р2)< 0 > |
dt
На основе леммы 2 можно предложить различные функции е(р,t), для которых норма |р(01 решения системы (17) не будет возра
стать. Например, можно взять е ( р Д ) = — ||C(f)||, где НСИ— норма матрицы, соответствующая евклидовой норме вектора. Так как
|(Ср,р")|<||С|||р|2, то е(р, 0 ------ДС(0Ц<— |Ср_,р)|-, и в силу
Р2
леммы 2 |p(f)| не будет возрастать. Однако практическое вычис ление |С (t) | часто бывает затруднительным, поэтому, имея в виду . оценку
IIс (О Р < |
£ |
I сц (t)|2, |
|
£,/=0 |
|
можно положить |
|
|
е (Р-0 = - ( |
£ |
IСг, (О 1а),/г |
£./=о
176 |
П Р И Н Ц И П МАКСИМ УМА |
Л. С. ПОНТРЯГИНА |
[Т,1. 3 |
|
или даже е(р, £)==— Стах, где постоянная |
|
|
||
|
С тах > max ( £ |
|Су(0 |а)'/а, |
|
|
|
£,/=0 |
|
|
|
С^СО- |
элементы матрицы С (it). Заметим, что приведенные функции |
|||
е (р ,t) |
от р не зависят, и система |
(17) остается |
линейной относи |
|
тельно |
р. |
|
|
|
В |
некоторых случаях выбор |
е (р, t) •< — — |
* |
может при- |
|
|
е! |
|
|
вести к столь быстрому убыванию |р(0|. что |p(f)| может обра
титься в машинный нуль. |
Во избежании |
этого |
можно |
принять |
||||||||
е (р> 0 = е (Р2). где е(г) |
— непрерывная функция одной переменной, |
|||||||||||
удовлетворяющая условиям |
e (r )^ .C max при r < r b е ( г ) ^ — Стах |
|||||||||||
при г ^ г 2, |
|е(г) |^ С тах |
при |
|
где гх и г2— подходящим |
||||||||
образом выбранные положительные числа, |
г\ < г2. Например, мож |
|||||||||||
но положить |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
е (г)== — 2Стах------ — + |
Стах. |
|
|
|
|||||
|
|
|
|
|
|
|
|
Го— гх |
|
|
|
|
Из леммы |
2 |
в этом |
случае |
следует, что если |
r i^ p 2(^0) ^ г 2, то |
|||||||
П < р 2(0 < / 2 |
во |
все |
моменты |
t<=[t0T]\ |
если |
p2(*o )< ri |
или |
|||||
Р2(^о)> £ "2, |
то величина_р2(£) |
будет стремиться с течением времени |
||||||||||
попасть в |
полосу ri-^ p 2(0 - ^ |
r 2 и остаться |
в этой полосе в после |
|||||||||
дующие моменты времени. О других способах |
выбора |
е(р, t) |
см. |
|||||||||
в работах |
[1, |
243]. |
|
|
|
|
|
|
|
|
|
|
Если |
система |
(13) |
|
нелинейна и неустойчива, то может |
ока |
|||||||
заться полезным рассмотрение системы |
|
|
|
|
||||||||
|
|
|
П |
|
|
|
|
|
|
|
|
|
|
|
Pi = |
^ |
С£зР/ + е (Р. |
0 Pi (*' = 0, 1, • • • , л), |
|
|
|||||
|
|
|
/=о |
|
|
|
|
|
|
|
|
|
где С,1. = — дх1 и функция е(р, t) выбирается одним из вышеуказан-
ных способов [243].
Об использовании принципа максимума для решения конкрет ных прикладных задач, о методах решения возникающих при этом краевых задач см. в работах [1, 2, 27, 34, 44, 75, 130, 141, 144, 146, 147, 152, 171, 243, 246] и др.
§ 4] |
Связь |
с классическим вариационным исчислением |
1 7 7 |
|
§ 4. СВЯЗЬ МЕЖДУ ПРИНЦИПОМ МАКСИМУМА И КЛАССИЧЕСКИМ |
||||
|
|
|
ВАРИАЦИОННЫМ ИСЧИСЛЕНИЕМ |
|
|
Основной |
задачей классического вариационного |
исчисления, |
|
как |
известно |
[68, |
254], является следующая задача: |
среди всех |
непрерывных кривых, x = x ( t ) , имеющих кусочно-непре рывные производные x(t) и удовлетворяющих условиям х(/0) е 5 0,
x ( T ) e S i, |
найти такую, которая доставляет функционалу |
|
|||||
|
|
|
= |
J / °(*(0, |
x(t),t).dt |
|
|
|
|
|
|
и |
|
|
|
минимальное значение. |
3p,ecb^x(t) — (xl (t), ..., xn(t)), |
S0 и S i — за |
|||||
данные |
множества |
в |
Е п. |
Будем |
предполагать, |
что |
функция |
f°(x,u,t) |
непрерывна |
и имеет непрерывные производные |
/2,/°,/?, |
fau /их>fuu при (х, и, t) ^ E ny(Eny(\to,-\-oo\. Далее в этом парагра фе для простоты ограничимся случаем закрепленного левого конца
(дг('/о) = X q, |
t0 задано), |
а |
правый |
конец |
х(Т) |
либо |
закреплен |
||||||||||
(x(T )= X i, |
Т задано), либо |
свободный |
( S ^ E n, |
Т задано), |
либо |
||||||||||||
является |
подвижным |
и . лежит |
на |
заданной |
гладкой |
кривой |
|||||||||||
S i= { ( x ,£ ) |
: х—-cp (f)= 0}, |
Т не задано. |
|
|
|
|
|
|
|
|
|||||||
Обозначим |
х = и |
и запишем |
рассматриваемую задачу |
в экви |
|||||||||||||
валентном |
виде |
как |
задачу |
оптимального управления: минимизи- |
|||||||||||||
|
|
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
ровать |
функционал |
J {и) = |
j f° |
(х, и, t) dt |
при |
|
условиях |
|
х = и , |
||||||||
to^ t^ T -, |
x{t0) = x Q, х (7’) е 5 1, ° и ( 0 е 1/=Дп. |
|
|
|
|
|
|
||||||||||
Для исследования этой задачи воспользуемся принципом мак |
|||||||||||||||||
симума Понтрягина. Согласно теоремам |
2.1—2 |
нужно |
выписать |
||||||||||||||
функцию Гамильтона — Понтрягина: |
|
|
|
|
|
|
|
|
|
||||||||
|
|
Н = ф0/° (х, |
и, |
t) + (ф, и) = |
Н (х, |
ф, и, |
t), |
|
|
(1) |
|||||||
и сопряженную |
систему |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Ф = |
— |
= |
|
|
|
и, |
t), |
ф0 = |
const < 0 . |
|
|
(2) |
|||
Для оптимального решения u(t), |
x { t ) = x ( t ,u ) |
должно выполнять |
|||||||||||||||
ся необходимое условие |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Н (x(t), ф (0, u(t)- t) = |
|
m a x # (x (t), |
ф(/), v, |
t), |
/„ < / < Г , |
(3) |
|||||||||||
|
|
|
|
|
|
|
v&V |
|
|
|
|
|
|
|
|
|
|
где ф(^) |
решение системы |
(2) при u = u ( t ) , |
x = x ( t ,u ) . |
Так как в |
|||||||||||||
данном случае |
множество |
|
значений |
управления V совпадает со |
|||||||||||||
всем пространством Е„, |
то условие |
(3) |
может |
соблюдаться |
лишь |
||||||||||||
в стационарной точке, т. е. |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
н и= |
Фо/° (x{t), u(t),t) + |
ф(^) = |
0. |
|
|
|
(4) |
178 |
|
|
П Р И Н Ц И П МАКСИМ УМА Л. |
С. ПОНТРЯГИНА |
|
|
[Гл. 3 |
||||||
Отсюда ясно, |
что фо=7^0, так как в противном случае ф ( 0 = 0 |
(см. |
|||||||||||
условие |
(2.2) |
теоремы |
2.1). |
Следовательно, можно считать, |
что |
||||||||
ф о = — /• |
Тогда |
соотношения |
(1) — (4) |
перепишутся |
в виде |
|
|
|
|||||
|
|
|
|
Н (х , -ф, и, t) = — /° (х, |
u, t)+ |
(ф, и), |
|
|
|
(5) |
|||
|
|
|
|
Ф = |
/ 2 (* ,М ) . t0< t < T , |
|
|
|
(6) |
||||
Я (х (t), ф (0 , и (t), |
t)= |
max Я (х (t), ф {t), v,t), |
|
|
|
(7) |
|||||||
|
|
|
|
Ф (0 = |
f°u (X(t), и (t), |
о . ^0 < |
t< т. |
|
|
|
(8) |
||
|
|
|
|
|
|
t |
(t), и (/), t)]dt\-\-ф ( д , |
|
|
|
|||
Из уравнения (6) имеем ф (^) = J fx {x |
поэтому |
||||||||||||
с учетом |
(8) |
получим |
|
to |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|||||
|
'/2 (*(0. и (0,0 = |
( |
|
|
|
|
|
|
|
||||
|
J /° (х (t), |
U |
dt + ф ( g . |
|
|
(9) |
|||||||
|
|
|
|
|
|
i. |
|
|
|
|
|
|
|
Уравнение |
(9) |
называется |
уравнением Эйлера |
в интегральной |
|||||||||
форме-, здесь |
u ( t ) = x ( t ) . Если (9) |
продифференцировать |
по |
t, |
то |
получим уравнение Эйлера классического вариационного исчисле ния в дифференциальной форме
at |
(/° (х (0, |
и (t), 0) - |
/° (a-' (t), и |
= |
0, ц (0 = х (I(). |
(9') |
||||
Далее, |
необходимым |
условием |
достижения |
функцией |
||||||
H (x(t), ф( 0 . |
«, 0 |
максимума при |
u = u {t ) |
является |
неположи |
|||||
тельность квадратичной формы |
|
|
|
|
|
|
||||
£ Я «‘У (* (0. Ф (Q. « (0 - 0 Ь£/ < |
0 |
при любых I = (Zi, Si, . . . |
, у , |
|||||||
i,/=l |
|
|
|
|
|
|
|
|
|
|
или если учесть выражение |
(5) для Я , то |
|
|
|
|
|||||
|
£ |
/“д (* ( 0 , « ( 0 . 0 |
> 0, I е е п, t0 < t < r . |
|
(Ю) |
|||||
|
£./=0 |
|
|
|
|
|
|
|
|
|
Условие |
(10) |
называется |
необходимым |
|
условием |
Лежандра. |
||||
В частности, |
при n = 1 отсюда имеем |
|
|
|
|
fau (x (t),u (t),t)> 0, t0< t < T .
§ |
Связь с классическим |
вариационным исчислением |
179 |
||||
|
Теперь выведем необходимое условие Вейерштрасса. Для это |
||||||
го |
перепишем |
условие (7) с учетом (5), |
(8) в следующем |
виде: |
|||
|
О < Н ( х (t), |
ф (t), и (t),t)— H(x (t), г))(t), v, t) = |
/° (* (t), v, t) - |
|
|||
|
~ f° (x (t), u ( t ) , t ) - ( v - u ( t ) , f°u(x(t), |
u[t),t)). |
(11) |
||||
Это неравенство справедливо |
при любых |
v ^ V = E n и |
|
||||
если u(t), x ( t ) — оптимальное |
решение исходной |
задачи. Введем |
|||||
в рассмотрение функцию |
|
|
|
|
|
||
|
Е (£, л:, и, |
v ) = f° ( x , v, f) |
/° (х, и, t) — (и— и, |
f u{x, и, t)), |
(12) |
называемую функцией Вейерштрасса. Известное в классическом вариационном исчислении необходимое условие Вейерштрасса тогда немедленно следует из (11):
E ( t ,x ( t ) ,u ( t ) ,v ) > 0, t0 < C t< T , v e Еп.
Далее, |
из |
принципа |
максимума |
следует |
непрерывность |
||||||
вектор-функции |
ф(/) |
и |
функции |
|
H (x{t), ф(/), u(t), t) = |
||||||
— m axH (x(t), ф( 0 . v, i) |
по переменной |
|
t, |
|
|
(см. пред- |
|||||
ставления (2.15) в теореме 2.2). Поэтому |
с учетом |
соотношений |
|||||||||
(5), (8) имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[fu{x{t),u{t),t)]t = |
0, |
|
|
|
(13) |
|||
[(и (t) , /°„ (х (t), и (t), t)) - |
/о (х (t), и (t), t)]t = |
0, |
tb < |
t < T, |
|||||||
здесь принято обозначение |
[г(^ )]4= г ( 7 + 0 ) — z(t — 0). Поскольку |
||||||||||
равенства |
(13) выполнены при всех t, |
|
|
|
то они сохраняют |
||||||
силу и в те моменты |
t, когда функция x(t) может иметь излом, |
||||||||||
т. е. производная x(t) |
терпит разрыв. |
Таким образом, |
если учесть |
||||||||
связь u { t ) = x ( t ) , |
условия |
(13) |
превращаются в известные из клас |
||||||||
сического |
вариационного исчиления |
условия |
Эрдмана — Вейер |
||||||||
штрасса в точках излома кривой x(t). |
|
|
|
|
|
|
|||||
Перейдем к рассмотрению условий на правом конце оптималь |
|||||||||||
ной кривой x(t). |
Если конец х(Т) свободен, |
то в силу теоремы 2.1 |
|||||||||
ф(7’) = 0 и с учетом выражения (8) имеем |
|
|
|
|
|
||||||
|
|
|
f u(x(T ),u (T ),T ) = |
0. |
|
|
|
(14) |
Если правый конец х(Т) подвижен, точнее, лежит на заданной кри вой Si = {(х, t ) : hj (х, t) = х ! — ф;- (t) = 0, / = 1, 2, . . . , л}, то соглас но теоремам 2.1 — 2 существуют такие постоянные аъ а2, ..., ап, что
П
. !Pi(T) = Y 1a/ dhj(i J )— = a" Н (х (Т) ^ ( Т)’ и (Т) ^ =
/=1