Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы в системах поддержки принятия решений

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
16.41 Mб
Скачать

Итак, оптимальная траектория движения системы имеет вид

*V ) = 0,

t + x 2 - T , tZ S tZ T .

В заключение решения можно заметить, что f' = х{, a f" = Т - *2, так как траектория непрерывна, и что формальный анализ движения системы на отрезке времени от /' до приводит к выводу о несуществовании «настоящей траектории x(t) = 0» и необходимости реализации управления посредством бесконечно частого переключения с u°(t) = - 1 на u°(t) - 1 (это четеринг-режим). При этом траектория на [/',/£] представляется пилообраз­ ной, равномерно сходящейся к х(Г) = 0.

Рассмотрим задачу с целью раскрытия сущности метода отыскания магистрали на основе необходимых условий принципа максимума Понтрягина.

Задача 2. Найти оптимальный процесс роста замкнутой экономики (k(t), по критерию максимума функционала полезности потребления, приходящегося на одного работающего,

при условиях k(t) = f ( k ( t )) - \ k ( t ) - c(t\ k(t0) = k0t 0 £ c(t) й/(к(1)),

где k(f) — объем фондов на одного работающего, к0 — начальные фонды,

c(t) — кусочно-непрерывная функция потребления на одного работающего,

fik(t)) =/(&(/), 1) = у ^ /) — производственная функция — выпуск продукции; здесь принята производственная функция Кобба-Дугласа, 0£а£1,у>0,

А.= р + л, р — норма амортизации, л — норма роста численности работающих,

/о(е(0 »Оя *~*(/“/а)Ф Х $ > 0 — норма дисконтирования. Р е ш е н и е . 1. Составим функцию Гамильтона

Я(у(/), *(/), с(/), 0 = e-S('-'«V0(c(0, о + й Ш Ш - и « ) -

с(/)]К

где у(1) = ф )е~^'~ 'о) — вмененная ценность, теневая цена y(f) =

это результат

операции W c - 0, индекс с обозначает взятие производных по переменной с — по потреб­ лению на одного работающего.

2. Запишем сопряженное уравнение

согласно которому, а также с учетом исходного уравнения изменения фондовооруженно­ сти одного работающего выпишем систему дифференциальных уравнений

*(') = /(*(')>-М(Г)-с(Г), с(/)=— L -\ f X m ) - a + b))cU)-

(*)

ХФ))

 

— эластичность предельной полез-

61

3. Проанализируем кратко, (полный экономико-математический анализ в [25, 141, 142]) стационарный режим: k(t) = 0, с(0 = О это режим, в котором при t- * оо потреб­

ление и фондовооруженность на одного работающего постоянны и равны к* и с* или, ина­ че, это режим, когда имеет место магистральный процесс сбалансированного роста — фондовооруженность, потребление и выпуск растут с одинаковыми темпами и равными темпу роста численности работающих. В основу анализа примем расположение траекто­ рий роста экономики в окрестности магистрали (к*, с*). Для этого перепишем уравнения

(*)в линеаризованной форме

£(/),?„/"(* \ к « ) - к ’), т = - ( .с « ) - с ')+ 8 (т - к ')

<*с )

ивычислим собственные числа матрицы

Ос 'П к Г )

е(с*)

из характеристического уравнения

-г(8 -г) + с 7 ^ > = О

£<С*)

с учетом того, что производственная функция Кобба — Дугласа непрерывна, дифферен­ цируема и вогнута, т.е. /"(£*)<().

Врезультате имеем действительные и различные собственные числа г{ > 0, г2 < 0. Но тогда (к*, с*) — седловая точка и она единственна; к этой точке приближается оптималь­ ная траектория экономического роста в условиях бесконечного промежутка времени. В седловую точку две ветви входят и две выходят из нее; на ветвях, сходящихся в седловой точке, выполняются условия оптимальности. Из точек ветвей, входящих в седловую точку можно достичь состояния сбалансированного роста — магистрали развития экономики и выйти из него по соответствующей ветви в связи с необходимостью достижения требуемо­ го конечного состояния.

Вдругих задачах оптимальные решения могут быть найдены на ос­

нове достаточных условий, удовлетворяющих требованию близости к необходимым. Такие условия оптимальности решения формулируются в [30; 31; 19; 32] при введении функции ср(t,x(t)), непрерывной по сово­

купности своих аргументов и имеющей непрерывные частные произ­

водные по t u x

для всех t, за исключением конечного или счетного чис­

ла сечений {tk},

к = 1 ,2 ,..., tk е [Г0, 7] пространства [/о, 7] х R", где /0 и

Т — фиксированные моменты времени. При этом вместо функции

Понтрягина—Гамильтона вводится функция

S(t, х{1), «(/)) = /0(/, x(t), u(t)) + Эф(?’^

))- + (grad ф(t, x (t)),M x(t), u(0),

at

 

(при S(t, x(t), u(t)) = 0 имеет место

ф у н к ц и я П о н т р я г и н а —

В е л л м а н а ) . Тогда сущность достаточных условий оптимальности tf{f) заключается в существовании

62

{<*}» к = 1, 2 , и <р(/, х(0),

таких, чтобы при

t0 £ t < T и х(0 е Хк с Л", Л = 1, 2,...

выполнялись соотношения

£(/, х(0, и(0) ^ 0 — для любых допустимых и(0 € U,

S(t, x(t), м°(/)) = 0 — для оптимального и°(0,

<р(Г,х(7)) = Ф(Г,х(7)).

Особенность такого метода отыскания оптимального решения за­ ключается в задании функции <р(/, х(/)) с требуемыми свойствами не­ прерывности и гладкости. Раскроем проявления этой особенности в конкретных задачах.

Задача 3. Пусть требуется найти

u°(/) = argminj [u1(t)dt+ х 2(Т) если Н О = «(/), х(10) = хо;

“Т о

U — замкнутое множество кусочно-непрерывных функций, х е Е[.

Р е ш е н и е . Составим уравнение вида

 

 

mmS(t,H O M O ) =

+ ^

1М 0 ) + 2(/)| = 0 , ^ T, H D ) = *2<7).

Видно, что min достигается при u ( 0 -

2

или когда u(t) принимает граничные

 

ox

 

значения множества U. Пусть u(t) есть внутренняя точка U, тогда

М<А0) _ 1 гэ<fO,HO)\2

а*

4{

a* J

=0-

Дня решения этого уравнения зададим функцию

<р(/, *(/)) отрезком ряда в базисе

I* Xt Хгt т.е.

 

 

 

<Р('> МО) = Yo(') + Vi(r)uc + y 2(t)H.

Такое задание согласуется с терминальным членом на момент времени Г. Запишем выра-

жения для производных

F

^

7^ = V o ( ') +

№ * £ > > = VI (,) + 2 V2(/)X( 0

 

 

Э/

и подставим их в исходное уравнение для ф(/, x(t)):

V, + v ,x + v 2xJ - I ( Vl + 2 щ х ? = 0, у 0(7’)+ у , (Г)х + у 2(7 > 2 = х2.

63

Разрешим полученное дифференциальное уравнение, для чего приравняем члены при одинаковых степенях базисных функций; получим систему

Vo ~ 7 V.2

* 0. Vi - Vi V2 = 0, V2 - V2 = 0. VoW “ Vi( T) = 0, 0 S t S T.

4

1

 

Проинтегрируем эту систему:

Vo(') = °. V|(0 = 0, y 2(/) = -

l - ( t - T )

Итак, восстановлено выражение для функции ф(/, x(t))

Cp(r,JC(/)) =

l - O - T ) '

а искомое выражение для функции управления (как внутренней точки множества U) име­ ет вид

« v .* о)=

1 Эф _

1

 

 

 

2 Эх

l - ( t - T )

 

Задача 4. Найти функцию-управление u(t), при которой обеспечивается min

Т

 

 

 

-1<ы(/)<П

минимальное время перевода системы

из начального состояния jC](0> = х10, х2(0) = х20 в

конечное х {(Т) = 0, х2(7) = 0, если ее движение описывается системой уравнений

вида

JCj = х2, х { = и.

 

 

 

 

Р е ш е н и е . Составим уравнение

 

 

 

 

m i n f (/)'х2<<)) , Эф(<,х,(0,х2(0 )

Эц|(/,Х|(0,х,(/))

 

Эt

дх2

 

dt

 

В условиях рассматриваемой задачи функция <p(f, Xj(f), x2(f)) явно от t не зависит, т.е.

— = 0, и оптимальное управление и(/) = sign—

Поэтому имеем уравнения

Э/

Эх2

 

 

 

= и

^ -

= -1 ПРИ U(t) = -1

И

1,

Эх, Эх2

Эх, Эх2

 

 

 

соответственно, из решения которых получаем

 

 

 

ф(», х,(0> х2(/)) = ф х 2 + 4х, + х2, <р(г, х,(0, х2(0) = ^ 2 х\

-

4х, - х2.

Отсюда непосредственно следует, что значения этих функций совпадают только то­ гда, когда они «выходят » в точку параболы х, = 0,5х2 или х, = -0,5х2 (параболы представ­ ляют линию переключения управления). Но в любой точке, принадлежащей какой-либо параболе, производная функции ф(г, xt(/), х2(/)) терпит разрыв, который соответствует мо­ менту времени переключения управления со значения - 1 на +1 (или наоборот), такие мо­ менты и составляют отмеченное выше множество {/*}, к - 1,2,....

Г. Выпишем условия оптимальности управления для задачи, в ко­ торой уравнение состояния записывается в виде интегро-дифферен- циального уравнения, т.е. условие оптимальности для з а д а ч и

64

у п р а в л е н и я с распределенным (непрерывным) запаздыванием и найдем оптимальный процесс (x(t), u(t))mтакой, чтобы был достигнут

т

inf/(и) и(0 е U J(u) = j f„(x(t),u(0d)dt

о

при ограничении (уравнении состояния)

t

x(t) = f(x(t),u(t),t) + |<р(х(т),и(т),т)0</т

с начальными условиями, заданными на начальном отрезке t е \-d , 0] в

виде начальных функций

x(t) = х(0. «(0 = П(0 и х(0) = х 0 = х(0);

/ 0:[0,71 x R ”x R r ->R, f :[0>T \x R " x R —»/{", <p:[0,71 х [0,7] х Л" х Rr

Предварительно запишем вспомогательное равенство

т ,

 

о

 

т

 

= J [(*r (0>v(0)+(*r (0, ¥(0)ДО =

тГ

о

т

= J (х т( 0 М 0 ) + (Vr (0 ./W 0 ,« (0 ,0 )+ J(Vr (т),<р(х(т),й(т)Лт))Л dt,

vy(0 : [0, 71 —> R", и предполагается, что компоненты \|/(f) непрерывно

дифференцируемые функции.

Теперь составим для /(и) выражение

m = JL/O- j t (x r

+ (х т(Т )М Т )) - (x T(0),\|/(0)),

из которого очевидным образом получаем следующее выражение для заданного функционала:

т т

J(u) = j { f 0 - ( V (t)J ( x (t)M t) J )) - \( M x ) J (x (x ),t,x ))d x - (x T( T ) M m d t +

о

/

-Кхг(Г),¥ (Г )) -(х г(0),¥ (0)),

 

т

где/0(х(0, u(t), 1) -

{ y T{t),f{x{i), u(f), t)) - |(\|/7’(т),ф(х(т),ы(т),/,т))Л= H,

 

о

# = H(x(t)9u(t)9у(/), t) — функция Гамильтона.

5 - 5396

65

В результате можно записать условие оптимальности решения — управления. Пусть в рассматриваемой задаче существует оптимальный процесс (x(t), «(/))’. Тогда найдется непрерывная сопряженная векторфункция у (0 , t e [0, 71 такая, что для функции Гамильтона будут вы­

полнены условия

Я(х*(0,и‘(0.\|/(0,0=

Л//

V(0 = --r -,

и«)еи

ЭХ

последнее из которых есть интегро-дифференциальное уравнение с гра­ ничным условием \у( 7) = 0.

При этом придем также и к исходному уравнению состояния. Для

вогнутой функции max H (x'(t),u(t),vf(t),t) по фазовой переменной x(t)

u(t)eU

эти условия оптимальности управления будут и достаточными.

2.4. Необходимые и достаточные условия оптимальности для условно-экстремального механизма

в дискретных задачах

Условно-экстремальный механизм в дискретных задачах вводится для выбора лучшего решения х° по скалярному критерию качества fix), х е X c R " , где X — конечное множество, или по скалярному функцио­

налу

 

Д[«/]), к ] = («о» « I , « л м ) , Ui 6 Uj<z R", i = 0 ,Я -1

 

при наличии ограничивающих связей

 

 

*ж = Ffpc„ и),

 

где Fj = (F ',F i1,...,Fl"), х , =(х) ,x f ,...,х"), х0 = с,

 

i

— дискретный момент времени, i = 0,N -1, N > 1, N — натуральное

число,

 

 

с — заданная начальная точка в фазовом пространстве,

 

 

N - 1

 

 

/([«,]) = £ / • ( * , ,« ,)+ф (*лг)> где / и Ф известны.

 

 

/ =0

 

Механизм записывается в виде

 

 

х° € Aig m in/(x),

(1)

 

x tX

 

где Х =

{х,} х, > 0, х,- — целое, / = 1,г, или

 

 

[«/°]е Arg min /([и ,]), / = 0 ,..., N - 1,

(2)

 

[U, |eU

 

66

при

ограничениях х/+, = F,(x„ и,), х0 = с, i = 0 ,N - l, и ,е U ,czR "

х, е

(7, с RP, п>. т.

 

Пусть механизм (1) реализуется в целочисленной линейной задаче

выбора решения. Тогда необходимое и достаточное условия оптималь­ ности решения согласно (1) для такой задачи устанавливаются на осно­ ве ее погружения в условную непрерывную задачу линейного програм­ мирования с последующим построением (поэтапным сужением) для нее допустимого и двойственно-допустимого базисного множества решений (альтернатив).

Базисное множество представляется выпуклой оболочкой, натяну­ той на исходное множество X поиска целочисленного решения. Опти­

мальное решение, выбранное из этого множества, является оптималь­ ным [33; 34; 35] и для исходной целочисленной задачи. В связи с этим необходимое и достаточное условия оптимальности решения в рассмат­ риваемой дискретной задаче формулируются согласно принципу двой­ ственности, т.е. равенство значений критериев пары двойственных не­ прерывных задач линейного программирования на допустимом и двойственно-допустимом базисных множествах есть необходимое и достаточное условие оптимальности решения для механизма (1). При этом двойственная задача позволяет упростить решение исходной задачи. Однако на практике такие условия оптимальности не всегда реализуемы, и выбор наилучших решений в целочисленных задачах осу­ ществляется на основе различных принципов, соответствующих содер­ жательной сущности и математической постановке каждой задачи.

Для условно-экстремального механизма (2) необходимые условия оптимальности решения записываются по аналогии структуры необхо­ димых условий принципа максимума Понтрягина1 изложенных в п. 2.3. Конкретно они формулируются следующим образом [36; 37]: для того чтобы управление [и®] в задаче принятия решения по механизму (2)

было оптимальным, необходимо, чтобы оно удовлетворяло неравенству

 

(ЬН, (х,° ,и(°,у ”)

-и®

>0, / = 0 ,N - l,

 

 

 

.

Эи

 

 

 

 

 

 

 

 

 

при всех и,

U„ для которых направление и, -и ? не выводит из допус­

тимого U, в точке и®, или равенству

 

 

 

 

 

 

 

р я , ( » >

f , _ и , j =0

 

 

 

если точка

— внутренняя точка множества Щ здесь

 

 

I I ,

ч ,,

ч_ь/ rv

чч

ЭЯ,

(ЭЯ,

ЭЯ,

ЭЯ,Л

Щ х9и, \|/)

и) + (\|/„ /;.(*, и))9 — ^

f

Эи2

Эи т)

 

 

 

 

Эи

\ д и 1

 

1 В задачах с дискретным временем в общем случае этот принцип не имеет места.

5*

67

При этом [\|/“] должно быть решением уравнений

 

 

д Я,(х,,и,,у , )

 

ЭФ(%)

 

, / = 0,Я-1,

Эх ’

 

дх

 

ЭЯ,

ЭЯ, ЭЯ, ЭЯ, X

/;_|(х/_1 им ). *<>=с.

дх

.Эх1 ’ Эх2 ’“" Э х " / * '

 

 

Для линейных дискретных задач выбора управлений и0 эти условия яв­ ляются и достаточными. В целом они составляют д и с к р е т н ы й п р и н ц и п м а к с и м у м а П о н т р я г и н а .

Другим принципом оптимальности для механизма (2) является принцип, выражаемый р е к у р р е н т н ы м у р а в н е н и е м Б е л л м а - н а, которое выводится непосредственно из (2):

i=0,N-1

= min{/(x0 ,и0) + min... min {/(х, ,и,) + / ( х 2,и2)+...

1 ^ N-\ ) Ф (* Л Г )}}*

Теперь введем функцию

 

Л*(х*) = min

Глг-i

,j £/(*<>«/)+< £(**)

1**1-

 

и учтем, что хж = Ffcxh и) е Gl+l, i = k , N - 1, а минимумы достигаются.

Тогда по этому выражению можно записать рекуррентное уравнение Веллмана

Л*(**) = , min { f ( x k,uk)+ A k^(F k(xkyuk))}.

|Ufc|€t/J

Оптимальное решение как управление находится по формулам

*о° = с>«о° =«о(*°)> *,° =Fo(xo,uo)> «,° =«,(^°),

х2° = / ’1(х1°,и1°),

W2 = U2^X2^> "•>

= ^ЛГ-I (*ЛГ-1

)•

Проиллюстрируем применение метода функциональных уравнений.

68

Задача. Найти решение условной экстремальной задачи

з

W= Y /,(* ,., ,«/)-* max,

^и

/=1

/i(*o> "]) = -5(*о -И))2 + 4U(JC0- и,), / 2(х, ,и2) = |(х , + и2)2 - 2и|,

Х0 = 4 , Х| = XQ - tfj, х 2 =

*! - и2» *3 =

*2 “ w3> 0 < l/| < XQ,

0 £ w2 - * 1> 0 £

«3 £ x 2,

с указанием оптимального

управления

w° =(w1°,«2 >i/3 ) и

оптимальной

траектории

Х° =(^,^°,4,X3 ).

Р е ш е н и е . Составим функциональное уравнение Веллмана для последнего (третье­ го) шага. Полагаем, что процесс S2 перед этим шагом характеризуется величиной х2, тогда условный оптимальный выигрыш на третьем шаге при условии, что S2 = х2, определится выражением

Из необходимого условия максимума получаем условное оптимальное управление

«з№ - *2> = *2; тогда W f( S 1 = х 2)=

О

Для предпоследнего (второго) шага оптимальный выигрыш при условии, что процесс перед ним S { характеризуется величиной X], имеет вид

^/(^1 =-<i) = onwX( [ /2(х,,«2) + И'*(S2 = *| -и 2)] =

= шах j(xi + и2)2- 2 и2 + i(xj - « 2)2j*

OZui&Ci

Из необходимого условий максимума получаем условное оптимальное управление на вто­ ром шаге

~ * i)

при этом W*{SX=х,) = A xj2.

Для первого шага условный оптимальный выигрыш

= *о)= 0ag“ в[л <х о > и 1 ) + ^ / ( ^ 1 = *о - щ )] =

= шах

-5(х0 - щ )2 + 4и,(х0 - и,) + А(х0 - и, )21

О£ы £дс0

J-

 

69

Из необходимого условия максимума функции находим, что щ = ~ * о - Тогда искомое

максимальное значение WmdX = W *(SQ= 4), а оптимальное управление и0 =(«1°,«2>из) и

оптимальную траекторию х°

>*з) получим, рассматривая шаги с первого по

третий в прямом порядке:

Соседние файлы в папке книги