Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая экономика

.pdf
Скачиваний:
190
Добавлен:
22.03.2015
Размер:
3.49 Mб
Скачать

Следует отметить, что принцип максимума позволяет доказать, что оптимальное по быстродействию управление не только объектом (8.18), но и любой системой, имеющей линейную модель (7.17) при ограничении

u U 0 , будет кусочно-постоянным и должна принимать только предель-

ные значения из заданного промежутка допустимых значений (8.27). Кроме того, установлено, что в тех случаях, когда все собственные значения системной матрицы A в модели (7.17) являются вещественными, управление будет иметь не более n интервалов постоянства, где n – порядок модели. Этот результат называют теоремой об n интервалах [34].

Задача 2 [34]. Рассмотрим задачу об управлении тем же объектом

(8.18), т.е.

x1′ = x2, x2′ =u,

с краевыми условиями:

x1(0) = x2 (0) = 0 ; x1(tк) = x1к = a ; x2(tк) = 0 .

Требуется найти оптимальное по быстродействию управление, при котором J =tк min .

Рассмотренное выше в задаче 1 ограничение на величину управления u U0 заменим интегральным ограничением

tк

 

 

 

 

 

 

 

 

u2(t)dt =b .

 

 

 

 

 

(8.34)

0

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

Решение. Введем новую переменную x3 = u2(t)dt . Для нее можно за-

 

 

 

0

 

 

 

 

 

писать следующие соотношения: x3′ = u2 ; x3 (0) = 0 ; x3(tк) =b .

 

Сформируем функцию Гамильтона: H = ψ

0

1x

 

+ ψ u + ψ u2 .

 

 

 

1

2

2

3

Условие ее максимальности дает уравнение

dH

2

+ 2ψ u = 0 .

 

 

 

 

du

 

 

3

 

 

 

 

 

 

 

 

Отсюда получаем

 

 

 

 

 

 

 

 

u* = −1

 

 

 

 

 

 

 

 

 

ψ2 .

 

 

 

 

 

 

2

 

ψ3

 

 

 

 

 

 

Запишем уравнения для сопряженных переменных:

241

 

 

 

 

 

 

 

 

 

ψ1′ = −

H = 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ψ′2 = −

H

= −ψ1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ψ3′ = −

H

= 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из этих уравнений получаем: ψ1 =C1;

ψ2 = −C1t +C2 ; ψ3 =C3 .

 

Используя эти результаты, можно записать выражение, определяющее

форму оптимального управления:

 

 

 

 

 

 

 

 

 

 

 

u* = −

ψ2

=

C1t C2

= C t C

5

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2ψ3

2C3

4

 

 

 

 

 

C1

 

 

С2

 

 

 

 

где

C

 

=

;

C =

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

2C

5

2С

 

 

 

 

 

 

 

 

 

 

3

 

 

3

 

 

 

 

 

 

 

 

 

 

 

Подставляем полученное выражение для управляющего воздействия в уравнения (8.18):

 

 

 

 

x1′ = x2,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2′ =C4t C5.

 

 

 

В результате интегрирования получаем:

 

 

 

x =C

 

t

2

 

 

 

 

 

 

 

 

 

 

C t +C ,

 

 

 

 

2

 

4 2

 

5

 

6

 

 

 

 

 

 

 

t3

 

 

t2

 

 

 

 

 

x1 =C4

C5

 

 

 

 

 

6

2

+C6t +C7.

 

 

 

 

 

 

 

 

 

 

 

При t = 0

x1 = x2 = 0 ; поэтому C6 = 0 и C7 = 0 .

При t =tк

x1 = a; x2 = 0 , поэтому:

 

 

 

 

 

 

C

 

 

2

C t

 

= 0,

 

 

 

 

 

 

tк

 

 

 

 

 

 

 

 

4 2

 

5 к

 

 

 

 

 

 

 

 

 

tк3

 

 

 

 

 

 

 

 

 

C

4

C

tк2 = a.

 

 

 

 

 

 

6

5

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кроме этого нужно рассмотреть условие (8.34):

 

tк

 

 

2 2

 

 

 

 

2

= b

 

x3 = (C4t

 

2C4C5t +C5 )dt

или

0

 

 

 

 

 

 

 

 

 

 

 

 

C42 t3

 

 

 

 

 

 

 

 

 

 

 

C C t2

+C2t

к

= b.

 

 

3

к

 

 

 

4 5 к

 

5

 

 

(8.35)

(8.36)

242

Из системы уравнений (8.35) получаем:

 

 

C =

1 t

C ;

C

4

= −(12a) / t3;

C

= −(6a) / t2.

 

5

2

к 4

 

 

 

к

5

к

 

Из условия (8.36) находим:

 

 

 

 

 

 

 

 

 

tк

= 3 12a2 .

 

 

 

 

 

 

 

 

 

 

b

 

 

 

При этом оптимальное по быстродействию управление оказалось

линейным. Оно определяется выражением

 

 

 

 

u* =C

12

t

, где C = 6a .

 

 

 

 

 

 

 

 

 

 

tк2

 

 

 

 

 

 

 

tк

 

 

 

График формирования оптимального управления показан на рис.8.6.

 

 

u*

 

 

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tк

t

 

 

 

 

 

 

 

tк

 

 

 

-C

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 8.6

 

 

 

§ 8.5. Задачи об управлении линейной динамической системой

 

 

со свободным правым концом

 

Рассмотрим примеры применения ПМ для решения задач об оптимальном управлении, сформулированных в форме задач Больца [31, 34]. Как было показано в § 8.1, решение таких задач можно осуществить с помощью ПМ, дополнив его условием трансверсальности (8.10).

243

Задача 1 [24]. Рассматривается управляемая линейная система второго порядка, модель которой имеет следующий вид:

dx1 = x

+ x ,

 

 

dt

1

2

 

(8.37)

 

 

 

dx2

 

 

=u.

 

 

 

dt

 

 

 

Допустимые значения управляющего воздействия ограничены диа-

пазоном 0 u 1. Управление

осуществляется на промежутке

времени

0 t 3.

 

 

 

 

Начальное состояние управляемой системы задано:

 

x1(0) =1; x2 (0) = 0 ,

(8.38)

а конечное состояние x(3) не зафиксировано.

 

Требуется найти управление u = u* (t) , 0 t 3, которое минимизи-

ровало бы заданный функционал качества:

 

 

3

 

 

 

J = x1(3) + (x1 + 2x2 3u)dt .

(8.39)

0

Решение

Сформируем функцию Гамильтона:

H = ψ0(x1 + 2x2 3u) + ψ1(x1 + x2) + ψ2u ,

где ψ0 = −1.

Это выражение можно записать в следующем виде:

H =u(ψ2 +3) 1(x1 + x2) (x1 + 2x2) .

Учитывая линейность полученного выражения по u и заданные ограничения на управление, из условия максимальности Η можно получить следующие соотношения, определяющие вид оптимального управления:

 

1, если

(ψ2 + 3)> 0,

 

 

 

 

 

 

 

(ψ2

+ 3)< 0,

 

(8.40)

u* = 0, если

 

 

 

 

 

 

 

 

0.

 

 

u [0;1], если(ψ2 + 3) =

 

Уравнения (8.6) для вспомогательных переменных ψi

в данном слу-

чае принимают следующий вид:

 

 

 

 

ψ1

= −

H

= −(ψ1

1)=1−ψ1,

 

 

x

 

 

 

 

 

 

 

 

(8.41)

 

 

1

 

 

 

 

= −

 

H

 

 

 

 

 

 

x

 

 

 

 

ψ2

 

= −(ψ1 2)= 2 −ψ1.

 

 

 

2

 

 

 

 

 

244

Первое уравнение ψ1′ +ψ1 =1 является линейным неоднородным дифференциальным уравнением первого порядка. Используя стандартные приемы, несложно найти его решение:

ψ1(t) =Cet +(1et ) ,

где C – подлежащая определению константа. Для ее отыскания емся условием трансверсальности:

ψ1(tк) = − F = − (x1) = −1. x1 x1

(8.42)

воспользу-

(8.43)

При tк =3 из (8.42) – (8.43) получаем Ce3 + (1 e3) = −1. Из этого соотношения находим искомую константу: C =12e3 . Подставив ее в (8.42), можно получить следующее выражение: ψ1 =1k et , где k = 2e3 = 40,171.

Рассмотрим теперь уравнение, определяющее вторую переменную из

(8.41): ψ2= 2 (1ket ) =1+ ket .

 

 

 

Интегрируя это выражение, получаем:

 

 

 

 

 

ψ2 =t ket +C .

(8.44)

Для определения C воспользуемся вторым условием трансверсаль-

ности:

 

 

 

 

 

 

 

 

 

 

 

ψ

2

(t ) = −

F

.

(8.45)

 

 

 

 

 

 

 

 

к

x2

 

 

 

 

 

 

 

 

Правая часть в (8.45) будет равна нулю, так как в рассматриваемой

задаче F = x (3) от

x

2

не зависит. Получаем условие

3 ke3 +C = 0

1

 

 

 

 

 

 

 

или C = −3 + 2e3 e3 = −1. Таким образом, ψ2 =t ket 1.

В соответствии с (8.40) величина оптимального управления определяется знаком переменной: σ 2 +3 =t ket + 2 .

Заметим, что функция σ(t) обладает следующими свойствами:

σ(0) = 2 k ≈ −37,4 ; σ(3) =3 2e3e3 + 2 =3 ;

σ′=1+ ket > 0.

Эта функция монотонно вырастает от отрицательного значения на левом конце промежутка 0 t 3 до положительного значения на правом конце. Учитывая непрерывность этой функции, можно сделать вывод о

245

том, что она имеет единственную точку t = τ, в которой величина σ меняет знак. Вид этой функции показан на рис. 8.7, а.

σ

 

 

*

3

 

u

 

 

 

 

 

t t

 

 

 

1

 

1

2

3

 

tt

1 2 3

б)

а)

( k + 2 )

Рис. 8.7

Уравнение τ− ke−τ + 2 = 0 является трансцендентным. Его приближенное решение можно найти каким-либо численным методом, например методом деления пополам [17]. В результате получается τ= 2,247 .

В соответствии с (8.40) оптимальное управление определяется следующим образом:

u

*

0 при 0 t ≤ τ,

(8.46)

 

={1 при τ<t 3.

Его вид показан на рис. 8.7, б.

Для отыскания оптимальных переменных состояния рассмотрим (8.37) с начальным условием (8.38) для функции u = u(t) , определяемой

(8.46).

На первом этапе 0 t ≤ τ, когда u = 0 , получаем уравнение

x

= x

+ x

 

 

 

,

1

 

1

2

 

x

 

= 0,

 

 

2

 

 

 

x1(0) =1; x2 (0) = 0 .

246

Из второго уравнения получаем x2 =C = const , а учитывая начальное условие x2 (0) = 0, следует принять x2 = const = 0 .

Из первого уравнения x1′ − x1 = 0 можно получить следующее реше-

ние: x1 (t) = x1(0)et . Для заданного начального условия получается

x1(t) = et .

На границе первого этапа процесса управления переменные будут

равны следующим значениям: x1(τ) = eτ; x2(τ) = 0 .

Их следует принять в качестве начальных условий для второго этапа, на котором система будет описываться уравнениями:

xx12==x1.1 + x2,}

Для второго этапа введем новый отсчет времени, полагая t = t − τ. Из уравнения x2 =1 при x2 (~t = 0) = 0 находим x2 (~t ) = ~t .

Тогда первое уравнение примет следующий вид: x1(~t ) x1(~t ) = ~t ,

x1(t = 0) = eτ.

Интегрируя это уравнение, получим: x1(t ) = eτet + et 1t .

Если вернуться к времени t, то решение, определяющее оптимальный процесс, примет вид:

*

 

t

 

0 t ≤ τ,

 

 

 

 

e ,

 

 

 

 

x =

 

 

 

 

 

 

 

 

 

1

et + et −τ 1 t + τ, τ≤ t 3,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

0,

0 t ≤ τ,

 

 

 

 

x2

={t − τ, τ<t 3.

 

Задача 2 [24]. Найти оптимальное управление линейной системой

первого порядка:

 

 

 

 

 

 

 

 

 

 

 

x′ = x +u , x(0) = x0 , 0 t tк =T ,

(8.47)

при котором

 

 

 

 

 

 

 

 

 

 

 

J =

1

x

2

 

tк

(x

2

+u

2

)dt min .

(8.48)

2

 

(tк) +

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

247

Решение. Запишем функцию Гамильтона:

H = ψ0 (x2 + u2 ) + ψ1(x + u) .

Для вспомогательных переменных в соответствии с ПМ получаем соотношения

H

 

= − x

 

ψ1

= −(2ψ0 x + ψ1),

ψ0 = −1

 

 

или

 

ψ1′ +ψ1 = 2x .

(8.49)

Рассмотрим условие максимальности Н. Учитывая то, что ограничений на управление в данной задаче нет, максимум Н определяется из необходимого условия экстремума:

 

H

= −2u + ψ = 0 ,

 

 

 

 

 

u

 

1

 

 

 

 

 

откуда получаем

 

 

 

 

 

u* =

1

ψ .

(8.50)

 

 

 

2

1

 

Таким образом, задача свелась к рассмотрению системы из двух дифференциальных уравнений (8.47) и (8.49), в которой u определяется

(8.50), т.е.

1

 

 

 

= x + 2

 

 

(8.51)

x

ψ,

= 2x −ψ.

 

 

ψ

 

 

Для решения этой системы выполним следующие преобразования:

– из второго уравнения выразим x:

x = 12 (ψ′+ ψ);

(8.52)

– дифференцируем это выражение: x′ = 12 (ψ′′+ψ′);

– затем оба соотношения подставим в первое уравнение из системы

(8.51):

12 (ψ′′+ψ′)= 12 (ψ′+ ψ)+ 12 ψ;

248

– после упрощений получаем однородное уравнение второго поряд-

ка:

ψ′′− 2ψ = 0.

Его характеристическое уравнение λ2 2 = 0 имеет корни: λ = 2 ;

 

 

 

 

 

1

λ2 = − 2 . Общее решение будет иметь вид:

 

 

ψ(t) =C e

2t +C

2

e

2t .

(8.53)

1

 

 

 

 

Подставив это выражение, а также

ψ′ =

2C1e 2t 2e2t в урав-

нение (8.52), получаем соотношение, определяющее оптимальный переходный процесс:

x =C1

 

1+

2

 

2t

+C2

 

1

2

 

2t

.

(8.54)

 

2

 

e

 

 

2

 

e

 

 

 

 

 

 

 

 

 

 

 

 

 

В найденные выражения (8.53) – (8.54) для ψ(t) и

x(t) входят две

неизвестные константы C1 и C2. Для их определения нужно воспользоваться начальным условием x(0) = x0 и условием трансверсальности (8.10):

 

 

ψ(T ) = −

F

 

 

 

= −

 

1

x

2

= −x(T ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

x

2

 

 

 

 

 

 

 

 

 

 

 

t=T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Первое условие дает соотношение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 +

 

2

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C1

 

 

2

 

 

 

+C2

 

 

2

 

 

= x0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Второе условие приводит к уравнению

 

 

 

 

 

 

 

2T

 

 

2T

 

 

 

 

1 +

2

 

 

2T

 

 

1

2

 

2T

C1e +C2e

 

 

 

= − C1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

2

 

 

e

 

 

 

+C2

 

2

 

e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

которое преобразуется к виду

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2T

 

 

1 + 2

 

 

 

 

2T

 

 

 

1

 

2

 

 

 

 

 

C1e

 

 

 

+

 

 

 

 

 

 

 

 

+C2e

 

 

 

 

 

 

 

 

 

= 0

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

1 +

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2T

3 + 2

 

 

 

2T

3 2

 

 

 

 

 

 

 

C1e

 

 

 

 

 

 

 

 

 

 

+C2e

 

 

 

 

 

 

 

 

= 0 ,

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

2

= −C e2 2T 3 + 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

3

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(8.55)

(8.56)

249

Подставив это соотношение в (8.55), находим:

C1 =

2x0

 

 

 

.

 

(3

+

 

 

(1 + 2) (1 2)e2 2T

2)

 

 

 

(3

2)

 

 

 

 

 

 

Полученное значение C1 совместно C2, вычисленным по (8.56), полностью определяет оптимальное управление:

u

*

=

1

 

 

2t

+C e

2t

, 0 t T ,

 

2

C e

 

 

 

 

 

 

 

1

 

2

 

 

 

иоптимальный процесс x = x* (t) из (8.54).

§8.6. Задача об управлении линейной динамической системой

сминимизацией обобщенного квадратичного интегрального показателя

Рассмотрим задачу об управлении системой, модель которой можно представить в виде линейных дифференциальных уравнений, т.е.

 

 

 

 

 

dx

= Ax + Bu

,

(8.57)

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

где A и В – матрицы (n ×n) и (n ×m) коэффициентов aij и bij .

 

 

 

Требуется

найти закон

формирования

управляющих воздействий

u

=

u

* (t) , при

которых система переходит

из начального состояния

x(0) = xн в конечное состояние x(tк) = 0 и при этом минимизируется показатель качества в виде следующего функционала:

 

1 tк

Τ

 

 

Τ

 

 

J =

Qx + u

Ru ) dt min ,

(8.58)

2

(x

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где R и Q – квадратные симметрические матрицы заданных или выбранных

весовых коэффициентов, причем Q – неотрицательно-определенная мат-

рица, а R – положительно-определенная матрица [17]; в этом

случае

xΤQ x 0 для любых x 0 , u ΤR u > 0 для любых u .

Входящие в подынтегральное выражение компоненты являются

квадратичными формами, например:

 

 

 

 

 

 

[x x

] q11

q12

x1

 

= [q x2

+ 2 q x x

2

+ q

22

x2

].

1

2 q

q

 

x

 

 

11 1

12 1

 

2

 

 

12

 

22

 

2

 

 

 

 

 

 

 

 

250