Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ОиАС-3

.pdf
Скачиваний:
14
Добавлен:
26.03.2016
Размер:
1.53 Mб
Скачать

Теорема 2.2.1 (принцип максимума Л. С. Понтрягина). Пусть u(t), t0 t t1

такое допустимое управление, что соответствующие ему решения

xi(t) (i=0, …, n) уравнения (2.2.11), исходящие в момент t0 из состояния (2.2.3), (2.2.7), проходят в момент времени t1 через точку х(1), x0(t1). Для

оптимальности управления (при котором x0(t1) принимает наименьшее значение) необходимо существование таких ненулевых непрерывных функций ψ0(t), ψ1(t), ..., ψn(t), удовлетворяющих уравнениям (2.2.12), что при любом

t (t0 t t1) функция H(х(t), ψ(t), ψ0(t), u) переменного u U достигает при u = u(t) максимума

H(х(t), ψ(t), ψ0(t), u(t)) = M(х(t), ψ(t), ψ0(t)),

(2.2.17)

при этом в конечный момент времени t1 выполняются соотношения

 

ψ0(t1) < 0; M(х(t1), ψ(t1), ψ0(t1)) = 0.

(2.2.18)

Если ψ(t), х(t) и u(t) удовлетворяют (2.2.11), (2.2.12) и (2.2.17), то функции ψ0(t) и M(х(t), ψ(t), ψ0(t)) переменного t являются постоянными и поэтому проверку соотношений (2.2.18) можно проводить не обязательно в момент времени t1, а в любой момент t (t0 t t1).

21

Доказательство теоремы является достаточно сложным, и поэтому в рамках курса не рассматривается.

Соотношения (2.2.17) и (2.2.18) можно записать в более простой форме:

max H x, ,

0 ,u 0

(2.2.19)

u U

 

 

Таким образом, центральным в теореме 2.2.1 является условие максимума (2.2.19). Оно означает, что если u1(t), ..., um(t) – оптимальные управления, a x1(t), ..., xn(t) – оптимальные траектории, то непременно найдутся такая постоянная ψ0 < 0 и такие решения ψ1(t), ..., ψn(t) системы (2.2.12), что функция

H(х1(t), ..., хn(t), ψ0, ψ1(t), ..., ψn(t), u1, ..., um) переменных u1, ..., um при всех t [t0, t1]

будет достигать максимума на U именно при оптимальных управлениях u1(t), ..., um(t).

Поэтому теорему 2.2.1, дающую необходимое условие оптимальности в задачах оптимального управления, принято называть принципом максимума.

Отметим, что во внутренних точках множества U для оптимального управления выполняются условия (2.2.13), (2.2.14), которые являются необходимыми для

(2.2.19).

22

Практическое применение

принципа максимума

23

Как же практически воспользоваться условием (2.2.19), ведь функции

х1(t), ..., хn(t), ψ1(t), ..., ψn(t) и постоянная ψ0, входящие в это условие, неизвестны?

Здесь поступают следующим образом: рассматривая функцию H(х, u, ψ, ψ0) как функцию m переменных u1, ..., um U и считая переменные х, ψ, ψ0 параметрами, решают задачу максимизации функции H и находят функцию

u = u(х, ψ, ψ0) U,

(2.2.20)

на которой достигается наибольшее значение функции H.

В ряде случаев функция (2.2.20) может быть записана в явном виде. Например, если правые части (2.2.1) имеют структуру

1

n

2

 

 

 

 

 

 

x uk

i 1, n

i x,u i

x ik

 

 

k 1

 

 

 

 

 

 

а подынтегральное выражение функционала (2.2.5)

0 x,u 0 x n 0 k x uk

k 1

множество U описывается неравенствами (2.2.2), то

H x, , ,u

n

 

t

1

 

m

n

t

2

 

 

 

 

 

 

 

 

 

x u

 

(2.2.21)

 

 

 

 

 

 

 

 

 

 

 

 

0

i 0

 

i

 

i

 

k 1

i 0

 

i

ik

k

 

и эта функция достигает наибольшего значения на U в точке с координатами

 

u* , если

n

 

x 0;

 

2

 

 

k

 

i 0

i ik

 

uk

 

 

 

 

n

 

 

u* ,

если 2 x 0

 

 

k

 

 

i

ik

 

 

 

 

i 0

 

или

 

 

 

n

2

 

 

 

 

 

uk

*

k 1, m

(2.2.22)

t uk sign

i ik

x

 

 

i 0

 

 

 

 

 

 

24

Формула (2.2.22) дает большой объем информации о структуре оптимального управления: k-я (k=1, …, m) координата оптимального управления является ступенчатой (кусочно-постоянной) функцией со значениями uk* и – uk*, при этом моменты переключения определяются условием

 

 

n

2

 

x 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.2.23)

 

 

i ik

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

Итак, допустим, что функция (2.2.20) известна. Рассмотрим систему 2n

 

дифференциальных уравнений

 

 

 

 

i

 

 

 

 

xi i x,u x , 0

 

 

 

1, n

(2.2.24)

 

n

 

x,u x ,

 

 

 

 

 

 

 

 

 

i

 

j

 

 

 

0

 

j i 1, n

(2.2.25)

 

xi

 

 

 

j 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функции φ и u, входящие в правые части этих уравнений, известны. Общее решение системы (2.2.24), (2.2.25) зависит от произвольных постоянных, которые определяются из краевых условий (2.2.3), (2.2.4). Задача интегрирования уравнений (2.2.24), (2.2.25) при краевых условиях (2.2.3), (2.2.4) называется краевой задачей (двухточечной краевой задачей).

Таким образом, принцип максимума позволяет свести решение задачи об оптимальном программном управлении к решению краевой задачи.

25

Трудность ее решения состоит в том, что интегрирование уравнений (2.2.24), (2.2.25) в «прямом времени» не представляется возможным, так как неизвестны начальные условия ψi(t0) (i= 1, …, n). Один из возможных подходов к решению краевой задачи заключается в следующем.

Задаваясь произвольным вектором ψ(t0) = ψ(0) и интегрируя (2.2.24), (2.2.25) при известных начальных условиях x(t0), ψ(0), найдем функции x(t), ψ(t) и при t=t1 проверим выполнение равенства (2.2.4). Если оно нарушается, задаемся другим вектором ψ(t0) = ψ(1) и, интегрируя (2.2.24), (2.2.25) при начальных условиях x(t0), ψ(1) получим при t=t1 вектор x(t1).

Если он не совпадает с заданным, продолжаем процесс до тех пор, пока не найдется такой вектор ψ(t0), что условия (2.2.4) будут выполняться с приемлемой точностью. При этом подходе используются градиентные методы, когда ψ(t0) определяется из условия минимума «расстояния» x(t1) от заданного вектора х(1).

В вычислительной математике разработан ряд методов приближенного численного решения краевых задач:

метод стрельбы,

метод прогонки,

ряд итерационных методов.

26

Во многих случаях не представляется возможным найти из условия (2.2.19) явный вид (2.2.22) оптимального управления. Тогда уравнения (2.2.1), (2.2.6), сопряженная система (2.2.12) и условия максимума (2.2.19) образуют краевую задачу принципа максимума.

Эта задача имеет ряд специфических особенностей, затрудняющих применение стандартных численных методов решения краевых задач. К числу таких особенностей относятся разрывы функций uk(t) (k=l, …, m), удовлетворяющих условию максимума (2.2.14), их неединственность, нелинейный характер зависимости (2.2.20) даже в линейных системах. Кроме того, особенностью краевых задач, связанных с принципом максимума даже в случаях, когда удается найти явный вид управлений (2.2.20), является их плохая сходимость, вызванная неустойчивостью системы (2.2.24), (2.2.25).

Несмотря на различные методы численного решения краевой задачи принципа максимума, процесс решения каждой оптимизации на основе этого принципа является самостоятельной творческой задачей, решаемой в рамках той частной отрасли динамики, к которой относится объект управления, с учетом его специфических особенностей, используемых для улучшения сходимости численного решения краевой задачи.

27

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]