Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Северо-Восточный федеральный университет им. М.К. Аммосова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

оту шпоры(beta).doc

Скачиваний:

Добавлен:

23.12.2018

Размер:

3.2 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1512 13 14 15 > Следующая >>>

46. Принцип максимума л.С. Понтрягина для задач терминального управления

с нефиксированной продолжительностью процесса

Рассмотрим следующую задачу оптимального управления

=f(x, u, t), x(t₀)=x⁰, (13.2.1)

u(t)U, t₀ ≤ t ≤ t₁. (13.2.2)

J(u) = (x(t₁)). (13.2.3)

Момент t₁ не известен. Допустим, что решение задачи (13.2.1)-(13.2.3) существует. Это значит, что найдется такой оптимальный момент времени t₁* и управление u*(t), заданное на отрезке t₀ ≤ t ≤ t₁, что

J(u*) = (x*(t₁*)) =(x(t₁)), t₁>t₀, t₀ ≤ t ≤ t₁.

Рассмотрим задачу (13.2.1)-(13.2.3) при t₁=t₁*. В этом случае задача (13.2.1)-(13.2.3) есть задача с фиксированным временем и следовательно оптимальное управление u*(t) в этой задаче будет совпадать с оптимальным управлением в задаче (13.2.1)-(13.2.3) с фиксированным временем и по доказанному оно обязано удовлетворять принципу максимума.

Получим дополнительное условие, определяющее специфику задачи. Найдем дополнительное соотношение, которому удовлетворяет оптимальный момент времени t₁*.

Пусть t₁> t₀ произвольный момент и Δt₁ приращение времени, такое что t₁+Δt₁> t₀. Δt₁ может принимать достаточно малые приращения.

Найдем приращение функционала (13.2.3), соответствующее приращению момента t₁–Δt₁. Пусть задано некоторое допустимое управление u(t), t₀ ≤ t ≤ t₁ и x(t) соответствующая ему фазовая траектория.

(Если t₁+Δt₁>t₁, то расширим промежуток регулирования, при этом управление на отрезке [t₁, t₁+Δt₁] доопределяется произвольным образом, не выходя из области допустимых управлений с сохранением непрерывности в точке t₁).

Рассмотрим приращение функционала, соответствующее приращению Δt₁. Тогда

J(u) = (x(t₁+Δt₁)) –(x(t₁)) = == –ψ(t₁)´f(x(t₁), u(t₁), t₁) = –H(x(t₁), ψ(t₁), u(t₁), t₁) . (13.2.4)

Рассмотрим приращение функционала вдоль оптимального процесса u*(t), x*(t), ψ*(t), t₀ ≤ t ≤ t₁.

Тогда .

Учитывая произвольность приращения Δt₁ из формулы (13.2.4) для приращения функционала получаем, что функция Гамильтона Н, подсчитанная в оптимальный момент t₁* должна равняться нулю в силу произвольности Δt_{1 .}

H(x*(t₁*), ψ*(t₁*), u*(t₁*), t₁*) = 0.Это есть дополнительное условие, характеризующее оптимальный момент времени t₁*.

Теорема 13.2. Пусть u(t), t₀ ≤ t ≤ t₁, некоторое допустимое управление в задаче оптимального управления (13.2.1)-(13.2.3) с нефиксированным моментом времени t₁; x(t), ψ(t) соответствующие этому управлению фазовая и сопряженная траектории.

Для оптимальности управления u(t) и момента t₁ необходимо, чтобы выполнялось условие максимума функции H

а в конечный момент t₁ было выполнено условие H(x(t₁), ψ(t₁), u(t₁), t₁) = 0.

Следствие 1. Если система (13.2.1) стационарна = f(x, u), то вдоль управления, удовлетворяющего принципу максимума H(x(t), ψ(t), u(t)) ≡ 0, t₀ ≤ t ≤ t₁.

48. Свойства функции Гамильтона. Достаточность принципа максимума для линейных систем

Управление u(t) у нас кусочно-непрерывно, x(t), ψ(t) – непрерывны по t. Поэтому в общем случае функция Гамильтона кусочно-непрерывна по t. Оказывается, если управление удовлетворяет принципу максимума, то функция Гамильтона непрерывна и даже кусочно-дифференцируема по t вдоль всех процессов, подозрительных на оптимальность. Таким образом, вдоль оптимального процесса функция Гамильтона обладает повышенной гладкостью.

Теорема 13.3. Пусть вектор-функция f(x, u, t), задающая правую часть системы, непрерывна по своим аргументам вместе с частными производными по x - ∂f/∂x и по t - ∂f/∂t.

Если допустимое управление u(t) удовлетворяет принципу максимума, то функция Гамильтона M(t)=H(x(t), ψ(t), u(t), t),

вдоль этого управления является непрерывной и кусочно-дифференцируемой функцией времени на [t₀, t₁]. Причем, в точках непрерывности управления u(t), производная dM/dt существует и равна.(Функция Гамильтона дифференцируема во всех точках непрерывности управления).

Доказательство: Рассмотрим приращение M(t) в некоторой произвольной точке

t₀ ≤ t ≤ t₁.

ΔM(t)=M(t+Δt)-M(t)=H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt)-H(x(t), ψ(t), u(t), t)=H[t+Δt]-H[t].

Т.к. u(t) удовлетворяет принципу максимума, то имеет место неравенствоH[t+Δt] ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt),

(по сравнению, с какими угодно управлениями и в частности, по сравнению с u(t)). АналогичноH[t] ≥ H(x(t), ψ(t), u(t+Δt), t). Произведем оценку приращения ΔM(t) ΔM(t) ≤ H(x(t+Δt), ψ(t+Δt), u(t+Δt), t+Δt) - H(x(t), ψ(t), u(t+Δt), t)=A(Δt).

Управление никакого приращения не получает. С другой стороны ΔM(t) ≥ H(x(t+Δt), ψ(t+Δt), u(t), t+Δt) - H(x(t), ψ(t), u(t), t)=В(Δt). Таким образом имеем оценку B(Δt) ≤ ΔM(t) ≤ A(Δ (13.4.1)

Перейдем к пределу при Δt→0. Т.к. вектор-функции x(t), ψ(t) непрерывны по t, а функция Гамильтона непрерывна по своим аргументам, то при Δt→0, A(Δt)→0, B(Δt)→0. В A(Δt), B(Δt) управление приращения не получает. Отсюда следует: ΔM(t)→0, что и доказывает непрерывность функции M(t).

Докажем дифференцируемость. Пусть t точка дифференцируемости управления u(t). Т.е.u(t+Δt)=u(t).

Тогда x(t), ψ(t) будут являться дифференцируемыми в точке t, т.е. их производные в этой точке будут являться непрерывными. Тогда в этой точке производные существуют и непрерывны. Поделим неравенство (13.4.1) на приращение Δt (Δt – произвольное приращение)..

Если Δt<0, то неравенство переменится. Будет иметь противоположный смысл при Δt<0.

Пусть Δt→0 и рассмотрим, как ведут себя эти отношения. Тогда .

∂H/∂x существует, поскольку существует ∂f/∂x ; ∂H/∂t существует, т.к. существует ∂f/∂t .

Эти производные существуют и непрерывны.

Следовательно, . существует и равен ∂H/∂t. .

Таким образом, вдоль управления, удовлетворяющего принципу максимума.

Следствие 1. Пусть исходная система является стационарной (правые части явно от времени не зависят):

=f(x, u). В этом случае H = H(x, ψ, u), также явно от t не зависит. Следовательно, вдоль управления, удовлетворяющего принципу максимума . Отсюда, учитывая непрерывность H по времени, получаем

H(x(t), ψ(t), u(t)) ≡ C, для любых t₀ ≤ t ≤ t₁. Из механики известно, что если система дифференциальных уравнений описывает механическую систему, то функция Гамильтона Н описывает полную энергию. Это свойство равносильно закону сохранения энергии.

Теорема 13.4. Для оптимальности допустимого управления u(t) в задаче оптимального управления, линейной по фазовым переменным

=A(t) x + b(u, t), (13.4.2)

x(t₀) = x₀, u(t)U, t₀ ≤ t ≤ t₁. (13.4.3)

J(u) = (x(t₁)) → min, (13.4.4)

где (x) выпуклая функция, необходимо и достаточно, чтобы оно удовлетворяло принципу максимума.

Рассмотрим следующую линейную задачу:

=A(t)x + B(t)u + W(t), x(t₀)=x⁰, u(t)U, t₀ ≤ t ≤ t₁. J(u) = x(t₁) → min,

C – заданный n-мерный вектор.

Для этой задачи в силу теоремы 13.4 принцип максимума есть необходимое и достаточное условие оптимальности. Найдем управление, удовлетворяющее принципу максимума в сформулированной задаче.

H=ψ(t)’x +ψ’B(t)u +ψ’W(t).

Сопряженная система (13.4.5)

Сопряженная система (13.5.5) не зависит от выбора управления u и является замкнутой. Найдем управление, удовлетворяющее принципу максимума. Это управление и будет являться оптимальным управлением. Чтобы найти максимум нужно максимизировать линейную форму по u.B(t)u* = B(t)u, t₀ ≤ t ≤ t₁. (13.4.6) Таким образом, оптимальное управление для сформулированной линейной задачи определяется из условия (13.4.6), где ψ=ψ(t) есть решение сопряженной системы (13.4.5).

47.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1512 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.201558.37 Кб66Ответы ПР-в бизнесе и гос. структуре.doc
#
17.09.201939.58 Кб6Ответы стилистика.docx
#
18.09.2019125.14 Кб18ответы теор.грама.docx
#
01.04.201549.66 Кб517Ответы Тест ПР-кампания.doc
#
22.09.2019847.36 Кб5Отраслевой дорожный методический документ.doc
#
23.12.20183.2 Mб36оту шпоры(beta).doc
#
22.12.2018380.84 Кб38ОТу экзмен ответ.docx
#
01.04.20153.44 Mб56отчет .docx
#
18.09.20199.62 Mб1Отчет о практике 12 .docx
#
20.11.201929.12 Кб2Отчет о прохождении практик 2012.docx
#
01.04.20151.72 Mб76отчет по буровой практике.docx