- •II. Элементы оптимального управления
- •2.1. Постановка задачи оптимального управления
- •2.2. Линейная стационарная задача оптимального
- •2.3. О возможности решения задач оптимального
- •2.4. Принцип максимума Понтрягина в линейной
- •2.5. Быстрейшая остановка движущейся точки в заданном месте
- •2.5.1. Сведение задачи (1) к нормальной линейной системе
- •2.5.2. Нахождение оптимального управления и оптимальных траекторий без краевых условий. Линия переключения.
- •2.6. Приведение маятника в верхнее положение равновесия
- •2.6.1. Сведение задачи (1) к нормальной линейной системе дифференциальных уравнений
- •2.6.2. Нахождение оптимального управления и оптимальных траекторий без краевых условий. Линия переключения Сопряженная система
- •2.6.3. Синтез оптимальной траектории
- •Контрольные вопросы
2.2. Линейная стационарная задача оптимального
быстродействия
Система дифференциальных уравнений называется стационарной (или автономной), если она не содержит явно время :
(1)
(время скрыто в функциях и ). В этом случае скорость в точке не зависит от времени. Поэтому, отправляясь из этой точки в разные моменты времени и , за один и тот же промежуток времени точка опишет одну и ту же траекторию и попадет в одну и ту же точку (так ведут себя, например, частицы жидкости при установившемся течении).
Мы рассматриваем линейную систему (1) (первой степени относительно переменных ):
,
где известная постоянная - матрица,
известная постоянная - матрица (матрица управления).
Таким образом, мы рассматриваем линейную стационарную задачу без фазового ограничения ( )
(2)
где искомая -мерная вектор-функция, непрерывная с кусочно-непрерывной производной, -мерное кусочно-непрерывное управление.
Сформулируем без доказательства критерий управляемости системы (2).
2.2.1. Теорема (критерий Калмана)
Линейная стационарная система (2) управляема (т.е. найдется допустимое управление , переводящее объект (2) из состояния в состояние при любых ) тогда и только тогда, когда
.
Под матрицей понимается матрица, полученная приписыванием справа к матрице элементов матрицы (с сохранением порядка элементов), затем элементов матрицы и т.д.
Пример. Проверим управляемость системы
.
Здесь ,
, .
Составим матрицу :
, ,
Система управляема.
Задача оптимального быстродействия состоит в следующем. Пусть в фиксированный начальный момент времени объект находится в состоянии . Надо подобрать допустимое управление , переводящее его в заданное состояние за кратчайшее время: если – конечный (не фиксированный) момент времени, т.е. , то промежуток времени должен быть минимальным. Ясно, что за критерий качества следует взять интегральный критерий
с подынтегральной функцией : -
критерий оптимального быстродействия.
Таким образом, линейная стационарная задача оптимального быстродействия имеет вид
.
2.3. О возможности решения задач оптимального
управления с помощью вариационного исчисления
В некоторых случаях задачи оптимального управления можно решать методами вариационного исчисления.
Рассмотрим задачу
(1)
(2)
(3)
(4)
где , управление скалярная функция, непрерывная на отрезке , , где функции и непрерывны как функции четырех переменных и непрерывно дифференцируемы как функции двух фазовых переменных , дважды непрерывно дифференцируема как функция четырех переменных , и данные скалярные функции, непрерывные на , конец отрезка фиксирован, конец не фиксирован: правые концы графиков функций и скользят по прямым и .
|
Без ограничения (4) на управление эта задача представляет собой задачу Лагранжа на условный экстремум при уравнениях связи (1). Заметим, что интеграл функционала (3) |
не зависит от производных искомых функций (задача Лагранжа в форме Понтрягина).
Пусть из системы уравнений Эйлера-Пуассона
(5)
где функция Лагранжа, множители Лагранжа, с учетом краевых условий (2) найдены одна или несколько экстремалей .
Можно доказать, что если экстремум функционала имеется, то он достигается на функции , где управление - непрерывная функция, график которой составлен из кусков графиков функций (или некоторых из них), содержащихся |
|
между графиками и , и кусков графиков функций и - границ множества допустимых значений управлений. В каких точках стыкуются куски, можно найти. В этом случае управление является оптимальным, а функция дает соответствующую оптимальную траекторию.
В рассмотренной задаче управление было непрерывным. Однако в большинстве задач оптимального управления оно бывает разрывным (кусочно-непрерывным) и потому применение методов вариационного исчисления затруднено.
Возьмем, например, линейную стационарную задачу оптимального быстродействия (п. 2.2):
, , (6)
(здесь ). Оказывается, что в классе непрерывных управлений эта задача, вообще говоря, неразрешима.
Действительно, попытаемся ее решить рассмотренным только что способом. Функция Лагранжа имеет вид (здесь )
(7)
Если экстремаль существует, то она удовлетворяет системе уравнений Эйлера-Пуассона (5), которая в нашем случае имеет вид
где .
Продифференцируем по второе равенство:
. Исключим из равенств , умножив первое равенство справа на . Получили систему уравнений для и :
(8)
с матрицей . Ее ранг при транспонировании сохраняется. Транспонированная матрица имеет вид
.
Согласно критерию Калмана (теорема 2.2.1), система (6) управляема тогда и только тогда, когда . Следовательно, ранг матрицы системы (8) совпадает с числом неизвестных и потому однородная линейная система (8) имеет единственное (тривиальное) решение Но тогда функция Лагранжа (7) имеет вид , т.е. не учитывает уравнений связи (6). Однако данная задача без самой системы (6) бессодержательна. Можно доказать, что экстремалей не существует.
Если же экстремалей не существует, то оптимальным может быть только управление , график которого составлен из кусков графиков функций и (границ множества допустимых значений управлений). Но остается открытым вопрос, в каких точках |
|
происходит переключение управления от значения к значению и наоборот. Управление может иметь разрывы.
Таким образом, рассмотренная задача неразрешима в классе непрерывных управлений.
В 1956г. Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко предложили метод, который обобщил методы классического вариационного исчисления на случай кусочно-непрерывных управлений. В основу этого метода был положен так называемый принцип максимума. В общем случае он сложен. Мы познакомимся с ним в сравнительно простом случае линейной стационарной задачи оптимального быстродействия.