- •Учебное пособие
- •I. Элементы вариационного исчисления
- •1.1. Введение и вспомогательные утверждения
- •1.1.1. Пример.
- •1.1.2. Лемма Лагранжа
- •1.2. Основные понятия
- •Число обладает свойствами:
- •Величина, определенная равенством , является нормой.
- •1.2.5. Замечание.
- •1.3. Вычисление вариации интегрального функционала.
- •1.4. Простейшая вариационная задача
- •Если функционал от вектор - функции
- •1.4.3. Пример.
- •1.4.4. Пример.
- •1.5. Вариационная задача с подвижными границами.
- •1.6. Вариационные задачи на условный экстремум
- •Пусть требуется найти экстремум функционала
- •1.6.3. Пример
- •1.6.6. Пример.
- •II. Элементы оптимального управления
- •2.1. Постановка задачи оптимального управления
- •2.2. Линейная стационарная задача
- •2.2.2. Определение.
- •2.2.3. Определение.
- •2.3. Примеры синтеза оптимального управления
- •Составим сопряженную систему
- •2.3.1. Пример
- •2.3.2. Пример.
- •Сопряженная система
- •2.3.3. Пример.
- •III. Примеры решения задач.
- •3.1. Простейшие задачи вариационного исчисления
- •3.2. Задачи для самостоятельного решения
- •3.3. Варианты заданий: «Простейшие задачи вариационного
- •3.4. Задачи с подвижными границами
- •Задача 1.
- •Условие трансверсальности
- •3.5. Варианты заданий: «Задачи с подвижными границами»
- •3.6. Варианты заданий: «Задачи по оптимальному управлению»
Сопряженная система
имеет общее решение
где – постоянный вектор. Функция Понтрягина имеет вид
При фиксированном , еслиили, то функция Понтрягина имеет максимальное значение, если взятьилисоответственно. Таким образом, функция управления, доставляющая максимум функции Понтрягина, имеет только два значенияи, и переключение этих значений происходит в единственной точке, в которой.
При таком выборе функции будет автоматическипри всех, кроме упомянутого исключительного значения.
Найдем фазовые траектории под управлениями и.
При система (1) имеет вид
(2)
Ее общее решение
(3)
где - произвольные постоянные. Исключив отсюда, получим
–семейство равнобочных гипербол с центром и асимптотамии. Из равенства(в системе (2)) видно, что еслитоа еслито. Это значит, что с возрастанием временив верхней полуплоскости (где) движение происходит слева направо (возрастает), а в нижней полуплоскости () движение справа налево (убывает). |
Аналогично при из системыполучаем
(4)
семейство равнобочных гипербол с центроми с асимптотамии. Как и в случаеприипри: в верхней полуплоскости движение происходит слева направо, в нижней полуплоскости – справа налево. |
Движение фазовой точки к пункту назначенияпроисходит слева направо по верхней части левой ветви гиперболы семейства (3) с уравнением
(5)
и справа налево по нижней части правой ветви гиперболы семейства (4) с уравнением
. (6)
Линия переключения имеет уравнения
(7)
Построение оптимальной траектории при данных краевых условиях.
Как и в задаче 1, оптимальная траектория будет состоять из куска одной из гипербол семейства (3) и (4) и куска линии переключения. Из рисунка видно, что если точка находится в полосе между прямымии, то оптимальная траектория
найдется. Если же точка находится вне этой полосы или на одной из прямых ,, то оптимальной траектории нет (Это объясняется тем, что в задаче имеется фазовое ограничениетак что).
|
Пусть, например, точка содержится в этой полосе левее линии переключения в верхней полуплоскости.
Тогда по одной из гипербол семейства (4) под управлением в некоторый моментдойдем до линии переключения и затем по линии переключения под управлениемдойдем до точки. Эта траектория будет оптимальной, так как выполняется принцип максимума Понтрягина. |
Действительно, при , т.е.где, использовано управление, а при, т.е., использовано управление. Это значит, что при постоянном векторепри всех(кроме) управлениевыбрано так, что функция Понтрягинаимеет максимальное значение – выполняется п.1) принципа максимума Понтрягина. Как было отмечено раньше, п.2) выполняется автоматически:.
|
Оптимальное управление имеет вид . Аналогично определяются оптимальное управление и оптимальная траектория при других расположениях точки относительно линии переключения. |
2.3.3. Пример.
(в момент маятник отклонен от положения равновесия на угол 0,2 радиан и движется влево со скоростью 1 ед.). Здесь . Можно убедиться, что точкасодержится в полосе управляемости между прямымии, правее линии переключения в верхней полуплоскости. |
До линии переключения дойдем по гиперболе семейства (3), проходящей через эту точку, под управлением . Найдем закон движения по такой гиперболе с моментаиз точки:
Закон движения имеет вид:
Гипербола имеет уравнение:
.
Найдем точку её пересечения с линией переключения (7) (у нас )
Найдем момент попадания в эту точку:
.
Теперь найдем закон движения из точки с моментапо линии переключения – гиперболе семейства (4):
Закон движения имеет вид:
Найдем момент попадания в точку назначения(достаточно воспользоваться вторым равенством):
.
Итак, оптимальная траектория имеет вид:
где
оптимальное уравнение
Судя по фазовой траектории на последнем рисунке, управление движением маятника происходит так:
В момент , когда включили управление, маятник был отклонен от положения равновесия на угол 0,2 радиан влево и продолжал отклоняться влево со скоростью 1 ед. Чтобы замедлить и остано-
вить его отклонение влево, включили двигатель на полную мощность в направлении вправо. Маятник был остановлен (скорость) при некотором положительном отклонении(слева от положения равновесия). Это – фазовое состояние. Под тем же управлениеммаятник стал приближаться назад к положению равновесия (уже с отрицательной скоростью). Чтобы маятник не перескочил через положение равновесия, в моментуправление было переключено на(для замедления маятника). Это – фазовое состояние. После этого маятник пришел в положение равновесия со скоростью(в момент).