- •3. Принцип максимума л. С. Понтрягина
- •3.1. Неклассическое вариационное исчисление
- •3.2. Постановка основной задачи принципа максимума
- •3.2.1. Критерий оптимальности по быстродействию
- •3.2.2. Функция управления
- •3.3 Геометрическое обоснование принципа максимума л.С. Понтрягина
- •3.3.1. Игольчатая вариация
- •3.3.2. Временная вариация
- •3.4 Математическое обоснование принципа максимума л. С. Понтрягина
- •3.4.1. Задача оптимального управления линейными стационарными объектами
- •3.4.2. Теорема об n – интервалах
- •3.5 Применение теоремы о числе переключений
- •3.5.1. Понятие фазового пространства
- •3.5.2. Оптимальное быстродействие в фазовом пространстве
3. Принцип максимума л. С. Понтрягина
3.1. Неклассическое вариационное исчисление
Классическое вариационное исчисление формировалось и развивалось в рамках аналитической динамики, электродинамики, термодинамики и других научных направлений физики в период с 18-го века и до первой половины 20-го века. Все вариационные методы и принципы были созданы для решения проблем физики и естественно не были ориентированы для решения вариационных задач современной техники.
Еще раз напомним основные положения классического вариационного исчисления. Вариации функционалов считались непрерывными и линейными. Переменные, входящие в функционал или в уравнения объекта управления, ограничений не имели.
Однако во многих практических задачах эти условия не соблюдаются. Известно, что управляющие воздействия, которые входят в функционалы, могут быть кусочно-непрерывными, т.е. претерпевать разрывы первого рода. Например, релейные элементы вырабатывают кусочно-непрерывные сигналы управления. Поэтому нарушаются условия непрерывности. Кроме того, на координаты и управления практически всегда накладываются ограничения.
Преодолеть эти условия с помощью классического вариационного исчисления более простыми способами не удается.
Во второй половине 20-го века были сформулированы вариационные принципы управления: принцип максимума Л. С. Понтрягина и принцип оптимальности Р. Беллмана. В них заложены фундаментальные положения математической теории оптимального управления. С этого времени начинает формироваться неклассическое вариационное исчисление [8, 11]. В рамках развития принципа максимума и принципа относительности в 90-х годах прошлого века был создан принцип конечно-временных вариаций оптимального быстродействия и метод варьирования свободных функционалов [2].
Вариационные принципы управления, как и вариационные принципы механики, играют важную роль в понимании процессов в природе и технике. Они имеют большую эвристическую ценность, обладают глубоким идейным смыслом, дают пути к единообразной трактовке различных физических процессов и общие подходы к их исследованию. Вариационные методы решения ряда теоретических и прикладных задач оказываются наиболее эффективными в качественном и, в ряде случаев, в количественном отношениях.
3.2. Постановка основной задачи принципа максимума
Принцип максимума позволяет находить оптимальное управление при наличии ограничений и выполнять оптимальный синтез систем управления. Изложение принципа максимума встречает большие трудности. Его доказательство базируется на функциональном анализе и теории множеств. Поэтому основные положения принципа приводятся способом геометрического толкования.
Рассмотрим объект управления в векторной форме:
(3.1)
или в скалярной форме:
(3.2)
и критерий оптимальности:
(3.3)
Кроме того, заданы начальное состояние объекта и конечное положение .
Требуется так выбрать вектор управления , чтобы объект был переведен из в за минимальное время.
В начальном варианте принцип максимума был сформулирован как принцип оптимальности по быстродействию. В дальнейшем этот принцип получил более широкую трактовку, включая минимизацию расхода энергии на управление.
В выражениях (3.1÷3.3) обозначено: вектор состояния объекта; вектор управления; координаты состояния объекта (например, угол поворота вала двигателя, скорость вращения вала и т.д.); скалярные величины управления (управляющего воздействия); и временные пределы интегрирования; время перевода объекта из начального состояния в конечное положение.
В принципе максимума вводится новая координата [5, 11]
(3.4)
или
(3.5)
Соответственно движение системы (3.2) с учетом (3.5) рассматривается в (n+1)-мерном пространстве.
,
или в векторной форме
.
Причем в начальной точке при , , а в конечной точке при , .
Допустим, применено управление . Тогда будет решением уравнения при известных начальных условиях.
Представим это решение графически в трехмерном пространстве (рис. 3.1).
Рис.3.1 График движения траектории объекта с учетом x0.
Через точку проводят прямую П, параллельную оси x0. Тогда траектория это траектория в плоскости x1x2, а является кривой функционала с учетом . То есть, мы рассматриваем движение объекта в плоскости, а с учетом в трехмерном пространстве.
Тогда основная задача отыскания оптимальных управлений может быть сформулирована следующим образом.
В фазовом пространстве X даны две точки и . Среди всех допустимых управлений U=U(t), переводящих объект из положения в положение , найти такое, для которого функционал (3.4) принимает наименьшее возможное значение.
Управление U(t), дающее решение поставленной задачи, называется оптимальным управлением, а соответствующая траектория х(t) – оптимальной траекторией.