Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка с теорией.DOC
Скачиваний:
145
Добавлен:
01.05.2014
Размер:
4.7 Mб
Скачать

5.2. Вариационные задачи на условный экстремум.

Будем считать, что y - не одна функция, а набор из m функций , т.е. . Если они независимы, то уравнение Эйлера-Лагранжа надо писать для каждогоотдельно:

, i =,

Если между ­ есть связь, то получаем задачу на условный экстремум.

5.2.1. Модельные задачи на условный экстремум.

1). Пусть в пространстве есть поверхность, а на ней две точки.

Определение: Линия, которая проходит по поверхности, соединяя эти две точки, и имеющая минимальную длину, называется геодезической.

Задача найти геодезическую, соединяющую две точки, может быть сформулирована, как задача вариационного исчисления.

Предположим, что поверхность задана уравнением j(,,x) = 0 (*)

j -дифференцируемая функция ;

x - независимая координата;

y1, y2 - функции от x;

тогда длина пути , соединяющего две точки , равна:

Надо найти минимум функционала при условии (*)

Т.о. получаем задачу на условный экстремум. Начальные условия :

начало и конец геодезической.

2) Изопериметрическая задача

Требуется найти линию заданной длины , ограничивающую max площадь .

Задача может быть поставлена так :

(**)

- длина линии.

S = max

Связи типа (*) называются локальными.

Связи типа (**) называются интегральными.

Задачи на условный экстремум типа (*) и (**) решаются методом множителей Лагранжа.

Обозначим ограничения следующим образом:

локальные : = 0, i =- сильные связи

интегральные : =, j =- слабые связи

Составлим функционал :

= F + +

Увеличилось количество неизвестных функций за счет .

Оказывается , что экстремальная траектория такова, что на ней справедливо уравнение Эйлера-Лагранжа для нового функционала относительно переменныхy и , то есть задача сводится к задаче на безусловный экстремум функционала . Введение каждого множителя Лагранжа(x) сопровождается появлением соответствующего нового уравнения Эйлера-Лагранжа относительно.

Пример:

Часто локальные связи задаются дифференциальными уравнениями.

- уравнения связи, (u - управление)

J =min

На плоскости имеются начальная и конечная точки. Надо выбратьu так , чтобы перевести систему из начальной точки в конечную, и функционал достигал экстремального значения.

*т.е. окончательный результат задачи - фазовая траектория.

Решаем методом множителей Лагранжа.

= +

Выписываем уравнение Эйлера-Лагранжа относительно параметров : ,,,,u.

= 0

= 0,

=(t)

(t) = 0  уравнение Эйлера-Лагранжа

= (t) ;=(t)

(t) = (t)

= 2u (t);= 0 2u (t) = 0

u =

и дадут уравнения связи.

Тогда получим :

(t) =

(t) =

u(t) = =

Т.о. , экстремальная траектория такова, что управление u - линейная функция. иопределяются из граничных условий на концах промежутка.

Т.о., мы сможем получить решение задачи, проинтегрировав исходную систему уравнений связи.

* мы получим новую фазовую траекторию.

Метод вариационного исчисления ориентирован на уменьшение перебора возможных значений. Так в нашем примере класс функций u(t) сужен и доведен до линейного.

6. Принцип максимума Понтрягина ( на примере задачи оптимального управления ).

Пусть некоторая физическая система описана системой дифференциальных уравнений:

,

где t - независимая переменная , в роли которой обычно выступает время.

, ... , - переменная состояния или фазовые координаты.

, ... , - переменные управления.

Если ввести векторные обозначения:

X =

U =

F =, то рассматриваемая система записывается в виде := F (X,U)

Требуется в классе кусочно-непрерывных (поэтому нельзя использовать вариационное исчисление) управлений, которые считаются допустимыми, найти U(t) такое, чтобы при переходе из начальной точки X(0) = =в заданную точку X(T) ==функционал I =достигал экстремума,

где - заданная гладкая функция.

Введем переменную , определив ее в виде интеграла с переменным верхним пределом:=

Тогда =(X,U)

Присоединив это уравнение к исходной схеме, получим:

= , i =

Важно отметить, что правые части уравнений новой системы не зависят от координаты . Если ввести расширенные n+1-мерные векторы:

X =

F =, то система= F (X,U)

Функционал I =(T) представляет собой конечное значение координатыи сформулированная выше задача сводится к задаче о достижении экстремума конечного значения координаты(будем иметь в виду минимизацию функционала ).

Метод принципа максимума Понтрягина является расширением классического вариационного исчисления на случай , когда управляющие воздействия ограничены и

описаны кусочно-непрерывными функциями.

Принцип максимума является необходимым условием оптимальности, для линейных систем - необходимым и достаточным.

Сущность принципа максимума состоит в следующем:

Наряду с системой =, i =(*),

описывающей движение управляющего объекта, будем рассматривать систему:

= -, i =(**),

составленную относительно некоторых вспомогательных переменных . Она называется сопряженной к (*).

Введем функцию Гамильтона:

H=

Вычислим частные производные: =,=.

Теперь с помощью функции Гамильтона системы (*) и (**) могут быть записаны так:

(***)

Система (***) называется гамильтоновой системой.

Необходимые условия оптимальности управления (принцип максимума) формулируется так :

Если управление U(t) и соответствующая ему траектория X(t) оптимальны ,то:

  1. Существует ненулевая непрерывная (n+1)-мерная вектор-функция

 (t) = , составляющие которой удовлетворяют гамильтоновой системе.

  1. Функция Гамильтона

H = ( (t), F (X,U)) представляющая собой произведение вектора скорости, изображающей точки F (X,U) на вектор  (t) , достигающее при каждом значении 0 < t < T максимума по U.

  1. В момент времени t = T выполняются соотношения:

(T) 0 и H в момент T равна 0.

Пример:

Для системы минимизировать функционал I =при фиксированных концах траектории и фиксированном времени процесса.

Составим функцию Гамильтона:

H = ++=++

Определяем функции (t) , i = 0,1,2

= ;

= 0, =

= ;= 0 ,=

= ;= -,=+

Т.о. H = ++

Согласно условию 2 принципа максимума функция Гамильтона H должна достигать

максимума по u, т.е. = 0 2+= 0

u(t) =

Итак, для оптимального управления получен закон линейного изменения. Выше этот

результат был получен классическим вариационным исчислением.