Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вариационное исчисление.doc
Скачиваний:
658
Добавлен:
02.05.2014
Размер:
5.29 Mб
Скачать

1.6.6. Пример.

.

.

  1. Уравнения Эйлера:

  1. Определим и:

, откуда

,

,откуда .

  1. Решение уравнений Эйлера:

  1. Найдем постоянные

Экстремаль: . ■

II. Элементы оптимального управления

2.1. Постановка задачи оптимального управления

Будем рассматривать объект, состояние которого в фиксированный момент времени описывается набором из чисел. Например, если объект есть движение материальной точки в пространстве, токоординаты точки; если объект – электрическая цепь, тонапряжения или токи в различных участках цепи, если объект – течение химической реакции, токоличества различных ингредиентов, катализаторов. Эти числа называюткоординатами фазового состояния, вектор называетсяфазовым вектором. Состояние объекта в каждый момент времени можно изобразить точкой (вектором) мерного арифметического пространства, которое называетсяфазовым пространством.

Движение объекта (например, течение химической реакции) проявляется в том, что его фазовые координаты меняются с течением времени , т.е. фазовый вектор является вектор – функцией. При движении объекта фазовая (т.е. изображающая) точкаописывает в фазовом пространствекривую –фазовую траекторию. Обычно фазовые координаты являются инерционными (меняются плавно), так что вектор – функция непрерывна.

Пусть множество представляет собой совокупность всех фазовых состояний, в которых объекту разрешается находиться. Тогда при движении объекта его состояниев каждый момент временидолжно подчиняться условию

,

которое называется фазовым ограничением.

Предположим, что объект находится под воздействием управления, параметры которого в каждый момент времени описываются набором из чисел(например, углы поворота рулей, мощность двигателя; в химической реакции – количество добавляемых или убираемых ингредиентов, и т.д.). Этот набор чисел составляетвектор управления , его можно изобразить точкой (или вектором)мерного пространства.Управление - вектор – функция обычно является кусочно-непрерывной функцией (может иметь конечное число скачков в моменты переключения управления). Параметры управления не могут быть совершенно произвольными из-за конструктивных особенностей объекта, ограниченности ресурсов, условий эксплуатации объекта. Это значит, что в пространствеуправляющих параметров выделяется некоторое множество, называемоеобластью управления. В любой момент времени точки должны принадлежать этому множеству:

.

Это условие называется ограничением на управление. Кусочно–непрерывные функции управления , значения которых попадают в область управления, называетсядопустимыми управлениями. В дальнейшем имеем в виду допустимые управления.

Чтобы указать, как именно фазовая траектория объекта определяется по выбранному управлению, надо задатьзакон движения объекта (управляемой системы). Будем предполагать, что закон движения объекта задается системой обыкновенных дифференциальных уравнений

(1)

где известная вектор – функция, непрерывная как функцияпеременных и имеющая непрерывные частные производные по фазовым переменным.

При фиксированном допустимом управлении система (1) превращается внормальную систему обыкновенных дифференциальных уравнений с неизвестными функциями. Её решениеназываетсяфазовой траекторией, соответствующей выбранному управлению .

Говорят, что управление , определенное на отрезке времени,переводит объект (1) из фазового состояния в фазовое состояние , если соответствующая этому управлению фазовая траектория – решение системы (1) с начальным условием удовлетворяет фазовому ограничениюи в момент временипопадает в фазовое состояние. Таким образом,задача управления состоит в том, чтобы найти какое–нибудь допустимое управление (кусочно – непрерывную функцию из области управления), чтобы задача (1) с краевыми условиями,, т.е. задача

, ,(2)

имела решение , удовлетворяющее фазовому ограничению

.

Если эта задача имеет решение при любых краевых условиях (т.е. всегда найдется допустимое управление , переводящее объект (1) из любого состоянияв любое другое состояние), то говорят, чтосистема (2) управляема.

Если система (2) управляема, то обычно она имеет бесконечно множество решений: имеется бесконечно множество допустимых управлений, переводящих объект (1) из фазового состояния в фазовое состояниепо различным траекториям. Поэтому ставится задача оптимального выбора: среди допустимых управлений, решающих задачу (2), выбрать такое, при котором управляемый процесс будет наилучшим в каком – либо смысле. Другими словами, если качество процесса оценивается некоторой числовой характеристикой (себестоимость, время процесса и т.п.), то задача заключается в том, чтобы выбором подходящего управления обеспечить максимальное или минимальное значение этой числовой характеристики. Такую числовую характеристику называюткритерием качества. Значение критерия качества определяется фазовой траекторией и управлением: это – число, зависящее от функций,, т.е. функционал.

Задача оптимального управления состоит в отыскании управления , обеспечивающего экстремум этого функционала:

,,,.

Управление , обеспечивающее экстремум критерия качества, называется оптимальным управлением, а соответствующая этому уравнению фазовая траектория оптимальной траекторией.

Наиболее широко используется интегральные критерии качества – функционалы вида

,

где имеет такие же свойства, как и (в смысле непрерывности и дифференцируемости).