Тема 25
.doc
25. Элементы математической теории оптимального управления
25.1. Постановка задачи оптимального управления экономической системой
В отличии от метода динамического программирования, в теории управления экономическими процессами управление осуществляется непрерывно.
Критерии оптимальности управления обычно связаны либо с получением наибольшей прибыли, либо с достижением минимальных экономических затрат, либо с обеспечением минимального времени процесса. Самым распространенным на практике является критерий минимальных экономических затрат.
Пусть исследуемый экономический процесс, подлежащий управлению, представляет собой перепрофилирование производства, организацию дополнительных цехов, предприятий и т.д. с целью увеличения выпуска продукции. Обозначим y(t) - объем выпускаемой продукции в единицу времени, который естественно будет изменяться во времени t при перепрофилировании производства.
Пусть далее функция u(t) характеризует управление экономическим процессом. Она может представлять собой текущие инвестиции в процесс перепрофилирования, количество рабочей силы, направляемой для этой цели в момент времени t, число единиц специальной техники и т.п. Ясно, что вид функции y(t) зависит от того, какой будет выбрана функция u(t).
Кроме того, очевидно, что в каждый момент времени t текущие экономические затраты g будут зависеть от вида функций y(t) и u(t), т.е.
g = g(y(t), u(t), t).
Чтобы найти полные экономические затраты нужно проинтегрировать g в пределах от момента начала исследуемого процесса t0 до момента его окончания tk. Тогда критерием оптимальности управления является минимизация интеграла
,
где управление u(t) принадлежит некоторому классу U возможных функций, а y(t) определяется начальным состоянием системы и видом управления, т.е. видом функции u(t).
Определенный интеграл в правой части равенства является числом, которое зависит от выбора функции u(t). Если каждой функции из некоторого множества функций поставлено в соответствие определенное число, то говорят, что задан функционал. В приведенном выше интеграле J(y(t), u(t)) является функционалом.
Как правило, скорость увеличения объема продукции при перепрофилировании производства является функцией вида управления и самого объема производства. То есть имеет место дифференциальное уравнение:
,
здесь производная по времени обозначена точкой.
Кроме того, естественно, известно состояние экономической системы (объем производства) в начальный момент:
y(t0) = y0
и задано состояние системы в конечный момент (т.е. объем производства, на который производство должно быть перепрофилировано в момент окончания процесса):
y(tk) = yk.
Таким образом математически задача оптимального управления экономической системой может быть поставлена следующим образом:
Требуется определить функции u(t) и y(t), минимизирующие функционал
При этом y(tk) = yk , а функции y(t) и u(t) связаны дифференциальным уравнением с начальным условием y(t0) = y0. В этом случае функция u(t) называется оптимальным управлением и обозначается u*(t), а y(t) называется функцией оптимальных параметров производства и обозначается y*(t).
Следует отметить, что в литературе обычно рассматривается более общий случай, когда экономическая система характеризуется не одной переменной (в нашем случае объем производства), а несколькими. При этом управление также включает ряд управляющих параметров. В этом случае y и u представляют собой вектор-функции: y(t) = (y1(t), y2(t), … yn(t)); u(t) = (u1(t), u2(t), … um(t)). Мы же рассматриваем простейший случай n = m = 1.
Поставленная выше задача называется задачей Лагранжа. Принцип оптимальности Лагранжа, согласно которому отыскивается вид оптимальной функции управления, является развитием задачи нахождения условного и безусловного экстремумов.
Рассмотрим алгоритм решения задачи Лагранжа.
-
Составляется функция Лагранжа. Очень часто эту функцию называют - функционалом:
.
-
Составляется функция Гамильтона (гамильтониан) H, которая учитывает скорости изменения рассматриваемых функций:
,
где - неизвестная функция времени, которая называется неопределенным множителем.
Доказана следующая теорема: Пусть гамильтониан H(, y, u, t) дифференцируем по u, существует его экстремум в точке u* и соответствующая функция y*(t) является оптимальной, т.е. дает экстремум гамильтониану H . Тогда можно найти такое оптимальное значение * и оптимальную функцию , что экстремум гамильтониана H совпадет с минимальным значением функционала J(y,u). Иначе говоря, у этих функционала и гамильтониана оптимальный вид функций y*(t) и u*(t) совпадает.
В соответствии с этой теоремой можно получить следующие необходимые условия экстремума:
и .
Решение системы из этих двух уравнений позволяет получить оптимальную функцию управления u*(t). При этом по условиям задачи Лагранжа начальное условие для неизвестно. Обычно задается лишь конечное условие в виде
.
Пример. Задана некоторая система, процесс функционирования которой описывается дифференциальным уравнением
,
определяющим скорость изменения его основной характеристики y = y(t) в зависимости от управления u(t).
Известны начальное и конечное состояния системы: t0 = 0; tk=1; y(t0) = 0, y(tk) = 1. Найти оптимальное управление u* и соответствующую ему функцию y*, которые доставляют минимальное значение функционалу
Решение.
По условию задачи и g(y,u,t) = u2 + y. Составим -функционал и гамильтониан:
;
.
Для вычисления неопределенного множителя (t) продифференцируем гамильтониан по u и приравняем к нулю. Имеем
.
Откуда
.
Далее
,
откуда
.
Так как по конечному условию
,
то . Отсюда .
Таким образом, оптимальная зависимость неопределенного множителя *(t) будет иметь вид:
.
В последнем выражении неизвестным является *. Для его нахождения воспользуемся исходным дифференциальным уравнением . Подставляя в это уравнение
и интегрируя, получим
.
Воспользовавшись начальным условием y(0)=0, получим C1=0.
Таким образом, имеем оптимальную функцию производства:
.
Подставляя в это выражение конечное условие y(1)=1, вычисляем . Окончательно, оптимальная функция будет иметь вид:
,
а оптимальная функция управления:
.
Минимальное значение функционала J(y, u) равно:
.
25.2. Принцип максимума Понтрягина
При решении задачи Лагранжа или задачи оптимального управления предполагалось, что управление носит неограниченный характер. На практике управление всегда ограничено по величине. Это ограничение связано с конечным значением возможностей управления.
Пусть ограничение на управление имеет вид, изображенный на рис.25.1.
По задаче Лагранжа
450
- umax 0 +umax u
Рис. 25.1. Реальный и идеальный случаи управления
Тогда в место управления u необходимо использовать, как показано на рис.25.1, нелинейную функцию , которая будет являться аргументом функционала Гамильтона. При такой нелинейности дифференцировать гамильтониан нельзя.
Впервые задачу Лагранжа с ограничением решила группа ученых под руководством академика Л.С. Понтрягина. Решение задачи явилось обобщением принципа Лагранжа.
Запишем формулировку задачи принципа максимума Понтрягина: дан объект управления, модель которого описывается дифференциальным уравнением
=.
Даны начальные условия y(t0)=y0 и заданы ограничения. Рассмотрим два ограничения
q1 (yk)= 0;
q2 (yk)= 0.
Аналогично даны ограничения по скорости изменения функций
= ;
= .
В отличие от предыдущей задачи добавляется еще ограничения на функцию управления
;
.
Необходимо определить оптимальный вид функций y* и u*, которые обеспечивают минимальное значение целевой функции I(y*, u*) при выполнении всех перечисленных выше ограничений. Т.е.
I(y,u)=.
При решении, аналогично задаче Лагранжа, составляются функционалы Лагранжа и Гамильтона:
= I(y, u)+ q1[yk]+ q2[yk],
H=+ - g(y,u).
Далее воспользуемся теоремой, которую называют принципом максимума Понтрягина:
Если при оптимальных функциях y* и u*существует минимальное значение целевой функции I(y*, u*) при выполнении всех перечисленных выше ограничений, то тогда можно найти такие оптимальные функции , , , , при которых функционал Гамильтона принимает максимальное значение, т.е.
.
Заметим, что в последнем выражении для нахождения управляющей функции u* не производится дифференцирование гамильтониана, а ее значение отыскивается путем перебора.
Сделаем несколько замечаний:
-
Постановка задачи Понтрягина отличается от задачи Лагранжа тем, что включается дополнительное ограничение на управление.
-
Принцип максимума позволяет найти максимум функционалов на концах отрезка, как это изображено на рис. 25.2, т.к. он не требует дифференцирования гамильтониана.
H
- umax 0 +umax u
Рис.25.2. Вид функционала Гамильтона на отрезке
При этом, если управление u невелико и концентрируется на небольшом отрезке, не достигая границ ограничения, то принцип Понтрягина сводится к решению задачи Лагранжа. Если управление выходит на границу отрезка, то задача решается в постановке Понтрягина и максимум гамильтониана отыскивается путем простой подстановки.
Пример.
Дана система, описываемая уравнением
.
Известно начальное условие y(0)=0 и ограничение . Найти оптимальное управление и соответствующую ему функцию, которые доставляют минимальное значение целевой функции
I(y,u)=min.
Заметим, что в условии примера управляющая функция не входит в подынтегральную функцию. Кроме того, отсутствуют ограничения на конечное условие q и скорость изменения функции . Легко убедиться, что в этом случае функционал Лагранжа совпадает с целевой функцией I(y,u).
Решение. Приведем к постановке задачи Понтрягина. Для этого обозначим и запишем гамильтониан в виде
H=u - y.
Применим к последнему выражению принцип Понтрягина
(u - y) при ограничении.
Выражение в скобках состоит из двух слагаемых, из которых второе не зависит от u. Тогда
(u - y) = u при .
Следовательно, .
По определению
.
Интегрируя, получим
.
Для вычисления постоянной воспользуемся соотношением
,
но - функционал в условии задачи не зависит от y(tk). Поэтому полагаем
=0.
Кроме того, по условию задачи tk =4, тогда
.
Откуда C1=-4. Следовательно
.
Построим эту функцию
0 4 t
-4
Рис.25.3. График функции неопределенного множителя
Из рис.25.3 видно, что на отрезке [0,4], на котором производится минимизация целевой функции I(y,u) , множитель . Так как , то . Подставив это значение в исходное дифференциальное уравнение, найдем . Интегрируя последнюю формулу, находим . С учетом начального условия получим .
Тогда
I()=.
При любом другом управлении меньшее значение получить нельзя.
Пример.
Найти оптимальное управление в системе, описываемой уравнением
.
Дано начальное условие y(0)=0 и ограничение . Найти оптимальное управление и соответствующую ему функцию, которые доставляют минимальное значение целевой функции
I(y,u)=min.
Решение. Так как ограничения на конечные значения отсутствуют, то
I(y,u).
Обозначим и составим гамильтониан
H=u - (u2 + y).
Применим принцип Понтрягина
(u - y – u2) при ограничении.
Рассмотрим в начале интервал.
Необходимое условие экстремума дает
–2 u=0.
Откуда
при .
Для вычисления воспользуемся
.
Аналогично вычислениям в примере 2 получаем
.
Вид этой функции показан на рис.19.3 . Подставляя полученную функцию в выражение для u, получим
.
Но , тогда . Откуда 2 < t < 6.
По условию задачи правый конец интервала =4, поэтому принимаем
2 < t 4.
Теперь рассмотрим случай, когда . В соответствии с проведенными вычислениями и рис.19.3 этот случай может быть только на отрезке 0 t 2. Аналогично вычислениям в примере 2
.
Из рис.19.3 видно, что на отрезке [0,2], на котором производится минимизация целевой функции I(y,u) , множитель . Тогда .
Таким образом, управляющая функция будет иметь вид
Тогда, подставляя управляющую функцию в исходное уравнение, оптимальная система с точки зрения заданного критерия и ограничений будет описываться дифференциальным уравнением
На рис.25.4 показаны полученные функции.