Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры_ТАУ.doc
Скачиваний:
2
Добавлен:
05.08.2019
Размер:
3.18 Mб
Скачать
  1. Прямой (второй) метод исследования устойчивости Ляпунова.

Если уравнения движения системы dy/dt = Ф(y,t) (3.17) таковы, что можно найти знакоопределенную положительную функцию W(y, t), полная производная которой

(3.18), вычисленная в силу этих уравнений, есть знакопостоянная отрицательная функция или тождественно равная нулю, то невозмущенное движение y = 0 устойчиво по Ляпунову.

В случае, когда функция W(y) не зависит от времени (это имеет место, например, для автономных систем, правые части которых не зависят от времени) есть скалярное произведение вектора градиента функции с компонентами ( ) и вектора скорости ( ) изображающей точки в фазовом пространстве. По условию производная dW/dt отрицательна или нуль. С учетом того, что вектор градиента всегда направлен по нормали к поверхности W(y) = C в сторону возрастания функции W(y), то траектории системы пересекают (в силу отрицательности скалярного произведения) замкнутую поверхность W(y) = C извне во внутрь или располагаются на ней (если dW/dt = 0). В любом случае при любом ε > 0 всегда можно выбрать δC < ε такое, что если неравенство ||y(to)|| ≤ δ выполняется при условии dW/dt ≤ 0, то любая траектория системы может покинуть поверхность W(y) = C только в сторону убывания W(y), и неравенство ||y(t)||<ε будет соблюдаться при любом t > to, что и требовалось доказать.

***

Если уравнения движения системы (3.17) таковы, что можно найти знакоопределенную положительную функцию W(y,t), допускающую бесконечно малый высший предел при ||y||→0 и имеющую знакоопределенную производную по времени в силу этой системы, то невозмущенное движение y = 0 асимптотически устойчиво.

Доказательство достаточно простое в случае, когда функция W не зависит от времени. Так как производная dW/dt ≤ 0 и обращается в ноль только в начале координат y = 0, то любая траектория системы будет пересекать поверхность W(y) = C снаружи внутрь. Поскольку число

ε > 0 можно выбирать сколь угодно малым, то такое поведение траекторий можно проследить до момента прихода их в точку y = 0.

  1. Первый метод Ляпунова исследования устойчивости динамических систем.

Применяется только для ЛДС или для ЛС, близких к линейным.

ЛДС dy/dt = By асимптотически устойчива, если действительные части всех собственных значений матрицы B отрицательны (Re(λi) < 0), каковы бы не были нелинейные слагаемые, полученные в этой ДС.

Замечания:

Если dy/dt = By + B2(y), то нелинейные слагаемые B2(y) должны обращаться в 0 при y = 0.

Если хотя бы одна действительная часть Re(λi) > 0, то решение y = 0 неустойчиво, каковы бы не были нелинейные слагаемые B2(y).

Если если хотя бы одна действительная часть Re(λi) обращается в 0, то первый метод Ляпунова не даёт ответа на вопрос об устойчивости. Необходимо пользоваться вторым методом или анализировать нелинейные слагаемые ДС.

  1. Принцип оптимальности Беллмана для задачи быстродействия.

Принцип оптимальности Беллмана: «Оптимальные стратегии управления обладают тем свойством, что каково бы ни было начальное состояние системы и управление в начальный момент, последующее управление должно быть оптимальным в смысле заданного критерия относительно любого другого состояния, которое могло бы явиться естественным следствием управления в начальный момент». Этот принцип для динамических систем может быть сформулирован короче: любой отрезок оптимальной траектории есть тоже оптимальная траектория. Последнее означает, что независимо от того, каким было управление на начальном отрезке [to,T], последующее управление на отрезке [t,T] должно обладать свойством оптимальности по выбранному критерию. Следовательно, если ставится задача поиска оптимального управления на всем отрезке[to,T], то управление u должно быть оптимальным в каждый момент времени tЄ[to,T]. Применение принципа оптимальности Беллмана для динамических систем (1.1) и (1.8) приводит к необходимости решения некоторого уравнения в частных производных – уравнения Беллмана относительно функции вектора переменных состояния x (или y). Данную функцию обычно называют производящей и ее определение позволяет найти оптимальное управление uo как функцию от вектора состояния x (или y), то есть решить задачу синтеза.

Выведем уравнение Беллмана для задачи быстродействия I = T при управлении динамической системой общего вида (1.1). Пусть xo = x(to) - начальное положение системы (1.1). Необходимо найти управление uo Є U, переводящее систему (1.1) из положения xo = x(to) в заданное положение xT = x(T) за минимальное время. Возьмем некоторый момент времени tЄ[to,T]. Переход из состояния xo в состояние x = x(t) осуществляется за время tto (это время не обязательно минимально). Двигаясь затем из состояния x(t) в состояние x(T) оптимально затратим минимальное время T(x). Общее время перехода будет равно tto + T(x). Пусть T(xo) минимальное время перехода из состояния xo в состояние xT, тогда справедливо неравенство T(xo) ≤ tto + T(x) или , где введено обозначение . При tto получаем или (3.1).

Так как начальная точка x(to) была выбрана произвольно, то согласно принципу динамического программирования соотношение (3.1) должно быть справедливо для любой точки x(t), а не только для x(to). Следовательно, для любого момента времени t имеем неравенство , где знак равенства соответствует оптимальной траектории.

Таким образом, оптимальное управление должно быть вычислено из условия

. Определив из этого условия функцию и подставив в это же соотношение, получим дифференциальное уравнение в частных производных (уравнение Беллмана) в виде (3.3) относительно производящей функции .

Решая уравнение (3.3) и, тем самым, определяя функцию , затем находим оптимальное управление , так как вид этой функции известен.

Замечание. При определении управления и при выводе уравнения Беллмана (3.3) было сделано предположение о существовании оптимальной (в смысле быстродействия) фазовой траектории системы (1.1) и о непрерывности функции и ее частных производных.