ОиАС-1
.pdfВ первом приближении эти уравнения имеют вид
δx& |
= |
n |
a |
(t )δx |
|
+ m |
b |
(t )δu |
|
+ |
μ ψ |
(t )δf |
|
(i = |
|
) |
|
|||||
j |
k |
ρ |
1, n |
(1.3.2) |
||||||||||||||||||
i |
|
∑ |
ij |
|
|
∑ |
|
ik |
|
|
|
|
∑ iρ |
|
|
|
|
|
||||
|
|
j=1 |
|
|
|
|
k =1 |
|
|
|
|
|
|
|
ρ=1 |
|
|
|
|
|
|
|
|
|
|
|
|
(t )= |
∂ϕi |
|
* |
(i = |
|
|
) |
|
|
|
|
|
|||||
|
|
|
ψ |
|
|
|
, ρ = |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
1, n |
1, μ |
|
|
|
|
|
||||||||||
|
|
|
|
iρ |
|
|
∂fρ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В зависимости от объема информации о функциях δfi(t) можно различить три случая:
а) полная информация (это означает, что функции известны заранее; тогда, в частности, они могут быть включены в состав fi*(t) (i=1… µ) либо они точно
измеряются в процессе движения объекта)
б) δfi(t) (i=1… µ) – случайный процесс с известными статистическими характеристиками;
в) отсутствует какая-либо информация о функциях δfi(t) (i=1… µ), однако известно, что они ограничены некоторыми известными числами δf (δfi (t ) ≤ δfi , i =1, μ)
В зависимости от объема информации о внешних воздействиях можно различить следующие типы оптимальных систем:
Равномерно- |
Статистически |
Минимаксно- |
оптимальные |
оптимальные |
оптимальные |
|
|
|
Стабилизирующее управление находится из условия минимума функционала (1.2.9) на решениях системы (1.3.2).
реализации внешнего воздействия при известных управлениях (1.2.10) свое значение интеграла (1.2.9), и поэтому в качестве меры стабилизирующих управлений используется математическое
этого интеграла
J = t∫1 (∑n qiiδxi2
t0 i=1
J |
1 |
= M |
t1 |
(n |
q |
δx2 |
|
|
∫ ∑ |
ii |
i |
||
|
|
|
t0 |
i=1 |
|
|
+ ∑m γkk δuk2 )dt k =1
m |
2 |
|
|
γkkδuk |
)dt |
|
|
+ ∑ |
(1.3.3) |
||
k =1 |
|
|
|
42
Физический смысл величины J1, состоит в том, что случайные воздействия возбуждают случайное движение по ординатам δxi(t) (i=1… n).
Если вычислить значение интеграла (1.2.9) для каждой реализации случайного движения и затем определить «среднеарифметическое», то получим значение J1. Управление, при котором J1 достигает минимума, является оптимальным в среднем, и поэтому система стабилизации называется статистически оптимальной.
При отсутствии информации о внешних воздействиях используется игровой подход к определению оптимального управления.
В соответствии с этим подходом функции δfi(t) (i=1… µ) считаются «управлениями» и определяются из условия максимизации интеграла (1.2.9), а управления δuk(t) (k=1… m) – из условия его минимизации. Эти управления обеспечивают наилучший результат при наихудшем внешнем воздействии [минимум максимального значения функционала (1.2.9)], и поэтому системы с таким управлением называются минимаксно-оптимальными.
43
Общий вид уравнений стабилизирующего управления
44
В общем случае стабилизирующие управления описываются не алгебраическими уравнениями (1.2.10), а дифференциальными уравнениями вида
x& p = ϕp (xp ,δx,t ) |
(1.3.4) |
δu = rp (xp ,δx,t ) |
(1.3.5) |
xp(t) – np-мерный вектор переменных состояния устройства управления (регулятора);
φр(xp, δх, t), rp(xp, δх, t) – nр- и m-мерные векторы соответственно.
В ряде случаев не все переменные состояния объекта управления доступны непосредственному измерению.
Пусть измеряются некоторые переменные y1(t), ..., yr(t), связанные с переменными объекта соотношениями
y = w(δх, t), |
(1.3.6) |
у(t) – r-мерный вектор измеряемых переменных; |
|
w(δх, t) – заданный r-мерный вектор. |
|
В этом случае уравнения регуляторов имеют вид |
|
x& p = ϕp (xp , y,t ) |
(1.3.7) |
δu = rp (xp , y,t ) |
(1.3.8) |
Далее будем опускать символ δ в соотношениях (1.2.2) ... (1.2.5), (1.2.9), (1.2.10), относящихся к системам стабилизации. Если теперь для общности изложения заменить функцию под интегралом (1.2.9) функцией φ0, то модели объекта управления и модели целей управления (критерии качества управления) в системах программного управления и стабилизации будут совпадать. Это естественно, так как с математической точки зрения несущественно происхождение этих моделей.
45
Используя матричную форму, запишем также, отбрасывая символ δ, уравнения (1.3.2) первого приближения и уравнение (1.2.14) для регулируемых переменных:
x& = A(t )x + B(t )u + Ψ(t )f , θ = N(t )x |
(1.3.9) |
A(t), B(t), Ψ(t), N(t) – матрицы, элементами которых являются известные функции времени. Эти матрицы имеют размеры n×n, n×m, n×µ, m×n соответственно.
Связь (1.3.6) переменных состояния объекта с измеряемыми переменными часто может быть линеаризована и тогда она с учетом помех измерения принимает вид
|
y=D(t)x + χ(t), |
(1.3.10) |
χ(t) – |
r-мерный вектор помех измерения; |
|
D(t) – |
заданная матрица размеров n×r. |
|
Устройство управления (регулятор) часто описывается не уравнениями |
|
|
(1.3.7)...(1.3.8), а линейными уравнениями вида |
|
|
|
x& p = A p (t )xp + Bp (t )y; |
(1.3.11) |
|
u = Dp (t )xp + Fp (t )y |
(1.3.12) |
Ap(t), Bp(t), Dp(t), Fp(t) – матрицы размеров np×np, np×r, m×np, m×r соответственно.
46
Часто регулятор содержит управляющую ЭВМ. В этом случае он описывается разностными уравнениями:
хр[(k+1)T] = Φр(kT)xр(kT)+Rр(kT)y(kT) (k=0,1,2,...); |
(1.3.13) |
u(kT)=Dp(kT)xp(kT)+Fp(kT)y(kT) (k=0,1,2,...); |
(1.3.14) |
u(t)=u(kT), kT ≤ t < (k+l)T (k=0,1,2,...), |
(1.3.15) |
Т – интервал дискретности регулятора;
Φр(kT), Rр(kT), Dp(kT), Fp(kT) (k = 0, 1, 2, ...) – матрицы чисел соответствующих размеров.
Поскольку для работы регулятора (1.3.13)...(1.3.15) достаточно измерения вектора у лишь в дискретные моменты времени 0, Т, 2Т, 3T и т. д., то естественно при определении параметров дискретного регулятора использовать дискретную модель объекта (1.3.9), (1.3.10). Такая модель при f(t)= χ(t)=0 имеет вид
х[(k+1)T] = Φ(kT)x(kT)+R(kT)u(kT); θ(kT)=N(kT) x(kT); |
(1.3.16) |
y(kT)=D(kT)x(kT) (k=0, 1, 2,...). |
(1.3.17) |
47
Матрицы Φ(kT) и R(kT) (k=0, 1, 2,...) нетрудно построить на основе матриц А(t) и В(t), если воспользоваться формулой Коши
t |
|
x(t ) = H(t,t0 )x(t0 )+ ∫H(t,τ )B(τ )u(τ )dτ |
(1.3.18) |
t0 |
|
H(t, t0) – нормированная фундаментальная матрица. Эта матрица (размеров n×n) составлена из n-мерных векторов (первый вектор – это решение однородного
уравнения x& = A(t )x при начальных условиях x1(t0) = 1, x2(t0) = ... = xn(t0) = 0; второй вектор является решением однородного уравнения при начальных
условиях x1(t0) =0, x2(t0) = l, x3(t0) = ... = xn(t0) = 0 и т. д.).
Произведение Н(t, τ) В(τ) – это импульсная переходная матрица объекта. Ее
можно получить экспериментально, прикладывая (в момент τ) к входам объекта δ-
импульсы.
Полагая в (1.3.18) t=(k+1)T, t0=kT и принимая во внимание (1.3.15), получим
x[(k +1)T ]= H[(k +1)T , kT ]x(kT )+ |
(k +1)T |
u(kT ) (1.3.19) |
|||
∫H[(k +1)T ,τ ]B(τ )dτ |
|||||
отсюда следует, что |
|
|
kT |
|
|
|
|
|
|
||
Φ(kT ) = H[(k +1)T , kT ] |
|
|
(1.3.20) |
||
R(kT )= |
(k +1)T |
]B(τ )dτ (k = 0,1,2,K) |
|||
|
|||||
∫H[(k +1)T ,τ |
|
kT
48
В дискретном случае критерий качества имеет вид
N |
′ |
′ |
(1.3.21) |
J = ∑x (kT )Q(kT )x(kT )+ u [(k −1)T ]u[(k −1)T ] |
k =1
Q(kT) (k=1… N) – заданные положительно-определенные матрицы чисел.
В стационарном случае, когда параметры объекта не изменяются во времени, его уравнения (1.3.9) записываются как
x& = Ax + Bu + Ψf , θ = Nx |
(1.3.22) |
A, B, Ψ, N – заданные матрицы чисел.
Дискретная модель объекта, описываемого уравнениями (1.3.22), имеет (при f=0) вид
x[(k+1)T] = Φx(kT) + Ru(kT); θ(kT)=Nx(kT), |
(1.3.23) |
||||||||||
|
|
|
|
1 |
2 |
|
|
1 |
|
|
|
Φ = eAT |
= E + AT + |
|
(AT ) |
+K + |
|
|
(AT )μ +K |
(1.3.24) |
|||
2! |
μ! |
||||||||||
|
|
1 |
|
|
|
1 |
|
|
|
|
|
R = |
ET + |
|
AT 2 |
+K + |
|
Aμ−1T μ |
+K B |
(1.3.25) |
|||
|
|
||||||||||
|
|
2! |
|
|
μ! |
|
|
|
|
Соотношения (1.3.23)...(1.3.25) можно доказать, если принять во внимание, что в стационарном случае можно указать явный вид нормированной фундаментальной матрицы
49 |
H(t, t0 ) = eA (t −t0 ) |