Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МОИИ конспект

.pdf
Скачиваний:
162
Добавлен:
28.12.2014
Размер:
631.87 Кб
Скачать

m × m, т.

е. a тKa > 0 ,

 

где

а

произвольный положительный

детерминированный вектор с размером m.

 

 

 

 

 

 

 

 

 

 

 

При

сделанных допущениях

 

фильтрация

 

по методу

наименьших

квадратов сводится к отысканию оценки

ˆ

из условия достижения минимума

X

квадратичной формы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

т

K

−1

 

Y F

ˆ

 

т

K

−1

 

ˆ

 

,

(3.15)

 

 

 

 

 

 

S ( X ) = δ

 

δ =

( X )

 

 

 

 

Y F ( X )

 

где δ – определяемый по формуле (3.8) вектор невязок.

Проиллюстрируем эту процедуру на простейшем случае линейной модели измерений

Y = HX + Z .

(3.16)

Модель (3.16) представляет собой (3.7), где так же, как

в (3.13), через Z

обозначена суммарная методическая и измерительная ошибка.

Будем также считать, что суммарная ошибка Z является несмещенной,

некоррелированной и равноточной (ошибки имеют одинаковые дисперсии).

Тогда условие (3.14) принимает вид

 

 

 

 

 

 

 

M (Z ) = 0,

 

P = σ2E ,

 

 

 

(3.17)

 

 

 

z

 

 

 

 

где Е – единичная матрица.

 

 

 

 

 

 

 

При условии (3.17) в выражении (3.15)

K = K −1 = E .

Тогда

минимизируемая квадратичная форма

 

 

 

 

 

ˆ

ˆ

т

m

n

2

 

 

ˆ

hij xˆi )

,

(3.18)

S ( X ) = (Y HX )

 

(Y HX ) = ( yi

 

 

 

 

i=1

j =1

 

 

 

где hij (i = 1, 2, …, m; j = 1, 2, …, n) – элементы матрицы H. Необходимое условие минимума квадратичной формы (3.18)

 

S

= 0,

 

k = 1, 2,..., n .

(3.19)

 

 

 

 

xˆk

 

 

 

 

 

 

 

 

 

Решив уравнение (3.19), получим H

т

ˆ

 

 

т

Y

, откуда

 

HX = H

 

 

 

ˆ

т

H )

−1

H

т

Y .

 

(3.20)

 

X = (H

 

 

 

 

41

Заметим, что для рассматриваемого частного случая линейной модели измерений и гауссовского характера вектора ошибок измерения Z оценки,

соответствующие обобщенному методу наименьших квадратов, и оценки,

минимизирующие функцию правдоподобия (3.12), совпадают между собой.

Поскольку МНК при сделанных допущениях обеспечивает получение

несмещенной оценки ˆ удовлетворяющей условию

X ,

 

ˆ

] = X и,

 

 

 

 

 

M [ X

 

 

 

 

 

где X и – истинное значение вектора состояния, то точность этой оценки может

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

быть охарактеризована ковариационной матрицей P( X ) :

 

 

ˆ

 

 

 

2

Q

−1

.

 

(3.21)

P( X ) = σ

 

 

 

 

 

Здесь

 

 

 

 

 

 

 

 

 

 

 

 

 

Q = H тH .

 

 

(3.22)

Если используется модель (3.2) и она удовлетворяет условиям

линеаризируемости, можно показать, что

 

 

 

 

 

 

 

 

 

 

F т

 

 

−1

 

F

 

 

Q =

 

 

 

K

 

 

 

 

 

,

 

ˆ

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

X

 

 

где К – положительно определенная матрица, заданная условием (3.14).

3.3. Пример применения МНК в задаче определения движения путеизмерительного вагона

При измерении геометрических параметров рельсового пути с использованием инерциальных чувствительных элементов и методов требуется точная привязка результатов измерений к пройденному пути. Основным прибором, определяющим пройденное вагоном расстояние, является одометр,

установленный на одну из колесных пар. Как правило, это фотооптический датчик, вырабатывающий N импульсов на оборот колеса. Тогда цена одного импульса одометра составляет

k = 2πR N ,

42

а измеренный путь определяется выражением

S = S0 + kn = S0 + R n ,

N

где n – число импульсов выходного сигнала одометра.

Отыскиваемый закон движения представляет собой зависимость пройденного пути от времени:

S = f (t) .

(3.23)

Для определения функции f(t) будем использовать показания одометра,

полученные в моменты времени ti (i = 1, 2, …, m) на мерном интервале времени

[0…T].

Очевидно, что при любом конечном количестве измерений m их недостаточно для полного определения закона движения. Рассмотрим случай простейшего закона – равномерного движения (3.10), который в данной задаче вырождается в одномерный вариант:

 

S = S0 + υt .

(3.24)

Состояние системы в названном

случае описывается

системой двух

&

= υ,

&

 

дифференциальных уравнений: S

υ = 0 .

 

При представлении в векторно-матричной форме (3.11) определяется вектор

r

 

т , матрица состояния

 

 

состояния X =

S , υ

 

 

 

 

 

1

 

 

 

A =

0

.

 

 

 

0

0

 

Учитывая, что для определения закона движения (3.24) достаточно определить

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

т и вектор

параметры S0 и υ, зададим для удобства вектор состояния X =

S0 , υ

r

 

 

 

т, где y

 

 

 

 

 

 

 

 

 

 

 

 

измерений Y =

y , y

2

,..., y

m

i

= S

0

+ υt

i

;

i = 1, 2,..., m .

 

 

1

 

 

 

 

 

 

 

 

 

 

В этом случае матрица Н модели измерений (3.16) примет вид

 

 

 

 

 

 

 

1

1

...

 

 

1

т

 

 

 

 

 

 

H = t

t

2

...

t

 

 

.

 

 

 

 

 

 

 

1

 

 

 

 

m

 

43

(3.24).

Предположим, что

измеренное

значение

 

вектора

Y удовлетворяет

условиям (3.17), тогда

отыскание

 

 

 

ˆ

 

 

 

 

 

решению системы

оценки X сводится к

уравнений (3.20), в которой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H тH =

 

m

 

ti

 

,

H тY =

 

yi

 

,

 

 

 

 

 

 

 

 

 

 

t

i

t

2

 

 

 

 

t

y

 

 

 

 

 

 

 

 

i

 

 

 

 

i

i

 

 

 

где суммирование ведется от 1 до m. По правилу вычисления обратных матриц находим Q −1 в выражении (3.21) для случая (3.22):

 

 

 

t 2

t

i

 

 

 

 

 

 

 

i

 

 

 

 

 

Q−1 = (H тH )−1 =

 

 

ti

m

 

 

 

,

(3.25)

 

 

 

 

 

det (H тH )

 

 

 

 

 

 

 

 

 

 

 

Q = det (H тH ) = mti2 (ti )2.

Таким образом, в соответствии с (3.20)

 

ˆ

1

 

2

 

 

ˆ

S0

 

yi ti

ti ti yi

 

X =

υˆ

=

mti2 (ti )2

 

mti yi ti yi

.

 

 

 

 

 

Дисперсии погрешностей оценок определяются диагональными элементами ковариационной матрицы (3.21). После подстановки (3.25) в (3.21) получим

ˆ

 

σ2 ti2

 

 

 

D(υˆ ) =

 

σ2 m

 

 

D(S0 ) =

mti2 (ti )2

 

;

 

 

.

 

 

 

 

 

 

mti2 (ti )2

 

 

Можно показать, что

ˆ

0 )

=

lim D(υˆ ) = 0 ,

т. е. оценки

ˆ

и υˆ

lim D(S

S0

 

 

m→∞

 

 

 

m→∞

 

 

 

 

состоятельны на рассматриваемой последовательности ym .

Вместе с тем, из-за неучтенного при построении алгоритма фильтрации математического ожидания M(Z) ошибки измерений могут возникнуть смещенность и несостоятельность вырабатываемых оценок. Погрешность оценок будет также увеличиваться при наличии ускорений на отдельных участках пути, т. е. при отклонении реального движения от линейной модели

При постоянном на некотором отрезке времени ускорении w

44

математическое ожидание ошибки составит M (Z ) = wt 22 , как и в случае

прогнозирования, рассмотренного в конце 3.1.

3.4. Фильтр Калмана и интегрированные системы

Рассмотренный метод наименьших квадратов и некоторые другие методы фильтрации предусматривают совместную обработку всего массива информации, заключенной в векторе Y . Это, как правило, приводит к большому объему трудоемких вычислений. Во многих практических задачах составляющие вектора измерений поступают последовательно во времени, так что оказывается полезным находить текущее значение оптимальной оценки

вектора состояния ˆ по имеющейся на данный момент измерительной

X

информации и последовательно уточнять его по мере поступления новых результатов. Тогда алгоритм оценивания осуществляется с помощью рекуррентных алгоритмов вида

ˆ

ˆ

,Yi ) .

X i = Ф( X i −1

Кроме того, до сих пор рассматривались задачи так называемого безынерционного оценивания, в которых не учитывали какие-либо временные изменения измеряемых величин и оцениваемых параметров. Рассмотрим теперь задачу оценивания изменяющегося во времени случайным образом вектора состояния X (t) . Напомним, что n-мерным случайным процессом называется такая функция времени X(t), которая при любом фиксированном значении времени является n-мерной случайной величиной.

Будем считать, что математическая модель исследуемой системы непрерывна и линейна, т. е. дифференциальные уравнения, описывающие движение системы, могут быть представлены в виде системы однородных уравнений первого порядка

dxi (t)

 

n

 

=

aij (t)x j (t),

i = 1, 2,..., n

dt

 

j =1

 

 

 

 

или в векторно-матричной форме

45

X& = AX ,

где А – матрица состояния с размером n × n.

Если на систему воздействуют r (r <= n) возмущений U1,U 2 ,...,U r , то состояние системы определяется уравнениями

 

dxi (t)

 

n

 

n

 

 

=

aij (t)x j (t) +

bik (t)U k (t) .

(3.26)

 

dt

 

 

j =1

 

j =1

 

 

 

 

 

 

Уравнения (3.16) и (3.26) образуют полную модель состояния и

измерений в векторно-матричной форме

 

 

 

&

 

 

+ B(t)U

(t);

 

 

X (t) = AX (t)

 

 

 

 

 

 

 

(3.27)

 

Y (t) = H (t) X (t) + Z (t).

 

Структурная

схема,

описывающая

систему (3.27),

представлена на

рис. 3.1. Основой

схемы

является

блок

из

n интеграторов, охваченных

U(t)

 

 

 

&

 

 

 

X(t)

 

 

Y(t)

 

 

 

 

 

 

 

B(t)

 

 

X (t )

 

 

Н(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

Z(t)

 

 

 

 

 

 

 

 

 

 

 

 

обратными связями.

 

 

 

 

 

A(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рисунок 3.1

 

 

 

Имея математическую модель системы (3.27) с известными параметрами

A, B, H и начальными значениями X (t0 ) ,

 

 

 

ˆ

можно получить оценку X (t) , если

подать сигнал возмущений U(t) на вход компьютерной модели. В задаче камановской фильтрации обычно предполагается, что возмущения U(t) и

погрешности измерений представляют собой некоррелированные друг с другом случайные процессы типа “белого” шума с нулевыми математическими ожиданиями

M [U (t)] = 0; M [V (t)] = 0

(3.28)

и корреляционными матрицами

46

M [U (t) U

т

 

 

 

 

(t)] = Q(t) δ(1 − τ);

 

 

т

 

 

(3.29)

M [V (t) V

 

 

 

 

(t)] = R(t) δ(1 − τ).

 

Матрица Q(t), симметричная неотрицательно-определенная

с размером

[r × r], и матрица R(t), симметричная положительно-определенная с размером

[m × m], являются матрицами интенсивностей “белых” шумов. В компьютере соответствующие сигналы генерируются с помощью формирующих фильтров.

Рассматриваемый в технике широкий класс случайных процессов, в частности процессов, характеризующих погрешности инерциальных приборов, может быть представлен с помощью корреляционных функций

1)K x (τ)

2)K x (τ)

3)K x (τ)

2

− α |τ|

 

 

 

= σ x e

 

;

 

 

= σ 2x e − α |τ| cos λτ;

 

 

 

(3.30)

 

 

 

 

 

= σ 2x e

− α |τ| (cos λτ + (α λ )sin λ | τ |).

 

 

Корреляционным функциям (3.30) соответствуют спектральные плотности процесса

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) S (ω) =

 

ασ x

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

π(ω2

+ α 2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α(ω

2

+ α

2

 

 

2

 

2

 

 

 

 

 

 

2) S (ω) =

 

 

 

 

 

 

+ λ

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

;

(3.31)

 

π[ω

4

+

2(α

2

 

2

2

+

2

2

)

2

 

 

 

 

 

 

− λ

 

 

+ λ

 

]

 

 

 

 

 

 

2α(ω2 + α 2 2

 

 

 

 

 

 

 

3) S (ω) =

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

.

 

 

π[ω4 + 2(α 2 − λ2 2 + (α 2

+ λ2 )2

 

 

 

 

]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Связь между корреляционными функциями (3.30) и спектральными плотностями (3.31) устанавливается с помощью преобразования Фурье

S (ω ) = π1 K x ( τ) e jωτ d τ;

K x ( τ ) = 2 S (ω ) e jωτ d ω.

Формирующие фильтры представляют собой устройства, при подаче на вход которых случайного процесса типа “белого” шума на выходе получают случайный процесс с заданной корреляционной функцией. Уравнения

47

фильтров, соответствующих корреляционным функциям 1) и 3) в (3.30), имеют,

соответственно, вид

 

&

 

 

w,

(3.32)

 

x + α x = σ x

&&

&

2

 

 

 

 

 

x = 2

ν σ x α w(t ),

(3.32а)

x

+ 2α x + ν

 

где ν 2 = α 2 + λ2 , w(t) – порождающий “белый” шум с единичной дисперсией и нулевым математическим ожиданием. Уравнениями вида (3.32), (3.32а)

дополняют математическую модель системы.

Вернемся к системе уравнений (3.27). Примем условие, что в первом из них в качестве возмущающих воздействий выступают “белые” шумы,

отвечающие условиям (3.28), (3.29). Из теории линейных дифференциальных уравнений известно, что решение такого уравнения может быть представлено в

виде

t

 

X (t) = Ф(t, t0 ) x(t0 ) + Ф(t, τ) B(τ) w(τ) dτ,

(3.33)

t0

 

где Ф(t, t0 ) – переходная (весовая) матрица системы, удовлетворяющая уравнению

d Ф(t,t0 ) = A(t) Ф(t,t0 ) d t

при начальном условии Ф(t0 , t0 ) = E .

Аналитически найти решение (3.33) достаточно сложно, поэтому для его получения применяют численные методы или принимают ряд допущений,

приводящих к некоторым упрощениям. Если

предположить,

что матрица

А = const на интервале времени

t, то

 

 

 

 

 

 

 

 

 

A(t t0 )

 

Ak (t t0 )

k

 

Ф(t, t0 ) = e

=

 

.

(3.34)

 

 

k!

 

 

 

 

 

 

k =0

 

 

 

 

 

 

 

 

 

 

 

 

Экспоненциальное решение

(3.34) на

интервале t = t2 t1

может быть

представлено в виде разложения

 

 

 

 

 

 

 

 

48

Ф(t

2

, t ) = E + A t + A

2

( t)

2

+ ... .

(3.35)

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

Если t мало по сравнению с постоянной времени системы, то можно ограничиться двумя или тремя первыми членами разложения (3.35).

Поскольку измерительная информация поступает, как правило, дискретно,

при практической реализации алгоритмов оптимальной обработки используются дискретные аналоги уравнений (3.27). Для этого переходят от непрерывных стохастических дифференциальных уравнений к конечно-

разностным:

X

k +1

= F X

 

+ G

w ,

 

 

k

k

 

k k

 

(3.36)

Yk = H k X k + Zk .

 

 

 

В (3.36) матрица Fk = F( t) является постоянной на данном интервале дискретности, поскольку матрицы А и В системы (3.27) постоянны или изменяются достаточно медленно. По аналогии с (3.34) и (3.35) для F( t)

запишем:

 

1

 

 

1

 

 

 

F ( t) = E + A t +

( A

t)2

+... =

( A

t)k =

F ( t).

(3.37)

 

 

2

 

 

k =0 k!

k =0

k

 

 

 

 

 

Матрица F( t) системы (3.37) называется переходной матрицей и аналогично матрице А (3.27) полностью отражает динамические свойства системы. Можно доказать, что случайные процессы X(t), удовлетворяющие первым уравнениям системы (3.27) и (3.36), являются марковскими.

Марковские процессы играют важную роль в теории фильтрации.

Напомним, что марковским случайным процессом называют такой процесс, для которого его значение x(tk ) в момент времени tk при фиксированном значении x(tk −1 ) зависит только от этого значения и не зависит от значений процесса в моменты времени t < tk −1 (т. е. не зависит от “истории” процесса). Это равносильно выполнению условия

f (xk , tk x1, x2 ,..., xk −1; t1, t2 ,..., tk −1) = f (xk , tk xk −1, tk −1).

49

Модель (3.36) называют дискретной линейной моделью с нормальной марковской последовательностью состояний. Марковость процесса позволяет построить итерационную процедуру нахождения решений (3.34) и (3.35),

последовательно переходя от t0 к t1 и т. д. до tk .

Получим основные соотношения калмановской фильтрации. Конечно-

разностное уравнение для ковариационной матрицы вектора состояния

 

P

= M [ X

k

X т]

 

 

 

 

 

 

X k

 

k

 

 

 

 

 

 

 

может быть получено непосредственно из первого уравнения (3.36) в виде

P

= F P F т + G

k

G

т

 

 

 

 

X k +1

k k k

 

 

 

k

 

 

 

 

при начальном условии PX 0 .

 

 

 

 

 

 

 

 

 

 

 

Задача оптимальной фильтрации состоит в том,

чтобы найти алгоритм

выработки оптимальной оценки вектора состояния системы

ˆ

X k на k-м шаге,

опираясь на последовательность

измерений

 

y , y

2

,..., y

k

= Y k . В теории

 

 

 

 

 

 

 

1

 

 

оптимального оценивания доказывается, что такой оптимальной оценкой по критерию минимума дисперсии погрешности оценки является условное математическое ожидание

ˆ

Y

k

].

X = M [ X k

 

Введем понятие прогноза вектора состояния. Получив оптимальную оценку на

(k–1)-м шаге (или предположив ее значение),

прогноз

~

значения

X k

оптимальной оценки на k-м шаге представим в виде

 

 

 

 

~

ˆ

 

= M [ X k Y

k −1

].

 

(3.38)

X k

= Fk X k

−1

 

 

Смысл выражения (3.38) заключается

в

том, что

переходная матрица Fk

описывает переход состояния системы от момента k – 1 до момента k. Среднее изменение вектора состояния под действием вектора возмущения в виде

“белого” шума с нулевым математическим ожиданием равно нулю. Таким образом, прогноз определяется как состояние, принимаемое системой в

50