Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МОИИ конспект

.pdf
Скачиваний:
162
Добавлен:
28.12.2014
Размер:
631.87 Кб
Скачать

2. Несмещенность

Оценка θˆ n называется несмещенной, если при каждом фиксированном n

ее математическое ожидание равно θ:

M θˆ n = θ.

3. Эффективность

Эффективной оценкой называется такая оценка, дисперсия которой имеет

минимальное значение по сравнению с дисперсией других возможных оценок.

Примеры 2.4. Есть выборка x1,K, xn

для генеральной совокупности.

Если распределение случайной

величины нормальное, то оценка

 

 

 

1

n

 

 

 

=

xi будет состоятельной, несмещенной

математического ожидания mˆ X = X

n

 

 

 

=

 

 

 

 

 

i 1

 

и эффективной.

Если оценка дисперсии определяется как

ˆ

 

1

n

 

 

 

 

 

2

 

DX

=

 

(xi X )

,

n

 

 

=

 

 

 

 

 

 

i 1

 

 

 

то такая оценка состоятельной, но смещенной, так как:

 

1

n

 

 

 

 

 

n − 1

(xi

X )2

=

M

 

 

 

DX .

 

 

n i=1

 

 

 

 

 

n

Если оценка дисперсии определяется как

ˆ

 

1

 

n

 

 

 

 

=

 

(xi X )

2

,

DX

n −1

 

 

 

=

 

 

 

 

 

 

 

 

i 1

 

 

то такая оценка состоятельной, несмещенной и эффективной.

Для приведенной выборки оценка математического ожидания дает оценку результата измерения, а оценка дисперсии – оценку точности измерений,

методики.

Оценка математического ожидания

Пусть имеется случайная величина Х с неизвестным математическим ожиданием mX . Над величиной Х произведено N независимых экспериментов, в

21

результате которых была получена

совокупность N численных

результатов

x1, x2 ,K, xn . В качестве оценки

математического ожидания

естественно

предложить среднее арифметическое

наблюдаемых значений:

 

mˆ X = X = 1 N xi . N i=1

Оценка математического ожидания является несмещенной.

Найдем интервальную оценку математического ожидания. Интервальной

называют оценку, которая определяется двумя числами – концами отрезка.

Любая оценка, полученная по выборке, является случайной оценкой

(величиной), то есть сделав оценку, мы можем утверждать, что оцениваемый параметр лежит в определенном интервале:

x1 x x2 .

Для исключения неопределенности интервал берут симметричным.

Пусть закон распределения случайной величины нормальный. Если генеральная дисперсия известна (известно СКО σX ), то для i-ого измерения имеем квантиль u :

u = xi mx ;

σX

u u1−q / 2 ,

где q = 1 − p – уровень значимости (вероятность того, что параметр не попадет в интервал).

Отсюда математическое ожидание лежит в интервале

xi − σX u1−q / 2 mx xi + σX u1−q / 2 .

При использовании оценки математического ожидания mˆ X . вместо СКО

σX берем:

σX = σX ,

N

mˆ X − σX u1−q /2 mx mˆ X + σX u1−q/2 .

Если генеральная дисперсия неизвестна, то имеем оценку дисперсии:

22

 

 

1

N

 

 

 

 

ˆ

 

(xi

 

 

 

 

 

2

 

DX

=

 

X )

.

 

 

N − 1 i=1

 

 

 

 

В этом случае пользуются распределением и статистикой Стьюдента:

 

 

 

 

 

 

 

t =

X mX

 

 

 

 

N ,

 

 

σˆ X

 

 

 

 

 

 

 

где mX оцениваемое математическое ожидание;

X выборочное среднее для данного объема выборки случайных чисел с произвольным нормальным законом распределения;

σˆ X исправленное выборочное среднеквадратическое отклонение для данной выборки.

Статистика является центральной и распределена по закону Стьюдента с

N − 1степенями свободы. Плотность распределения Стьюдента есть четная функция, поэтому при определении квантилей можно положить:

tq (N − 1) = −t1−q (N − 1)

где t1−q квантиль t-распределения (распределения Стьюдента).

Тогда интервальная оценка математического ожидания будет

mˆ

 

σˆ

X

 

t

m

 

mˆ

 

+

σˆ

X

 

t

.

X

 

 

 

x

X

 

 

 

 

 

 

N

 

1−q/2

 

 

 

 

N

 

1−q /2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.3. Вариации Аллана

В наиболее распространенном приеме статистической обработки данных,

позволяющим оценить погрешность измеряемой величины k 0 вводятся ее среднее значение k , дисперсия σ2 и дисперсия среднего выборочного

относительно математического ожидания σ2 (k ) . Для N измерений эти значения определяются как

 

 

 

 

1

N

 

 

 

 

=

ki ,

 

 

k

 

 

 

N

 

 

 

 

 

i=1

 

 

1

 

 

N

 

σ2 =

 

(ki

 

)2 ,

(2.25)

 

k

 

 

 

 

 

N − 1 i=1

 

σ2 (k ) = σ2 / N.

23

Первоначально метод вариации (дисперсии) Аллана разработан для статистической оценки погрешностей эталона частоты при наблюдениях на больших интервалах времени. Сущность метода вариации Аллана состоит в вычислении дисперсии не самих отклонений центрированного случайного процесса, как это делается при определении классической выборочной

дисперсии, а разницы соседних отклонений.

В работе последних лет стало практиковаться определение границ предельной чувствительности измерений, ограниченной шумами, с помощью метода дисперсии Аллана. Получаемые в экспериментах значения измеряемой величины разбиваются равные подгруппы и проводится анализ дисперсий каждой подгруппы, при этом количество подгрупп может варьироваться.

Пусть исходная последовательность состоит из N элементов yk, где k=0,1,…N-1. Последовательность разбивается на n подгрупп, где

n=1,2,3,…MN/2, и вычисляются для каждой подгруппы средние значения по аналогии с (2.25):

 

ynj + ynj +1 + K+ ynj + n −1

 

N

 

(2.26)

x j (n) =

 

,

j = 0,1,K,

 

 

−1

n

 

 

 

n

 

 

Если интервал выборки t, то временной диапазон в пределах усредненной последовательности длиной n является τ=n t. Физически параметр τ представляет собой интервал осреднения измеренных значений в группе размером n.

Для каждого n, последовательность xj(n) имеет N/n элементов, где j

проходит от 0 до N/n-1. При этом можно сформировать N/n-1 разностей xj+1(n)- xj(n) в диапазоне изменения j от 0 до N/n-2.

Вариация Аллана для каждой подгруппы длиной n определяется как:

 

1

N / n −2

 

 

σa2 (τ, N ) =

(x j +1

(n) − x j (n))

2

 

2(N / n −1)

 

 

j =0

 

 

 

 

 

 

Квадратный корень из дисперсии, то есть СКО Аллана,

логарифмическом масштабе от времени усреднения τ.

(2.27)

строится в

24

Пример 2.5.

Рассматривается последовательность измерений размером N=12. Тогда

n=1…6. Рассчитаем дисперсии Аллана для каждого n:

n=1, τ =

t:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x0 (1) = y0 , x2 (1) = y2 ,K, x11(1) = y11,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

1

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σa2 ( τ,12) =

 

 

 

 

(x j +1

(1) − x j (1))2 =

 

 

 

 

( y j +1 y j )2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 11 j =0

 

 

 

 

 

 

 

 

2 11 j =0

 

 

 

 

 

 

 

 

 

 

 

n = 2, τ = 2

t :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

0

(2) =

 

 

y0 + y1

, x (2) =

y2 + y3

,K, x

5

 

(2) =

y10 + y11

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

4

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

4

 

 

 

y2 j + 2

+ y2 j +3

 

 

y2 j

+ y2 j +1

 

 

 

σa2 (2 τ,12) =

 

 

(x j +1(2) − x j (2))2 =

 

 

 

(

 

)2 .

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5 j =0

 

 

 

 

 

 

 

 

 

 

 

5 j =0

2

 

 

 

2

 

 

 

 

 

n = 3, τ = 3

t :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

0

(3) =

 

y0 + y1 + y2

, x (3) =

y3 + y4 + y5

 

,K, x

3

(3) =

y9 + y10 + y11

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

1

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

y3 j +3

+ y3 j + 4 + y3 j +5

 

y3 j + y3 j +1 + y3 j + 2

 

σa2 (3 τ,12) =

 

 

(x j +1

(3) − x j (3))2 =

 

 

 

(

)2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 3 j =0

 

 

 

 

 

 

 

 

 

2 3 j =0

3

 

 

 

3

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n = 6, τ = 6

t :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

0

(6) =

y0 + y1 + y2 + y3 + y4 + y5 + y6

, x (6) =

y6 + y7 + y8 + y9 + y10 + y11 + y12

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2 (6 τ,12) =

1

 

 

(x (6) − x

 

(6))2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

2 1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

1

(

y6 + y7 + y8 + y9 + y10 + y11 + y12

y0 + y1 + y2 + y3 + y4 + y5 + y6

)2 .

 

 

 

 

 

 

2 3

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

Пример 2.6. Рассмотрим пример построения СКО Аллана от времени усреднения для волоконно-оптического гироскопа. Оценка вариации Аллана на сегодняшний день включена в спецификации на инерциальные измерители:

гироскопы и акселерометры.

Исходя из известных для волоконно-оптических гироскопов основных физических причин возникновения шумовых составляющих, используется аппроксимация следующим полиномом:

σ2 (τ) =

R

τ2 +

K 2

τ +

2B2 ln(2)

+

Е2

+

3Q2

,

(2.28)

 

 

π

τ

τ2

2

3

 

 

 

 

 

25

где Е − коэффициент случайного углового ухода (Angle Random Walk);

B − коэффициент нестабильности смещения нуля (Bias Instability);

R − коэффициент линейного изменения угловой скорости (Rate Ramp);

Q − коэффициент шума квантования (Quant Noise);

K − коэффициент случайного ухода угловой скорости (Rate Random Walk).

Случайный угловой уход. Эта компонента обусловлена спонтанным излучением фотонов, которое всегда присутствует в выходе источника и носит название квантовой границы. Другие частотные шумовые составляющие,

которые имеют время корреляции много меньше, чем период измерения, также могут вносить свой вклад в случайный угловой уход гироскопа. Однако большинство из этих источников можно устранить на стадии разработки. Все эти случайные составляющие характеризуются спектром белого шума в выходном сигнале ВОГ.

Нестабильность смещения нуля. Источник этого шума - электроника или другие компоненты, чувствительные к случайным мерцаниям (фликкер-шумам).

Из-за низкочастотной природы, они проявляются как флуктуации систематической погрешности.

Случайный уход угловой скорости. Этот случайный процесс не имеет определенного источника, возможно это предельный случай экспоненциально коррелированного шума с очень большим временем корреляции.

Представляется как прямая с наклоном +1/2 на двулогарифмическом графике σ(τ).

Линейное изменение (отклонение) угловой скорости. Для больших, но конечных временных интервалов это скорее детерминированная ошибка, чем случайный шум. Ее присутствие в данных может показывать очень медленное монотонное изменение выходной интенсивности ВОГ, сохраняющееся на длительном отрезке времени.

Кроме приведенных основных случайных составляющих (2.28) в ряде случаев приходится учитывать Марковский коррелированный шум с определенной амплитудой и временем корреляции и гармонические сигналы,

26

присутствующие в реализациях по различным причинам.

Шум квантования обусловлен цифровой природой выхода ВОГ.

На рис. 2.6 показана теоретическая зависимость СКО Аллана, приведенная в стандартах IEEE [2] для волоконно-оптического гироскопа.

σ(τ)

τ

Рисунок 2.6 – Зависимость СКО Аллана от времени усреднения Quant. Noise – шум квантования (наклон = –1)

Angle Random Walk – случайный дрейф угла (наклон = –1/2) Correlated Noise – коррелированный шум

Sinusoidal – синусоидальный шум

2.4. Проверка на нормальность закона распределения

Исследователь выдвигает на основе своего опыта и имеющейся у него дополнительной информации определенную гипотезу о виде теоретического распределения и вычисляет вероятность, характеризующую её приемлемость.

Если эта вероятность превосходит некоторую величину, называемую уровнем значимости, то считают, что гипотеза не противоречит экспериментальным данным и может быть принята. В противном случае гипотеза отвергается и следует либо выдвинуть новую гипотезу, либо пополнить статистический материал, либо сделать и то и другое.

Степень соответствия между выдвинутой гипотезой и статистическим материалом устанавливается с помощью критериев согласия.

В данной курсовой работе проверка выдвигаемой гипотезы производится по трем критериям согласия.

27

Проверка по критерию асимметрии и эксцесса (метод моментов)

Часто применяемыми числовыми характеристиками случайной величины

являются асимметрия и эксцесс. Асимметрия характеризует скошенность распределения вероятностей случайной величины. Для симметричных

распределений асимметрия равна нулю. Асимметрия называется

положительной, если мода, т.е. такое значение случайной величины, для которого в случае дискретного распределения вероятность, а в случае непрерывного распределения плотность вероятности имеют наибольшее значение, предшествует медиане, т.е. такому значению случайной величины,

при котором вероятность или плотность вероятности имеют значение 0.5.

Эксцесс характеризует крутизну распределения вероятностей случайной величины. Для нормального распределения эксцесс равен нулю. Если кривая плотности вероятности имеет более острую и высокую вершину, чем кривая нормального распределения, то эксцесс положителен, если более низкую и пологую – эксцесс отрицателен.

Для

каждой

j -ой выборки выборочная

асимметрия

ˆ

A и выборочный

ˆ

вычисляются по формулам:

 

 

 

 

 

 

 

эксцесс E

 

 

 

 

 

 

 

 

 

 

ˆ

 

=

mˆ 3, j

,

ˆ

 

=

mˆ 4, j

− 3 ,

 

 

 

 

A

j

σˆ 3j

E

j

σˆ 4j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где mˆ 3, j

и mˆ 4, j

-

оценки

третьего

и

четвертого

центрального моментов

распределения для

j–ой

выборки;

σˆ j

 

-

оценка

среднеквадратического

отклонения для j–ой выборки, вычисляемая по формуле, приведенной в п. 2.2.

В случае, когда значения случайной величины группируются вокруг

некоторого числа

d , называемого «ложным нулем», оценки третьего mˆ 3, j

и

четвертого mˆ 4, j

центрального

моментов распределения вычисляются

по

следующим формулам:

 

 

 

 

 

 

 

 

 

n

 

 

 

M k , j

=

1

j

(xi, j d j )k ,

 

 

n j

 

 

 

 

=

 

 

 

 

 

 

i 1

 

 

28

xmin

mˆ 3, j = M 3, j − 3 M 2, j M1, j + 2 M13, j ,

mˆ 4, j = M 4, j − 4 M 3, j M 1, j + 6 M 2, j M 12, j − 3 M 14, j .

В этом случае для расчетов целесообразно принять d j = xˆ j .

Дисперсия случайных величин

 

ˆ

 

 

ˆ

 

вычисляется по формулам:

A j

и E j

 

 

 

 

 

ˆ

=

 

 

 

6(n j − 1)

,

 

 

 

 

 

 

 

D A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

(n j

+ 1)(n j + 3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

=

 

24 n j

(n j − 2)(n j − 3)

 

.

 

DE

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n j + 1)

2 (n j + 3)(n j

+ 5)

 

 

 

 

 

 

 

 

 

 

 

 

 

Считается, что гипотеза о нормальном распределении случайной величины

xi может быть принята, если значения

ˆ

 

ˆ

 

 

 

 

 

A j и

 

E j удовлетворяют условиям:

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≤ 3

 

ˆ

 

 

 

,

 

ˆ

 

≤ 5

 

ˆ

.

 

 

 

 

 

 

 

 

 

 

A j

 

 

D A

j

 

E j

 

 

DE

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

Проверка по критерию хи-квадрат (критерий К. Пирсона)

Эмпирическое распределение заданной реализации сравнивается с

теоретическим нормальным распределением, причем исследуется полная реализация случайного процесса. Для ее получения необходимо последовательно объединить все пять выборок, содержащих наблюдения случайного процесса.

Если значения параметров теоретического распределения не известны, то

они заменяются оценками. Оценки математического ожидания xˆ и

среднеквадратического отклонения σˆ определяются по формулам,

приведенным в п. 2.2.

По результатам наблюдений строят вариационный ряд – располагают

результаты в порядке возрастания и выбирают минимальное и

максимальное xmax значения. Область изменения случайной величины между ними разбивают на k интервалов одинаковой ширины . Число интервалов определяется по формуле Стэрджесса:

29

k = int[1 + 3.322 ln n] ,

где int – обозначение операции округления до ближайшего целого; n - общее

число наблюдений случайной величины, содержащихся в полной реализации случайного процесса.

Ширина интервала определяется как:

= xmax xmin .

k

Интервалы

ограничены

значениями

xi и

xi+1 , где xi = xi

+ (i − 1) -

нижняя

граница

интервала;

xi+1 = xi + i

- верхняя граница интервала;

i = 1,2...k

- номер интервала. Заметим,

что

верхняя граница

последнего

интервала xk +1 = xn . По вариационному ряду определяют частоты ni . Частоты равны числу результатов, лежащих в каждом i-м интервале, т.е. меньших или равных его правой и больших левой границы. Нормированные по ширине

интервала относительные частоты ni (n ) служат оценкой среднего значения

плотности вероятностей на интервале. Для построения гистограммы распределения по оси абсцисс откладывают границы интервалов и на каждом

интервале строят прямоугольник высотой ni (n ) . По совокупности

столбиков оценивают форму изменения плотности вероятностей. В пределе,

при n → ∞ и

→ 0 , гистограмма превращается в плавную кривую.

 

Для каждого интервала находят теоретические вероятности pi

попадания

в него результатов наблюдения, которые вычисляется по формуле:

 

 

 

 

 

 

x

i+1

xˆ

 

 

 

x

i

xˆ

 

 

p

i

= Ф

0

 

 

 

Ф

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

x

 

t 2

 

Значения

функции Лапласа

Φ 0 (x) =

 

 

 

 

e

 

dt находятся

в табл.1.

 

 

 

 

2

 

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

Пользуясь таблицей значений функции Лапласа, необходимо учитывать, что функция Лапласа является нечетной функцией. При вычислении нужно считать,

что крайний левый интервал расширяется до − ∞ , крайний правый до + ∞ .

Далее вычисляется величина

30