Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Mathematics5.pdf
Скачиваний:
100
Добавлен:
17.03.2015
Размер:
1.16 Mб
Скачать

47

2.5 Оценки математического ожидания

Найдем сначала точечную оценку математического ожидания. Пусть исследуется некоторая случайная величина X , в результате испытаний получены значения этой величины x1 , x2 , …, xn . Рассмотрим попарно незави-

симые случайные величины X1 , X 2 , …, X n , распределения которых совпадают с распределением X и каждая X k определена соответствующим xk .

По условию

M ( X ) = M ( X1 ) = ... = M ( X n ) = a , D( X ) = D( X1 ) =... = D( X n ) =σ 2 .

По теореме Чебышева всякое значение случайной величины n1 ( X1 +... + X n )

с большой вероятностью близко к M ( X ) . Отсюда

 

 

 

 

 

M ( X )

1

(x + x

2

+... + x

n

) .

(1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

 

 

 

 

1 (x

 

 

 

 

 

 

 

 

 

 

 

Число

+ x

2

+... + x

n

) называется средней статистической. Оценка

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1) является точечной, она тем точнее, чем больше n . Однако какой-либо информации о количественной мере точности и о том, как эта мера зависит от n , формула (1) не дает.

Более глубокий подход к оценке математического ожидания состоит в следующем. В силу центральной предельной теоремы случайная величина

 

 

=

1

( X1 + X 2 +... + X n ) при больших n имеет нормальное распределение с

X

 

 

 

n

 

 

 

 

 

 

 

 

 

 

параметрами

 

 

σ 2

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

M ( X ) = M ( Xi ) = a , D( X ) =

D( Xi ) =

.

(2)

 

 

 

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

Можно доказать, что если X распределена нормально, то справедливо соотношение

 

 

 

 

 

 

δ

 

 

 

P(

 

X

a

 

<δ )= 2Ф

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D( X )

Обозначив число δσn = t (*), с учетом (2), получим

 

 

 

 

 

σ t

= 2Ф(t) .

X a

<

P

 

 

 

 

 

 

n

 

 

 

 

 

 

(3)

(4)

Получили, что вероятность того, что значение случайной величины X ,

т.е.

 

=

1

( X1 + X 2 +... + X n ) отличается от искомого значения M ( X ) = a

X

 

 

 

n

 

меньше, чем на δ , равна 2Ф(t) (Ф(t) – функция Лапласа).

48

Если параметр σ известен, то равенство (4) определяет интервал

(x δ ; x +δ ) , т.е. ( x σ t n ; x +σ t n ) , в котором с вероятностью p = 2Ф(t) заключено подлежащее оценке математическое ожидание величи-

ны X , M ( X ) = a .

В этом случае говорят об интервальной оценке математического ожи-

дания. Интервал (x δ ; x +δ ) называют доверительным интервалом (δ

произвольное число), а вероятность p = 2Ф(t) – доверительной вероятностью, соответствующей данному доверительному интервалу ( p иногда называют надежностью γ ).

Разумеется, чем больше взят доверительный интервал, тем больше доверительная вероятность. Увеличивая же число испытаний n можно увеличить доверительную вероятность p = 2Ф(t) , приблизив ее как угодно близко к 1 для любого (даже очень малого) интервала (x δ ; x +δ ) .

Из соотношений (4), (*) можно вычислить n по заданным σ , δ , p , т.е.

решить задачу о нахождении такого числа испытаний, чтобы данному доверительному интервалу соответствовала данная доверительная вероятность.

 

Пример 5.

 

 

X со

 

 

 

 

 

 

 

Случайная величина

средним квадратическим

отклонением

σ ( X ) = 2

испытывается 20 раз. Оценить ее математическое ожидание, если

результаты испытаний таковы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

102

 

100

101

103

97

99

100

98

96

93

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

 

12

13

14

15

16

17

18

19

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

100

 

103

101

102

104

100

101

103

101

99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение.

Вычислим точечную оценку математического ожидания этой величины

 

 

 

20

 

x =

 

1

xi =100,15 a .

 

 

 

 

20 i =1

 

Найдем теперь вероятность того, что математического ожидание a бу-

дет находиться в пределах 100,15 ± 0,5.

 

Имеем

 

 

 

 

 

x =100,15;

δ = 0,5 ;

n = 20 ; σ = 2 .

t = δ n

=

0,5 20

= 0,5 5 1,12 .

σ

 

 

2

 

p = 2Ф(t) = 2 Ф(1,12) = 2 0,3686 = 0,7372 .

49

Ответим еще на такой вопрос: каков должен быть интервал, чтобы искомое математическое ожидание находилось в нем с вероятностью 0,99 ?

Имеем

x =100,15;

δ = 0,5 ; n = 20 ; σ = 2 ;

p = 0,99 ; δ = ?

2 Ф(t) = 0,99

Ф(t) = 0,495

t = 2,58 .

δ = t σ

=

2t

 

=1,15 .

 

 

 

 

n

20

 

 

100,15 1,15 < a <100,15 +1,15 с вероятностью 0,99.

2.6 Оценки дисперсии

Для нахождения точечной оценки дисперсии можно вычислить среднее арифметическое квадратов отклонений значений xi от среднего статистиче-

ского x :

 

 

 

1

n

 

 

 

=

(xi x)2 .

(5)

D

 

 

 

n i =1

 

На первый взгляд при больших приближением неизвестной дисперсии что число

n это число должно быть хорошим величины X . Однако оказывается,

 

 

 

n

 

 

 

1

n

 

 

 

* =

 

=

(xi x)2

(6)

D

D

 

n 1

 

 

 

 

 

 

n 1 i =1

 

дает лучшее приближение неизвестной дисперсии (хотя при больших n D и

D * мало отличаются).

Можно доказать, что математическое ожидание случайной величины

1 n ( Xi X )2 равно D( X ) (в предположении, что величины X k незави- n 1 i =1

симы и одинаково распределены). Если же вычислить математическое ожи-

 

1

n

n 1

 

дание случайной величины

( Xi

 

)2 , то получится

D( X ) . Указан-

X

 

 

 

n i =1

n

ные факты и являются основными аргументами в пользу того, чтобы считать оценку дисперсии (6) более удачной.

Рассматривают также интервальную оценку дисперсии, указывая для каждого интервала D ±δ вероятность P(δ ) , с которой искомая дисперсия

принадлежит этому интервалу. Обычно удобнее оценивать не саму дисперсию, а среднее квадратическое отклонение:

P( σ σ * <δ )= γ , σ * = D * ,

σ * δ <σ <σ * +δ ,

50

σ * 1 σδ* <σ <σ * 1 + σδ* .

Положив σδ* = q , получим оценку

σ * (1 q) <σ <σ * (1 + q) .

Значение q определяется из довольно сложного интегрального уравнения. На практике для отыскания значения q по данным значениям n и γ пользуются таблицами.

Заметим, что в задаче об интервальной оценке математического ожидания в случае неизвестной величины σ допустимо взять в качестве σ число

D * , где D * – точечная оценка дисперсии, выражаемая формулой (6).

2.7 Общие замечания об оценке параметров статистического распределения

Рассмотрим кратко общий вопрос об оценке параметров статистического распределения. Оценкой какого-либо параметра распределения по опытным данным является значение некоторой функции ϕ( X1, X 2 , ..., X n ) от

результатов испытаний x1 , x2 , …, xn . Для того, чтобы эта оценка была разумной (приемлемой), функция ϕ должна обладать некоторыми свойствами,

аименно эффективностью, состоятельностью и несмещенностью.

1.Оценка ϕ параметра a называется состоятельной, если

lim P( a ϕ < ε )=1.

n→∞

2. Оценка ϕ параметра a называется несмещенной, если M (ϕ) = a . 3. Оценка ϕ эффективна, если D(ϕ) минимальна.

Замечание. Оценка (1) состоятельна и несмещена. Она также эффективна для нормально распределенной случайной величины X .

Оценки (5) и (6) состоятельны, но не являются эффективными.

(5)также не является несмещенной в отличие от (6).

2.8Оценка параметров статистического распределения

сточки зрения генеральной совокупности и выборки

Решение задачи об оценке математического ожидания и дисперсии можно сформулировать, используя понятия генеральной совокупности и выборки.

Пусть дано большое количество N элементов, каждый из которых характеризуется некоторым числом xi , i =1, N . Как известно, такое множество

51

называют генеральной совокупностью ( N – объем генеральной совокупности).

 

1

N

Число xГ =

xi называется средней генеральной, а число

 

 

N i =1

DГ = 1 N (xi xГ )2 генеральной дисперсией.

N i =1

Фактическое вычисление xГ и DГ часто оказывается невозможным

вследствие того, что объем генеральной совокупности очень велик. Тогда из генеральной совокупности делают сравнительно небольшую по объему n < N выборку. Выборка производится случайным образом, т.е. для каждого элемента генеральной совокупности вероятность попасть в выборку равна

N1 , так что все элементы имеют равные вероятности и последовательность

испытаний независима.

Таким образом, возникает задача об оценке параметров xГ и DГ по

выборочным данным. Она является частным случаем описанной выше задачи об оценке параметров распределения по результатам испытаний: достаточно рассматривать испытание как выбор одного элемента из генеральной сово-

купности. Обозначим элементы выборки через xВ ,

x

В , …,

xВ . Тогда имеем

оценки:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

2

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xiВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xГ

i =1

 

= xВ ,

 

 

 

 

 

 

 

(7)

xВ – средняя выборочная;

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xiВ xВ )2

 

 

В* ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DГ

 

i =1

 

 

=

 

 

 

 

 

 

 

 

(8)

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

В* – выборочная дисперсия;

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(

 

xВ xГ

 

 

<δ )= 2Ф(t),

 

δ =

 

σ t

,

 

 

 

(9)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σВ* (1 q) <σГ <σВ* (1 + q) ,

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σВ* =

 

 

В*

( q находят по заданным значениям n и γ

– надежности).

 

D

 

 

 

 

 

Пример 6.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из генеральной совокупности извлечена выборка объема n =12 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

0,5

0,4

0,2

 

0

 

0,2

 

0,6

0,8

 

 

 

1

 

 

1,2

1,5

Σ

 

 

ni

1

2

1

 

1

 

 

 

 

1

 

1

1

 

 

 

 

1

 

 

2

1

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]