Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика

.pdf
Скачиваний:
10
Добавлен:
30.05.2015
Размер:
313.16 Кб
Скачать

 

1

n

s

1

k

s

µˆs =

 

(xi x) =

 

(xi x) ni .

n

n

 

i=1

 

i=1

 

Выборочной квантилью порядка

p называется абсцисса xp точки,

лежащей на кумулятивной кривой и имеющей ординату p .

Оценкой моды унимодального (одновершинного) распределения является элемент выборки, с наибольшей частотой.

Для группированной выборки, в том случае, когда интервал от минимального до максимального значения разбивается на

подынтервалы равной

длины

, оценка

моды вычисляется по

формуле:

 

 

 

 

 

~

 

nd nd 1

 

 

 

 

 

 

 

dX

 

 

,

= xd + ∆

 

 

 

 

 

2nd nd 1 nd +1

 

где

 

 

 

 

 

xd нижняя граница интервала,

содержащего наибольшее количество

наблюдений;

nd количество элементов выборки, попавших в этот подынтервал; nd 1, nd +1 количество элементов выборки в соседних подынтервалах.

ˆ

Оценкой медианы hX называется число, которое делит вариационный ряд на две части, содержащие равное количество наблюдений.

Если количество элементов нечетное, то есть n = 2k +1 , то

ˆX = k+1 . h x

Если количество элементов четное, то есть n = 2k , то

ˆ

=

1

(xk + xk+1 ).

hX

2

 

 

 

13

2.5 Распределения статистик

1. Нормальное распределение

Говорят, что случайная величина имеет нормальное распределение или распределение Гаусса, если для x (−∞,+∞) её плотность

fX (x)имеет вид:

 

fX (x)

 

 

1

 

 

 

 

 

 

(x a)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

σ

 

2π

exp

 

2σ

2

 

.

 

 

 

X ~ N(a,σ ).

 

 

 

 

 

 

 

 

 

 

 

 

Обозначают:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функция распределения имеет вид:

 

 

 

 

 

 

 

 

 

(t a)2

 

 

FX (x)= P(X < x)=

 

 

1

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

2π

 

 

 

exp

2σ

2

dt .

 

 

 

 

 

 

 

 

 

−∞

 

 

 

 

 

Основные числовые характеристики:

 

 

 

 

 

 

 

 

 

 

 

 

MX = a ,

DX =σ 2 ,

 

 

 

=σ СКО.

 

 

 

DX

Квантили up

= −u1p .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стандартное нормальное распределение:

Если a = 0 , σ =1, то говорят, что случайная величина X ~ N(0,1) имеет стандартное нормальное распределение.

Если Y = a +σX , где X ~ N(0,1), то Y ~ N(a,σ).

2. χ2 распределение

Пусть имеется совокупность k совместно независимых стандартных нормальных величин

Ui ~ N(0,1), i =1, k .

Величина

χ2 (k)=U12 +U22 +... +Uk2

имеет χ2 распределение с k степенями свободы и плотностью распределения

14

 

 

 

 

 

 

 

k

 

 

k

 

x

f

 

 

(x)=

(1/ 2)2

 

x

1e

2

(k )

 

2

2

,

k

 

 

 

χ

 

 

 

 

 

 

 

 

 

 

 

Γ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

где Γ(...)гамма-функция,

+∞

Γ(z)= t z1et dt .

0

Основные числовые характеристики:

Mχ2 (k)= k , Dχ2 (k)= 2k .

Для данного распределения справедливо

χ2 (k1 )+ χ2 (k2 )= χ2 (k1 + k2 ),

χ2 (k)~ U (k,2k)

3. Распределение Стьюдента

 

 

 

 

 

 

 

 

 

 

 

Пусть имеется стандартная

нормальная величина U и величина

χ2 (k), имеющая распределение χ2

с k

степенями свободы.

Тогда величина t(k)=

 

 

 

 

U

 

 

 

 

имеет распределение Стьюдента с k

 

 

 

 

 

 

 

 

 

 

 

 

χ2 (k) k

степенями свободы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Плотность распределения Стьюдента

 

 

 

 

 

 

k +1

 

 

 

 

 

 

k+1

 

 

 

 

Γ

 

 

 

 

 

 

x2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(x, k)=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, −∞ < x < +∞

k

 

 

 

 

 

1+

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ

 

πk

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Основные числовые характеристики:

Mt(k)= 0 , Dt(k)= k k 2 .

Квантили tp = −t1p .

Для данного распределения при числе степеней свободы k > 30 справедливо

t(k)~ U (0,1)

4. Распределение Фишера

15

Пусть имеется две случайные величины

χ

2 (k

)

и

χ2 (k

2

),

имеющие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

χ2 распределение с числом степеней свободы k

и k

2

соответственно.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

Тогда случайная величина

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(k1, k2 )

 

 

χ2 (k ) k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= χ

2 (k2 ) k2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

имеет распределение Фишера с числом степеней свободы k1

и k2 .

Плотность распределения Фишера

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 0;

 

 

 

 

 

 

 

 

 

k

 

+ k

2

 

 

 

 

 

 

 

 

k1

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

f

F

(x; k , k

2

)=

 

 

 

 

 

 

k1

 

 

 

 

 

 

 

 

 

 

 

 

 

, x > 0.

 

 

 

 

1

 

k

k

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k1+k2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Γ

1

 

Γ

 

 

 

 

 

 

2

 

 

 

 

 

 

 

k1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1+

k

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Математическое ожидание MF =

 

 

k2

 

 

,

 

k2 > 2 .

 

 

 

 

 

 

 

k2 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Квантили F1p (k1, k2 )=

 

 

 

 

 

 

1

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fp (k2 , k1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Между этими распределениями существует следующая связь:

χ2 (1)=U 2 ,

t2 (k)= F(1, k), F(k,)= χ2k(k) .

2.6 Основные статистики и их распределения

Рассмотрим теперь, какие статистики имеют какие распределения. Пусть x1, x2 ,..., xn выборка, полученная при наблюдении за случайной величиной X , имеющей нормальное распределение с

параметрами mX и σ 2 .

16

1. Выборочное среднее x = 1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

имеет нормальное распределение с

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

параметрами

mX и

σ 2

, так как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

Mx = M

 

Xi

 

=

MXi =

 

nmX = mX ,

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

n

i=1

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

1

 

σ

2

 

 

 

 

 

 

Dx = D

Xi

 

=

 

 

DXi =

nσ 2 =

.

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

n

i=1

 

 

 

 

 

 

n

i=1

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

 

 

 

 

 

σ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x =

 

xi = N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

mX ,

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

2. Выборочная дисперсия при известном математическом ожидании

2

=

1

n

 

 

2

являясь суммой квадратов отклонений, имеющих

S0

n

(xi

mX )

,

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нормальное

распределение,

 

имеет

распределение

 

χ2 с

числом

степеней свободы n .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

=

1

 

n

 

 

 

 

 

 

 

 

 

2

=

σ 2

χ

2

(n).

 

 

 

 

 

 

 

 

 

 

S0

 

n

(xi mX )

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.

Выборочная дисперсия при неизвестном математическом ожидании

 

 

 

1

n

(xi x)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

=

 

 

 

имеет

 

 

распределение

 

 

χ2 с числом

степеней

 

 

 

 

 

 

 

 

 

 

n 1 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

свободы n 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

1

 

n

 

 

 

 

 

 

 

 

2

 

 

σ 2

 

 

2

(n 1).

 

 

 

 

 

 

 

 

S

 

=

 

 

 

 

(xi x) =

 

 

 

 

 

χ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

3. Статистика Y =

x mX

 

представляет собой центрированную

 

 

 

σ n

 

 

(вычитается мат ожидание) нормированную (делится на СКО)

величину,

следовательно,

имеет

стандартное

нормальное

распределение.

 

 

 

 

 

 

 

 

 

 

 

 

Y =

 

x mX

 

= N(0,1).

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

n

 

 

4. Статистика Y =

x mX

 

представляет собой

отношение

 

 

 

 

 

 

S

 

 

n

 

 

 

 

 

 

нормальной

величины

к

корню

величины, имеющей χ2

распределение, следовательно, имеет распределение Стьюдента с числом степеней свободы k = n 1.

Y= xSmnX = t(n 1) .

5.Пусть имеется две независимые выборки объема n1 и n2 соответственно из нормальных генеральных совокупностей с дисперсиями σ12 и σ22 . Найденные по этим выборкам выборочные

дисперсии S 2

и S

2 .

Тогда

статистика F =

S 2

σ 2

имеет

1

1

S22

σ22

1

 

2

 

 

 

 

 

 

 

распределение

Фишера

 

с

числом

степеней свободы

k1 = n1 1 и

k2 = n2 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

σ 2

 

 

 

 

 

 

 

F =

1

1

= F(n 1,n

 

1).

 

 

 

 

S22

 

 

 

 

 

 

 

 

σ22

1

2

 

 

 

 

18

2.7 Метод максимального правдоподобия

Метод максимального правдоподобия, предложенный Фишером, является одним из наиболее распространенных методов нахождения оценок неизвестных параметров.

При построении оценок по этому методу, в качестве оценок параметров θ1,θ2 ,...,θk принимают значения θˆ1,θˆ2 ,...,θˆk , доставляющие максимум функции правдоподобия.

Пусть имеется выборка x1, x2 ,..., xn . Закон распределения выборки при конкретных значениях переменных является функцией неизвестных параметров θ1,θ2 ,...,θk .

Функцией правдоподобия дискретной случайной величины X в

случае независимых наблюдений называют функцию аргументов

θ1,θ2 ,...,θk

L(x1, x2 ,..., xn ;θ1,θ2 ,...,θk )= P{X1 = x1, X 2 = x2 ,..., X n = xn }= = P{X1 = x1} P{X 2 = x2} ... P{X n = xn }.

Функцией правдоподобия непрерывной случайной величины X в

случае независимых наблюдений называют функцию аргументов

θ1,θ2 ,...,θk

L(x1, x2 ,..., xn ;θ1,θ2 ,...,θk )=

= f (x1;θ1,θ2 ,...,θk )f (x2 ;θ1,θ2 ,...,θk )... f (xn ;θ1,θ2 ,...,θk ).

Иногда для удобства рассматривают не саму функцию правдоподобия, а ее логарифм, то есть ln L(x1, x2 ,..., xn ;θ1,θ2 ,...,θk ).

Для нахождения МП-оценок необходимо найти те значения параметров θ1,θ2 ,...,θk , которые дают максимум функции правдоподобия.

19

Для этого находят частные производные функции правдоподобия по каждому параметру и приравнивают их к нулю

L = 0, i =1, k .

θi

Тем самым находят критические точки θ1* ,θ2* ,...,θk* . Далее, находят вторые производные. Если значение второй производной в критической точке отрицательное, то точка θ* = (θ1* ,θ2* ,...,θk* )точка

максимума. И МП-оценки θˆ =θ* .

Оценки, получаемые по ММП, имеют асимптотически нормальное распределение и для некоторых распределений генеральной совокупности имеют минимальную дисперсию.

Пример. Построить МП-оценку параметра λ распределения Пуассона. Пусть имеется выборка x1, x2 ,..., xn наблюдений за случайной величиной X , имеющей распределения Пуассона с параметром λ . Функция правдоподобия является функцией параметра λ и имеет вид

L(x1, x2 ,..., xn ;λ)= P{X1 = x1} P{X 2 = x2 } ... P{X n = xn }=

n

n

λ

xi

 

xi

 

 

 

 

 

 

 

λ

 

 

 

= P{Xi = xi }= x

! eλ

=

 

 

 

eλn .

x !x

!...x

!

i=1

i=1

 

i

 

 

1 2

n

 

 

Отбрасывая не зависящую от параметра λ константу, получаем:

L(λ)= λxi eλn .

Логарифмируем

ln L(λ)= xi ln λ λn .

Найдем производную и приравняем ее к нулю

20

 

d ln L(λ)

=

xi

n

= 0 .

 

 

 

 

dλ

λ

 

 

Из последнего соотношения выразим λ

 

 

 

 

1

 

n

 

 

 

λˆ =

xi = x .

 

 

 

 

 

 

n

i=1

 

 

Видно, что при этом значении λ вторая производная отрицательная

 

d 2 ln L(λ)

 

= −

2xi

 

2

 

dλ

 

 

λ

 

 

 

 

 

 

 

1

n

Следовательно, найденное значение

λˆ =

xi = x точка минимума

n

 

 

 

 

 

 

i=1

функции правдоподобия.

Как видно из полученного соотношения, оценка параметра распределения Пуассона совпадает с выборочным средним. Это логично, так как для данного распределения MX = λ .

2.8Интервальные оценки

Вотличие от точечных оценок, выражающихся одним числом, интервальные оценки определяются двумя числами, границами интервала, между которыми с заданной достоверностью лежит истинное значение параметра.

Доверительным интервалом для параметра θ называется

интервал (θ1;θ2 ), содержащий истинное значение параметра с заданной вероятностью p =1α , то есть

P(θ1 <θ <θ2 )=1α .

Здесь

21

p =1α называется доверительной вероятностью (надежностью) оценки; α уровень значимости.

Чаще задают надежность, равную 0.95, 0.99 и т.д., то есть при уровне значимости 0.05, 0.01 и т.д.

Алгоритм построения доверительного интервала.

Пусть наблюдается некоторая случайная величина X с функцией распределения FX (x). Необходимо по наблюдениям x1, x2 ,..., xn за случайной величиной построить доверительный интервал для неизвестного параметра θ .

Сначала строится точечная оценка данного параметра θˆ . Далее выбирается статистика, зависящая только от оцениваемого параметра

θи его точечной оценки θˆ . Пусть это статистика Y (θ,θˆ),

распределение которой известно.

 

 

 

Если распределение Y известно, то можно найти такие y1

и y2 ,

что с заданной вероятностью

p =1α при фиксированном уровне

значимости α будет выполняться неравенство

 

P{y <Y

(θ,θˆ)< y

2

}= p =1α .

 

1

 

 

 

Решая неравенство в скобках относительно неизвестного

параметра θ , находим границы доверительного интервала θ1

и θ2 ,

такие, что

 

 

 

 

P{θ1 <θ <θ2}= p =1α .

 

Пример. Построение доверительного интервала для математического ожидания нормального распределения при известной дисперсии.

22