Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2015_4488

.pdf
Скачиваний:
17
Добавлен:
11.03.2016
Размер:
842.4 Кб
Скачать

распределения известна, то вероятность попадания случайной величины x в интервал (x1 ... x2 ) в конкретном наблюдении равна

P{x1 x x2} P(x2 ) P(x1).

(3.2)

На практике чаще используют дифференциальную функцию распределения – плотность вероятности:

f (x) dP .

(3.3)

dx

 

Она имеет физическую размерность, обратную размерности величины x и также позволяет рассчитывать вероятность попадания слу-

чайной величины в интервал (x1 ... x2 ) :

x2

 

P{x1 x x2}

f (x) dx .

(3.4)

x1

 

 

Функция f (x) подчиняется условию нормировки: вероятность попадания в интервал всей области определения равна единице:

 

f (x) dx 1

 

 

(3.5)

(или 0)

(вдальнейшихформулах предполагается областьопределения ( , )).

Интегральными характеристиками распределения случайной величины является математическое ожидание или генеральное среднее

M{x}

 

 

x f (x)dx ,

(3.6)

первые моменты k-го порядка:

D{x} m2

 

[x M{x}]2 f (x)dx – дисперсия,

 

 

(3.7)

 

 

 

 

 

 

 

 

m3

 

[x M{x}]3 f (x)dx,

 

 

 

 

(3.8)

21

 

 

 

 

 

 

 

m4 [x M{x}]4 f (x)dx

 

 

 

 

и производные от них:

A{x}

m3

– асимметрия,

 

3/2

 

(m2 )

 

E{x} m4

3

– эксцесс.

 

m2

 

 

 

2

 

 

(3.9)

(3.10)

(3.11)

Дисперсия характеризует разброс случайной величины относительно ее математического ожидания. Асимметрия характеризует симметричность распределения относительно M{x} . Положительная

асимметрия указывает на отклонение распределения в сторону, большую M{x} . Эксцесс характеризует остроконечность или сглаженность

вершины плотности вероятности распределения. Кроме этого используются характеристики:

мода ( md ) – значение x , при котором f (x) имеет максимум;

медиана ( m ) – значение x , делящее площадь под распределением f (x) пополам.

Наиболее простым является равномерный закон распределения, при котором плотность вероятности постоянна:

f (x) f const .

При этом условие нормировки требует, чтобы область определения этой величины (a, b) была ограниченной так, чтобы f (b a) 1 . При

этом f b 1 a .

Наиболее распространенным в практике измерения физических величин является нормальный или гауссов закон распределения

f (x)

1

 

 

(x )2

 

(3.12)

 

exp

 

 

 

 

 

2

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

22

 

 

 

 

 

с параметрами и . Для этого закона:

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

(x )2

 

 

 

 

 

 

M{x}

 

 

 

 

x exp

 

 

 

 

 

 

 

2

 

dx ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

(x )2

 

 

 

 

D{x}

 

 

 

 

 

(x )2 exp

 

 

 

 

 

 

dx 2 ;

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

(x )

2

 

 

 

 

 

m

 

 

 

 

 

(x )3 exp

 

 

 

dx

0 ;

A{x} 0 ;

 

 

 

 

 

 

2

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

(x )

2

 

 

 

 

 

 

 

m

 

 

 

 

 

(x )4 exp

 

 

 

dx 3 2 ;

E{x} 0 ;

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

md ;

 

m .

 

 

 

 

График функции плотности вероятности гауссова распределения показан на рис. 3.1. Функция имеет максимум в точке x . Пара-

метр 2 характеризует разброс случайной величины вокруг математического ожидания , поэтому чем больше 2 , тем более растянута вдоль оси x функция f (x) . Так как эта функция подчиняется условию

нормировки (3.5), площадь под каждой из кривых одинакова и равна единице.

Другими самыми распространенными статистическими распределениями являются t-распределение Стьюдента и χ2-распределение Пирсона.

t-распределение Стьюдента имеет вид

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

x

2

 

 

 

 

 

2

 

 

 

 

f (x)

 

 

 

1

 

 

 

 

 

,

(3.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

где – параметр распределения, называемый числом степеней свободы;

23

(x ) e t t x 1 dt – гамма-функция.

0

График t-распределения Стьюдента при различных значениях параметра представлен на рис. 3.2.

0.4

f(x)

 

 

 

 

 

 

 

 

 

 

 

= 1

 

 

 

 

 

 

 

 

 

 

 

0.3

 

 

 

 

 

 

 

 

0.2

 

 

 

 

 

 

 

 

 

 

 

 

 

= 2

 

 

 

0.1

 

 

 

 

 

 

= 3

 

 

 

 

 

 

 

 

 

0.0

 

 

 

 

 

 

 

 

4

6

8

10

12

14

x

16

 

 

 

 

 

 

 

 

Рис. 3.1. Кривые плотности нормального распределения

 

 

для различных значений дисперсии 2

 

 

0.45

 

 

 

 

 

 

 

 

0.40

 

 

 

 

 

 

 

 

0.35

f(x)

 

 

= 10

 

 

 

0.30

 

 

= 5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 2

 

 

 

0.25

 

 

 

= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.20

 

 

 

 

 

 

 

 

0.15

 

 

 

 

 

 

 

 

0.10

 

 

 

 

 

 

 

 

0.05

 

 

 

 

 

 

 

 

0.00

-3

-2

-1

0

1

2

 

3

 

 

 

 

 

 

x

 

 

 

 

Рис. 3.2. Кривые плотности распределения Стьюдента

 

 

при различных значениях параметра

 

 

 

 

 

 

24

 

 

 

 

При

распределение Стьюдента переходит в нормальное с

параметрами = 0 и = 1.

 

 

 

 

 

 

 

Распределение Пирсона ( 2 ) имеет плотность вероятности:

 

 

f (x)

 

1

 

 

x

/2 1

 

x

;

x

2

0 ,

(3.14)

 

 

 

 

 

 

exp

 

 

 

2

/2

 

 

 

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где – параметр распределения (число степеней свободы) (рис. 3.3).

 

0.30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.25

 

= 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

0.20

 

 

 

= 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.15

 

 

 

 

 

= 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

2

 

 

 

4

6

8

10

12

 

14

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

Рис. 3.3. Кривые плотности распределения Пирсона

 

 

 

при различных значениях параметра

 

 

Распределения Стьюдента и Пирсона используются при оценке доверительных интервалов величин, имеющих нормальный закон распределения.

Распределение Фишера F имеет плотность вероятности:

 

 

 

m n

 

m

f (x)

 

 

2

 

m

2

 

 

 

 

n

 

 

m

 

n

 

 

 

2

2

 

 

 

m

1

 

 

x 2

 

 

;

0 x .

1

m x

m n

2

 

 

 

n

 

 

 

 

25

1.2

 

 

 

 

 

 

1.0

f(x)

 

 

 

 

 

m=1; n=2;

 

 

 

 

 

 

 

 

 

 

 

0.8

m=2; n=4;

 

 

 

 

 

 

 

 

 

0.6

 

m=3; n=5;

 

 

 

 

 

 

 

 

 

 

0.4

 

 

m=4; n=6;

 

 

 

 

 

 

 

 

 

0.2

 

 

 

 

 

 

0.0

 

 

 

 

 

 

0.0

0.5

1.0

1.5

2.0

2.5

3.0

 

 

 

x

 

 

 

Рис. 3.4. Кривые плотности распределения Фишера

при различных значениях параметров m и n

 

Параметрами этого распределения являются m и n.

Распределение Фишера используется для сравнения дисперсий случайных величин, распределенных по нормальному закону. График распределения показан на рис. 3.4.

3.3. КВАНТИЛИ РАСПРЕДЕЛЕНИЙ

Функции распределений f (x) позволяют по формуле (3.4) вычис-

лить вероятности попаданий случайной величины в заданный интервал. На практике часто необходимо решить обратную задачу – вычислить интервал, в котором с заданной вероятностью будет лежать случайная величина. Верхняя граница этого интервала называется кван-

тилем соответствующего распределения. Иными словами, квантиль есть корень уравнения:

F( )

 

f (x) dx P 0 .

 

 

(3.15)

 

или 0

 

 

Квантиль есть функция параметров распределения и заданной вероятности P . Квантиль распределения Стьюдента (его обычно обозначают t )

26

будет функцией двух переменных –

t( , P) . Аналогично квантиль рас-

пределенияПирсона 2 есть функцияэтих жепеременных: 2 ( , P).

0.45

 

 

 

 

 

 

 

 

0.40

 

 

 

 

 

 

 

 

0.35

f(x)

 

 

 

 

 

 

 

0.30

 

 

 

 

 

 

 

 

0.25

 

 

 

 

 

 

 

 

0.20

 

 

P = 0.9

 

 

 

 

0.15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.10

 

 

 

 

 

 

 

 

0.05

 

 

 

 

 

 

 

 

0.00

-3

-2

-1

0

1

2

x

3

 

 

 

 

 

 

t = 1.372

 

 

Рис. 3.5. Квантиль распределения Стьюдента

 

 

при 2 для P = 0.9

 

 

0.15

 

 

 

 

 

 

 

 

f(x)

 

 

 

 

 

 

0.10

 

 

 

 

 

 

 

 

 

P = 0.9

 

 

 

 

 

0.05

 

 

 

 

 

 

 

0.00

 

 

 

 

 

 

14 x

0

2

4

6

8

10

12

 

 

 

 

 

2=10.645

 

Рис. 3.6. Квантиль распределения Пирсона

 

 

при 6 для P = 0.9

 

 

 

 

 

 

27

 

 

 

Квантиль распределения Стьюдента при 2 , соответствующий уравнению (3.15) для вероятности P 0.9 , показан на рис. 3.5. Значе-

ние квантиля (он обозначен как t ) равно 1,372.

Площадь под распре-

делением

слева от

этого значения составляет

P 0.9 , а справа –

1 P 0.1.

На рис.

3.6 показан квантиль распределения Пирсона для

6 и P 0.9 . Его значение составляет 10,645.

3.4. ОЦЕНКА ИНТЕРВАЛОВ

Во многих задачах статистики необходимо определить интервал, в который случайная величина попадает с заданной вероятностью. При этом может производиться односторонняя оценка (сверху или снизу) или двухсторонняя.

Если проводится односторонняя оценка сверху, то искомая граница x и есть квантиль:

x ..., P .

Для односторонней оценки снизу нужно вычислить квантиль с параметром вероятности 1 P :

x ...

,1 P .

При вычислении двухсторонних границ интервала слева от нижней границы и справа от верхней должны получиться одинаковые площади

под распределением, равные 1 2P . Следовательно, границы x1 и x2 могут быть вычислены через квантили

x

...,

1 P

.

(3.16)

 

 

1

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

x

 

...,

1

P

.

(3.17)

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Многоточием обозначен список параметров распределения, который для каждого конкретного распределения может быть различным.

Например, необходимо вычислить границы t1 и t2 , в которые ве-

личина t , подчиняющаяся распределению Стьюдента при 2 , попадает с вероятностью P 0.9 :

28

0.45

 

 

 

 

 

 

 

0.40

 

 

 

 

 

 

 

0.35

f(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

0.30

 

 

 

 

 

 

 

0.25

 

 

 

 

 

 

 

0.20

 

 

P = 0 .9

 

 

 

 

0.15

 

 

 

 

 

 

 

 

 

 

 

 

 

0.10

 

 

 

 

 

 

 

0.05

 

 

 

 

 

 

 

0.00

 

 

 

 

 

x

 

-3

-2

-1

0

1

2

3

 

t1

= -1.812

 

t2

= 1 .812

 

 

Рис. 3.6. Двухсторонние границы распределения Стьюдента

 

 

при 2 для P = 0.9

 

 

 

0.15

 

 

 

 

 

 

 

f(x)

0.10

P = 0 .9

0.05

0.00

0

2

4

6

8

10

1 2

1 4

x

2

= 1 .6 3 5

 

 

 

 

2

= 1 2 .5 9 2

 

1

 

 

 

 

 

2

 

 

Рис. 3.7. Двухсторонние границы распределения Пирсона при 6 для P = 0.9

29

 

t

t

,1 P t

 

2,1

0,9

t 2,

0.05 1,812 ,

 

 

 

 

1

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t2

 

 

1 P

 

 

2,

1 0,9

 

 

 

 

 

 

t ,

2

t

 

 

2

 

t 2, 0.95 1,812 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для распределения Пирсона при 6 и

P 0.9 границы

2

и

2.

будут равны:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

,1 P 2

6,1 0,9 2 6,

0.05 1,635 ,

 

 

1

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

22

 

 

 

1

P

 

 

 

1 0,9

6,

0.95 12,592 .

 

 

2 ,

 

2

2 6,

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эти значения границ показаны на рис. 3.6 и 3.7.

3.5. СТАТИСТИЧЕСКИЕ ФУНКЦИИ MathCAD И Excel

Самым лучшим пакетом, предназначенным для решения статистических задач, является специализированный пакет Statistica. Но и программы более широкого применения – MathCAD и Excel имеют ряд статистических функций.

Функции MathCAD, соответствующие рассмотренным выше задачам, следующие:

для расчета интегральных функций распределения P(x) :

punif(x,a,b) – функция равномерного распределения;

pnorm(x, , ) – функция нормального распределения;

pt(x, ) – функция распределения Стьюдента;

pchisq(x, ) – функция 2 -распределения Пирсона;

pF(x,n,m) – функция распределения Фишера;

для расчета функций плотности вероятности f (x) dPdx :

dunif(x,a,b) – плотность вероятности равномерного распределения;

dnorm(x, , ) – плотность вероятности нормального распределения;

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]