Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дуплякин В.М. Статистический анализ

.pdf
Скачиваний:
43
Добавлен:
16.03.2015
Размер:
1.3 Mб
Скачать

Р

1,0

 

 

 

 

 

 

0,8

n1 = 15

 

 

 

 

 

0,6

 

 

 

 

 

 

0,4

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,0

 

 

 

 

x

 

0

5

10

15

20

 

 

 

 

Генеральное распределение

 

 

 

 

Выборочное распределение

 

 

 

Выровненное выборочное распределение

 

Рис. 3.2 - Выравнивание исходных данных нормальным законом распределения, n=15

Р

 

 

 

 

1,0

 

 

 

 

0,8

n2 = 40

 

 

 

0,6

 

 

 

 

0,4

 

 

 

 

0,2

 

 

 

 

0,0

 

 

 

x

0

5

10

15

20

 

Генеральное распределение

 

 

 

Выборочное распределение

 

 

 

Выборочное выровненное распределение

 

Рис. 3.3 - Выравнивание исходных данных нормальным законом распределения, n=40

30

Р

1,0

 

 

 

 

 

 

0,8

n3 = 100

 

 

 

 

 

0,6

 

 

 

 

 

 

0,4

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,0

 

 

 

 

x

 

0

5

10

15

20

 

 

Генеральное распределение

 

 

 

 

 

Выборочное распределение

 

 

 

 

 

Выборочное выровненное распределение

 

 

Рис. 3.4 - Выравнивание исходных данных нормальным законом распределения, n=100

Как видно из приведенных примеров, увеличение объёма выборочных данных приводит к сближению выборочной функции распределения к генеральному распределению, что вполне предсказуемо. Но даже при наименьшем объёме выборки из числа рассмотренных процедура выравнивания даёт убедительный результат, особенная ценность которого заключается в воспроизведении "хвостов" распределения, куда статистические данные не попадают. Последнее имеет большое практическое значение, так как именно "хвосты", т.е. участки функции распределения в области наименьших и наибольших возможных значений представляют наибольший интерес для практического использования.

Рассмотрим особенности применения метода моментов для выравнивания статистических данных, которые в генеральной совокупности подчиняются закону

распределения с равномерной плотностью вероятности

 

ì

1

при

α £ x £ β ;

 

 

ï

 

 

 

f (x) =

α - β

(3.17)

í

 

 

 

ï

0

при

x < α или x > β .

 

 

î

 

Для справки отметим, что интегральная функция равномерного закона распределения

имеет вид

F(x) =

x -α

 

, если

0 £ x £1;

 

β -α

 

 

 

 

 

F(x) = 0,

если

x < 0;

(3.18)

F(x) =1, если

х > 0.

 

 

 

 

31

 

 

Из теории вероятностей известно, что моменты равномерного закона распределения

связаны следующими соотношениями с его явными параметрами

m

 

=

α

+ β

 

 

D =

− α )2

 

 

x

 

 

 

;

 

 

.

 

(3.19, 3.20)

 

 

 

 

 

 

 

 

 

2

 

 

x

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Воспользуемся результатами статистической обработки имеющихся выборочных

данных m*x и Dx* = (sx* )2 , приравняв между собой следующие выражения

 

α* + β *

= m*;

* − α* )2

= D*

,

(3.21, 3.22)

 

 

2

 

 

x

12

 

x

 

 

 

 

 

 

 

 

 

 

 

 

откуда найдём параметры выравнивающей функции равномерного закона распределения

α* = m*

 

 

β * = m* +

 

 

 

3D* ;

3D* .

(3.23, 3.24)

x

x

x

x

 

Рассмотрим выравнивание равномерным законом распределения на конкретных примерах иллюстрируемых рисунками 3.5, 3.6 и 3.7, где выборки получены из одной и той же генеральной совокупности.

Р

1,0

 

 

 

 

 

 

0,8

 

 

 

 

 

 

0,6

n1 = 15

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,0

 

 

 

 

x

 

0

1

2

3

4

 

 

 

 

Генеральное распределение

 

 

 

Выборочное распределение Выровненное выборочное распределение

Рис. 3.5 - Выравнивание исходных данных законом равномерной плотности, n=15

32

Р

1,0

 

 

 

 

 

 

0,8

n2 = 40

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

0,4

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,0

 

 

 

 

 

 

0

1

2

3

4

x

 

 

Генеральное распределение

 

 

 

 

 

Выборочное распределение

 

 

 

 

Выборочное выровненное распределение

 

Рис. 3.6

- Выравнивание исходных данных законом равномерной плотности, n=40

Р

1,0

 

 

 

 

 

0,8

n3 = 100

 

 

 

 

0,6

 

 

 

 

 

0,4

 

 

 

 

 

0,2

 

 

 

 

 

0,0

 

 

 

 

 

0

1

2

3

4

 

 

Генеральное распределение

 

x

 

 

 

 

Выборочное распределение Выборочное выровненное распределение

Рис. 3.7 - Выравнивание исходных данных законом равномерной плотности, n=100

Следует отметить, что в рассматриваемом примере особенно для наименее

представительной выборки объёмом n=15

 

α* ¹ x

и β* ¹ x .

min

max

 

33

Поэтому выравнивание равномерного закона распределения с использованием

наблюдаемых наибольших и наименьших значений, а именно

 

α* = x

и β * = x

(3.25, 3.26)

min

max

 

можно рекомендовать только при достаточно большом числе наблюдений.

В приведенных на рисунках 3.5, 3.6 и 3.7 примерах нетрудно заметить, что

выборочная выравнивающая функция распределения намного лучше соответствует функции распределения генеральной совокупности данных, чем статистическая функция распределения, представленная отдельными точками.

4.ПРЕДВАРИТЕЛЬНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ

4.1.Оценка математических ожиданий и средних квадратических отклонений

Одной из наиболее распространённых задач предварительного статистического анализа является оценка значений математического ожидания и дисперсии или среднего квадратического отклонения генеральной совокупности по результатам обработки выборки элементов. Эта задача имеет большое практическое значение по многим причинам, одной из которых является то, что эти параметры однозначно определяют нормальный закон распределения.

Методика расчёта математических ожиданий и средних квадратических отклонений зависит от объёма используемой выборки элементов. Различают средние и представительные выборки. Средними считаются выборки, объём которых составляет n = 12 – 30 элементов.

Представительные выборки имеют объём n = 200 – 300 элементов.

Математическое ожидание характеризует центр рассеивания случайных величин

 

N

 

 

 

mx =

åxi

 

 

 

i=1

 

, где N – объём генеральной совокупности.

(4.1)

N

 

 

 

 

Дисперсия является мерой рассеивания случайных величин относительно

математического ожидания

 

 

 

 

 

 

 

 

n

 

 

 

Dx =

å(xi mx )2

 

 

 

i=1

.

(4.2)

 

N

 

 

 

 

 

34

Использование дисперсии при решении практических задач зачастую неудобно изза размерности этой величины. Например, если значения исследуемой величина имеют размерность кг, то размерность дисперсии соответствует кг2 , что лишено смысла. Более удобной, в этом смысле является мера рассеивания в виде среднего квадратического отклонения, которое связано с дисперсией следующим ниже соотношением и имеет

размерность исследуемой величины

sx =

Dx

.

(4.3)

4.1.1. Оценка математических ожиданий и средних квадратических отклонений для средних выборок

Представим каждый результат наблюдения xi графически на числовой оси, как это показано на рис. 4.1.

Рис. 4.1 – К вычислению статистической оценки математического ожидания

Статистическая оценка математического ожидания находится по формуле

 

n

 

mx =

åxi

(4.4)

i=1

.

 

 

 

 

n

 

Статистическая оценка дисперсии определяется следующим образом

é

n

 

ù

 

 

 

 

 

ê

åxi2

- (mx )2

ú

 

n

 

 

 

Dx = ê

i=1

ú

×

.

(4.5)

n

n -1

ê

 

ú

 

 

 

ê

 

 

ú

 

 

 

 

 

ë

 

 

û

 

 

 

 

 

Следует отметить, что множитель n/(n–1) в формуле (4.5) устраняет смещение статистической оценки дисперсии, которое увеличивается при уменьшении объёма выборки.

35

… , xk+1

Пример. Рассмотрим определение статистических оценок математического ожидания и среднего квадратического отклонения наблюдений, представленных в таблице 4.1.

Таблица 4.1 Обработка выборочных данных

 

 

 

 

 

 

 

i

xi*

(xi*)2

i

xi*

(xi*)2

1

10,42

108,63

11

15,81

249,98

2

11,49

132,09

12

16,24

263,66

3

12,22

149,34

13

16,69

278,67

4

12,8

163,92

14

17,2

295,74

5

13,31

177,06

15

17,78

316,11

6

13,76

189,41

16

18,51

342,51

7

14,19

201,33

17

19,58

383,28

8

14,6

213,12

Σ

 

 

9

15

225

255

3927,04

10

15,4

237,2

 

 

 

В таблице приведены данные 17 наблюдений. Оценка математического ожидания по формуле (4.4) производится следующим образом

 

 

mx =

255,00

=15,00 .

 

 

 

 

 

17

 

 

 

 

 

 

Оценка дисперсии по формуле (4.5) имеет значение

 

 

é

3927,04

 

 

2

ù

17

 

Dx

= ê

 

 

-15,00

 

ú ×

 

 

= 6,38 .

17

 

 

17 -1

 

ë

 

 

 

 

û

 

В итоге получаем статистическую оценку среднего квадратического отклонения

s*x = 6,38 = 2,53 .

4.1.2. Оценка математических ожиданий и средних квадратических отклонений для представительных выборок

Оценка математического ожидания и среднего квадратическского отклонения в случае представительной выборки начинается с предварительной обработки исходных данных. Для этого они распределяются по разрядам, как это показано на рис. 4.2, где x1, x2,

представляют собой границы разрядов.

36

Число разрядов k обычно выбирается в пределах 12 – 30, а сами разряды принимаются одинаковыми по ширине. Увеличение числа разрядов сверх указанного не даёт повышения точности статистических оценок и поэтому нецелесообразно. Также, как правило, не имеет смысла введение разрядов переменной ширины.

Рис. 4.2. - Выделение разрядов представительной выборки

Сначала для каждого разряда следует вычислить частоту появления в разряде

 

 

ni

 

k

 

pi =

,

где N = åni .

(4.6)

 

 

 

N

i=1

 

После этого вычисляются характерные представители разрядов

 

xi =

xi + xi+1

, i =1, 2 , ... , k .

(4.7)

 

2

 

 

 

 

 

 

 

k

 

Оценка математического ожидания определяется по формуле mx = åxi pi

. (4.8)

i=1

Статистическая оценка дисперсии находится следующим образом

é

k

2

ù

- (mx )

2

.

 

Dx = ê

å(xi )

pi ú

 

(4.9)

ê i=1

 

ú

 

 

 

 

ë

 

 

û

 

 

 

 

37

Пример. Рассмотрим оценку математического ожидания и среднего квадратического отклонения результатов наблюдений, которые зарегистрированы в 15 разрядах и представлены в таблице 4.2.

Таблица 4.2 – Оценка выборочных характеристик

 

Исходные данные

 

 

Результаты вычислений

 

 

 

 

 

 

 

 

 

 

i

xi

xi+1

 

ni

pi*=ni/N

 

xi*

xi*·pi*

(xi*)2·pi*

1

30,00

31,00

 

2

0,0096

 

30,50

0,29

8,94

 

 

 

 

 

 

 

 

 

 

2

31,00

32,00

 

4

0,0192

 

31,50

0,61

19,08

 

 

 

 

 

 

 

 

 

 

3

32,00

33,00

 

7

0,0337

 

32,50

1,09

35,55

 

 

 

 

 

 

 

 

 

 

4

33,00

34,00

 

11

0,0529

 

33,50

1,77

59,35

 

 

 

 

 

 

 

 

 

 

5

34,00

35,00

 

19

0,0913

 

34,50

3,15

108,72

 

 

 

 

 

 

 

 

 

 

6

35,00

36,00

 

27

0,1298

 

35,50

4,61

163,59

 

 

 

 

 

 

 

 

 

 

7

36,00

37,00

 

33

0,1587

 

36,50

5,79

211,37

 

 

 

 

 

 

 

 

 

 

8

37,00

38,00

 

32

0,1538

 

37,50

5,77

216,35

 

 

 

 

 

 

 

 

 

 

9

38,00

39,00

 

28

0,1346

 

38,50

5,18

199,53

 

 

 

 

 

 

 

 

 

 

10

39,00

40,00

 

17

0,0817

 

39,50

3,23

127,52

 

 

 

 

 

 

 

 

 

 

11

40,00

41,00

 

12

0,0577

 

40,50

2,34

94,63

 

 

 

 

 

 

 

 

 

 

12

41,00

42,00

 

6

0,0288

 

41,50

1,20

49,68

 

 

 

 

 

 

 

 

 

 

13

42,00

43,00

 

5

0,0240

 

42,50

1,02

43,42

 

 

 

 

 

 

 

 

 

 

14

43,00

44,00

 

3

0,0144

 

43,50

0,63

27,29

 

 

 

 

 

 

 

 

 

 

15

44,00

45,00

 

2

0,0096

 

44,50

0,43

19,04

 

 

 

 

 

 

 

 

 

 

 

Σ

 

 

208

1,0000

 

Σ

37,11

1384,07

 

 

 

 

 

 

 

 

 

 

Суммирование числа наблюдений по всем разрядам даёт общее число опытов N=208.

Заполнение вычисляемой части таблицы определяется заголовками соответствующих столбцов. Поразрядное суммирование частот даёт 1,0000 , что используется для контроля правильности вычислений.

38

Суммирование элементов столбца xi*pi* позволяет получить оценку математического

ожидания

mx = 37,106 .

Статистическая оценка дисперсии даёт следующий результат

Dx* = 1384,07 − (37,106)2 = 7,229 .

Статистическая оценка среднего квадратического отклонения имеет значение

s*x = 7,229 = 2,689 .

4.2. Построение статистических функций распределения на нормальновероятностной бумаге

Статистическая функция распределения строится по результатам наблюдений, она

имеет следующее теоретическое определение

F*(x)=P*(X<x) ,

(4.10)

 

т.е. для каждого значения аргумента эта функция даёт вероятность того, что рассматриваемая случайная величина будет меньше заданного значения аргумента.

Смысл функции распределения можно проиллюстрировать с помощью графика, представленного на рисунке 4.3, из которого, например, видно, что случайная величина, для которой построен этот график, может принимать значения меньше чем 15,2 с вероятностью

Р = Р (Х<15,2) = F (15,2) = 0,82 .

Рис. 4.3 – Пример использования функции распределения

39