Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дуплякин В.М. Статистический анализ

.pdf
Скачиваний:
43
Добавлен:
16.03.2015
Размер:
1.3 Mб
Скачать

Функция распределения, являясь одной из форм закона распределения, представляет собой наиболее общую характеристику рассматриваемой случайной величины, которая содержит в себе информацию обо всех её статистических свойствах.

Оценка функции распределения является весьма распространённой на практике процедурой предварительного статистического анализа так, как её значения используются в качестве вероятностей событий различного физического содержания.

Методика построения статистических функций распределения зависит от объёма используемых выборок элементов. Здесь, как и в предыдущем разделе, различают средние выборки объёмом n = 12 − 30 элементов и большие или представительные выборки,

которые имеют объём n = 200 − 300 элементов.

Для предварительного анализа статистической функции распределения удобно пользоваться её графическим представлением. Поскольку вследствие центральной предельной теоремы подавляющее большинство случайных величин, характеризующих реальные явления, подчиняется нормальному закону распределения, то первой задачей

предварительного статистического анализа является сопоставление полученной статистической функции распределения с функцией нормального закона, описываемого

зависимостью

 

 

1

 

+∞

( xmx )2

 

F(x) =

 

 

ò

e

2sx2

dx ,

(4.11)

 

 

 

 

sx

 

 

 

 

 

 

 

 

 

где mx математическое ожидание, sx среднее квадратическое отклонение.

Непосредственно построив графики нормального закона распределения и статистической функции распределения, затруднительно судить об их взаимном соответствии, что видно, например, из рисунка 4.4.

40

Рис. 4.4 - Построение функции распределения в линейных координатах

Рис. 4.5 - Построение функции распределения с неравномерным масштабом координаты Р

41

Задачу предварительной визуальной оценки соответствия нормальному закону распределения значительно облегчает использование нормальновероятностной бумаги, на

которой за счет неравномерного масштаба оси ординат график нормальной функции распределения представляется в виде прямой линии, как показано на рис. 4.5 для тех же данных, которые использовались при построении графика на рис. 4.4.

Чтобы неравномерно разметить ось ординат, на которой откладываются вероятности Р, вводится вспомогательная вертикальная ось Up , изображаемая справа.

Ось Up имеет равномерную разбивку и на ней откладывается квантиль нормального распределения, определяемый по следующей формуле

up =

x mx

,

(4.12)

 

 

sx

 

где mx математическое ожидание, sx среднее квадратическое отклонение.

 

Значения up можно взять из таблицы нормального распределения П.1,

которая

представлена в приложении. Для этого следуем иметь в виду, что табличному значению F (x)=P соответствует квантиль up=x, если P >0,5 и up= −x, если P<0,5.

Откладывая значения функции нормального распределения в координатах x и Up , мы всегда получим прямую линию, что используется для разграфления вероятностных бумаг.

Чтобы сделать шкалу квантилей существенно положительной обычно увеличивают их

значения, вводя новое обозначение

 

UP + 5 = uP + 5 .

(4.13)

Пример использования нормальновероятностной бумаги показан на рисунке 4.6, а

сама нормальновероятностная бумага представлена в приложении на рисунке П.8.

Рассмотрим построение функции нормального закона распределения на нормальновероятностной бумаге с заданными значениями математического ожидания и среднего квадратического отклонения mx и sx показанное на рисунке 4.6.

Сначала воспользуемся значением математического ожидания и обозначим положение точки M(mx, 5), воспользовавшись правой осью ординат Up+5. Очевидно, что эта же точка может быть построена с использованием правой оси ординат Р, тогда она имеет координаты M(mx, 50).

42

Рис. 4.6 – Использование нормально-вероятностной бумаги

Из выражения (4.12) следует, что перемещение от точки М вправо или влево на величину кратную среднему квадратическому отклонению, т.е. mx ± sx, mx ± 2sx и т.д. соответствует приращению по шкале квантилей ±1, ±2. Отсюда ясно, как построить точки S1, S1, S2, S2.

Функция нормального закона распределения будет изображаться на рисунке 4.6 в виде прямой линии, проходящей через точки М, S1, S1, S2, S2. При проведении прямой линии достаточно любых двух точек, но для контроля правильности построения желательно использовать три точки, например, М, S1, S1, или М, S2, S2.

43

4.2.1. Средняя выборка

Статистическая функция распределения для средней выборки строится по точкам на основании следующей зависимости

F*(x ) = P* =

i

 

,

(4.14)

 

i

i

n +1

 

 

 

 

 

 

где i – номер наблюдения, полученный после сортировки результатов наблюдения по возрастанию числовых значений, n – общее число наблюдений.

Пример. Рассмотрим построение статистической функции распределения для средней выборки, которая в отсортированном по возрастанию порядке представлена в таблице 4.3, где также приведены результаты вычисления статистических вероятностей Pi* и промежуточные данные, необходимые для оценки математического ожидания и среднего квадратического отклонения по формулам (4.4, 4.5, 4.3).

Таблица 4.3 - Обработка выборочных данных

i

xi*

(xi*)2

Pi*

i

xi*

(xi*)2

Pi*

 

 

 

 

 

 

 

 

1

4,74

22,47

0,063

9

6,15

37,82

0,563

 

 

 

 

 

 

 

 

2

5,02

25,2

0,125

10

6,31

39,82

0,625

 

 

 

 

 

 

 

 

3

5,27

27,77

0,188

11

6,42

41,22

0,688

 

 

 

 

 

 

 

 

4

5,45

29,7

0,25

12

6,54

42,77

0,75

 

 

 

 

 

 

 

 

5

5,56

30,91

0,313

13

6,78

45,97

0,813

 

 

 

 

 

 

 

 

6

5,67

32,15

0,375

14

6,92

47,89

0,875

 

 

 

 

 

 

 

 

7

5,9

34,81

0,438

15

7,22

52,13

0,938

 

 

 

 

 

 

 

 

8

6,05

36,6

0,5

Σ

90

547,23

 

 

 

 

 

 

 

 

 

Вычисления по ранее приведенным формулам дают следующие результаты

*

 

90,00

 

 

15

é 547, 2 3

 

2

ù

 

mx

=

 

= 6,00 , s x

=

 

 

 

ê

 

- (6, 0 0)

 

ú

= 0, 7 19 .

15

15

- 1

15

 

 

 

 

 

ë

 

 

û

 

44

Статистическая функция распределения F*(xi)=P*i, построенная по данным таблицы 4.3, представлена на рисунке 4.7 в виде ломаной линии, а прямая линия соответствует нормальному закону распределения с математическим ожиданием mx=6,00 и средним квадратическим отклонением sx=0,719. График нормального закона распределения построен на рисунке 4.7 по точкам S2, S1, М, S1, S2 .

Рис. 4.7 – Построение функции распределения на нормально-вероятностной бумаге

Положение точек S2, S1, М, S1, S2 в координатах X, Up+5 определяется следующим

образом

S2(6,00 − 2 0,719; 3,0)= S2(4,562; 3,0),

S1 (6,00 − 0,719; 4,0)= S1(5,281; 4,0), M(6,00; 5,0),

S1(6,00 + 0,719; 6,0)= S1(6,719; 6,0),

S2(6,00 + 2 0,719; 7,0)= S2(7,438; 7,0).

45

4.2.2. Представительная выборка

Построение статистической функции распределения для представительной выборки требует предварительной обработки исходных данных. Сначала результаты опытов распределяются по разрядам, как это было показано на рис. 4.2, где x1 , x2, … , xk+1 представляют собой границы разрядов.

Число разрядов k обычно принимается в пределах 12 – 30. Увеличение числа разрядов сверх указанного не приводит к повышению точности статистических оценок. Также не имеет смысла введение разрядов переменной ширины.

Частота появления рассматриваемого события в разряде определяется как

 

ni

 

k

 

pi =

,

где N = åni .

(4.15)

N

 

 

i=1

 

Значения статистической функции распределения определяются суммированием частот во всех разрядах, начиная с первого и кончая рассматриваемым разрядом

i

 

F* (xi+1 ) = Pi* = å pj , i = 1, 2, ..., k .

(4.16)

j=1

Следует отметить, что значения статистической функции распределения, получаемые по формуле (1.16) соответствуют правой границе рассматриваемого разряда.

Пример. Рассмотрим построение статистической функции распределения для представительной выборки, содержащей результаты 240 опытов, зафиксированных в 15 разрядах, представленные в таблице 4.4, где также приведены результаты вычисления статистических вероятностей Pi* и промежуточные данные, необходимые для оценки математического ожидания и среднего квадратического отклонения по формулам (4.15, 4.16, 4.7, 4.8, 4.9, 4.3).

Статистические оценки математического ожидания и среднего квадратического отклонения, полученные по методике, изложенной в разделе 4.1.2, имеют следующие

значения

m*x = 34,72 , s x = 1 230,84 − (34 ,72 )2 = 5, 02 .

На рисунке 4.8 точки вида ■, соответствуют значениям статистической функция распределения F*(xi+1)=P*i , построенной по данным таблицы 4.4. Прямая линия является изображением нормального закона распределения с математическим ожиданием mx=34,72 и средним квадратическим отклонением sx=5,02.

46

Таблица 4.4 – Обработка выборочных данных

i

xi

xi+1

Ni

pi*=ni/N

xi*

xi*·pi*

(xi*)2·pi*

Pi*=Σpj

 

 

 

 

 

 

 

 

 

1

20,0

22,0

1

0,0062

21,0

0,13

2,74

0,0062

 

 

 

 

 

 

 

 

 

2

22,0

24,0

3

0,0125

23,0

0,29

6,60

0,0187

 

 

 

 

 

 

 

 

 

3

24,0

26,0

6

0,0249

25,0

0,62

15,59

0,0436

 

 

 

 

 

 

 

 

 

4

26,0

28,0

11

0,0457

27,0

1,23

33,34

0,0894

 

 

 

 

 

 

 

 

 

5

28,0

30,0

19

0,0790

29,0

2,29

66,44

0,1684

 

 

 

 

 

 

 

 

 

6

30,0

32,0

28

0,1164

31,0

3,61

111,89

0,2848

 

 

 

 

 

 

 

 

 

7

32,0

34,0

38

0,1580

33,0

5,21

172,07

0,4428

 

 

 

 

 

 

 

 

 

8

34,0

36,0

39

0,1622

35,0

5,68

198,65

0,6050

 

 

 

 

 

 

 

 

 

9

36,0

38,0

35

0,1455

37,0

5,38

199,23

0,7505

 

 

 

 

 

 

 

 

 

10

38,0

40,0

25

0,1040

39,0

4,05

158,11

0,8545

 

 

 

 

 

 

 

 

 

11

40,0

42,0

17

0,0707

41,0

2,90

118,83

0,9252

 

 

 

 

 

 

 

 

 

12

42,0

44,0

10

0,0416

43,0

1,79

76,88

0,9667

 

 

 

 

 

 

 

 

 

13

44,0

46,0

5

0,0208

45,0

0,94

42,10

0,9875

 

 

 

 

 

 

 

 

 

14

46,0

48,0

2

0,0083

47,0

0,39

18,37

0,9958

 

 

 

 

 

 

 

 

 

15

48,0

50,0

1

0,0042

49,0

0,20

9,98

1,0000

 

 

 

 

 

 

 

 

 

Σ

 

 

240

1,0000

Σ

34,72

1230,84

 

 

 

 

 

 

 

 

 

 

47

Рис. 4.8 – Выравнивание статистической функции распределения

График нормального закона распределения построен по точкам S2, S1, М, S1, S2,

обозначенным как ∙ , положение которых в координатах X, Up+5 определяется следующим образом:

S2(34,72−2*5,02; 3,0)= S2(24,68; 3,0),

S1 (34,72−5,02; 3,0) = S1(29,70; 4,0), M(34,72; 5,0),

S1(34,72+5,02; 3,0) = S1(39,74; 6,0),

S2(34,72+2*5,02; 7,0) = S2(44,76; 7,0).

48

5.ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

5.1.Проверка гипотезы нормальности статистической функции распределения

Статистические функции распределения, являясь одной из форм закона распределения, содержат всю информацию, которая необходима для оценки любых числовых характеристик исследуемых случайных величин. Функция распределения

определяется соотношением

F* (x) = P* (X < x) .

В предыдущем разделе подробно рассматривалось построение этих функций на основе средних и представительных выборок. При статистическом анализе используемых

данных весьма важно решить вопрос о соответствии полученной статистической функции распределения какомулибо из известных законов распределения.

Поскольку наибольший практический интерес представляет нормальный закон распределения, то поэтому в настоящем пособии рассматривается вопрос определения вероятности соответствия наблюдаемых результатов нормальному закону распределения.

Поставленный вопрос методически может быть решён разными средствами. В

настоящем пособии демонстрируется использование критерия согласия КолмогороваСмирнова для средних выборок и критерия согласия Пирсона для представительных выборок.

Предварительно познакомимся с принципиальной стороной применения критериев согласия. Допустим, что статистическая функция распределения F*(x) заменяется или, как ещё говорят, выравнивается с помощью теоретической функции распределения F(x). Этого можно добиться, если в качестве параметров теоретической функции использовать оценки соответствующих параметров, полученные при обработке опытных данных. Так, если определены оценки математического ожидания mx* и среднего квадратического отклонения sx* (см. раздел 3.3), то функция нормального закона распределения, "выравнивающая"

статистическое распределение определяется выражением

 

 

1

 

+∞

(xm*x )2

F(x) =

 

 

òe

2(sx )2

dx .

*

 

 

 

 

 

 

 

sx

 

 

−∞

 

 

 

Общим для статистической функции распределения и для "выравнивающей" теоретической функции будет то, что у них совпадают значения математического ожидания и средних квадратических отклонений. Если построить графики этих функций, то они не будут совпадать, как это, например, показано на рис. 5.1.

49