Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладная статистика Для презентации в интерне...doc
Скачиваний:
24
Добавлен:
11.11.2019
Размер:
3.81 Mб
Скачать

6. Проверка гипотезы о законе распределения генеральной совокупности по критерию пирсона (критерию 2)

Те, что веруют слепо, - пути не найдут.

Тех, кто мыслит, - сомнения вечно гнетут.

Опасаюсь, что голос раздастся однажды:

«О, невежды! Дорога не там и не тут?»

О. Хайям (перевод Г. Плисецкого)

6.1. Пример

Рассмотрим такую ситуацию. 200 электронных ламп, выбранных наудачу из большой партии, испытывались на продолжительность работы. Результаты (в часах) таковы (табл. 6.1):

Таблица 6.1

[xi-1;xi)

[0;300)

[300;600)

[600;900)

[900;1200)

[1200;1500)

[1500;1800)

ni

53

41

30

22

16

12

[xi-1;xi)

[1800;2100)

[2100;2400)

[2400;2700)

[2700;3000)

[3000;3300)

ni

9

7

5

3

2

Хотелось бы дать разумный ответ на такие вопросы: какую продолжительность работы следует ожидать, если взять наудачу лампу из этой же партии? Какова вероятность, что лампа проработает не менее 1000 часов? Какова вероятность того, что лампа проработает менее 200 часов? Ответить на эти вопросы легко, если известен закон распределения случайной величины Х – времени работы лампы. Но его-то мы не знаем. Мы располагаем только выборкой (правда, достаточно большой, n = 200) из генеральной совокупности X. Попробуем, пользуясь этой выборкой, подобрать подходящий закон распределения.

Построим прежде всего гистограмму (рис. 6.1).

Рис. 6.1

Высоты прямоугольников таковы:

; ;

; h4 = 0,00037; h5 = 0,00027; h6 = 0,0002;  h7 = 0,00015; h8 = 0,00012; h9 = 0,00008; h10 = 0,00005; h11 = 0,00003.

Гистограмма – аналог графика функции плотности вероятности. В нашем случае гистограмма очень похожа на график функции плотности показательного закона. Мы вправе предположить, что большая выборка хорошо представляет генеральную совокупность и что если гистограмма похожа на график экспоненты, то это означает, что выборка извлечена из генеральной совокупности, распределенной по показательному закону с функцией плотности вероятности

f(x) = e-x.

Однако показательный закон зависит от одного параметра – числа . Чтобы полностью описать закон, нужно знать, чему равно . Подберем значение по выборке, причем поступим самым бесхитростным способом. Как известно, математическое ожидание случайной величины, имеющей показательное распределение, М(Х) = 1/. Если наша выборка хорошо представляет генеральную совокупность, мы вправе полагать, что значение выборочного среднего не слишком отличается от М(Х). Поэтому найдем и положим =1/ .

+19509 +22507 .

Тогда = 1/  0,00115, f(x) = 0,00115e -0,00115x ,x  0.

Вычислим значения f(х) на границах интервалов (табл. 1.2) и построим график функции плотности вероятности прямо на гистограмме

(см. рис. 6.1).

Таблица 6.2

xi

0

300

600

900

1200

1500

f(xi)

0,00115

0,00081

0,00058

0,00041

0,00029

0,0002

xi

1800

2100

2400

2700

3000

3300

f(хi)

0,000115

0,0001

0,00007

0,00005

0,000037

0,000026

Не следует увлекаться слишком большим количеством значащих цифр, ведь все наши данные достаточно приближенные.

Кривая функции плотности вероятности f(х) очень «ладно» легла на гистограмму. Такое хорошее совпадение гистограммы и графика f) прибавляет уверенности в том, что закон распределения генеральной совокупности Х выбран достаточно точно.

Попробуем теперь оценить числом расхождение между экспериментальными данными и тем, что должно быть «по теории».

Мы можем вычислить теоретическую вероятность рi попадания случайной величины X, распределенной по показательному закону с функцией плотности f(x) = 0,00115е-0,00115x, x  0 в интервал [xi-1, xi).

р(хi-1 < X < xi) = .

Зная вероятность pi, можно вычислить математическое ожидание числа попаданий случайной величины Х в интервал [xi-1, xi) в результате n независимых испытаний, оно равно nрi. Теперь можно найти разность

ni - nрi между числом вариант выборки, попавших в интервал [хi-1, хi), и ожидаемым числом попаданий. Чтобы оценить суммарное расхождение между теоретическими и опытными данными, нужно сложить все полученные разности. Чтобы положительные и отрицательные разности не уничтожили друг друга, возведем их в квадрат. Кроме того, важно не абсолютное значение ni - nрi, а относительное (ni,- npi)/npi. Действительно, если ni = 0, nрi = 1, это совсем не одно и то же, что в случае, когда ni = 10, nрi = 11. Относительное отклонение в первом случае равно 1, а во втором 

только 1/11.

Итак, вычислим прежде всего вероятности рi.

р1 = P(0 < X < 300) = e-*0 - e-*300 = e 0 - e –0,345 = 1- 0,708 = 0,2918;

p2 = P(300 < X < 600) = e-*300 - e-*600 = 0,7082 – 0,5016 = 0,2066;

р3 = P(600 < X < 900) = e-*600 - e -*900 = 0,1464;

р4 = 0,1036; р5 = 0,0734; р6 = 0,052; р7 = 0,0368; р8 = 0,0261;

р9 = 0,0185; р10 = 0,0131; р11 = 0,0092.

Дальнейшие вычисления приведены в табл. 6.3.

Таблица 6.3

[xi-1; xi)

pi

npi

ni

ni - npi

[0;300)

0,2918

58,36

53

-5,36

0,490

[300;600)

0,2066

41,32

41

-0,32

0,002

[600;900)

0,1464

29,28

30

0,72

0,018

[900;1200)

0,1036

20,72

22

1,28

0,079

[1200;1500)

0,0734

14,68

16

1,32

0,119

[1500;1800)

0,0520

10,40

12

1,60

0,246

[1800;2100)

0,0368

7,36

9

1,64

0,365

[2100;2400)

0,0261

5,22

7

1,78

0,607

[2400;2700)

0,0185

3,70

5

1,30

0,457

[2700;3000)

0,0131

2,62

3

0,38

0,056

[3000;3300)

0,0092

1,84

2

0,16

0,014

pi = 0,9775

npi = 195,5

ni = 200

2 = 2,45

Сумма вероятностей pi равна 0,9775. Это значит, что интервал [0; 3300) охватывает практически все возможные значения выбранного нами теоретического закона. Сумма чисел последнего столбца традиционно обозначается буквой 2 (читается «хи - квадрат»). В нашем случае

.

Много это или мало?