Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Нвчально-методичний посібник-теорія ймов.doc
Скачиваний:
29
Добавлен:
27.11.2019
Размер:
4.87 Mб
Скачать

9.3. Перевірка гіпотези про закон розподілу. Критерій згоди Пірсона.

Критерієм згоди називають статистичний критерій перевірки гіпотези про закон розподілу ймовірностей випадкової величини (ознаки генеральної сукупності). Є кілька критеріїв згоди: критерій Колмогорова, критерій Смірнова, критерій Пірсона та ін.

Найбільш розповсюдженим критерієм перевірки вірогідності H про закон розподілу ознаки генеральної сукупності є критерій згоди Пірсона (критерій ), який ґрунтується на порівнянні емпіричних і теоретичних частот та визначається за формулою , де m – число інтервалів, на які поділяється статистичний розподіл вибірки; nі – частота ознаки в i –му інтервалі; пі* – теоретичні частоти, підраховані за відповідними формулами закону розподілу ймовірностей, який припускається для ознаки генеральної сукупності.

Теоретичні частоти знаходяться за формулою , де n – об’єм вибірки; pi – для дискретної випадкової величини є ймовірність події Х=х; для неперервної випадкової величини – ймовірність, що ознака Х попаде в і-ий інтервал.

Нехай висунуто гіпотезу H0 : випадкова величина Х розподілена за законом А.

Здійснивши вибірку обсягу п, знаходять і записують у вигляді таблиці інтервальний статистичний розподіл частот:

...

ni

n1

n2

n3

...

nm

Оскільки перевіряється гіпотеза про те, що розподіл ознаки Х генеральної сукупності описується певною (конкретною) функцією розподілу F(x), то для кожного інтервалу можна визначити теоретичні ймовірності pi попадання значень випадкової величини Х у цей інтервал, а отже, і теоретичні частоти .

Для обчислення ймовірностей pi використовують формули:

(26)

Зазначимо, що для обчислення ймовірностей pi і pm у формулі (26) покладають, відповідно, і . Тоді .

Отримані результати обчислень зручно записати у формі таблиці:

...

ni

n1

n2

n3

...

nm

pi

p1

p2

P3

...

pm

n1*

n2*

n3*

...

nm*

Згідно з критерієм Пірсона для перевірки гіпотези H0 вводиться випадкова величина (статистика) K :

На підставі даних вибірки, записаних у таблиці, обчислюють емпіричне значення критерію Пірсона:

Відомо, що при n → ∞ закон розподілу статистики K прямує до закону розподілу з k=mr−1 ступенями вільності, де m – кількість груп у статистичному розподілі вибірки; r − кількість параметрів гіпотетичного розподілу A (наприклад, r = 2 для нормального розподілу, r =1 для розподілу Пуассона, r =0 для рівномірного розподілу).

Для критерію будують правосторонню критичну область за правилом:

P  кр.= (27)

За заданим рівнем значущості α і кількістю ступенів вільності k із таблиці критичних точок розподілу (в якій дано розв’язки рівняння (27)) знаходять критичну точку kкр=(,k).

Порівнюємо значення kкр і Кспост: якщо Кспост kкр то гіпотезу H0 відхиляють; якщо ж Кспостkкр, то гіпотезу H0 приймають.

Застосування критерію вимагає дотримання таких умов:

1) експериментальні дані мають бути незалежними, тобто вибірка має бути випадковою;

2) обсяг вибірки має бути достатньо великим (практично не меншим ніж 50 одиниць), а частота кожної групи – не меншою за 5. Якщо остання умова не виконується, то проводиться попереднє об’єднання нечисленних груп.

Критерій згоди Пірсона дає відповідь на питання, чи розбіжність між емпіричними і теоретичними частотами зумовлена випадковістю, чи вона є значущою. Як і будь-який інший критерій він не доводить справедливості гіпотези H0, а лише дозволяє встановити на прийнятному рівні значущості узгодженість чи неузгодженість гіпотези H0, з даними спостережень.

Приклад. При рівні значущості перевірити гіпотезу про нормальний розподіл генеральної сукупності, якщо відомі емпіричні і теоретичні частоти

Емпіричні частоти, ni

7

14

39

75

107

86

31

15

Теоретичні частоти, пі*

4

15

43

83

100

77

38

14

Розв’язання

Складаємо таблицю для обчислення -критерію.

і

пі*

1

7

4

3

9

2,25

49

12,25

2

14

15

-1

1

0,07

196

13,06

3

39

43

-4

16

0,37

1521

35,37

4

75

83

-8

64

0,77

5625

67,77

5

107

100

7

49

0,49

11449

114,49

6

86

77

9

81

1,05

7396

96,05

7

31

38

-7

49

1,29

961

25,28

8

15

14

1

1

0,07

225

16,07

374

374

27422

380,34

Контроль обчислень: – обчислення правильні.

Кількість ступенів вільності: s=8, k=s-3=5. За таблицею критичних точок -розподілу (додаток 4) за рівнем значущості і кількістю ступенів вільності k=5 знаходимо . Оскільки , то немає підстав відхилити нульову гіпотезу. Отже, розбіжність емпіричних та теоретичних частот незначуща, дані спостережень узгоджуються з гіпотезою про нормальний розподіл генеральної сукупності.