Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Вказівки до лаб_2010

.pdf
Скачиваний:
16
Добавлен:
16.02.2016
Размер:
4.53 Mб
Скачать

6.Вибірковий коефіцієнт асиметрії As .

7.Вибірковий коефіцієнт ексцесу E .

Нагадаємо, що кожна дискретна вибірка може бути не згрупованою: x1 , x2 , ..., xn

або згрупованою (записаною у вигляді таблиці частот)

xi

x1

x2

 

xk

ni

n1

n2

 

nk

k

причому n = åni — об’єм вибірки.

i=1

Випадок А. Ознака ξ генеральної сукупності — дискретна випадкова

величина.

Таблиця 2.

Точкова оцінка

Незгрупована вибірка

 

 

 

 

 

 

 

Згрупована вибірка

 

Вибіркове середнє x

 

 

 

 

 

 

 

 

 

x =

1

 

n

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x =

1

k

 

x × n

 

 

 

 

 

 

 

 

 

 

n

 

åi=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

åi=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

(xi - x )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åi=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D = n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åni ×

(xi - x )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

Вибіркова дисперсія D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

або

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

k

 

2

- (x )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 1

 

 

å(xi )2 - (x )2

 

 

 

або D = n åi=1

ni × xi

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Виправлена вибіркова

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

%

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсія

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

=

 

 

 

 

 

 

× D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n -1

 

 

 

 

 

 

 

 

 

 

 

 

Вибіркове середньоквад-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

ратичне відхилення

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Виправлене вибіркове

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

середньоквадратичне ві-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ% =

 

%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

дхилення

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вибірковий коефіцієнт

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

(x - x )3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

k

n ×(x - x )3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åi=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åi=1

 

асиметрії

 

 

 

 

 

 

 

=

n

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

n

i

 

i

 

 

 

 

 

 

 

As

 

 

 

 

 

 

 

 

 

 

 

 

 

As

 

 

 

 

 

 

 

 

 

 

σ

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вибірковий коефіцієнт

1

 

 

 

n

 

(x - x )4

 

 

 

 

 

1

 

k

 

n ×(x - x )4

 

 

 

 

 

 

 

 

 

 

 

 

åi=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åi=1

 

ексцесу

 

 

=

n

 

 

i

 

- 3

 

 

 

 

 

 

 

 

=

n

i

 

 

i

 

- 3

E

 

 

 

 

 

 

 

 

 

 

E

 

 

 

 

 

 

 

 

σ

4

 

 

 

 

 

 

 

 

 

 

σ

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

41

Випадок Б. Ознака ξ генеральної сукупності — неперервна випадкова

величина. Тоді формули випадку А залишаються в силі, якщо замінити в них xi

на z* =

zi−1 + zi

— середини інтервалів (z

i−1

; z

], а n вважати інтервальними ча-

 

i

2

 

 

i

i

 

 

 

 

 

 

стотами.

 

 

 

 

Інтервальною

оцінкою (довірчим інтервалом) для заданого довірчого

рівня γ

(γ <1, γ →1)

невідомого параметра θ генеральної сукупності назива-

ють інтервал (θ1*; θ*2 ),

який з імовірністю γ

містить справжнє значення параме-

тра θ:

P{θ1* < θ < θ*2} = γ .

 

 

 

Найчастіше шукають довірчі інтервали для математичного сподівання і

дисперсії генеральної сукупності, але за умови, що розподіл в генеральній сукупності — нормальний.

Отже, якщо ξ — нормально розподілена ознака генеральної сукупності з невідомими параметрами a та σ , то при заданому довірчому рівні γ інтерваль-

ні оцінки для математичного сподівання

Mξ = a та дисперсії Dξ = σ 2 знахо-

дять за такими формулами:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x - t

 

 

×

σ%

 

< a < x + t

 

 

×

σ%

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α ; n−1

 

 

 

n

 

 

 

α ; n−1

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n -1)σ%2

 

 

 

(n -1)σ%2

,

 

 

 

 

 

 

 

χ

2

 

 

 

 

 

< σ 2 <

χ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

 

 

 

 

 

 

 

 

α

; n−1

 

 

 

1 −

; n−1

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де n — об’єм заданої вибірки, x

 

— вибіркове середнє, σ% — виправлене вибір-

кове

середньоквадратичне

відхилення,

α =1− γ

 

 

рівень значущості;

tα ; n−1

— критичне значення t -розподілу Стьюдента для рівня значущості α і

(n −1) ступенів вільності;

χα2

; n−1

, χ 2

α

; n

−1

— критичні значення розподілу χ 2

 

 

2

 

 

1−

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для рівнів значущості α (чи, відповідно,

1- α ) і (n −1)

ступенів вільності.

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

42

Типовий приклад Завдання А

У таблиці наведено кількість оформлених протягом одного літнього дня путівок у навмання відібраних туристичних агенціях міста:

5

5

6

6

9

6

6

9

9

6

9

5

6

9

7

6

10

5

6

9

10

6

6

6

9

7

6

7

7

5

7

3

7

5

9

12

7

7

9

9

Знайти вибіркове середнє, вибіркову дисперсію, виправлену вибіркову дисперсію, вибіркове середньоквадратичне відхилення, виправлене вибіркове середньоквадратичне відхилення, а також вибіркові коефіцієнти асиметрії та ексцесу. Зробити висновки.

Хід роботи

І спосіб Крок 1. Записати вибірку у вигляді одного стовпця, побудувати таблицю

частот (див. крок 3 лаб. роботи №2).

Крок 2. Знайти вказані в умові точкові оцінки, користуючись формулами табл. 2 для згрупованої вибірки (рис. 36).

Рис. 36. Таблиця частот і точкові оцінки для завдання А.

43

ІІ спосіб

Незележно від того, записана вибірка у вигляді одного стовпця чи ні, вказані в умові точкові оцінки можна знайти за допомогою стандартних функцій

Excel (рис. 37).

Таблиця 3.

Функція

Точкова оцінка

AVERAGE

вибіркове середнє x

VARP

 

 

 

 

 

 

 

вибіркова дисперсія D

 

 

 

 

 

VAR

%

 

виправлена вибіркова дисперсія D

STDEVP

вибіркове середньоквадратичне відхилення σ

STDEV

виправлене вибіркове середньоквадратичне відхилення σ%

SKEW

вибірковий коефіцієнт асиметрії

 

 

As

KURT

вибірковий коефіцієнт ексцесу

 

 

E

Аргументом кожної з наведених функцій є масив елементів вибірки.

Зауваження 3. Для розрахунку вибіркової асиметрії As та ексцесу E в Excel використовуються функції SKEW та KURT, причому значення функцій SKEW та KURT незначно відрізняються від результатів, отриманих за формулами табл. 2.

Рис. 37. Знаходження точкових оцінок за допомогою вбудованих функцій.

44

ІІІ спосіб

Записавши вибірку у вигляді одного стовпця, викликати надбудову Data Analysis і обрати процедуру Descriptive Statistics:

у полі Input Range ввести діапазон вибіркових даних (рис. 38);

у полі Output Range — результуючу клітинку;

поставити мітку Summary Statistics.

Рис. 38. Діалогове вікно Descriptive Statistics.

Отримані результати відображено на рис. 39.

Рис. 39. Результати процедури Descriptive Statistics.

Співставити результати, отримані трьома способами.

45

Завдання Б

Для заданої таблиці інтервальних частот ( zi−1 та zi — відповідно, ліва та права межі інтервалів, ni — інтервальні частоти) обчислити вибіркове середнє,

вибіркову дисперсію, виправлену вибіркову дисперсію, вибіркове середньоквадратичне відхилення, виправлене вибіркове середньоквадратичне відхилення, а також вибіркові коефіцієнти асиметрії та ексцесу.

Знайти для довірчого рівня γ = 0,95 інтервальні оцінки для невідомого

математичного сподівання і дисперсії генеральної сукупності, вважаючи, що ознака генеральної сукупності розподілена нормально.

zi−1

zi

ni

10,00

12,25

10

12,25

14,50

15

14,50

16,75

28

16,75

19,00

26

19,00

21,25

12

21,25

23,50

9

Хід роботи

 

 

 

 

Крок 1. Знайти середини інтервалів за формулою x =

zi−1 + zi

, де z

i−1

та

 

i

2

 

 

 

 

 

 

zi — відповідно, ліва та права межі заданих інтервалів.

Крок 2. Знайти об’єм вибірки n як суму всіх інтервальних частот:

k

n = åni .

i=1

Крок 3. Обчислити вказані в умові точкові оцінки, використовуючи формули табл. 2 для згрупованої вибірки (рис. 40).

46

Рис. 40. Знаходження точкових оцінок для завдання Б.

Крок 4. Обчислити рівень значущості α =1− γ ; знайти довірчі інтервали для невідомого математичного сподівання і дисперсії генеральної сукупності, враховуючи, що критичне значення tα , k розподілу Стьюдента та критичне зна-

чення χα2, k розподілу хі-квадрат шукають в Excel за допомогою функцій

TINV(α ; k ) та CHIINV(α ; k )

відповідно.

Висновок. У завданні А ми досліджували вибірку об’єму n = 40, кожний елемент якої — кількість оформлених туристичних путівок протягом одного літнього дня туристичними агенціями міста. Так, перша та друга туристичні агенції оформили за день по 5 путівок, третя та четверта — по 6 путівок і т. д.

Співставивши результати, отримані трьома способами, можна стверджувати, що туристичні агенції оформляють протягом одного літнього дня в серед-

ньому по 7,075 ≈ 7 туристичних путівок. Вибіркова дисперсія ( D = 3,37 ) не-

% =

значно відрізняється від виправленої ( D 3,46 ), що пояснюється немалим

47

об’ємом вибірки. В той же час, виправлена вибіркова дисперсія є більш точною оцінкою дисперсії генеральної сукупності, оскільки, на відміну від звичайної вибіркової дисперсії, є незміщеною. Також ми обчислили вибіркове середньоквадратичне відхилення (σ =1,84) та виправлене вибіркове середньоквадратич-

не відхилення (σ% =1,86, що становить приблизно 26,3 % від середнього значен-

ня). Крім того, ми знайшли вибірковий коефіцієнт асиметрії ( As = 0,44) та екс-

цесу ( E = −0,05).

У завданні Б ми досліджували вибірку зі 100 елементів, записану у вигляді таблиці інтервальних частот.

Ми обчислили необхідні точкові оцінки і можемо зробити наступні висновки: середнє вибіркове x =16,57 потрапляє в інтервал із найбільшою часто-

тою; відхилення між вибірковою дисперсією ( D = 9,74) та виправленою вибір-

% =

ковою дисперсією ( D 9,8 ) незначне внаслідок великого об’єму вибірки

n =100 ; виправлене вибіркове середньоквадратине відхилення (σ% = 3,14) ста-

новить приблизно 18,9 % від вибіркового середнього; дуже мале значення ви-

біркового коефіцієнта асиметрії ( As = 0,075 ) свідчить про симетричність роз-

поділу; від’ємне значення вибіркового коефіцієнта ексцесу ( E = −0,62) показує меншу „гостровершинність” гіпотетичного розподілу генеральної сукупності порівняно з нормальним розподілом. Оскільки вибіркові коефіцієнти асиметрії та ексцесу близькі до нуля, то розподіл ознаки генеральної сукупності наближається до нормального; понад 50 % значень ознаки генеральної сукупності по-

трапляють в інтервал (x −σ%; x + σ%), тобто в інтервал (13,43; 19,71); згідно з

„правилом трьох сигм” практично всі (> 99,7%) значення нормально роз-

поділеної випадкової величини потрапляють в інтервал (x - 3×σ%; x + 3×σ%) ;

у нашому випадку в інтервал (7,16; 25,98) потрапили всі елементи вибірки, що зайвий раз свідчить про близькість розподілу генеральної сукупності до нормального.

48

Крім того, знайдено довірчі інтервали для математичного сподівання a і

дисперсії σ 2 генеральної сукупності, якщо довірчий рівень γ = 0,95 :

15,95 < a < 17,19 ; 7,55 < σ 2 <13,23.

Лабораторна робота № 5

Перевірка гіпотези про нормальність розподілу генеральної сукупності за допомогою критеріїв χ2 (Пірсона) та Колмогорова

Основні поняття

Статистичною гіпотезою називається будь-яке твердження про властивості (ознаки) генеральної сукупності, що перевіряються на основі вибірки.

Результатом перевiрки статистичної гiпотези є висновок про „прийняття” гіпотези (неможливість її відхилити) або відхилення гіпотези при заданому рівні значущості α . Величина рівня значущості α вказує на ймовірність помилки першого роду при прийнятті гіпотези.

Статистичні гіпотези поділяють на параметричні та непараметричні. Гіпотеза про вид розподілу — це твердження про те, що випадкова вели-

чина ξ генеральної сукупності, що досліджується, має той чи інший закон роз-

поділу, функцію розподілу Fξ (x) або густину розподілу ймовірностей fξ (x) .

При цьому нульову гiпотезу записують у вигляді

H0 : Fξ (x) = g (x) ,

де Fξ (x) — теоретична функція розподілу (функція розподілу ознаки генера-

льної сукупності), g (x) — деяка відома функція, а протилежну гіпотезу — як

H1 : Fξ (x) ¹ g (x) .

Гіпотези про вид розподілу відносяться до непараметричних статистичних гіпотез.

Для перевірки гіпотези про нормальність розподілу в генеральній сукупності висуваємо основну та протилежну гіпотези:

49

 

H

 

: f

(x) =

 

 

1

 

 

 

×e

(xa)2

 

H

 

: f

 

(x) ¹

 

1

 

 

×e

( xa)2

 

0

 

 

 

 

 

2

,

 

1

ξ

 

 

 

2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ξ

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де

a та σ — невідомі (гіпотетичні) параметри розподілу.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Критерій χ 2 (Пірсона)

 

 

 

 

 

 

 

 

 

 

 

Для перевірки гіпотези про нормальність розподілу генеральної сукупно-

сті за допомогою критерію χ 2

 

(Пірсона) на основі заданої незгрупованої вибір-

ки x1 , x2 , ..., xn

об’єму n ³ 50 необхідно притримуватись наступної послідовно-

сті дій:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.

Обчислити вибіркове середнє x =

n

та вибіркове середньоквадратич-

1 åxi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

не відхилення σ

=

 

å(xi - x )2 , які у випадку прийняття гіпотези слугу-

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ватимуть точковими оцінками параметрів a та σ нормального розподілу.

2.

Розбивши вибірку на l рівновеликих інтервалів (кількість інтервалів мо-

 

жна знайти, наприклад, за формулою Стерджеса), побудувати таблицю ін-

 

тервальних частот:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(zi−1; zi ]

[z0; z1]

 

 

(z1; z2 ]

 

(z2; z3 ]

 

 

 

...

 

 

(zl−1; zl

]

.

 

 

 

 

 

ni

 

 

 

 

n1

 

 

 

 

 

 

n2

 

n3

 

 

 

...

 

 

 

nl

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У цій таблиці ni

(i =

 

) — інтервальні, або емпіричні, частоти.

 

1,l

3. Оскільки нормальний закон розподілу визначений на всій числовій осі, тобто область визначення функції

fξ (x) =

 

1

 

×e

( xa)2

 

 

2

 

 

 

 

σ

 

 

 

 

 

 

— це інтервал (−∞; + ∞), то перший та останній інтервали розбиття без по-

рушення загальності можна продовжити до −∞ та +∞ відповідно:

(zi−1; zi ]

(−∞; z1]

(z1; z2 ]

(z2; z3 ]

...

(zl−1; + ∞)

.

ni

n1

n2

n3

...

nl

 

50

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]