Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кушнир - Статистика.pdf
Скачиваний:
74
Добавлен:
20.03.2015
Размер:
1.56 Mб
Скачать

5.3. Показники варіації

Середні величини дають узагальнюючу характеристику сукупності за варіаційними ознаками і показують типовий для даних умов рівень цих ознак. Проте велике теоретичне і практичне значення має визначення відхилень від середніх величин. При цьому цікавими є не тільки крайні відхилення (кращі і гірші), а й сукупність усіх відхилень. В дисперсійному аналізі варіацією вважається відхилення індивідуальних значень від загальних. Для характеристики варіацій застосовують таку систему показників:

Розмах варіації:

 

R = xmax - xmin,

(5.5)

В інтервальних рядах розподілу R визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого, або як різницю між середніми значеннями цих інтервалів.

Середнє арифметичне або лінійне відхилення – це середній модуль відхилень індивідуальних значень ознаки від їх середньої величини:

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

x

 

 

для незгрупованих даних,

(5.6)

d =

n

 

 

 

 

 

 

 

 

 

 

x

x

f

для згрупованих даних.

(5.7)

d =

 

 

f

 

 

 

Коефіцієнт осциляції – відношення розмаху варіації до

середньої величини ознаки:

R

 

 

V =

 

 

(5.8)

 

 

 

R

x

 

 

 

 

Лінійний коефіцієнт варіації визначається, як відношення середнього лінійного відхилення до середнього значення ознаки:

V

 

=

 

d

 

(5.9)

d

x

 

 

 

 

 

Однак, визначення лінійного коефіцієнта варіації, коефіцієнта осциляції та середнього лінійного відхилення недостатньо для оцінки варіації.

Основними узагальнюючими характеристиками варіації є

дисперсія і середнє квадратичне відхилення. Ці показники застосовуються не лише для оцінки варіації ознаки, але і для виміру

40

зв’язку між явищами та оцінки величини похибки при вибірковому спостереженні.

Дисперсія – це середня арифметична квадратів відхилень кожного значення ознаки від середньої величини. Дисперсію також називають середнім квадратом відхилень. В залежності від вихідних даних дисперсія може визначатися за середньою арифметичною простою або зваженою.

Для незгрупованих даних розраховується проста дисперсія:

 

 

 

(x

 

)2

σ

2

=

x

 

(5.10)

 

 

 

n

Для згрупованих даних розраховується зважена дисперсія:

 

 

 

(x

 

)2 f

 

σ

2

=

x

(5.11)

 

f

 

 

 

 

Середнє квадратичне відхилення – це узагальнююча характеристика абсолютних розмірів варіації ознаки в сукупності. Визначається як корінь квадратний із дисперсії:

 

 

 

(x

 

)2

 

 

σ = σ

2

=

x

- для незгрупованих даних

(5.12)

 

 

n

 

 

 

(x

 

 

 

 

 

 

)2 f

 

 

 

σ =

 

x

- для згрупованих даних

(5.13)

 

 

f

 

 

 

 

 

 

Середнє квадратичне відхилення завжди виражається в тих же одиницях виміру, що і ознака (в метрах, тонах, відсотках, гектарах) і є абсолютною мірою варіації.

Якщо вихідні дані представлені у вигляді інтервального ряду, то спочатку треба визначити дискретні значення, а потім розраховувати усі показники.

Порядок розрахунку середнього квадратичного відхилення:

1.Обчислюємо середню арифметичну ряду ( Х ) .

2. Відхилення кожної варіанти від середньої арифметичної:

(Х Х) .

41

3.Кожне відхилення підноситься до квадрату: (Х Х)2 .

4.Квадратвідхиленнямножитьсянавідповіднувагу: (Х Х)2 f

5.Додаються всі добутки: Σ(Х Х)2 f

6.

Ділиться сума

добутків на

суму

ваги (частот):

Σ(Х

 

)2 f

 

 

 

 

Х

і отримується дисперсія.

 

 

 

Σf

 

 

 

 

 

 

 

 

 

7.

З

дисперсії

вилучається

корінь

квадратний:

Σ(Х

Х

)2 f

і отримується середнє квадратичне відхилення.

Σf

 

Чим менше середнє квадратичне відхилення, тим типовіша середня і тим більш однорідна сукупність. На практиці застосовують спрощений метод визначення дисперсії за

залежністю:

 

 

 

 

 

 

 

x2 f

xf

 

 

 

 

2

 

 

 

 

 

2

 

 

2

 

 

 

 

2

 

 

 

 

 

 

= x

x

 

 

 

σ

 

 

 

=

f

( f

)

 

(5.14)

Тобто дисперсія ознаки дорівнює різниці між середнім квадратом значень ознаки і квадратом середньої.

Коефіцієнт варіації – є відносною мірою варіації і дозволяє порівняти ступінь варіації ознак у рядах варіації з різним рівнем середніх. Розраховується як відношення середнього квадратичного

відхилення до середньої величини:

 

V =

σ

100

(5.15)

 

 

 

 

x

 

 

 

 

Якщо коефіцієнт варіації < 33%, то така сукупність вважається

однорідною.

Розглянемо обчислення характеристик варіації для альтернативної ознаки. Позначимо через ” 0 ” – відсутність ознаки. Частку одиниць, які мають наявність ознаки позначаємо через “ p ”, а частку одиниць, які мають відсутність ознаки – “ q “.

p + q = 1 q = 1 p

(5.16)

42

 

Тоді

 

 

 

= 1 p + 0 q = p

 

 

x

(5.17)

 

 

p + q

 

Дисперсія альтернативної ознаки ( σр2 ) дорівнює

добутку

частки (р) на доповнююче частки число (1 – q).

 

 

 

σр2 = р( 1 – pq ),

(5.18)

Корінь квадратний σр2 дасть середнє квадратичне відхилення.

Приклад обчислення показників варіації. Визначити дисперсію, середнє квадратичне відхилення і коефіцієнт варіації за такими даними:

Таблиця 5.6

Група

Середина

Число

 

 

 

робітників за

_

_

_

розміром

інтервалу,

робітників,

х - х

( х – х )2

( х – х )2f

заробітної

(х)

( f )

 

 

 

плати, грн.

 

 

 

 

 

1300-1400

1350

10

-308

94864

948640

1400-1500

1450

50

-208

43264

2163200

1500-1600

1550

100

-108

11664

1166400

1600-1700

1650

115

-8

64

7360

1700-1800

1750

180

92

8464

1523520

1800-1900

1850

45

192

36864

1658880

Разом:

-

500

-

-

7468000

1. Визначаємо середню арифметичну зважену:

 

=

xf

=

 

1350 10 +1450 50 +1550 100 +1650 115 +1750 180 +1850 45

= 1658,0 грн.

x

500

 

 

f

 

 

2.Визначаємо дисперсію:

σ2 = (x x)2 f = 7468000 = 14936

f 500

3.Визначаємо середнє квадратичне відхилення:

σ= σ 2 = 14936 = 122,2 грн.

4.Коефіцієнт варіації:

43

V= σx = 1221658,2 100 = 7,4%

5.Розрахунок дисперсії за спрощеною формулою (табл. 5.2):

 

 

 

_

_

 

 

 

 

 

 

σ = х 2 – ( х )2

Таблиця 5.7

 

 

 

 

 

 

 

x

 

 

f

 

x2

 

x2f

 

1350

 

 

10

 

1822500

 

18225000

 

1450

 

 

50

 

2102500

 

105125000

 

1550

 

 

100

 

2402500

 

240250000

 

1650

 

 

115

 

2722500

 

313087500

 

1750

 

 

180

 

3062500

 

551250000

 

1850

 

 

45

 

3422500

 

154012500

 

Разом:

 

 

500

 

-

 

1381950000

 

 

 

 

= 1381950000 = 2763900

 

 

 

 

x2

 

 

 

 

 

500

 

 

 

 

 

 

 

_

 

 

 

 

 

( х )2 = (1658)2 = 2748964

σ= х 2 – ( х )2 = 2763900 – 2748964 = 14936

5.4.Дисперсійний аналіз. Правило додавання дисперсій.

Основною метою дисперсійного аналізу є виявлення на основі величини загальної дисперсії впливу окремих чинників на варіацію ознаки. Для оцінки частки варіації, зумовленої тією чи іншою ознакою, сукупність розподіляють на групи за тією ознакою, властивість якої досліджується. Це дозволяє розкласти загальну варіацію на 2 дисперсії, з яких одна частина варіації визначається впливом чинника, покладеного в основу групування, а друга – варіацією усіх чинників, крім того, що вивчається. Отже, згідно з правилом додавання дисперсій в дисперсійному аналізі визначають загальну, міжгрупову, внутрішньогрупову дисперсії.

Загальна дисперсія характеризує варіацію ознаки у статистичній сукупності в результаті впливу всіх чинників.

44

σ 2 =

 

 

2

(5.19)

x2

x

Міжгрупова дисперсія показує рівень відхилення групових середніх від загальної середньої, тобто характеризує вплив чинника, покладеного в основу групування.

 

 

 

(

 

 

)2 fi

 

δ

2

=

xi

x

(5.20)

 

 

fi

 

 

 

 

 

Внутрішньогрупова дисперсія (залишкова) характеризує варіацію ознаки в середині кожної групи статистичного групування.

σ2 = (xi xi )2 fi

i fi

Отже, загальна дисперсія складається внутрішньогрупової дисперсії і міжгрупової дисперсії.

Сутність зв’язку між ознаками характеризує детермінації, який розраховується як відношення дисперсії до загальної дисперсії:

(5.21)

із суми

коефіцієнт

міжгрупової

η

2

=

δ 2

(5.22)

 

σ 2

 

 

 

 

Корінь квадратний з

η2

- це емпіричне кореляційне

співвідношення:

 

 

 

 

η =

 

δ 2

(5.23)

 

σ 2

 

 

 

 

Кореляційне співвідношення характеризує ступінь наближення зв’язку до функціонального, тобто тісноту кореляційної залежності і коливається від 0 до 1 .

Якщо η2 = 0, то міжгрупова дисперсія дорівнює 0.

Якщо η2 = 1, то міжгрупова дисперсія дорівнює загальній, а середня з групових дорівнює 0. "η" може бути як додатнім так і від'ємним. Якщо факторна і результативна ознака змінюються в одному напрямку, то кореляційне співвідношення буде з знаком

“+”.

Правило додавання дисперсій. Загальна дисперсія дорівнює сумі середньої із групових дисперсій і міжгрупової дисперсії.

45

σ 2 =

σ 2

+ 2

(5.24)

Приклад 1:

Відомі дані про розподіл заробітної плати по трьом групам робітників з різним стажем роботи.

Визначити:

1.Середню заробітну плату для всієї сукупності робітників.

2.Загальну дисперсію і дисперсію заробітної плати.

Таблиця 5.8.

Дані про розподіл заробітної плати по трьом групам робітників з різним стажем роботи

 

Число

Середня

 

Середнє квадратичне

Стаж роботи

робітників(f),

 

 

 

зарплата

x

 

відхилення, грн (σ )

 

або(n)

 

i

 

 

<3

10

500

 

 

12

3 – 10

15

600

 

 

10

>10

25

700

 

 

20

50

 

 

 

 

x = 500 10 +15 600 + 25 700 = 630 (грн) 50

σ 2 =σ 2 + 2

σ 2 = 122 10 +102 15 + 202 25 = 258,8 (грн) 50

2 = (500 630)2 10 + (600 630)2 15 + (700 630)2 25 = 6100 (грн) 50

σ2 =258,8+6100=6358,8

σ= 6358,8 = 79,7 (грн)

Приклад 2. Визначити дисперсію, середнє квадратичне відхилення і коефіцієнт варіації:

46

Таблиця 5.9.

Розрахункова таблиця для визначення дисперсії, середнього квадратичного відхилення і коефіцієнта варіації

Групи

робітників зарозміром зарплати, грн.

1300-1400

1400-1500

1500-1600

1600-1700

1700-1800

1800-1900

Разом

Варіанта

Число

 

 

 

(x

 

)2

(x

 

)2f

 

 

(середина

робіт-

x

 

 

 

 

x2

x2f

x

x

x

інтервалу)

ників

 

 

 

 

 

 

 

 

 

 

 

, x, грн.

 

 

 

 

 

 

 

 

 

 

 

 

1350

 

 

 

 

 

 

 

10

-308

 

94864

948640

1822500

18225000

1450

50

-208

 

43264

2163200

2102500

105125000

1550

100

-108

 

11664

1166400

2402500

240250000

1650

115

-8

 

 

64

 

7360

2722500

313087500

1750

180

92

 

 

8464

1523520

3062500

551250000

1850

45

192

 

36864

1658880

3422500

154012500

500

 

7468000

1381950000

1)Середня місячна зарплата

 

=

xf

=

 

1350 10 +1450 50 +1550 100 +1650 115 +1750 180 +1850 45

= 1658,0 грн.

x

500

 

 

f

 

 

2)Середній квадрат відхилень від арифметичної:

 

(x

 

)2 f

 

 

 

σ 2 =

x

=

7468000

= 14936 грн.

 

f

 

500

 

3)Середнє квадратичне відхилення

σ= σ 2 = 14936 = 122,2 грн. Вибірка типова.

4)Коефіцієнт варіації:

V= σx = 1221658,2 100 = 7,4% <33%, отже, сукупність однорідна.

5)Обчислимо дисперсію спрощеним методом.

x2 = 1381950000 = 2763900 500

_

( х )2 = (1658)2 = 2748964

σ = х 2 – ( х )2 = 2763900 – 2748964 = 14936 грн

47