Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Кореляція

.docx
Скачиваний:
36
Добавлен:
08.02.2016
Размер:
74.87 Кб
Скачать

Кореляція дослівно з латинської "correlation" – відношення, тобто це означає співвідношення, відповідність речей, понять. Кореляційним зв'язком називається такий зв'язок між ознаками суспільно-економічних явищ, за якого на величину результативної ознаки крім факторної впливають багато інших ознак, які можуть діяти в різних напрямах одночасно чи послідовно. Цей зв'язок характеризується тим, що між факторною і результативною ознаками немає повної відповідності, а лише є певне співвідношення. Особливістю кореляційного зв'язку є те, що кожному значенню факторної ознаки відповідає не одне, а ціла низка значень результативної ознаки. Кореляційний зв'язок можна виявити тільки у вигляді загальної тенденції при масовому порівнянні факторів.

Кореляційний аналіз (кореляційний метод) – метод дослідження взаємозалежності ознак у генеральній сукупності, які є випадковими величинами з нормальним характером розподілу.

Основними вимогами до застосування кореляційного аналізу є достатня кількість спостережень, сукупності факторних і результативних показників, а також їх кількісний вимір і відображення в інформаційних джерелах.

Застосування кореляційного аналізу тісно пов'язане з регресійним аналізом, тому його часто називають кореляційно-регресійним. Головними завданнями кореляційного аналізу є:

– визначення форми зв'язку;

– вимірювання щільності (сили) зв'язку;

– виявлення впливу факторів на результативну ознаку.

Здійснення кореляційного аналізу передбачає такі послідовні етапи:

1) встановлення причинно-наслідкових зв'язків між досліджуваними ознаками (виявлення факторів та вибір серед них тих, які найбільше впливають на результативний показник);

2) формування кореляційно-регресійної моделі (інформаційне забезпечення аналізу, вибір типу і форми зв'язку, складання моделі);

3) визначення кореляційних характеристик (показників зв'язку);

4) статистична оцінка параметрів зв'язку (економічна інтерпретація, оцінка значимості коефіцієнтів кореляції (наскільки відібрані фактори пояснюють варіацію результативного показника) та використання їх для вирішення практичних завдань, наприклад прийняття рішень, прогнозування, планування, нормування тощо (рис. 12.3).

Отже, на початковому етапі аналізу виявляються зв'язки між результативною і факторними ознаками. Ці зв'язки можуть бути різними залежно від характеру залежності, напряму дії та аналітичного виразу (рис. 12.4).

Види зв’язків суспільних явищ

Рис. 12.3. Схема кореляційно-регресійного аналізу

Хоча варіація факторної ознаки і велика, проте вона не перевищує 33%. Це означає, що вихідні дані можна оцінити як однорідні та використати в подальших дослідженнях. Вважається, якщо варіація вище 33% – це свідчить про неоднорідність сукупності та потребує виключення нетипових матеріалів спостереження, як правило, в перших та останніх ран-жованих рядах вибірки. Незначною визнається варіація, що не перевищує 10% (табл. 12.4).

Формування кореляційної моделі передбачає визначення чи це буде проста (парна) кореляція (результативна ознака з одним фактором), чи множинна (результативна ознака і декілька факторів). У свою чергу за характером зв'язку кореляційні моделі можуть бути лінійними (прямолінійними, з оберненою лінійною залежністю) чи нелінійними (криволінійними).

Схема кореляційно-регресійного аналізу

На другому етапі оцінюється вихідна інформація для дослідження з використанням різних статистичних критеріїв (середнє квадратичне відхилення, коефіцієнт варіації тощо), а потім формується модель стохастичного зв'язку.

Для здійснення кореляційного аналізу скористаємося прикладом, який використали раніше для демонстрації регресійного аналізу. Спочатку оцінимо типовість та однорідність даних спостереження, які визначаються відносним їх розподілом навколо середнього рівня, за допомогою таких критеріїв, як середньоквадратичне відхилення (а) та коефіцієнт варіації (V).

Таблиця 12.4. Оцінка варіації за коефіцієнтом варіації

Значення коефіцієнта варіації

Оцінка варіації

5%

Варіація слабка

6—10%

Варіація помірна

11—20%

Варіація значна

21—50%

Варіація велика

Більше 50%

Варіація дуже велика

У лінійних моделях тіснота зв'язку між досліджуваними показниками вимірюється за допомогою лінійного коефіцієнта кореляції (Пірсона) r за формулою

При цьому:

Коефіцієнт кореляції набуває значень у межах ±1, завдяки чому відображає не лише щільність (тісноту) зв'язку, а й його напрям. Так, додатне значення свідчить про наявність прямого зв'язку, а від'ємне – зворотного.

Розрахуємо коефіцієнт кореляції:

Отже, розрахований коефіцієнт кореляції свідчить про наявність значного зв'язку між рівнем озброєності праці основними засобами та продуктивністю праці.

Оскільки обчислений коефіцієнт кореляції більший за критичне його значення (0,6 > 0,3809), то з вірогідністю 0,95 можна стверджувати про статистично достовірну залежність між озброєністю і продуктивністю праці.

Шкала оцінки тісноти зв'язку за коефіцієнтом кореляції та критичне його значення наведені в табл. 12.5 і 12.6.

Таблиця 12.5. Величина коефіцієнта кореляції і тіснота зв'язку за "Таблицею Чеддока"

Коефіцієнт кореляції

Тіснота зв'язку

1,00

Зв'язок функціональний

0,90—0,99

Дуже сильний

0,70—0,89

Сильний

0,50—0,69

Значний

0,30—0,49

Помірний

0,10—0,29

Слабкий

0,00

Зв'язок відсутній

Крім відображення щільності зв'язку, коефіцієнт кореляції відіграє ще одну важливу роль – через коефіцієнт детермінації (D) він характеризує розмір впливу факторів на результативну ознаку:

Таблиця 12.6. Критичне значення коефіцієнта кореляції

Кількість одиниць сукупності

Вірогідність

0,95

0,99

1

2

3

10

0,5760

0,7079

11

0,5529

0,6835

12

0,5324

0,6614

13

0,5139

0,6411

14

0,4973

0,6226

15

0,4821

0,6055

16

0,4683

0,5897

17

0,4555

0,5751

18

0,4138

0,5614

19

0,4329

0,5487

20

0,4227

0,5368

25

0,3809

0,4869

30

0,3194

0,4487

35

0,3246

0,4182

40

0,3044

0,3932

45

0,2875

0,3721

50

0,2732

0,3511

60

0,2500

0,3248

70

0,2319

0,3017

80

0,2172

0,2830

90

0,2050

0,2673

100

0,1946

0,2540

У нашому прикладі

Це означає, що у наведеному прикладі 36% рівня продуктивності праці формується під впливом озброєності працівників основними засобами. Решту 64% становлять інші фактори – матеріальна зацікавленість робітників, інтенсивність використання робочого часу тощо.

Залежності між декількома факторними ознаками складніші q виражаються рівнянням множинної лінійної кореляції

Коефіцієнт множинної кореляції характеризує ступінь тісноти зв'язку між залежною змінною та кількома незалежними змінними. Він не може бути меншим, ніж абсолютна величина будь-якого коефіцієнта парної чи множинної кореляції і набуває значення від 0 до 1.

Загальний математичний вираз коефіцієнта множинної кореляції має вигляд

Рівняння множинної регресії і показники множинної кореляції розв'язують і визначають за допомогою спеціальних комп'ютерних програм.

Таким чином, кореляційний аналіз має велике значення в економічному аналізі, вивченні суспільних явищ і процесів. Зокрема, він допомагає вирішити такі завдання:

– встановлення характеру і тісноти зв'язку між досліджуваними явищами;

– кількісний вимір ступеня впливу окремих факторів та їх сукупності на рівень явища, яке вивчається;

– розрахунок кількісних змін аналізованого явища при прогнозуванні показників та об'єктивна оцінка господарської діяльності підприємства.

Велике значення відводиться кореляційному аналізу в дослідженні кореляційних зв'язків на виробництві, зокрема між рівнем продуктивності праці та озброєністю її основними засобами, між урожайністю і кількістю внесених добрив, між собівартістю і випуском продукції та ін.

Завдяки кореляційному аналізу є можливість глибше дослідити взаємозв'язки економічних явищ і процесів, виявити вплив факторів на результати господарської діяльності, виявити і підрахувати резерви підвищення ефективності виробництва. Все це позитивно позначається на здійсненні управлінської, маркетингової та інших видів діяльності, прийнятті економічно обґрунтованих господарських рішень.

РАНГ

Коефіцієнт кореляції рангу Спірмена

Кореляція Спірмена виходячи з диних одного результату, коли дві змінні монотонно пов'язані між собою, навіть якщо це відношення не є лінійним. Навпаки, це не дає досконалої кореляції Пірсона.

Коли дані приблизно еліптично розподілені та немає помітих викидів, коефіцієнти кореляції Спірмена та Пірсона дають близькі значення.

Кореляція Спірмена є менш чутливою, ніж кореляція Пірсона відносно сильних викидів, які знаходяться в кінці обох зразків.

В статистиці коефіцієнт кореляції рангу Спірмена названий на честь Чарльза Спірмена. Цей коефіцієнт є непараметричною мірою статистичної залежності між двома змінними. Він оцінює наскільки гарно можна описати відношення між двома змінними за допомогою монотонної функції. Якщо немає повторних значень даних, то коефіцієнт Спірмана дорівнює 1 або −1, це відбувається коли кожна зміна є монотонною функцією від іншої зміної. Коефіцієнт кореляції, як і будь — яке обчислення кореляції, підходить для безперервних ті дискретних зміних, у тому числі порядкових змінних. Коефіцієнт кореляції Спірмена визначається як коефіцієнт кореляції Пірсона між ранжирування змінні. Для вибірки обсягу n множини Xi, Yi перетворюються в ряди xi, yi та обчислюється наступним чином:

У додатках, де повторювані значення відсутні, проста процедура може бути використана для розрахунку . Різниця між рангами кожного спостереження від двох змінних вираховуються і визначається за формулою: Зауважимо, що цей останній спосіб не слід використовувати в тих випадках, коли набір даних буде скорочуватись, тобто, коли коефіцієнт кореляції Спірмена бажаний для верхнього запису X (або шляхом попереднього зміни положення або після зміни рангу або обидва).

7.4. Рангова кореляція

Взаємозв’язок між ознаками, які можна зранжувати, передусім на основі бальних оцінок, вимірюється методами рангової кореляції. Рангами називають числа натурального ряду, які згідно зі значеннями ознаки надаються елементам сукупності і певним чином упорядковують її. Ранжування проводиться за кожною ознакою окремо: перший ранг надається найменшому значенню ознаки, останній — найбільшому або навпаки. Кількість рангів дорівнює обсягу сукупності. Очевидно, зі збільшенням обсягу сукупності ступінь «розпізнаваності» елементів зменшується. З огляду на те, що рангова кореляція не потребує додержання будь-яких математичних передумов щодо розподілу ознак, зокрема вимоги нормальності розподілу, рангові оцінки щільності зв’язку доцільно використовувати для сукупностей невеликого обсягу.

Ранги, надані елементам сукупності за ознаками х і у, позначають відповідно Rxj та Ryj. Залежно від ступеня зв’язку між ознаками певним чином співвідносяться й ранги. При прямому функціональному зв’язку Rxj = Ryj, тобто відхилення між рангами dj = Rxj – Ryj = 0, отже, і сума квадратів відхилень . При зворотному функціональному зв’язку де n —

число рангів. Якщо зв’язок між ознаками відсутній, являє собою середню арифметичну цих крайніх значень:

,

а отже,

.

Спираючись на зазначену математичну тотожність, К. Спірмен запропонував формулу для коефіцієнта рангової кореляції:

Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції: змінюється в межах від – 1 до + 1, водночас оцінює щільність зв’язку та вказує на його напрям.

Визначимо коефіцієнт рангової кореляції за даними експертних оцінок ефективності економіки та ступеня політичного ризику для семи країн з перехідною економікою (табл. 7.7). Оскільки експертні оцінки представлені балами, необхідно провести ранжування країн. За оцінками ефективності економіки країні з найбільшим балом надається ранг 1, з найменшим — ранг n = 7. За оцінками ступеня політичного ризику, навпаки, ранг 1 надається країні з найменшим ризиком, а ранг 7 — країні з найбільшим ризиком.

Якщо два і більше елементів сукупності мають однакові значення ознаки, їм надається середній ранг. Нехай, наприклад, друге за розміром значення ознаки мають три елементи сукупності (№ 2, 3, 4), тоді всім їм надається ранг а щільність зв’язку можна оцінити за формулою лінійного коефіцієнта кореляції.

7.5. Оцінка узгодженості

варіації атрибутивних ознак

Взаємозв’язки між атрибутивними ознаками аналізуються на підставі таблиць взаємної спряженості (співзалежності). Як приклад розглянемо табл. 7.9, в якій наведено результати соціологічного опитування населення щодо намірів прилучитися до ринку цінних паперів. Тих, хто не боїться ризикувати, класифікували як ризикованих інвесторів, тих, хто не уявляє ризику без гарантій, — обережними, а хто ризику уникає взагалі, — неризикованими.

Частоти комбінаційного розподілу респондентів за віком і схильністю до ризику концентруються навколо діагоналі з верхнього лівого кута в нижній правий. Серед молодих більшість готова ризикувати на ринку цінних паперів, у середній віковій групі готовий ризикувати один з п’яти, а половина не уявляє ризику без гарантій, у третій віковій групі на одного обережного припадають два неризиковані.