2.2 Аналіз моделі на наявність мультиколінеарності
Знаходження кореляційної матриці r.
Знайдемо кореляційну матрицю r, для чого скористаємося вбудованою функцією КОРРЕЛ. Отримаємо наступну матрицю парних коефіцієнтів кореляції:
|
1,00 |
0,95 |
0,97 |
r= |
0,95 |
1,00 |
0,95 |
|
0,97 |
0,95 |
1,00 |
Визначення критерію Пірсона.
Для відповіді на питання: чи є цей зв’язок наслідком мультиколінеарності чи ні скористаємося спочатку критерієм χ2. Для цього обчислимо визначник матриці r:
| r | = |
0,004495 |
Обчислимо критерій Пірсона за формулою:
(2.2)
Отримуємо:
65,75855
таб = 7,814728
Так як , то в масиві пояснюючих змінних існує мультиколінеарність.
Визначення матриці C= r-1.
Визначимо матрицю С, обернену до матриці парних коефіцієнтів кореляції (скористаємося вбудованою функцією МОБР) і отримаємо:
|
20,61 |
-5,22 |
-15,08 |
С= |
-5,22 |
12,11 |
-6,46 |
|
-15,08 |
-6,46 |
21,82 |
Обчислення F-критеріїв.
Обчислимо значення F-критеріїв для кожної пояснюючої змінної за формулою:
(2.3)
де сіі - діагональні елементи матриці С.
Отримаємо:
F1= 71,92096 |
F2= 40,74494 |
F3= 76,33211 |
Обчислимо табличне значення критерію Фішера та порівняємо його зі знайденими F-критеріями:
Fтаб= 3,587434
Так як F1>Fтаб, F2>Fтаб, F3>Fтаб, то це значить, що кожна з пояснюючих змінних мультиколінеарна з іншими.
Знайдемо частинні коефіцієнти детермінації для кожної змінної. Для чого скористаємося формулою:
(2.4)
R²(x1)= 0,95149
|
R²(x2)= 0,917439
|
R²(x3)= 0,95166
|
Знайдемо множинний коефіцієнт кореляції, для чого скористаємося формулою:
(2.5)
де: t – табличне значення критерію Стьюдента на рівні значимості та степенями вільності .
rкр= 0,513977
Знаходження частинних коефіцієнтів кореляції.
Визначимо частинні коефіцієнти кореляції, які показують на тісноту зв’язку між змінними хі та хj при умові, що всі інші змінні не впливають на цей зв’язок. Для цього скористаємося формулою:
(2.6)
r12= 0,330157
r13= 0,710887
r23= 0,39766
Знайдені коефіцієнти порівнюємо з критичним значенням r. Отже, так як r12> rкр, то між змінними існує тісний зв’язок так як r13<rкр, то між змінними не існує тісного зв’язку; так як r23<rкр, то між змінними не існує тісного зв’язку.
Порівнюючи дані частинних коефіцієнти кореляції ми тільки показуємо тісноту зв’язку між двома незалежними змінними за умови , що третя не впливає на зв'язок. Так частинні коефіцієнти кореляції не свідчать про наявність або відсутність мультиколінеарності.
Обчислення t-критеріїв.
Знайдемо, чи зв’язані мультиколінеарно фактори х1 і х2, х1 і х3 та х2 і х3 відповідно. Для цього обчислимо t-критерії за формулою:
(2.7)
t12= 1,160056
t13= 3,352373
t23= 1,437429
Обчислимо табличне значення t-критерію.
tтаб= 2,200985
Фактичні значення t порівнюємо із табличним значенням.
Отже, так як t12> t(tab),то між змінними х1 і х2 існує мультиколінеарний зв’язок. Так як t13 <t(tab), то між змінними х1 і х3 мультиколінеарність не існує.
Так як t23 <t(tab), то між змінними х2 і х3 мультиколінеарність не існує.
Для включення факторів у модель потрібно, щоб вони були слабо зв’язані між собою та зв’язані з результуючим фактором. Таким чином, розглянемо дві моделі:
Y = a0+a1*X1+a3*X3
|
||
Y |
X1 |
X3 |
12,11 |
2,17 |
3,22 |
12,3 |
2,9 |
3,87 |
13,82 |
3,29 |
4,95 |
14,84 |
4,13 |
5,1 |
15,86 |
5,25 |
5,98 |
16,41 |
4,92 |
7,28 |
17,8 |
5,79 |
6,9 |
18,61 |
5,87 |
7,54 |
19,57 |
6,99 |
7,91 |
21,26 |
7,04 |
8,4 |
21,08 |
8,14 |
8,14 |
22,99 |
8,06 |
8,76 |
23,43 |
8,57 |
9,67 |
24,63 |
9,45 |
10,28 |
25,41 |
9,06 |
10,59 |
52 |
10 |
12 |
Та другу модель
Y=a0+a1*X2+a2*X3
Y |
X2 |
X3 |
12,11 |
3,65 |
3,22 |
12,3 |
3,82 |
3,87 |
13,82 |
3,76 |
4,95 |
14,84 |
5,24 |
5,1 |
15,86 |
5,03 |
5,98 |
16,41 |
5,52 |
7,28 |
17,8 |
5,62 |
6,9 |
18,61 |
6,98 |
7,54 |
19,57 |
6,91 |
7,91 |
21,26 |
7,95 |
8,4 |
21,08 |
7,24 |
8,14 |
22,99 |
9,27 |
8,76 |
23,43 |
8,46 |
9,67 |
24,63 |
10,3 |
10,28 |
25,41 |
10,72 |
10,59 |
52 |
11 |
12 |
Обчислимо їх характеристики та виберемо кращу з моделей. Застосуємо до обох функцію ЛИНЕЙН. Отримаємо:
1)для першої моделі:
0,803307 |
1,112975 |
6,060469 |
0,343775 |
0,332033 |
0,721707 |
0,979949 |
0,673122 |
#Н/Д |
293,2332 |
12 |
#Н/Д |
265,7241 |
5,437121 |
#Н/Д |
2)для другої моделі:
1,002035 |
0,940729 |
5,119596 |
0,237514 |
0,230888 |
0,55393 |
0,98371 |
0,606717 |
#Н/Д |
362,3203 |
12 |
#Н/Д |
266,7439 |
4,417261 |
#Н/Д |
Вид моделі |
Е |
R2 |
F |
Fтаб |
Y=5,621635+0,696712*x1+1,301718*x3 |
0,673122 |
0,979949 |
293,2332 |
3,885294 |
Y=4,667597+0,760249*x2+1,231343*x3 |
0,606717 |
0,98371 |
362,3202 |
3,885294 |
З’ясувавши характеристики обох моделей, ми виявили, що друга модель краще за першу, оскільки стандартна похибка другої моделі менша за стандартну першої .
2.3 Оцінка достовірності моделі за критерієм Фішера та достовірності коефіцієнтів моделі за критерієм Стьюдента
Для обчислення табличного значення критерію Фішера скористаємося вбудованою в MS Excel функцією FРАСПОБР, де:
Одержимо табличне значення критерію Фішера:
Перша модель:
Fтаб= 3,885294
F= 293,2332
Друга модель:
Fтаб= 3,885294
F= 362,3202
Розрахункове значення.
Fр отримаємо з таблиці де використовується функція ЛИНЕЙН.
Для першої та другої моделі.
Так як Fр>Fтаб, то отримана економетрична модель достовірна, згідно критерію Фішера, отримана модель достовірна.
Оцінимо значущість коефіцієнтів моделі згідно t-критерію Стьюдента.
За означенням t-критерії для коефіцієнтів а1 ; а0; а2;
Для першої моделі:
= 6,558741 = 2,14828 4,059755 (2.9)
Для другої моделі:
= 4,380401 = 2,574938 4,15641 (2.10)
Порівняємо одержані t-критерії для коефіцієнтів моделі з табличним значенням критерію Стьюдента. Для обчислення табличного значення скористаємося вбудованою функцією СТЬЮДРАСПОБР:
Для першої моделі:
t(a2)= |
2,336722 |
t(a1)= |
3,352003 |
t(a0)= |
8,397403 |
t(tab)= |
2,200985 |
|
|
Для другої моделі:
t(a2)= |
4,218845 |
t(a1)= |
4,074389 |
t(a0)= |
9,242322 |
t(tab)= |
2,200985 |
Для першої та другої моделі: Так як ta3; ta2; ta1; ta0>tтаб, то модель достовірна.
Отже, дослідивши спочатку модель, яка має 3 змінні, я виявила мультиколінеарність між змінними Х1 та Х3. Побудувавши 2 моделі, між змінними яких мультиколінеарность відсутня, та перевіривши їх якість, можна прийти до висновку, що обидві моделі неякісні, тобто неадекватні економічному процесу, адже жодна з них не відповідає вимогам хоча б однієї з основних характеристик.
Таким чином нам удалось уникнути мультиколінеарності, але модель виявилася неякісною, причиною цього може бути:
недостатній об’єм даних;
новий нестабільний економічний процес або неповністю вивчене економічне явище, модель якого була побудована.