Приклад виконання лабораторної роботи №2
Досліджується залежність продуктивності праці Y (т/год) від рівня механізації робіт Х1 (%), середнього віку робітників Х2 (років) і енергоозброєності Х3 (КВт / 100 працюючих) по даним 14 промислових підприємств (див. таблицю свого варіанту).
Таблиця 1 – Фактори, що впливають на прибуток підприємства
№ п/п |
Продуктивність праці, т/год, |
Рівень механізації робіт, %, |
Середній вік робітників, років, |
Енергоозброєність, КВт/100 працюючих, |
1 |
20 |
32 |
33 |
300 |
2 |
24 |
30 |
31 |
290 |
3 |
28 |
36 |
41 |
350 |
4 |
30 |
40 |
39 |
400 |
5 |
31 |
41 |
46 |
400 |
6 |
33 |
47 |
43 |
480 |
7 |
34 |
56 |
34 |
500 |
8 |
37 |
54 |
38 |
520 |
9 |
38 |
60 |
42 |
590 |
10 |
40 |
55 |
35 |
540 |
11 |
41 |
61 |
39 |
600 |
12 |
43 |
67 |
44 |
700 |
13 |
45 |
69 |
40 |
700 |
14 |
48 |
76 |
41 |
750 |
Рішення
Обчислимо середні значення та стандартні відхилення пояснюючих змінних . Для цього можна скористатись стандартними функціями MS Excel (СРЗНАЧ та СТАНДОТКЛ).
Дані величини можна також розрахувати за формулами:
,
,
де середнє значення -тої пояснюючої змінної;
індивідуальне значення -тої пояснюючої змінної;
стандартне відхилення -тої пояснюючої змінної;
– число спостережень.
Додаткові розрахунки наведено в таблиці 1.
Таблиця 1 – Проміжні розрахунки
№ п/п |
|
|
|
|
|
|
|
1 |
20 |
32 |
33 |
300 |
388,65 |
36,00 |
43502,04 |
2 |
24 |
30 |
31 |
290 |
471,51 |
64,00 |
47773,47 |
3 |
28 |
36 |
41 |
350 |
246,94 |
4,00 |
25144,90 |
4 |
30 |
40 |
39 |
400 |
137,22 |
0,00 |
11787,76 |
5 |
31 |
41 |
46 |
400 |
114,80 |
49,00 |
11787,76 |
6 |
33 |
47 |
43 |
480 |
22,22 |
16,00 |
816,33 |
7 |
34 |
56 |
34 |
500 |
18,37 |
25,00 |
73,47 |
8 |
37 |
54 |
38 |
520 |
5,22 |
1,00 |
130,61 |
9 |
38 |
60 |
42 |
590 |
68,65 |
9,00 |
6630,61 |
10 |
40 |
55 |
35 |
540 |
10,80 |
16,00 |
987,76 |
11 |
41 |
61 |
39 |
600 |
86,22 |
0,00 |
8359,18 |
12 |
43 |
67 |
44 |
700 |
233,65 |
25,00 |
36644,90 |
13 |
45 |
69 |
40 |
700 |
298,80 |
1,00 |
36644,90 |
14 |
48 |
76 |
41 |
750 |
589,80 |
4,00 |
58287,76 |
Сума |
492,00 |
724,00 |
546,00 |
7120,00 |
2692,86 |
250,00 |
288571,43 |
Середнє |
35,14 |
51,71 |
39,00 |
508,57 |
192,35 |
17,86 |
20612,24 |
|
8,08 |
14,39 |
4,39 |
148,99 |
— |
— |
— |
|
65,21 |
207,14 |
19,23 |
22197,80 |
— |
— |
— |
За алгоритмом методу Фаррара-Глобера перший крок це нормалізація значень факторів. Нормалізуємо , використавши наведену нижче формулу.
= |
|
|
|
-0,366 |
-0,366 |
-0,374 |
|
-0,403 |
-0,488 |
-0,392 |
|
-0,292 |
0,122 |
-0,284 |
|
-0,218 |
0,000 |
-0,195 |
|
-0,199 |
0,427 |
-0,195 |
|
-0,088 |
0,244 |
-0,051 |
|
0,080 |
-0,305 |
-0,015 |
|
0,042 |
-0,061 |
0,021 |
|
0,154 |
0,183 |
0,146 |
|
0,061 |
-0,244 |
0,056 |
|
0,172 |
0,000 |
0,164 |
|
0,284 |
0,305 |
0,343 |
|
0,321 |
0,061 |
0,343 |
|
0,451 |
0,122 |
0,433 |
Другим кроком є розрахунок кореляційної матриці R за формулою:
,
де –транспонована матриця Х* (елементи матриці R характеризують щільність зв’язку однієї незалежної змінної з іншою);
– парні коефіцієнти кореляції.
Транспонуємо матрицю (нормалізовану) в матрицю
= |
-0,37 |
-0,40 |
-0,29 |
-0,22 |
-0,20 |
-0,09 |
0,08 |
0,04 |
0,15 |
0,06 |
0,17 |
0,28 |
0,32 |
0,45 |
-0,37 |
-0,37 |
-0,49 |
0,12 |
0,00 |
0,43 |
0,24 |
-0,30 |
-0,06 |
0,18 |
-0,24 |
0,00 |
0,30 |
0,06 |
0,12 |
-0,37 |
|
-0,37 |
-0,39 |
-0,28 |
-0,19 |
-0,19 |
-0,05 |
-0,02 |
0,02 |
0,15 |
0,06 |
0,16 |
0,34 |
0,34 |
0,43 |
-0,37 |
Тоді, перемноживши матриці Х* та , отримаємо:
|
0,93 |
0,34 |
0,92 |
R = |
0,34 |
0,93 |
0,39 |
|
0,92 |
0,39 |
0,93 |
Як бачимо, діагональні елементи матриці R не дорівнюють одиниці, отже необхідно штучно проставити на діагоналі матриці одиниці, а до решти елементів додати різницю між одиницею й значенням діагонального елемента.
|
1 |
0,41 |
0,99 |
R = |
0,41 |
1 |
0,46 |
|
0,99 |
0,46 |
1 |
Визначаємо значення
де – визначник кореляційної матриці R.
Перш за все визначимо визначник кореляційної матриці, для чого необхідно серед математичних функцій MS Excel знайти функцію “МОПРЕД”. Скориставшись нею, дістанемо: .
Оскільки наближається до нуля, то в масиві пояснюючих змінних може існувати мультиколінеарність.
Прологарифмуємо визначник матриці R: = -4,6225.
Тоді
Порівнюємо з табличним значенням при ступенях свободи і рівні значущості α = 0,05. Так як , то в масиві незалежних змінних (рівень механізації, середній вік робітників, енергоозброєність) існує мультиколінеарність.
Для визначення критеріїв необхідно знайти матрицю похибок , яка є оберненою до матриці R:
Безпосередньо критерій обчислюється за формулою:
де – діагональні елементи матриці С;
Обчислені критерії порівнюються з табличним значенням при п’ятивідсотковому рівні значимості і ступенях свободи і , що складає .
У розглядуваному випадку , , . Це означає, що перша і третя змінні мультиколінеарні з іншими.
Розрахуємо часткові коефіцієнти кореляції, які характеризують щільність зв’язку між двома змінними за умови, що інші змінні не впливають на цей зв’язок (існування парної мультиколінеарності):
де – елементи матриці С, що розміщені в k-ому рядку та j-му стовпці;
і – діагональні елементи матриці С.
Отже, спираючись на здобуті нами значення окремих (часткових) коефіцієнтів кореляції, можна сказати, що зв’язок між рівнем механізації та середнім віком робітників є помірним, якщо не враховувати вплив енергоозброєності, зв’язок між рівнем механізації та енергоозброєністю є досить високим, якщо не брати до уваги вплив середнього віку робітників. Зв’язок між середнім віком робітників та енергоозброєністю є середнім, якщо не враховувати рівень механізації.
Визначимо критерій.
Ці критерії застосовуються для визначення мультиколінеарності двох пояснюючих змінних і обчислюються за формулою:
.
,
,
.
Обчислені критерії порівнюються з табличним значенням при рівні значимості та числі ступенів свободи .
Оскільки , то рівень механізації та середній вік робітників не є мультиколінеарними між собою;
, тому відповідно рівень механізації та енергоозброєність є мультиколінеарними між собою;
, тому середній вік робітників та енергоозброєність не є мультиколінеарними між собою.
Висновок. Дослідження, проведені за алгоритмом Фаррара-Глобера показали, що мультиколінеарність між пояснюючими змінними даного прикладу існує. Отже, для того, щоб можна було застосувати метод 1МНК для оцінювання параметрів моделі за цією інформацію, необхідно в першу чергу звільнитися від мультиколінеарності. Приймаємо рішення про виключення фактору Х3 з подальших досліджень.