Методичні рекомендації щодо визначення гомоскедастичності (гетероскедастичності)
Мета роботи – навчитися перевіряти вибірку на гетероскедастичність за критеріями Гольдфельда–Квандта, за допомогою коефіцієнта рангової кореляції Спірмена, використовувати узагальнений метод найменших квадратів.
Після виконання роботи студент повинен:
ЗНАТИ, в чому полягає сутність явища гетероскедастичності, послідовність дій у процесі використання критеріїв Гольдфельда–Квандта та за допомогою коефіцієнта рангової кореляції Спірмена, узагальнений метод найменших квадратів.
УМІТИ застосовувати тести для виявлення гетероскедастичності, користуватися статистичними таблицями, узагальнений метод найменших квадратів.
МАТИ УЯВЛЕННЯ про методи усунення гетероскедастичності.
Завдання:
1 Перевірити вибірку на гетероскедастичність за допомогою тесту Гольдфельда–Квандта.
2 Перевірити вибірку на гетероскедастичність за допомогою коефіцієнта рангової кореляції Спірмена
Хід роботи:
Нехай є залежність збережень У від доходу Х у 12 сім’ях.
Побудувати регресійну модель, що характеризує залежність грошових збережень від доходів.
Перевірити умови гомоскедастичності
У випадку наявності гетероскедастичності залишків для побудови моделі використати УМНК.
номер семьи |
Y, млн.грн |
Х, млн.грн. |
1 |
0,3 |
1 |
2 |
0,1 |
2 |
3 |
2,2 |
3 |
4 |
0,9 |
4 |
5 |
4 |
5 |
6 |
1,7 |
6 |
7 |
5,8 |
7 |
8 |
2,5 |
8 |
9 |
7,5 |
9 |
10 |
3 |
10 |
11 |
9 |
11 |
12 |
3,4 |
12 |
1. Представимо наші дані –кореляційне поле
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
|
Множественный R |
0,685826823 |
|
|
|
|
|
|
|
|
R-квадрат |
0,470358431 |
|
|
|
|
|
Y, млн.грн |
Х, млн.грн. |
|
Нормированный R-квадрат |
0,417394275 |
|
|
|
|
|
0,3 |
1 |
|
Стандартная ошибка |
2,138274799 |
|
|
|
|
|
0,1 |
2 |
|
Наблюдения |
12 |
|
|
|
|
|
2,2 |
3 |
|
|
|
|
|
|
|
|
0,9 |
4 |
|
Дисперсионный анализ |
|
|
|
|
|
4 |
5 |
|
|
|
df |
SS |
MS |
F |
Значимость F |
|
1,7 |
6 |
|
Регрессия |
1 |
40,60447552 |
40,60448 |
8,880693 |
0,013807 |
|
|
|
|
Остаток |
10 |
45,72219114 |
4,572219 |
|
|
|
|
|
|
Итого |
11 |
86,32666667 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
Y-пересечение |
-0,096969697 |
1,316017165 |
-0,07368 |
0,942715 |
-3,02924 |
2,835299 |
-3,02923866 |
2,835299 |
|
Х, млн.грн. |
0,532867133 |
0,178811522 |
2,980049 |
0,013807 |
0,13445 |
0,931284 |
0,134450236 |
0,931284 |
|
|
|
|
|
|
|
|
|
|
|
Рівняння має вигляд : у=-0,097+0,533х
Середньоквадратичне відхилення Se =2,138
2. Перевіримо виконання умов гомоскедастичності залишків методом Гольдфельда-Квандта
1) упорядкуємо по змінній Х
2) розділимо на дві групи
Y, млн.грн |
Х, млн.грн. |
|
Y, млн.грн |
Х, млн.грн. |
0,3 |
1 |
|
5,8 |
7 |
0,1 |
2 |
|
2,5 |
8 |
2,2 |
3 |
|
7,5 |
9 |
0,9 |
4 |
|
3 |
10 |
4 |
5 |
|
9 |
11 |
1,7 |
6 |
|
3,4 |
12 |
Рівняння до цих вибірок
У=-0,207+0,497х
У=4,386+0,086х
3) визначимо залишкову суму квадратів
|
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
||||||||||||
|
Множественный R |
0,640792 |
|
|
|
|
|
|
|
|
|||||||||||
|
R-квадрат |
0,410615 |
|
|
|
|
|
|
|
|
|||||||||||
|
Нормированный R-квадрат |
0,263269 |
|
|
|
|
|
|
|
|
|||||||||||
|
Стандартная ошибка |
1,245812 |
|
залишкова сума квадратів |
|
|
|
|
|||||||||||||
|
Наблюдения |
6 |
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Дисперсионный анализ |
|
|
|
|
|
|
|
|
||||||||||||
|
|
df |
SS |
MS |
F |
Значимость F |
|
|
|
|
|||||||||||
|
Регрессия |
1 |
4,325143 |
4,325143 |
2,786733 |
0,170371 |
|
|
|
|
|||||||||||
|
Остаток |
4 |
6,20819 |
1,552048 |
|
|
|
|
|
|
|||||||||||
|
Итого |
5 |
10,53333 |
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
|||||||||||
|
Y-пересечение |
-0,20667 |
1,159788 |
-0,17819 |
0,867232 |
-3,42675 |
3,013421 |
-3,42675 |
3,013421 |
|
|||||||||||
|
Х, млн.грн. |
0,497143 |
0,297806 |
1,669351 |
0,170371 |
-0,3297 |
1,323985 |
-0,3297 |
1,323985 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
||||||||||||
|
Множественный R |
0,060215 |
|
|
|
|
|
|
|
|
|||||||||||
|
R-квадрат |
0,003626 |
|
|
|
|
|
|
|
|
|||||||||||
|
Нормированный R-квадрат |
-0,24547 |
|
|
|
|
|
|
|
|
|||||||||||
|
Стандартная ошибка |
2,972012 |
|
|
|
|
|
|
|
|
|||||||||||
|
Наблюдения |
6 |
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Дисперсионный анализ |
|
|
|
|
|
|
|
|
||||||||||||
|
|
df |
SS |
MS |
F |
Значимость F |
|
|
|
|
|||||||||||
|
Регрессия |
1 |
0,128571 |
0,128571 |
0,014556 |
0,909787 |
|
|
|
|
|||||||||||
|
Остаток |
4 |
35,33143 |
8,832857 |
|
|
|
|
|
|
|||||||||||
|
Итого |
5 |
35,46 |
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
|
|||||||||||
|
Y-пересечение |
4,385714 |
6,857437 |
0,639556 |
0,557253 |
-14,6536 |
23,42501 |
-14,6536 |
23,42501 |
|
|||||||||||
|
Х, млн.грн. |
0,085714 |
0,710447 |
0,120648 |
0,909787 |
-1,8868 |
2,058231 |
-1,8868 |
2,058231 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
4) обчислимо відношення
=5,05
F-розподіл зі ступенями свободи v1=n1-k=6-2=4, v2 =n-n1-k=12-6-2=4 (k –число оцінюваних параметрів в рівнянні).
Fтабл = 4,107 < F розр = 5,05, тому гетероскедастичність присутня
2. Перевіримо наявність гетероскедастичності за допомогою коефіцієнта рангової кореляції Спірмена
Де di - різниця між рангами, що приписуються двом характеристикам i-того об’єкта;
n- кількість об’єктів, що ранжуються
номер семьи |
Y, млн.грн |
Х, млн.грн. |
Залишки |
|
ранг залишків |
Di в квадрате |
1 |
0,3 |
1 |
-0,13589744 |
0,135897 |
1 |
0 |
2 |
0,1 |
2 |
-0,86876457 |
0,868765 |
3 |
1 |
3 |
2,2 |
3 |
0,698368298 |
0,698368 |
2 |
1 |
4 |
0,9 |
4 |
-1,13449883 |
1,134499 |
4 |
0 |
5 |
4 |
5 |
1,432634033 |
1,432634 |
6 |
1 |
6 |
1,7 |
6 |
-1,4002331 |
1,400233 |
5 |
1 |
7 |
5,8 |
7 |
2,166899767 |
2,1669 |
8 |
1 |
8 |
2,5 |
8 |
-1,66596737 |
1,665967 |
7 |
1 |
9 |
7,5 |
9 |
2,801165501 |
2,801166 |
10 |
1 |
10 |
3 |
10 |
-2,23170163 |
2,231702 |
9 |
1 |
11 |
9 |
11 |
3,235431235 |
3,235431 |
12 |
1 |
12 |
3,4 |
12 |
-2,8974359 |
2,897436 |
11 |
1 |
Проверяем за допомогою критерія t-Ст’юдента
= 11,64
tтабл(0,05; 10) = 2,23
тому
Якщо то відкидають гіпотезу про гомоскедастичність, є припущення про гетероскедастичність.