Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Econometrics

.pdf
Скачиваний:
22
Добавлен:
28.01.2022
Размер:
4.46 Mб
Скачать

6.Алгоритм Фаррара—Глобера складається із семи кроків: 6.1.Нормалізація (стандартизація) змінних

 

 

 

 

x*

xik xk .

 

 

 

 

 

 

 

 

 

ik

 

 

 

n 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xk

 

 

 

 

 

 

6.2.Знаходження кореляційної матриці rxx X * X *.

6.3.Визначення критерію 2 («хі»-квадрат)

 

2

 

 

n 1

 

1

2m

 

ln

 

r

 

.

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

6

 

 

 

 

xx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6.4.Визначення оберненої матриці C r

1

X * X 1 .

 

 

 

 

 

 

 

xx

 

 

 

6.5.Обчислення F-критеріїв

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fk ckk

1

n m

.

 

 

 

 

 

 

 

 

 

 

 

 

m 1

 

 

 

6.6.Знаходження частинних коефіцієнтів кореляції

rkj

 

ckj

.

 

 

 

 

 

ckk c jj

 

 

 

 

 

 

 

 

 

 

 

 

 

6.7.Обчислення t-критеріїв

 

 

 

 

 

 

 

 

tkj

rkj

n m

.

 

 

 

 

 

 

 

 

 

 

 

1 r2

 

 

 

 

 

 

 

 

 

 

kj

 

 

 

 

 

 

7. Можна звільнитись від мультиколінеарності за допомогою таких способів:

1)суттєво збільшити сукупність спостережень;

2)вилучити з моделі ті змінні, які є мультиколінеарними з іншими;

3)перетворити певним чином вихідну інформацію;

4)використати «рідж-регресію».

8.Метод головних компонентів використовується для оціню-

вання параметрів моделей великого розміру, а також моделей, до яких входять мультиколінеарні змінні.

Ідея методу полягає в тому, щоб перетворити множину змінних Х на нову множину попарно некорельованих змінних, серед

40

яких перша відповідає максимально можливій дисперсії, друга — максимально можливій дисперсії в підпросторі, який є ортогональним до першого, і т. д.

9.Головні компоненти Zj обчислюються як добутки матриці нормалізованих пояснювальних змінних на власні вектори матриці ( X X )aj:Zj=Xaj. Звідси сума елементів вектора Zj дорівнює

Z j Z j a j X Xa j .

10.Щоб знайти головні компоненти Zj, необхідно максимізувати вектор Z j Z j a j X Xa j за таких умов:

1)a j ak 1, k=j;

2)a j ak 0 , k j.

Перша умова нормалізує вектор aj, щоб він не став досить ве-

ликим, а друга умова забезпечує відсутність кореляції між Zj і Zk,

бо коваріація між ними подається у вигляді a j X X ak j a j k j і

дорівнює нулю лише тоді, коли ajak=0. Для розв’язування цієї за-

дачі будується функція Лагранжа:

 

 

 

 

 

 

 

 

 

 

a j X Xak 2

(a j ak 1)

(a j ak ) max.

Оскільки

 

 

0 і

 

0 , маємо рівняння (X X ) a j j a j ,

 

 

 

 

 

k

 

 

 

розв’язавши яке знайдемо всі власні вектори матриці X X aj.

11.Головні компоненти Zj=Xaj попарно некорельовані, а їхні

дисперсії визначаються так:

 

 

 

 

 

 

Z j Z j

j ,

j

 

;

 

1, m

m

 

 

 

 

 

 

 

 

j tr (X

 

 

 

X ) Z1Z1

Z2 Z2

... Zm Zm.

j 1

 

 

 

 

 

 

 

 

Співвідношення m j характеризують пропорційний внесок

j

j 1

загальної варіації змінних Х, а оскільки ці

кожного з векторів до

компоненти ортогональні, сума всіх внесків дорівнює одиниці.

12.Алгоритм головних компонентів складається з восьми кроків.

12.1.Нормалізація всіх пояснювальних змінних:

41

xij*

xij x j

, i

 

;

j

 

.

1, n

1, m

 

 

x j

 

 

 

12.2.Обчислення кореляційної матриці

 

1

 

*

 

*

rxx

 

X

 

X

.

n

 

 

 

 

 

 

12.3.Знаходження характеристичних чисел матриці r з рівнян-

ня:

rxx E 0 ,

де j — характеристичні числа; E — одинична матриця. 12.4.Власні (характеристичні) числа j упорядковуються за аб-

солютними величинами.

12.5.Знаходження власних векторів aj розв’язуванням системи рівнянь:

(rххE) a=0. 12.6.Обчислення головних компонент векторів Zk:

Zk X *ak , k 1, m .

Головні компоненти мають задовольняти умови:

n

z 0, j 1, m ; i 1, n ;

i 1 ji

n1 Z j Z j j ;

Z j Zk 0,

j k.

12.7.Визначення параметрів моделі з головними компонентами

,

Z

1

Y

ZB

B

Y .

12.8.Знаходження параметрів вихідної моделі:

Y

X

,

a B.

42

?

6.9. Запитання та завдання

для самостійної роботи

 

1.Що означає мультиколінеарність змінних?

2.Ознаки мультиколінеарності.

3.Як впливає наявність мультиколінеарності змінних на оцінку параметрів моделі?

4.Які статистичні критерії використовуються для виявлення мультиколінеарності?

5.Дайте коротку характеристику алгоритму Фаррара—Глобера. 6.На чому ґрунтується метод головних компонентів? Коли він засто-

совується?

7.Якобчислити головні компоненти і які умови вони задовольняють? 8.Якоцінюютьсяпараметри моделі на основі головнихкомпонентів?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9.Покажіть, як можна оцінити параметри моделі Y

X , скориста-

 

 

 

 

 

 

 

 

 

 

 

 

 

вшись параметрами моделі Y

ZB.

 

 

 

 

 

 

 

 

 

 

10.Для трьох пояснювальних змінних обчислено матрицю:

 

 

 

 

 

 

1

 

0,9

 

0,3

 

 

 

 

 

 

r

 

0,9

1

 

 

 

 

 

 

 

 

 

 

 

 

0,5 .

 

 

 

 

 

 

 

 

0,3

0,5

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

Знайдіть характеристичні числа k

цієї матриці.

 

 

 

 

11.За допомогою матриці r

 

E обчисліть власні вектори a

k

:

 

 

xx

 

 

 

 

 

 

 

 

 

 

 

 

 

5 6

2 6

1 6

 

 

 

 

 

r E

2 6

2 6

2 6

 

,

 

 

 

xx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 6

 

 

2 6

5 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

де елементи ak нормалізовані.

 

 

 

 

 

 

 

 

 

 

 

 

 

12.Обчисліть головні компоненти матриці

 

 

 

 

 

 

 

 

1

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

5

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1

 

 

2

 

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

6

 

5

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

0

 

 

5

 

 

 

 

 

 

 

 

 

6

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

яка складається з трьох власних векторів.

43

Матрицю нормалізованих змінних X * візьміть із прикладу 6.2.

13. Обчисліть F-критерій для визначення мультиколінеарності трьох пояснювальних змінних, якщо задано матрицю

1,60

0,41

0,61

 

 

0,41

1,50

 

 

rxx1 .

C

0,81

 

0,61

0,81

1,47

 

 

 

 

 

Сукупність спостережень n=20.

14.Використовуючи елементи матриці C із завдання 13, обчисліть коефіцієнти детермінації змінних. Що вони характеризують?

15.Використовуючи матрицю C із завдання 13, обчисліть t-критерій для оцінювання попарної мультиколінеарності змінних.

6.10. Основні терміни і поняття

Мультиколінеарність Детермінант кореляційної матриці

Стандартизація (нормалізація) змінних Критерій 2 — «хі»- квадрат Ступені свободи Метод головних компонентів Ортогональні змінні Характеристичні числа Характеристичні (власні) вектори Функція Лагранжа Множники Лагранжа Головні компоненти Алгоритм Фаррара—Глобера

44

Розділ 7

ГЕТЕРОСКЕДАСТИЧНІСТЬ

7.1. Поняття гетероскедастичності

Припущення, які було зроблено під час оцінювання параметрів моделі 1МНК, на практиці можуть порушуватися.

У розд. 6 було розглянуто проблему мультиколінеарності, яка пов’язана з порушенням четвертої умови.

Тепер розглянемо особливості економетричного моделювання, коли порушується умова (4.3), згідно з якою припускається, що відхилення мають такий розподіл імовірностей, який зберігається для всіх спостережень. Тоді дисперсія залишків лишається незмінною для кожного спостереження.

Означення 7.1. Якщо дисперсія залишків стала для кожного спостереження, тобто M (uu ) 2 , то ця її властивість нази-

вається гомоскедастичністю.

Часто у практичних дослідженнях явище гомоскедастичності залишків порушується. Наприклад, будуючи економетричну модель, що характеризує залежність між заощадженнями і доходами населення на підставі теоретичної та практичної інформації, можна висунути гіпотезу, що дисперсія залишків за окремими групами населення змінюватиметься і буде пропорційною до середнього доходу цієї групи. Коли розглядати економетричну модель, що характеризує залежність між депозитними вкладами і розміром прибутку клієнтів банку або між витратами на харчування і доходом на одного члена сім’ї, витратами на харчування і загальними витратами, то також можна припустити, що дисперсія залишків для окремих груп спостережень змінюватиметься. Уцих залежностях пояснювальна змінна може різко змінюватись, а динаміка залежної змінної буде досить помірною, не адекватною до зміни пояснювальної змінної. Це і приводить до зміни дисперсії залишків кожного спостереження або ж груп спостережень.

Означення 7.2. Якщо дисперсія залишків змінюється для кожного спостереження або групи спостережень, тобто

M (uu ) u2 S , то це явище називається гетероскедастичністю.

1

7.2. Наслідки гетероскедастичності

За наявності гетероскедастичності оцінки параметрів, отримані 1МНК, як правило, залишаються незміщеними, обґрунтова-

ними, але неефективними.

Нагадаємо, що дисперсія оцінок параметрів простої лінійної моделі визначається так:

 

u2

n

 

 

 

var a0

xi2

 

;

(7.1)

n

i 1

 

 

n xi x 2

 

 

 

i 1

 

 

 

 

var a1

2

.

 

(7.2)

n

u

 

 

 

 

 

 

 

xi

x 2

 

 

 

 

i 1

 

 

 

 

У цих співвідношеннях дисперсія залишків є сталою, тому вона винесена за знак суми. За гетероскедастичності дисперсія u2

буде змінюватись через зростаючий розкид значень залишків, тобто вона зростатиме. Це означає, що буде зростати дисперсія

оцінок параметрів моделі, яка приводить до збільшення їхніх стандартних похибок.

Дисперсія оцінки a1 у разі гетероскедастичностізапишеться так:

 

 

n

x

 

x 2 2 u

 

 

 

 

 

 

var* a

 

i 1

 

i

 

i

.

(7.3)

 

 

 

 

 

1

 

n

 

2

2

 

 

 

 

xi x

 

 

 

 

i 1

 

 

 

Порівнюючи обидва співвідношення дисперсій оцінок a1 ,

бачимо, що var* a

var a, тобто дисперсія оцінки параметра

1

1

a1 за гетероскедастичності більша, ніж дисперсія цієї оцінки за

гомоскедастичності.

 

Звідси інтервали довіри оцінок параметрів моделі також будуть більшими. Як наслідок, F та t-критерії дають неточні результати.

Таким чином, якщо не звертати увагу на гетероскедастичність і використовувати звичайні процедури перевірки гіпотез, то висновки будуть неправильними, тобто потенційно гетероскедастичність є серйозною проблемою.

2

Пояснимо сутність побудови моделі 1МНК за наявності гетероскедастичності.

Припустимо, що дисперсія залишків змінюється пропорційно

до величини 1 , де xij i-те значення j-ї пояснювальної змінної,

xij

яка може викликати гетероскедастичність.

Тоді, щоб усунути гетероскедастичність, можна перетворити вихідну інформацію, поділивши кожну зі змінних на xij і до цієї інформації застосувати 1МНК.

Економетрична модель матиме вигляд:

Y

a

 

1

a

u

 

Y

a

a

 

1

u.

(7.4)

X

0 X

X

0 X

 

1

 

 

1

 

 

 

У результаті для оцінювання параметрів можна застосувати 1МНК. Зауважимо, що параметри а0 і а1 помінялися ролями. Вільним членом моделі замість а0 стала оцінка параметра а1.

Приклад 7.1. Побудуємо економетричну модель, що характеризує залежність між заощадженнями та доходом населення, млрд ф.ст. (табл. 7.1).

Таблиця 7.1

Рік

Заощадження

Дохід

Рік

Заощадження

Дохід

 

 

 

 

 

 

1

0,36

8,8

10

0,59

15,5

 

 

 

 

 

 

2

0,2

9,4

11

0,90

16,7

 

 

 

 

 

 

3

0,08

10,0

12

0,95

17,7

 

 

 

 

 

 

4

0,20

10,6

13

0,82

18,6

 

 

 

 

 

 

5

0,10

11,0

14

1,04

19,7

 

 

 

 

 

 

6

0,12

11,9

15

1,53

21,1

 

 

 

 

 

 

7

0,41

12,7

16

1,94

22,8

 

 

 

 

 

 

8

0,50

13,5

17

1,75

23,9

 

 

 

 

 

 

9

0,43

14,3

18

1,99

25,2

 

 

 

 

 

 

Скориставшись оператором оцінювання 1МНК

3

X X

1

X Y ,

 

 

A

 

 

 

дістанемо a0 = –1,081; a1 = 0,1178.

 

 

 

 

 

 

1,081 0,1178X .

Економетрична модель має такий вигляд: Y

Коефіцієнт детермінації

R2 a

x y

y 2

для цієї моделі

 

 

1

i i

i

 

R2 =0,918, а це означає, що варіація заощаджень Y на 91,8% визначається варіацією доходів населення.

На перший погляд, результат наводить на думку, що специфікація моделі не містить похибки.

Але логічно висунути гіпотезу, що відхилення заощаджень можуть бути пропорційними до доходу, тобто для цієї моделі досить ймовірне існування гетероскедастичності залишків.

Отже, вихідну інформацію перетворимо, поділивши обидві змінні на дохід X (табл. 7.2):

yi* yi xi ; x* 1 xi .

 

 

 

 

 

Таблиця 7.2

 

 

 

 

 

 

 

Рік

y*

x*

Рік

y*

 

x*

 

i

i

 

i

 

i

 

 

 

 

 

 

 

1

0,041

0,114

10

0,038

 

0,065

 

 

 

 

 

 

 

2

0,022

0,106

11

0,054

 

0,060

 

 

 

 

 

 

 

3

0,008

0,100

12

0,054

 

0,056

 

 

 

 

 

 

 

4

0,019

0,094

13

0,044

 

0,054

 

 

 

 

 

 

 

5

0,009

0,091

14

0,053

 

0,051

 

 

 

 

 

 

 

6

0,010

0,084

15

0,073

 

0,047

 

 

 

 

 

 

 

7

0,032

0,079

16

0,085

 

0,044

 

 

 

 

 

 

 

8

0,037

0,074

17

0,073

 

0,042

 

 

 

 

 

 

 

9

0,030

0,070

18

0,079

 

0,040

 

 

 

 

 

 

 

Нове рівняння зв’язку згідно з даними табл. 7.2 має такий вигляд:

Y * 0,854 0,1026X *.

4

У результаті перетворення вихідних даних практично повністю змінилася специфікація моделі. Оскільки x*i 1 xi , то цей

зв’язок нелінійний. По-друге, yi* yi xi характеризує відносний

показник — рівень заощаджень, який припадає на одиницю доходу.

Виконавши цю процедуру, дістанемо таке: спостереження з меншими значеннямиxi* мають відносно більшу питому вагу при

оцінюванні параметрів моделі, ніж у першому варіанті.

З наведеного прикладу бачимо, що явище гетероскедастичності не впливатиме на оцінки параметрів 1МНК, якщо певним чи-

ном перетворити вихідну інформацію. Згідно з цим, якщо економетрична модель має лише дві змінні, то це можна зробити так, як у прикладі 7.1.

Це перетворення значно ускладнюється, якщо будується економетрична модель з багатьма змінними. У такому разі потрібно

з’ясувати зміст гіпотези, згідно з якою M (uu ) u2 S , де u2 ли-

шається невідомим параметром, а S — відома симетрична додатно визначена матриця.

7.3. Методи визначення гетероскедастичності

Можливість перевірки припущень про наявність гетероскедастичності залежить від природи вихідних даних. Розглянемо методи перевірки гетероскедастичності для різних вихідних даних, тобто застосуємо так зване тестування економічної інформації щодо наявності гетероскедастичності.

7.3.1. Перевірка гетероскедастичності за критері-

єм . Цей метод застосовується тоді, коли вихідна сукупність спостережень досить велика. Розглянемо відповідний алгоритм.

Крок 1. Вихідні дані залежної змінної Y розбиваються на k груп (r 1, k) відповідно до зміни рівня величини Y.

Крок 2. За кожною групою даних обчислюється сума квадратів відхилень:

Sr nr yir yr 2 . i 1

Крок 3. Визначається сума квадратів відхилень у цілому по всій сукупності спостережень:

5

Соседние файлы в предмете Моделирование