Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Econometrics

.pdf
Скачиваний:
21
Добавлен:
28.01.2022
Размер:
4.46 Mб
Скачать

Зауважимо, що необхідно включити по одній фіктивній змінній з кожної групи, якщо ми будемо оцінювати вільний член моделі. Цього можна досягти за рахунок іншої інтерпретації коефіцієнтів та . Якщо спостереження стосується бюджету сім’ї з

першої соціальної групи у першому кварталі, то всі фіктивні змінні дорівнюють нулю і вільний член дорівнює 1 . Для бюдже-

ту сім’ї з тієї самої соціальної групи, але для ІІ кварталу, вільний член дорівнюватиме 1 2 , а для сімейного бюджету сім’ї, яка

належить до третьої соціальної групи і для ІІІ кварталу він буде

1 2 3 і т. д.

Отже, 2 , 3 і 4 відображають різницю в сезонних коливаннях порівняно з першим кварталом, а 3 , 4 — різницю в моде-

люванні споживання для різних соціальних груп порівняно з першою соціальною групою. Тому сезонні відмінності для ІІ і ІV кварталу дає нам різниця 4 2 , а відмінності для різних соціа-

льних груп, наприклад третьої та другої — різниця 3 2 .

Такий підхід застосовний також, коли йдеться про оцінювання параметрів виробничої функції. Якщо потрібно, скажімо, побудувати виробничу функцію для цементної промисловості України, коли відома статистична інформація про випуск цементу та первинні виробничі ресурси за n років для s цементних підприємств, то маємо врахувати як ефект часу, так і «просторовий ефект» (тобто ефект відповідності даних за різними підприємствами). Тоді виробничу функцію можна специфікувати у вигляді:

Y 1 2T2 ...

nTn 2 F2 ...

S FS a1 X1 a2 X 2 u,

(5.7)

де Y — вектор виробництва цементу для всіх підприємств за всі роки;

X1 вектор витрат основного капіталу для всіх підприємств за всі роки;

рокиX2; вектор витрат робочої сили для всіх підприємств за всі а1, а2 — параметри моделі, які характеризують вплив відпові-

дно ресурсів Х1 та Х2;

Ti та Fs — фіктивні змінні, що мають враховувати відповідно часовий та просторовий чинники:

T1 —у роціі для кожногопідприємства, і 2, n;

i0 — вінші роки;

7

F 1 — дляпідприємства s щороку, s 2, r; s 0 — дляінших підприємств.

Це рівняння відповідає гіпотезі, що всі підприємства однаково реагують на зміни витрат первинних виробничих ресурсів. Водночас вони мають паралельні зсуви своїх виробничих функцій за рахунок відмінностей окремих підприємств з виробництва цементу та за рахунок відмінностей одного й того самого підприємства в різні часові періоди. Ці відмінності враховує вільний член економетричної моделі, у формуванні якого беруть участь фіктивні змінні.

5.5. Моделі ANOVA та взаємодія фіктивних змінних

У наведених раніше економетричних моделях ні модель споживання, ні виробнича функція не мають взаємодії між різними групами фіктивних значень: ефект від будь-якої пари значень фіктивних змінних дорівнює сумі двох окремих ефектів. Проте на практиці часто трапляються такі залежності, коли існує зв’язок між різними якісними ознаками економетричних процесів та явищ. Фіктивні змінні, що представляють ці якісні ознаки в моделі, будуть мати взаємозв’язок, і це можна врахувати введенням додаткових фіктивних змінних.

Економетричні моделі, що містять у правій частині лише фіктивні змінні, називають ANOVA-моделями (моделями дисперсійного аналізу).

Розглянемо залежність між кількістю прочитаного професійно орієнтованого матеріалу залежно від рівня освіти. На таку залежність може впливати і стать людини. Виділимо три рівні освіти:

I — молодший спеціаліст; II — бакалавр;

III — магістр.

Жіноча стать — I і чоловіча — II.

Покажемо, як доцільно вводити фіктивні змінні в економетричну модель, коли пояснювальні змінні — рівень освіти та стать

(табл. 5.1).

У табл. 5.1 Х1 означає змінну, що відповідає звичайному вільному члену; Х2 і Х3 — двом рівням освіти; Х4 — враховує стать, а

8

Х5 та Х6 відбивають зміни вільного члена, зумовлені водночас відмінностями статі та рівня освіти. Значення Х5 і Х6 знайдено як добуток на Х4 відповідно значень змінних Х2 і Х3.

Таблиця 5.1

ФІКТИВНІ ЗМІННІ

Рівень

Стать

 

 

Фіктивні змінні

 

 

 

 

 

 

 

 

освіти

людини

 

 

 

 

 

 

X1

X2

X3

X4

X5

X6

 

 

 

 

 

 

 

 

 

 

I

I

1

0

0

0

0

0

 

 

 

 

 

 

 

 

I

II

1

0

0

1

0

0

 

 

 

 

 

 

 

 

II

I

1

1

0

0

0

0

 

 

 

 

 

 

 

 

II

II

1

1

0

1

1

0

 

 

 

 

 

 

 

 

III

I

1

0

1

0

0

0

 

 

 

 

 

 

 

 

III

II

1

0

1

1

0

1

 

 

 

 

 

 

 

 

Економетрична модель у такому випадку набере вигляду:

Y 1 X1 2 X 2 ...

6 X 6 u.

(5.8)

Запишемо математичні сподівання кількості прочитаного матеріалу залежно від різних співвідношень ознак, що стосуються рівня освіти та статі.

M Y I, I 1;

M Y I, II 1 4 ;

M (Y /II, I) 1 2 ;

M Y II, II 1 2 4 5;

M Y III,I 1 3;

M Y III,II 1 3 4 6.

Наведена схема дає змогу врахувати взаємний вплив фіктивних змінних. Отже, різний ефект, зумовлений різною статтю, для першого рівня освіти вимірюється величиною 4 , для другого рі-

вня— 4 5 , для третього— 4 6 . Відмінності між другим та першим рівнями освіти вимірюються величиною 2 , третім та

9

першим — 3 , а між третім та другим — величиною 3 2 . Для

осіб, що належать до чоловічої статі, ті самі відмінності можна визначити так:

2 5 ,

3 6 ,

3 6 2 5 .

5.6. Фіктивна залежна змінна

Досі ми розглядали лише ті фіктивні змінні, які вводяться у праву частину економетричної моделі, тобто стосуються тільки пояснювальних змінних. Але існують і такі взаємозв’язки, коли залежна змінна не вимірюється кількісно, а є якісним показником соціально-економічного процесу.

Нехай, наприклад, потрібно дослідити наявність автомобіля в сім’ї чи його відсутність залежно від певних чинників: доходу, кількості членів сім’ї, терміну її існування і т. ін. У цьому разі залежна змінна набуває лише двох значень: вона дорівнює одиниці за наявності автомобіля, нулю — за його відсутності. Якщо ми побудуємо економетричну модель для такої залежності, то розраховане значення Y для заданих значеннях Xj можна тлумачити як оцінку умовної ймовірності Y для фіксованих Xj. Це економетричне моделювання присвячене вивченню динаміки соціальноекономічних систем на основі аналізу соціологічних та деяких інших змінних одночасно з традиційними економетричними змінними.

До економетричних моделей, в яких залежна змінна є фіктивною, не можна застосовувати оцінки — 1МНК, бо вони не матимуть ознак найкращих лінійних незміщених оцінок (BLUE). Тому для оцінювання параметрів моделі в цьому залучають інші методи.

5.6.1 Лінійна ймовірнісна модель (LPM-модель). Роз-

глянемо економетричну модель, в якій залежна змінна є фіктивною, а пояснювальні змінні можуть бути як кількісними, так і якісними.

Скажімо, потрібно проаналізувати зв’язок між результатами зовнішньоекономічної діяльності країни, ВВП та індексом цін внутрішнього і зовнішнього ринку.

Результати зовнішньоекономічної діяльності виразимо через додатне та від’ємне сальдо. У цьому разі залежна змінна Y має два можливих стани:

10

Y 1 — додатнесальдо;0 —від ємне’ сальдо.

Економетрична модель подається у вигляді:

Y

a0

a1 X1

a2 X 2

 

b1D1

 

u.

(5.9)

 

 

 

 

 

 

Модель виду (5.9) називається лінійною ймовірнісною моделлю (LPM-модель).

Назву цієї моделі пояснимо на прикладі простої економетричної моделі

Y a0 a1X u.

(5.10)

У моделі (5.10) з огляду на те, що M(u)=0, середнє очікуване значення Y (умовне математичне сподівання Y) при заданому X визначається співвідношенням:

M Y X x a0 a1 X .

Враховуючи, що Y набуває значення одиниця або нуль, для (5.10) можна записати:

p Y

1

X

(5.11)

 

a0

a1 X .

А це означає, що застосування 1МНК до моделей LPM має певні обмеження.

1.Залишки ui в даних моделях не є випадковими величинами,

анайвірогідніше мають біноміальний розподіл.

Так, для і-го спостереження знайдемо ui Ys a0 a1 X , але

ui 1 a0 a1 X

при уi=1;

ui a0 a1 X

при уi=0.

Це обмеження стосовно отримання оцінок—1МНК дуже важливе, коли перевіряються нульові гіпотези щодо значущості характеристик зв’язку. Але зі значним збільшенням сукупності спостережень біноміальний розподіл наближається до нормального і дане обмеження буде неістотним.

2. Залишки ui можуть бути гетероскедастичними, тобто дисперсія залишків може змінюватись для кожного спостереження:

D ui M ui M ui 2 M ui2 , оскільки M ui 0;

11

D ui M ui2 a0 a1xi 2 p yi 0 1 a0 a1 X 2 p yi 1

a0 a1xi 2 1 p yi 1 1 a0 a1xi 2 p yi 1

a0 a1xi 2 1 a0 a1xi 1 a0 a1xi 2 a0 a1 X1

a0 a1xi 1 a0 a1xi p yi 1 1 p yi 1 .

Отже, дисперсія залишків залежить від імовірностей відповідних значень yi, які, у свою чергу, є функціями від xij, тобто залишки не є випадковими величинами. У цьому разі для оцінювання параметрів моделі доцільно скористатись узагальненим методом найменших квадратів.

3. Розрахункові значення залежної змінної, здобуті на основі моделей (5.9), (5.10), можуть бути менші від нуля або більші від одиниці, що суперечить імовірності (5.11). Це обмеження є істот-

ним і суперечить застосуванню оцінок— 1МНК.

4. Важливою перешкодою до застосування оцінок—1МНК до моделі LPM є зміст характеристик взаємозв’язку. Так, збільшення значення пояснюючої змінної Х на одиницю (5.10) приведе до зміни значення Y на величину a1 незалежно від

конкретного значення Х. Це, безумовно, суперечить теоретичним і практичним висновками про спадну граничну ефективність.

Викладені щойно обмеження в застосуванні оцінок—1МНК до LPM-моделей дають підстави для висновку: безпосереднє ви-

користання 1МНК приводить до великих похибок та необґрунтованих висновків. Тому в даному випадку його використання недоцільне.

5.6.2. Логістична модель з фіктивною залежною змінною (Logit-модель). Щоб подолати недоліки LPMмоделей, необхідно використовувати такі моделі, для яких не буде порушуватись умова існування границь імовірності

0 p Y 1 X 1 і залежність між

p Y 1 X

та Х не матиме лі-

нійного характеру, а задовольнятиме закон спадної ефективно-

сті.Ці умови задовольнятиме Logit-модель. У цій моделі ймовір-

ність pi запишеться в такому вигляді:

 

 

 

 

 

 

 

 

 

1

 

1

 

 

p

M Y 1

 

 

 

 

 

 

,

(5.12)

1 e a0 a1Xi

1 e Z

i

 

Xi

 

 

 

 

де Zi a0 a1 Xi .

12

З (5.12) випливає, що при Z ніколи не порушується нерівність 0 pi 1. Крім того, залежність pi від xi не є лінійною

функцією від параметрів а0 і а1. Але для оцінювання цих параметрів не можна застосовувати 1МНК.

Дану проблему можна розв’язати, записавши рівність:

 

 

 

 

 

1 p

 

 

 

1

 

.

 

 

(5.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

1 eZi

 

 

 

Поділивши (5.12) на (5.13), дістанемо:

 

 

 

 

 

 

 

 

p

 

 

 

1 eZi

 

 

 

Z

 

(5.14)

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

e

i .

 

 

 

 

1 p

1

 

 

 

 

 

 

 

 

 

e Zi

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

Відношення

 

 

pi

є відношенням імовірностей,

яке характе-

1

p

 

p Yi

 

 

 

 

 

 

 

 

 

 

 

 

p Yi 0 .

 

ризує, у скільки разівi

 

1

більше за

 

Прологарифмувавши ліву та праву частини (5.14), знайдемо:

 

 

 

 

 

 

 

pi

 

 

 

 

 

(5.15)

 

 

 

 

 

 

 

 

 

 

 

Zi

 

 

 

 

 

1 p

 

 

 

 

 

ln

 

 

 

 

 

a0

 

a1 Xi .

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

Модель (5.15) називається Logit-моделлю. Вона виражає логарифм відношення ймовірностей через лінійну функцію. Якщо

0 pi 1 , то Zi . Якби ймовірності у виразі 1 pipi були

відомі, то ця модель могла б тлумачитись як напівлогарифмічна і для її оцінювання можна було б використати 1МНК.

Оскільки pi невідомі, то спочатку їх потрібно задати. Якщо використовуються групові дані, то ймовірності обчислюються так:

~

ni

, де n — кількість спостережень; ni — кількість спосте-

pi

n

режень i-ї групи. Тоді для оцінювання параметрів моделі можна застосувати узагальнений метод найменших квадратів, про який ітиметься в наступних розділах.

5.7. Фіктивні змінні в аналізі сезонних коливань

13

Фіктивні змінні відіграють досить важливу роль в коригуванні сезонних коливань. При цьому можливі два варіанти: по-перше, фіктивні змінні дають змогу звільнитись від сезонних коливань у квартальних чи місячних часових рядах, використовуваних для

побудови економетричної моделі; по-друге, побудувати економетричну модель на основі даних, серед яких є скориговані, а також не скориговані сезонні коливання. Розв’язок першої проблеми дає змогу порівняно легко розв’язати й другу проблему.

Відокремлення сезонних збурень для окремого часового ряду. Розглянемо квартальні спостереження над змінною Y.

Нехай

yis— значення змінної в s-му кварталі і-го року

i 1, n;

s

 

.

1,4

Визначимо матрицю фіктивних змінних, які описують сезонні зміни упродовж чотирьох кварталів. Ця матриця має 4n рядків та чотири стовпці:

1

0

0

0

 

 

 

0

1

0

0

 

 

 

 

 

 

0

0

1

0

 

 

 

0

0

0

1

 

 

 

 

 

D

1

0

0

0

.

(5.16)

 

0

1

0

0

 

 

 

 

 

 

0

0

1

0

 

 

 

 

 

...

...

...

...

 

 

0

0

0

1

 

 

 

 

 

Побудуємо рівняння залежної змінної Y із сезонними коливаннями, заданими матрицею D:

Y DB u,

де B — вектор параметрів моделі; u — вектор залишків. Запишемо оператор оцінювання параметрів цієї моделі мето-

дом найменших квадратів:

 

 

1

 

 

B D D

D Y .

1

 

 

 

 

Тоді u Y D D D

D Y

 

 

 

або

14

u AY ,

(5.17)

де A E D D D 1 D 1 , тобто u задається як лінійне перетворення

вектора Y. Зауважимо, що А— симетрична ідемпотентна матриця і AD = 0.

Значення вектора u не можна безпосередньо використовувати як значення для вилучення сезонних збурень з двох причин:

1)сума елементів вектора u дорівнює нулю;

2)елементи вектора u визначені як відхилення фактичних значень Y від квартальних середніх.

Отже, якщо вихідні дані залежної змінної містять тренд та циклічну складову, то це відіб’ється і на квартальних середніх, авідповідно, і на скоригованих даних.

Першу причину можна вилучити, якщо до значень вектора u додати середнє значення Y вектора Y.

Щоб вилучити другу причину, спробуємо подати значення ве-

ктора Y як суму чотирьох складових: 1) тренду; 2) циклічної складової;

3) сезонної складової;

4) випадкового збурення.

Тоді, будуючи модель для залежної змінної Y, скористаємося розширеною матрицею PD, яка крім раніше введених до неї фіктивних змінних містить перші Р стовпців, що сформовані як порядкові номери спостережень сукупності в системі P, де P — но-

мер кварталу P 1,4 . Запишемо цю матрицю так:

15

 

 

1

 

2

 

 

P

1

0

0

0

 

 

 

 

1 ...

1

 

 

 

 

2

22 ...

2P

0

1

0

0

 

 

 

 

3

 

2

 

3

P

0

0

1

0

 

 

 

 

3 ...

P

 

 

 

 

4

4

2

...

4

0

0

0

 

 

 

 

 

 

 

1

 

 

 

5

52 ...

5P

1

0

0

0

 

 

 

 

6

62 ...

6P

0

1

0

0

 

 

 

 

7

72 ...

7P

0

0

1

0

 

 

PD

 

 

.

...

... ...

...

...

... ...

...

 

 

 

 

 

 

... ...

... ... ... ... ...

 

 

 

...

 

 

 

...

... ...

...

...

... ...

...

 

 

 

 

 

... ...

...

...

... ...

...

 

 

 

...

 

 

 

 

 

... ...

... ... ... ... ...

 

 

 

...

 

 

 

...

... ...

...

...

... ...

...

 

 

 

 

4n

 

2

 

 

P

0

0

0

 

 

 

 

 

4n ...

4n

1

 

Якщо вектори, що були додані в матрицю D, позначити через матрицю P, то модель можна записати у вигляді:

Y PA DB u.

(5.18)

Юргенсон [2] 1964 року довів, що коли матриці P і D сформовані належним чином, то A і B будуть найкращими незміщеними оцінками систематичної (тренду) та сезонної складових на основі застосування методу найменших квадратів. Тоді скориговані дані залежної змінної за рахунок сезонності будуть визначатись так:

YS Y DB.

(5.19)

Оцінки параметрів моделі A і B можна дістати на основі блоч-

ного матричного оператора:

 

A

P P

 

B

D P

 

1

 

 

P D

 

P Y

(5.20)

 

 

.

D D

 

D Y

 

Звідси

 

1

 

B D MD

D MY ,

16

Соседние файлы в предмете Моделирование