Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие Эконометрические модели.pdf
Скачиваний:
43
Добавлен:
01.05.2015
Размер:
544.74 Кб
Скачать

1.3 Коэффициент Дарбина-Уотсона

Коэффициент Дарбина-Уотсона является расчетным показателем широко известного теста Дарбина-Уотсона. Этот тест оценивает наличие или отсутствие корреляции ошибок регрессии(автокорреляции). Если ошибки регрессии являются статистически связанными (значение {et } определяется

значением {et -1 }), то этот факт говорит о присутствии систематической ошибки в модели. При построении модели не были учтены факторы, существенно влияющие на уровень наблюдаемых экономических показателей. Присутствие такой систематической ошибки говорит о низком качестве модели.

Тест Дарбина-Уотсона основан на статистике

N

 

å(et - et -1 ) 2

 

 

 

 

 

 

DW =

i =2

 

 

 

 

 

 

 

 

N

.

 

 

 

 

(1.11)

 

 

ået2

 

 

 

 

 

 

 

 

 

i =2

 

 

 

 

 

 

 

 

Предполагая число наблюдений достаточно большим,

проведя

элементарные выкладки, получаем

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

ået * et -1

 

 

 

 

 

 

DW @ 2 * (1 -

i =2

 

) .

 

 

 

(1.12)

 

 

N

 

 

 

 

 

 

 

ået2

 

 

 

 

 

 

 

 

 

i =2

 

 

 

 

 

 

Из выражения (1.12)

видно,

что статистика

тесно

связана

с

выборочным

коэффициентом корреляции между et

и et-1 . Выразим коэффициент Дарбина-

Уотсона через коэффициент корреляции r

 

 

 

 

DW @ 2(1 - r) .

 

 

 

 

 

 

(1.13)

 

Рассмотрим

содержательный

смысл

показателя DW .

Если

коэффициент

корреляции

между

et и

et-1

близок

к единице(высокий

уровень

статистической связи ошибок регрессии), то в соответствии с(1.13) DW близок к нулю. Если наблюдается высокий уровень отрицательной корреляции

– коэффициент корреляции близок к «-1» - то в соответствии с (1.13) значение DW близко к четырем. Если ошибки регрессии не коррелированны, то коэффициент корреляции близок к нулю и соответственно DW близок к 2.

Коэффициент Дарбина-Уотсона позволяет оценить случайность ошибок регрессии. Близость DW к 2, говорит о том, что «ошибки» {et }параметра {Yt }

не связаны статистически. Для каждого значения {Yt } они возникают в результате действия множества независящих друг от друга случайных факторов

13

не определяющих значение {Yt }. Существенное отклонение DW от значения

2, говорит о проявлении статистической связи между ошибками {et } и {et -1 }. В

этом случае можно говорить, что величину {et } определяют один или несколько не включенных в модель факторов, существенно влияющих на значение наблюдаемого экономического показателя{Yt }. Для улучшения качества модели следует перейти от парной эконометрической модели к множественной модели или динамической модели.

1.4

Нелинейная регрессия. Линеаризация

 

 

При

построении

эконометрических

моделей

возможна следующая

ситуация. Очевидно, что экономические показатели взаимосвязаны, значения t-

статистики и F -статистики подтверждает значимость коэффициентов. Однако

коэффициент детерминации

существенно меньше 1, и соответственно, модель

не может считаться качественной. Остается предположить, что зависимость

Yt от X t не линейна. Тогда необходимо подобрать нелинейную функцию f ( X t ) , учитывая требование к простоте формы модели. Полученное модельное уравнение носит название нелинейной регрессии. Нелинейные регрессии делятся на два типа: нелинейные по объясняющим переменным(факторам) и

нелинейные по объясняемым переменным. В качестве

 

зависимостей

нелинейных по объясняющим переменным обычно выбираются:

 

 

§

полиномы различных степеней Yt = a + bX t + cX t

2 + dX t

3

+ e t ;

§

гипербола Yt = a +

b

+ et ;

 

 

 

 

 

 

 

 

 

X t

 

 

 

Примеры нелинейные зависимостей по объясняемым переменным:

§

степенная Yt = a * X t b ;

§

показательная Yt = a * b X t * et ;

§

экспоненциальная Yt = exp(a + bX t )e t .

Однако МНК позволяет оценить параметры регрессионного уравнения

линейного

по параметрам.

Значит

для построения

f ( X

t

)

,

функции

 

необходимо

привести нелинейную регрессию к линейному .видуЭту

процедуру

называют линеаризацией.

Для этого могут

быть использованы

разные приемы. Для регрессии нелинейной по объясняющим переменным используют замену переменной. Для гиперболы делают замену

X t =

1 ,

 

~

 

 

 

 

X t

 

 

в результате оцениваемая регрессия приобретает вид

 

Yt

~

 

= a + b X t + e t .

(1.14)

14

X (1)

Для уравнений в форме полиномов делают заменуt тогда нелинейная регрессия приобретает вид

Yt = a + bX t + cX t (1) + dX t (2) + et .

= X t2 , X t(2) = X t3 ,

(1.15)

Полученное

уравнение

линейно

относительно

 

объясняющих

переменных,

однако, это уже уравнение множественной регрессии. Как (1.14), так и (1.15)

 

могут быть оценены МНК. При расчете статистик необходимо помнить. Что в

 

изначальной постановке у нас парная экономическая модель и объясняющая

 

переменная одна -

X t .

 

 

 

 

 

 

 

 

 

 

 

 

Для регрессий нелинейных по объясняемым переменным процедура

линеаризации

сводится

к

логарифмированию

 

 

левых

и

правых

част

уравнений.

Для

 

степенной

 

Y

 

= a * X

b *e

t процедура

 

 

зависимостиt

 

 

t

 

линеаризации приводит уравнение к виду

 

 

 

 

 

 

 

 

lnYt = ln a + b * ln X t + ln et .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

~

 

 

 

A = ln a ,

~

= ln et .

 

Сделаем

замену

переменных Y t

= ln Yy , X t = ln X t

 

e t

 

Окончательно уравнение приобретает вид

 

 

 

 

 

 

 

 

~

 

~

~

 

 

 

 

 

 

 

 

 

 

 

 

Y = A + b X t

+ et .

 

 

 

 

 

 

 

 

(1.16)

 

 

Параметры (1.16) оцениваются МНК. Однако при оценке качества построенной

 

модели необходимо помнить,

что параметры регрессии оценены для

 

 

~

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

Y t = ln Yy и X t = ln X t .

 

 

 

 

 

 

 

 

 

 

После расчетов коэффициентов (1.16) необходимо вернуться к исходному

 

виду уравнения и оценить модельные значения объясняющей переменной

 

^

 

~

 

 

~

 

 

 

 

 

 

 

 

 

 

Yt

= exp(Y t ) = exp( A + b X t

) ,

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^

= exp( ln a) * exp( b *ln X t ) .

 

 

 

 

 

 

 

 

Yt

 

 

 

 

 

 

 

 

Таким образом, ошибка регрессии et

^

 

 

 

 

 

 

 

 

= Y t - Yt и соответственно значения R 2 и

 

DW оцениваются

для

исходных

 

Y

и

X

t . Для

нелинейных

 

 

переменныхt

 

 

 

регрессионных уравнений в показательной или степенной форме процедура линеаризации полностью аналогична рассмотренной выше. Сформулируем алгоритм оценки нелинейных регрессий:

§ выбрать форму зависимости для нелинейного уравнения регрессии; § провести линеаризацию регрессионного уравнения в соответствии с

видом выбранной зависимости;

15

§ оценить коэффициенты линеаризованного уравнения МНК, оценить

значимость

полученных

коэффициентов

для

линеаризованног

регрессионного уравнения;

 

 

 

§путем обратного преобразования вернуться к исходному виду регрессии – при необходимости преобразовать значения коэффициентов;

§

 

 

 

 

^

 

оценить

модельные

значения

объясняющей

Y

, ошибку

 

переменнойt

 

 

^

 

 

 

 

 

регрессии

et = Y t - Yt

и

коэффициент

детерминац, используяи

исходные значения объясняющей переменной X t .

1.5 Эконометрические модели с несколькими переменными – модель множественной регрессии

Пусть

выявлена

причинно-следственная

зависимость

наблюдаемого

экономического показателя {Yt } от

нескольких показателей {X 1t }, {X 21t },

t = 1,2,....n

- факторов. Этот вывод

может быть

сделан на«гуманитарном»

этапе исследования

экономического объекта

или в ,

случаекогда при

построении парной модели подтверждается значимость объясняющего фактора, однако моделирование не дает удовлетворительного результата. В этом случае строится модель с несколькими объясняющими переменными– модель множественной регрессии

^

Y = f ( X 1t , X 2t , X 3t ,...X kt ) ,

где

^

 

{X

 

}, {X

Y - объясняемая переменная (признак),

1t

 

t

 

 

 

объясняющие

переменные (факторы).

Наиболее

множественной регрессии является линейная зависимость переменной и объясняющими факторами

(1.17)

2t } , … t = 1,2,....n

-

простой

формой

между объясняемой

Yt = a + b1 X1t + b2 X 2t + b3 X 3t + .... + bk X kt .

Однако используются и нелинейные функциональные зависимости между признаком и факторами. Чаще всего для построения уравнения множественной регрессии используются следующие нелинейные зависимости

§

степенная - Yt = a * X 1t b * X 2bt2 * ...X ktbk ;

§

экспоненциальная -

Yt = exp(a + b1 * X 1t

+ b2 * X 2t t + ... + bk * X kt )et ;

§ гипербола - Yt

= a +

b1

 

+

b2

+ .... +

bk

e t .

X 1t

 

X 2t

 

 

 

 

 

 

X kt

Как и в случае парной модели, нелинейные зависимости приводят к линейному виду.

16

Предположения, положенные в основу модели множественной регрессии, являются обобщением модели парной регрессии (1.1 – 1.4):

-

экономические

показатели {X 1t },

{X 2 t } …. {X kt t }. и {Yt } связаны

 

зависимостью

Yt

= f ( X 1 t , X 2t , X 3t ,...X kt ) + e t

(1.17);

-

векторы

{X t },

{X 2 t }

…. {X kt t }- являются

детерминированными

 

величинами, линейно независимы;

 

 

-

значения

{et },

ошибок

(или

возмущений),

и соответственно{Yt },

являются случайными;

-предполагается, что ошибка для каждого наблюдения{Yt } является нормально распределенной величиной, описываемой стандартным распределением N (0,s 2 ) , причем

M [et ]= 0 ,

D[et ]= s 2 ,

cov(et

,et -1 ) = 0 .

 

 

 

 

Для оценки

модели, так же как и в случаемодели парной регрессии

используют МНК. Применение МНК к уравнению множественной регрессии

приводит

к

системе линейных уравнений( k +1)с

неизвестными

(см.

приложение 1). Решением системы являются коэффициенты функциональной

зависимости

 

f ( X 1t , X 2t , X 3t ,...X kt ) . Полученные коэффициенты уравнения

регрессии называют коэффициентами условно чистой регрессии. Коэффициент

уравнения

 

множественной

регрессии

измеряет

отклонение

объясняемой

переменной от ее среднего по выборке значения, при отклонении объясняющей переменной на единицу от среднего значения. Каждый из коэффициентов уравнения регрессии оценивает влияние изменения фактора на изменение объясняющей переменной, при неизменности всех других объясняющих

переменных. Т.е. абстрагируясь от

их влияния. Однако мы не можем

считать

коэффициенты множественной регрессии мерой чистого влияния

факторов.

Причиной тому - невозможность

включения в уравнение всех факторов,

влияющих на рассматриваемый экономический показатель. Включить в

эконометрическую

модель

все

факторы(экономические

показатели)

невозможно по

одной из

перечисленных ниже , причинили по всем

одновременно:

 

 

 

 

a)часть факторов может быть просто неизвестна исследователям;

b)часть известных факторов не может быть представлена в количественных

показателях, в

следствие, не

полной

информации

или

,оценок

разработанных только на качественном уровне;

 

 

 

 

c) объем

изучаемой

выборки

ограничен, что

ограничивает

число

объясняющих переменных уравнения регрессии.

 

 

 

 

Коэффициенты условно чистой регрессии являются именованными числами. В

следствии этого,

их невозможно сравнивать друг с другом. Единицы измерения

17

коэффициентов уравнения регрессии определяются единицами измерения

объясняемого

параметра

и

единицами

измерения

самих

объясняющи

переменных. Как и для моделей парной регрессии, часто для моделей

множественной регрессии выбираются уравнения в логарифмической

форме

как

наиболее

соответствующие

экономической

задаче. В

этом

случае

коэффициенты уравнения регрессии имеют смысл эластичностей объясняемой переменной по каждому из объясняющих факторов соответственно.

Показателем качества модели множественной регрессии в целом является коэффициент детерминации множественной регрессии. Как и в случае парной модели, коэффициент детерминации определяется следующим выражением

^-

å(Y t - Y ) 2

R 2 =

 

t

 

.

 

 

 

 

 

 

(1.18)

 

 

 

 

-

 

 

 

 

 

 

 

 

 

 

å(Yt - Yt ) 2

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

Определенный выражением (1.18) коэффициент детерминации не всегда дает

 

корректный

результат.

С

увеличением

числа

объясняющих переменных

в

модели

множественной

регрессии

значение

коэффициента

детерминации

начинает расти и автоматически приближается к единице

независимо

от

реального

 

 

влияния

факторов. Поэтому

на

практике

используют

скорректированный коэффициент детерминации, который содержит поправку

 

на число степеней свободы

 

 

 

 

 

 

 

 

Rкорр2

 

= 1 - (1 - R 2 )

(n -1)

 

,

 

 

(1.19)

 

 

 

(n - m -

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где n - число наблюдений, m - число объясняющих переменных – факторов. Оценить коэффициент детерминации множественной регрессии, а значит и качество модели, целесообразно до проведения оценки параметров модели. Значение коэффициента детерминации связано со значениями матрицы парной корреляции

 

1

 

ryx

 

 

ryx

22

...

 

....

r yx

m

 

 

 

 

 

 

 

 

 

1

11

 

 

 

 

....

 

 

 

 

 

 

 

 

 

r yx

 

 

 

 

rx x

2

rx x

2

rx x

m

 

 

 

 

 

 

 

11

 

 

 

 

 

 

1

 

1

 

 

1

 

 

 

 

 

 

 

 

 

ryx

 

rx

x

1

 

 

 

rx

x

....

rx

x

m

.

 

 

 

 

 

 

 

2

 

 

2

 

1

....

 

 

2

 

3

....

2

 

 

 

 

 

 

 

 

....

....

 

 

 

1

 

 

....

 

,

 

 

 

 

 

 

....

....

 

..... .....

1

 

 

 

 

 

 

 

 

 

 

 

ryxm

rx

 

x

rx

x

 

....

 

rxm xm -1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

m

1

m

 

 

2

 

 

 

 

 

 

 

 

 

Ryx2

 

 

 

 

поэтому в литературе используют также обозначение

x

..x

m

. Но основе

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

матрицы значение R 2 вычисляются с помощью выражения

 

 

 

R 2 =1 -

D yx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.20)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

где

 

1

 

ryx

 

ryx

22

...

 

....

r yx

m

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

r yx

 

1

 

rx x

2

rx x

2

....

rx x

m

 

 

 

11

 

 

1

 

1

 

 

1

 

 

 

 

 

ryx

2

rx x

1

 

 

 

rx

x

....

rx

x

m

.

 

D yx =

 

2

1

 

 

 

 

2

 

3

 

2

 

 

 

....

....

....

 

 

1

 

 

....

....

 

 

- определитель

 

....

....

..... .....

1

 

 

 

 

 

 

 

ryxm

rx

x

rx

x

 

....

 

rxm xm -1

1

 

 

 

 

 

 

 

m

1

m

 

 

2

 

 

 

 

 

 

 

 

 

 

матрицы парных коэффициентов корреляции;

 

1

 

rx x

2

rx x

2

....

rx x

m

 

 

 

 

 

 

1

1

 

1

 

 

 

 

rx x

1

 

 

rx x

....

rx

x

m

.

 

Dxx =

2

1

 

 

 

 

2

3

 

2

 

 

....

 

....

 

 

1

 

....

....

 

 

- определитель матрицы

 

....

 

.....

.....

1

 

 

 

 

 

 

rx x

rx

x

 

....

 

rxm xm -1

1

 

 

 

 

m

1

 

m

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

коэффициентов парной корреляции объясняющих переменных (факторов).

Этим способом можно рассчитать величинуRyx2 1 x2 ..xm , не вычисляя параметров

^

уравнения регрессии и модельных значенийYt . Если полученное качество модели не удовлетворяет аналитика, то следует внимательно изучить причины,

влияющие на качество модели и

откорректировать

состав

объясняющих

переменных (факторов).

Величина

Ryx x

..x

m

- называемая

коэффициентом

 

 

 

 

 

 

 

 

 

 

1 2

 

 

 

 

 

 

множественной корреляции – является наиболее общим показателем связи всех

входящих

в уравнение

факторов

и объясняемого фактора. Исходя

из (1.20)

Ryx x

..x

m

определяется выражением

 

 

 

 

 

 

 

 

1 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

R

=

1 -

yx

.

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xx

 

 

 

 

 

 

 

 

 

Значение коэффициента множественной корреляции близко к единице только в

том

 

 

случае,

если

коэффициенты

 

корреляции

между

объясняющими

переменными и факторами r yx , ryx 2 ……. ryx

m

близки по модулю к единице

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

(т.е. изменяются в промежутке от 0,7 до 0,98), а коэффициенты межфакторной корреляции изменяются от0 до 0,5-0,6. Если коэффициенты межфакторной корреляции превышают значение 0,8, можно говорить о наличии линейной зависимости между рассматриваемыми факторами. Чем сильнее выражена корреляционная зависимость между факторами, тем менее надежна оценка параметров уравнения регрессии МНК. Указанные формальные условия

19

определяют

рекомендации

по

формированию

модели

множественно

регрессии:

 

 

 

 

 

 

 

 

§ в модель следует включатьфакторы,

имеющие очевидные,

с

экономической

точки

зрения, причинно-следственные

связи

с

объясняющим параметром;

 

 

 

 

 

 

§не следует включать в модель факторы слабосвязанные статистически с объясняемым параметром и тесно связанные с другими факторами;

§ не

допускается

в

качестве

объясняющих

переменных

мод

множественной

регрессии

использовать

факторы

связа

функциональной зависимостью.

Значимость многофакторной эконометрической модели в целом оценивается F - статистикой

^-

(n - m -1)å(Y t - Y ) 2

F =

t

,

(1.21)

^

må(Yt - Yt ) 2

t

или через значение коэффициента детерминации множественной регрессии

F =

 

R yx2 1// x m

 

 

*

n - m -1

 

 

 

 

(1.22)

 

 

 

 

 

 

 

 

 

1 - Ryx2

x

 

 

m

.

 

 

 

 

 

 

1..

 

m

 

 

 

 

 

 

Значение F - статистики оценивает соотношение дисперсии, объясненной

регрессией

и

дисперсии

ошибок регрессии. Из (1.22) видно, что расчетное

значение Fфактич

 

- критерия определяется значениями коэффициентов парной

корреляции,

растет с ростом значения Ryx2

x

..x

m

и может быть вычислено на

 

 

 

 

 

 

 

 

1

2

 

 

предварительном этапе моделирования – до вычисления параметров уравнения регрессии. Выражения (1.21) и (1.22) показывают, что F - статистика оценивает значимость присутствия каждого фактора в модели множественной регрессии.

Оценка значимости каждого из коэффициентов условно чисто регрессии, а следовательно каждого из факторов, входящих в модель, сводится

к вычислениям значений t -статистики:

tb i

=

bi

,

ta

=

a

.

 

 

 

 

S b

 

 

S a

 

 

i

 

 

 

 

Если значение t-статистики для коэффициента больше некоторого критического значения, то с вероятностью a гипотеза о равенстве коэффициента условно чистой регрессии нулю может быть отклонена. Следовательно, значения рассматриваемого фактора действительно влияют на значение объясняемого параметра, а сам фактор является значимым.

20