Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пособие 09

.pdf
Скачиваний:
20
Добавлен:
01.05.2015
Размер:
2.46 Mб
Скачать

то система будет включать три уравнения

n

n

 

 

 

an b1 X1t b2 X 2t

Yt

 

t

t

 

t

 

n

n

n

 

n

aX1t b1

X12t b2

X1t X 2t Yt X1t

t

t

t

 

t

t

n

 

n

n

aX 2t b1

X1t X 2t b2 X 22t Yt X 2t .

t

t

 

t

t

Таким образом, для оценки параметров множественной регрессии МНК необходимо решить систему уравнений ( k 1) * (k 1) или k * k .

Вычисления МНК чрезвычайно громоздки, поэтому метод получил широкое распространение и, по существу, второе рождение благодаря развитию вычислительной техники и информационных технологий.

4.Эконометрическая модель с двумя переменными – модель парной регрессии

4.1 Основные гипотезы

Пусть экономист располагает набором наблюдаемых экономических

показателей

X t

и

Yt

t 1,2,....n

связанных причинно-следственной

зависимостью. Связь значений X t и

Yt можно отобразить графически на

плоскости. Таким образом,

будет

получено графическое изображение

эмпирической зависимости

Yt от

X t .

Нашей задачей является построить

формальный вид зависимости показателя Yt от показателя X t (фактора),

т.е.

подобрать функцию f ( X t ) , так, чтобы «наилучшим» образом описать

эту

зависимость. В геометрическом смысле - необходимо провести некую кривую (прямую) таким образом, чтобы она наиболее близко подходила ко всем точкам построенной эмпирической зависимости. Эту процедуру часто называют

^

«подгонкой кривой». Значения Y f ( X t ) обычно называют модельными.

Наиболее мощным аналитическим методом, позволяющим решить эту задачу, является метод наименьших квадратов (далее МНК) . Для этого метода мерой «близости» наблюдаемых значений экономических показателей и «модельных» значений является функционал

21

t 1,2,....n

F ( Yt f ( X t ))2 .

t

Откуда условием «хорошей подгонки кривой» будет являться

F ( Yt f ( X t ))2 min .

t

Рассмотрим ситуацию, когда предполагается линейная зависимость между наблюдаемыми экономическими показателями X t и Yt

Yt a bXt .

Для этой зависимости Yt является объясняемой (или зависимой) переменной, X t - объясняющей переменной (или фактором).

Дальнейшее определение параметров из следующих предположений:

 

экономические показатели X t и Yt связаны зависимостью

 

Yt a bX t ;

(4.1)

 

значения вектора X

являются детерминированными;

 

значения

t ,

t называемые ошибкой (или возмущением), и

 

соответственно Yt , являются случайными;

предполагается, что ошибка для каждого наблюдения является нормально распределенной величиной, описываемой стандартным распределением

N( 0, 2 )

, причем

 

M

0

,

(4.2)

D t

t 2 ,

(4.3)

cov( t , t 1 ) 0 .

(4.5)

Совокупность предположений и ограничений,

принятых при моделировании

носит название спецификации модели. Модель (4.1) имеет название

классической нормальной регрессионной модели. Уравнение связывающие

значения экономического

 

показателя

Yt со

значениями

объясняющего

параметра X t

(фактора)

называют

эконометрическим уравнением или

уравнением регрессии (регрессией).

 

 

 

 

Таким

образом, мы

предполагаем, что наблюдаемые значения

объясняющей переменной

 

X t не являются случайными.

Закономерность,

связывающая

влияние

изменения

величины

X t

на

изменение

экономического параметра, Yt может быть описана линейной

функцией.

Однако реально функциональной зависимости для показателей не наблюдается. Это происходит потому, что реальные экономические объекты (субъекты) функционируют в неодинаковых условиях. Возникающие в следствии этих

неодинаковых условий ошибки, t приводят к случайности наблюдаемой

22

величины показателя Yt . Величина «ошибки»

t параметра

Yt не

наблюдаема (т.е. мы не можем определить их величину) и определяется множеством независимых друг от друга факторов. Поэтому мы можем предположить, что ошибка является случайной нормально распределенной величиной. Влияние ошибки вызывает отклонение значения Yt от их

реального представления, как в сторону уменьшения, так и в сторону возрастания. Поэтому среднее значение (математическое ожидание) ошибки логично предположить равным нулю. Условие (4.5) предполагает, что ошибки для разных наблюдений статистически не связаны друг с другом. Т.е. значение пары X 1 и Y1 не влияют на значение пары X 2 и Y2 . Применительно к экономике такое допущение означает, что все наблюдаемые объекты функционируют в едином экономическом пространстве и испытывают сходное влияние. Но экономические (социальные, финансовые) показатели одного объекта не зависят от тех же показателей другого объекта.

 

^

 

 

 

 

 

Подобранная функциональная зависимость Y t является лишь оценкой

 

 

 

 

 

 

 

реальных

экономических показателей Yt . Отклонение модельных значений

 

^

 

 

 

 

 

от наблюдаемых - et Yt Yt - называют или

ошибкой,

или остатком

регрессии, или невязкой регрессии. Значение параметров модели

a

и

b

 

случайными величинами. Оценки значений a

 

^

 

^

являются

и b -

a

и

b ,

полученные по методу наименьших квадратов МНК, являются наиболее эффективными.. В соответствии с теоремой Гаусса-Маркова (см. теорему например в [1], [2]) они являются несмещенными и имеют наименьшую дисперсию:

^

M [ a ] a ,

^

 

 

 

 

 

 

 

 

M [ b ] b ,

 

 

 

 

 

 

 

 

 

 

^

 

 

 

^

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D[ b ] s 2

 

 

 

 

 

 

,

 

 

 

 

 

_

 

b

 

 

 

 

 

 

 

 

 

( X t X )2

 

 

 

 

 

t

 

 

 

 

 

 

^

2

X t2

 

 

^

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D[ a ] s 2

 

 

 

 

t

 

 

 

 

 

_

,

a

 

 

 

 

 

 

 

 

n ( X t X )2

t

_

где X - среднее значение экономического показателя оценка дисперсии ошибок t .

(4.5)

X t ; ^ - статистическая

23

 

 

^

 

 

Несмещенной оценкой дисперсии ошибок является остаточная

дисперсия

 

 

 

 

 

et2

 

 

s

2

 

t

 

 

 

n 2

.

 

(4.6)

Выбор формального вида зависимости Yt

от

X t , определение

ограничений построенной модели и ее параметров a

и

b еще не означает

завершения эконометрического моделирования. Необходимо оценить качество построенной модели. Для этого определяют насколько вероятно, что полученная модель близка к истинному виду зависимости изучаемых экономических показателей. Для оценки «качества» эконометрической модели используют три основных расчетных показателя: t - статистику ( t - критерий), R 2 - коэффициент детерминации; F - статистику ( F - критерий). Все указанные показатели реализованы в любом из статистических программных пакетов.

Оценка t -статистики основывается на проверке гипотезы b =0, a =0 т.е.

оценке

того, что фактические значения t - статистик для коэффициентов -

tb

b

,

ta

a

- меньше некоторого критического значения. Выполнение этого

 

 

 

Sb

 

S a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

условия

означает, что с

вероятностью -

P(

a

 

tск ) , P(

b

tск )

-

Sa

 

Sb

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значения коэффициентов регрессии равны 0.

Если

 

 

 

a

 

tcr

,

b

 

tcr ,

то

 

 

 

 

 

 

 

 

 

 

 

 

 

Sa

 

 

 

 

Sb

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

первоначальная гипотеза

b =0, a =0 отклоняется.

В этом случае мы можем

считать, что с заданной вероятностью коэффициенты регрессии не нулевые и, следовательно, функциональная модельная зависимость действительно

существует. Причем если tb , ta > 2 , то коэффициенты регрессии не равны 0 с вероятностью 90-95%. Уже в этом случае можно считать модель является качественной, или значимой. Если tb , ta > 3, то коэффициенты регрессии не равны 0 с вероятностью 99%.

Может случиться так, что значение ta меньше указанных критических значений. Тогда можно осуществлять оценивание уравнение регрессии без свободного члена. Однако если tb -статистика не превышает критических значений, то невозможно отклонить гипотезу b =0, и модель не значима.

F -статистика (другое название - F -критерий Фишера) – показатель дисперсионного анализа. При статистической обработке серий данных (серий экспериментов, выборок данных) F - критерий оценивает соотношение дисперсий двух выборок. Если фактическое значение Fфактич - критерия выше

некого критического значения Fкритич , то считают, что обе рассматриваемые выборки принадлежат одной генеральной совокупности.

24

Для эконометрического моделирования F - статистика оценивается как соотношение факторной дисперсии и остаточной дисперсии

 

^

 

 

 

( n m 1 ) ( Y t Y )2

 

F

t

 

,

m ( Yt Yt

^

 

)2

 

t

где m – число переменных в регрессионной модели, n – общее объем выборки. Для парной регрессионной модели m=1 и

 

 

 

 

^

 

 

 

 

( n 2 ) ( Y t

Y )2

 

 

F

 

 

t

 

 

.

(4.7)

 

( Yt

 

^

 

 

Yt

)2

 

 

 

 

 

t

 

 

 

 

Таким образом,

оценивается соотношение доли дисперсии, объясненной

регрессией,

 

к дисперсии

ошибок регрессии. Из

(4.7) следует, что чем

 

 

 

 

 

 

 

^

«качественнее» модель - меньше значения ошибок

et Yt Yt , тем выше

значение Fфактич .

F - статистика является показателем, оценивающим качество

модели в целом.

Связь между F -статистикой и t -статистикой выражается

равенством

 

 

 

 

 

 

tb

 

 

 

 

 

 

F .

 

 

 

 

Важнейшим показателем оценки качества эконометрической модели является коэффициент детерминации. Обозначается этот показатель R 2 и может быть определен любым из двух выражений

( Y t Y )2

R 2

 

t

 

 

 

;

 

(4.8)

( Yt

 

 

 

 

 

 

 

 

 

 

Yt

)2

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

( Yt

 

^

 

 

 

 

 

 

Y t )2

 

R 2

1

t

 

 

 

 

 

 

( Yt

 

 

.

(4.9)

 

 

 

 

 

 

 

 

 

Yt )2

 

t

Коэффициент детерминации может принимать значения 0 R2 1. Если коэффициент детерминации равен 1, то модельные значения полностью совпадают с наблюдаемыми. Наблюдаемые значения экономического показателя (значения объясняющей переменной) располагаются вдоль линии

 

^

 

 

регрессии и соответственно et Yt

Yt

0 . Если

R 2 0 , то доля дисперсии,

объясняемой регрессией равна нулю, и модель не соответствует наблюдаемым показателям, т.е. не значима.

25

Теперь, когда мы определили параметры эконометрической модели, провели статистическим методами оценку качества построенной модели – ее значимость, нашу задачу можно считать завершенной. Следующий этап – экономическая интерпретация полученных результатов и выводы.

4.2 Уравнение регрессии в логарифмической форме

Особое значение в эконометрике имеет экономическая интерпретация результатов моделирования. При использовании экономических показателейX t и Yt в абсолютном значении каждая из объясняющих переменных

(факторов) является именованной величиной (измеряются в соответствующих единицах). Коэффициенты эконометрической модели (регрессии) имеют смысл изменения объясняемого параметра от среднего значения при изменения фактора на единицу измерения от среднего значения, иными словами «скорости изменения объясняемого параметра при изменении объясняющего на единицу». Однако в экономике принято оценивать показатели в относительных величинах – процентах. Поэтому многие аналитики используют логарифмическую форму исходных экономических данных. Рассмотрим парную линейную регрессию в логарифмической форме

log Yt

log X t t

 

 

 

(4.10)

где log Yt ,

 

log X t - логарифмы значений экономических

показателей.

Продифференцируем уравнение (4.10)

 

 

 

 

 

dY

 

dX

,

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

X

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

dY Y

 

 

 

 

 

dX

X

 

 

 

 

 

 

 

 

 

 

 

 

и имеет смысл эластичности функции. Отношение

dY

 

Y

представляет

Y

Y

 

 

 

 

 

 

 

 

 

 

собой ничто иное, как процентное изменение объясняемого экономического

показателя.

Соответственно

 

dX

 

X представляет собой процентное

 

 

 

 

 

 

X

 

X

 

изменение

фактора.

Понятие

эластичности широко

используется в

экономическом анализе

для

того,

чтобы определить

степень реакции

(«чуткости») одной переменной в ответ на изменение другой. Коэффициент эластичности показывает, на сколько процентов изменяется величина y при изменении величины x на один процент. Таким образом, в случае построения линейных моделей модель в логарифмической форме наилучшим образом соответствует экономическим задачам.

26

t

4.3 Коэффициент Дарбина-Уотсона

Коэффициент Дарбина-Уотсона является расчетным показателем широко известного теста Дарбина-Уотсона. Этот тест оценивает наличие или отсутствие корреляции ошибок регрессии (автокорреляции). Если ошибки регрессии являются статистически связанными (значение определяется

значением t 1 ), то этот факт говорит о присутствии систематической ошибки

в модели. При построении модели не были учтены факторы, существенно влияющие на уровень наблюдаемых экономических показателей. Присутствие такой систематической ошибки говорит о низком качестве модели.

Тест Дарбина-Уотсона основан на статистике

 

N

 

 

 

 

 

 

 

( et et 1 )2

 

 

 

 

DW

i 2

 

 

 

 

 

 

N

.

 

 

 

(4.11)

 

 

 

 

 

et2

 

 

 

 

 

i 2

 

 

 

 

 

 

Предполагая

число

наблюдений

достаточно большим, и проведя

элементарные выкладки, получаем

 

 

 

N

 

 

 

 

 

 

et * et 1

 

 

DW 2* ( 1

i 2

 

)

.

(4.12)

N

 

 

 

 

 

 

 

et2

 

 

 

 

i 2

Из выражения (4.12) видно, что статистика тесно связана с выборочным коэффициентом корреляции между et и et 1 . Выразим коэффициент ДарбинаУотсона через коэффициент автокорреляции r

DW 2( 1 r ) .

 

 

 

(4.13)

Рассмотрим содержательный смысл показателя

DW .

Если коэффициент

корреляции между

et и et 1 близок

к

единице

(высокий уровень

статистической связи ошибок регрессии),

то

в соответствии с (4.13) DW

близок к нулю. Если наблюдается высокий уровень отрицательной корреляции

– коэффициент корреляции близок к «-1» - то в соответствии с (4.13) значение DW близко к четырем. Если ошибки регрессии не коррелированны, то коэффициент корреляции близок к нулю и соответственно DW близок к 4.

Коэффициент Дарбина-Уотсона позволяет оценить случайность ошибок

регрессии. Близость DW к 2, говорит о том, что «ошибки» параметра Y

 

не связаны статистически. Для каждого значения Yt ониt

возникают t

в

27

 

 

результате действия множества независящих друг от друга случайных факторов не определяющих значение Yt . Существенное отклонение DW от значения 2, говорит о проявлении статистической связи между ошибками t и t 1 . В

этом случае можно говорить, что величину t определяют один или

несколько не включенных в модель факторов, существенно влияющих на значение наблюдаемого экономического показателя Yt . Для улучшения

качества модели следует перейти от парной эконометрической модели к множественной модели или динамической модели.

4.5 Нелинейная регрессия. Линеаризация

При построении эконометрических моделей возможна следующая ситуация. Очевидно, что экономические показатели взаимосвязаны, значения t - статистики и F -статистики подтверждает значимость коэффициентов. Однако коэффициент детерминации существенно меньше 1, и соответственно, модель не может считаться качественной. Остается предположить, что зависимость

Yt от X t не линейна. Тогда необходимо подобрать нелинейную функцию f ( Xt ), учитывая требование к простоте формы модели. Полученное модельное

уравнение носит название нелинейной регрессии. Нелинейные регрессии делятся на два типа: нелинейные по объясняющим переменным (факторам) и нелинейные по объясняемым переменным. В качестве зависимостей нелинейных по объясняющим переменным обычно выбираются:

полиномы различных степеней Yt a bX t cX t 2 dX t 3 t ;

гипербола Yt a Xbt t ;

Примеры нелинейные зависимостей по объясняемым переменным:

степенная Yt a* X t b ;

показательная Yt a* b Xt * t ;

экспоненциальная Yt exp( a bX t ) t .

Однако МНК позволяет оценить параметры регрессионного уравнения

линейного

по параметрам.

Значит

для построения функции f ( X t ) ,

необходимо

привести

нелинейную

регрессию к линейному виду. Эту

процедуру называют линеаризацией. Для этого могут быть использованы разные приемы. Для регрессии нелинейной по объясняющим переменным используют замену переменной. Для гиперболы делают замену

~ 1 ,

X t X t

в результате оцениваемая регрессия приобретает вид

28

~

 

 

Yt a b X t t .

(4.14)

 

Для уравнений в форме полиномов делают замену

X t(1) X t2 , X t(2)

X t3 ,

тогда нелинейная регрессия приобретает вид

 

 

Yt a bX t cX t ( 1 ) dX t ( 2 ) t .

(4.15)

 

Полученное уравнение линейно относительно объясняющих переменных, однако, это уже уравнение множественной регрессии. Как (4.14), так и (4.15) могут быть оценены МНК. При расчете статистик необходимо помнить, что в изначальной постановке у нас парная экономическая модель и объясняющая

переменная одна - X t .

Для регрессий нелинейных по объясняемым переменным процедура линеаризации сводится к логарифмированию левых и правых частей

уравнений. Для степенной зависимости линеаризации приводит уравнение к виду

lnYt

ln a b* ln Xt ln t .

 

 

 

~

~

Сделаем

замену переменных Y t lnYy ,

X t

Окончательно уравнение приобретает вид

 

~

~

~

 

Y A b X t

t .

 

Yt a* X t b * t процедура

 

A ln a ,

~

ln X t

t ln t .

 

(4.16)

Параметры (4.16) оцениваются МНК. Однако при оценке качества построенной модели следует помнить, что параметры регрессии оценены для

~

~

Y t lnYy

и X t ln X t .

После расчетов коэффициентов (4.16) необходимо вернуться к исходному виду уравнения и оценить модельные значения объясняющей переменной

^

 

~

~

 

 

Yt

exp( Y t )= exp( A b X t

) ,

 

или

 

 

 

 

 

^

exp(

 

 

 

 

Yt

ln a ) * exp( b* ln X t ).

 

 

 

 

 

^

 

Таким образом,

ошибка регрессии et Yt Yt

и соответственно значения R 2 и

DW оцениваются

для исходных

переменных

Yt и X t . Для нелинейных

регрессионных уравнений в показательной или степенной форме процедура линеаризации полностью аналогична рассмотренной выше. Сформулируем алгоритм оценки нелинейных регрессий:

выбрать форму зависимости для нелинейного уравнения регрессии;

29

провести линеаризацию регрессионного уравнения в соответствии с видом выбранной зависимости;

оценить коэффициенты линеаризованного уравнения МНК, оценить значимость полученных коэффициентов для линеаризованного регрессионного уравнения;

путем обратного преобразования вернуться к исходному виду регрессии – при необходимости преобразовать значения коэффициентов;

^

оценить модельные значения объясняющей переменной Yt , ошибку

^

регрессии et Yt Yt и коэффициент детерминации, используя исходные значения объясняющей переменной X t .

30