Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пособие 09

.pdf
Скачиваний:
20
Добавлен:
01.05.2015
Размер:
2.46 Mб
Скачать

рассматриваемого фактора действительно влияют на значение объясняемого параметра, а сам фактор является значимым.

5.3 Рекомендации для построения модели регрессии

Построение и развитие эконометрической модели – сложный и длительный процесс. Очень редко первоначальный вариант модели дает хорошие результаты. Поэтому естественными этапами в построении качественных моделей является ее последовательное уточнение. Предложенные ниже рекомендации обобщают опыт построения эконометрических моделей.

1.Факторы (объясняющие переменные) должны находится в причинноследственной связи с объясняемыми факторами (переменными)

2.Объясняющие параметры (признаки факторы) не должны быть составными частями результативного признака.

3.Факторы (объясняющие переменные) не должны дублировать друг друга (коэффициент корреляции меньше 0,8).

4.Не следует включать в модели факторы различных уровней иерархии.

5.Математическая форма регрессионного уравнения должна соответствовать логике связи объясняющие факторов для реального объекта:

если объясняющий параметр может существовать без любого из результирующих факторов, то выбирается аддитивная модель (например урожайность в равной мере зависит от ряда факторов, но может существовать и без любого из них; доходы банка (определенного профиля) складывается из % по кредитам, РКО, операциям с ценными бумагами, обмена валют, любой из этих факторов может быть отброшен.

Если результат не существует без любого из рассматриваемых факторов, то зависимость мультипликативная.

Уточнение построенной модели проводят в следующих направлениях:

выведение из рассмотрения не значащих объясняющих переменных;

преобразование исходных данных с цель устранения их нежелательных свойств;

устранение сильно коррелированных между собой переменных;

построение нелинейного варианта уравнения регрессии

41

5.4 Эконометрические модели с несколькими объясняющими переменными – модели множественной регрессии. Примеры

В отличие от моделей парной регрессии модели множественной регрессии широко применяются для анализа экономических и финансовых объектов, для построения прогнозов экономических показателей. Эконометрические модели применяются в различных экономических и социальных дисциплинах. В одних случаях эти модели создаются с целью исследовать тот или иной экономический объект, выявить взаимосвязи и степень влияния различных экономических показателей на исследуемый показатель. В других случаях оценивается эффективность теоретической экономической модели. Для проверки используются эмпирические (экспериментальные) данные. Для этого теоретическая модель преобразуется к форме уравнения регрессии.

5. 4.1 Эконометрическое моделирование социально-экономических показателей

Одним из важнейших социально-экономических показателей в Российской Федерации является прожиточный минимум в среднем на душу населения. Уровень прожиточного минимума оценивается для каждого региона Российской Федерации на основе статистических данных об уровне цен на товары и услуги в данном регионе. Таким образом, величина прожиточного минимума в денежном измерении оценивается исполнительными органами власти региона и утверждается законодательными органами власти. Методика оценки этих показателей остается неясной не только для большинства граждан, но и для специалистов. Однако остается возможность оценить влияние различных факторов на величину прожиточного минимума, построив эконометрическую модель. Целью моделирования является определить насколько уровень прожиточного минимума, установленный региональными органами власти связан с реальными экономическими показателями. Анализ статистических данных по основным социально-экономическим показателям развития регионов позволяет предположить, что уровень прожиточного минимума определяется следующими факторами:

минимальным тарифом на электроэнергию для населения (руб./(кВт/ч));

федеральным стандартом стоимости жилищно-коммунальных услуг за 1 кв. м;

стоимостью фиксированного набора потребительских товаров и услуг на одного человека («потребительская корзина»).

Для подтверждения правильности сделанных предположений и оценки обоснованного уровня прожиточного минимума нужно подобрать функцию, аппроксимирующую зависимость

42

Прожит _ минимум _( руб ) f ( стоимость_" потреб _ корзины" ; стоимость_ 1_ кв _ м _ ЖКУ ;тариф _ за _ 1_ квтч )

Для поставленной задачи была выбрана модель в форме линейной множественной регрессии, как наиболее соответствующая данным. Соответствующее уравнение имеет вид

Si a b1 * Ei l b2 * Gi b3 * Fi ,

(5.7)

где Si - прожиточного минимума в среднем на душу населения (руб.) i - го региона; Eli - минимальный тариф на электроэнергию для населения (руб./(кВт/ч)) i - го региона; Gi - федеральный стандарт стоимости жилищнокоммунальных услуг (руб./ 1 кв.м.) в i -ом регионе; Fi - стоимостью фиксированного набора потребительских товаров и услуг на одного человека (руб.) в i -ом регионе; a , bi i 1,2....n - коэффициенты условно чистой

регрессии. Следует обратить внимание, что все факторы, входящие в уравнение (5.7) измеряются в денежных единицах. Экономический смысл коэффициентов bi модели состоит в оценке изменения прожиточного минимума при

изменении ценового уровня соответствующего фактора на 1 руб. Оценивание модели будем проводить на данных по социально-экономическим показателям для регионов Российской Федерации за 3-4 кварталы 2002 г. Источником данных являются официальные органы исполнительной власти Российской Федерации: Государственный комитет по статистике [14], Министерство финансов Российской Федерации [15].

Оценивать модель будем в соответствии с рекомендациями, изложенными в разделе 5.2. Матрица коэффициентов парной корреляции для объясняемого показателя и факторов модели (5.7) приведена в Таблице 5.1.

Таблица 5.1 – Матрица коэффициентов парной корреляции

 

S

 

El

 

G

 

F

S

 

1

 

 

 

 

 

El

 

0,57

 

1

 

 

 

G

 

0,91

 

0,55

 

1

 

F

 

0,97

 

0,53

 

0,88

1

Коэффициент детерминации, вычисленный по формуле (5.4) составляет RS2,El ,G,F =0,96, что говорит о высоком качестве построенной модели в целом.

Однако из матрицы коэффициентов парной корреляции очевидно, что фактор «минимальный тариф на электроэнергию для населения» слабо связан с объясняемым параметром, а для фактора «федеральный стандарт стоимости жилищно-коммунальных услуг за 1 кв.м» и фактора «стоимость

43

фиксированного набора потребительских товаров и услуг на одного человека»

коэффициент межфакторной

корреляции

превышает

значение 0,8.

Следовательно, нужно проанализировать следует ли

включать в уравнение

регрессии указанные факторы. Оценка

уравнения

(5.7)

даёт следующий

результат

 

 

 

 

 

 

Si 225,78 88,1* Ei l 11,82* Gi

0,641* Fi ,

 

 

ta =-2,81

tb =1,56

tb =4,39

tb

=13,85.

 

 

 

1

2

3

 

 

 

Коэффициент детерминации, вычисленный по формуле (5.2) RS2,El ,G,F =0,96 и совпадает с предварительной оценкой. Расчетное значение Fфактич - критерия

494,3, что на много превышает критическое значение Fкритич (0,05, m=3, n=67)=2,75 (см. таблицу значений F - критерия Приложения 2), следовательно, подтверждается значимость присутствия факторов в модели множественной регрессии. Проанализируем t -статистики. Коэффициенты регрессии при факторах «федеральный стандарт стоимости жилищно-коммунальных услуг за 1 кв.м» ( b2 ), «стоимость фиксированного набора потребительских товаров и

услуг на одного человека» ( b3 ) и свободный член регрессии не равны нулю с

вероятностью более 99% (см. таблицу значений t , N -статистики Стьюдента

Приложения 2). Для фактора минимальный тариф на электроэнергию для населения коэффициенты регрессии не равен нулю с вероятностью более 87%. Т.е. все выбранные объясняющие переменные значимы. Коэффициент ДарбинаУотсона DW =1,58, что говорит о некоррелированности ошибок регрессии и высоком качестве модели.

Из оценки модели мы можем сделать вывод: при увеличении стоимости кВтч на 1 руб. прожиточный минимум увеличивается на 88,1 руб., при увеличении стандарта стоимости жилищно-коммунальных услуг за 1 кв. м на 1 руб. прожиточный минимум увеличивается на 11,82 руб., при увеличении цены так называемой «потребительской корзины» на 1 руб., прожиточный минимум увеличивается на 0,64 руб.

Различное по абсолютной величине влияние факторов объясняется достаточно просто. Ценовой уровень «потребительской корзины» рассчитан на одного человека, а потребление электроэнергии оценивается по среднему уровню на душу населения.

Проанализируем, как изменится модель, если исключить один из факторов Gi и Fi (коэффициент корреляции GF =0,88, что позволяет говорить

о линейной зависимости между факторами). Следует заметить, что высокая коррелированность факторов «федеральный стандарт стоимости жилищнокоммунальных услуг за 1 кв.м» и «стоимость фиксированного набора потребительских товаров и услуг на одного человека» обусловлена исключительно экономическими причинами. При оценке стоимости так называемой «потребительской корзины» стоимость жилищно-коммунальных услуг не включалась (см. материалы [15]). Исключим из модели фактор Gi

44

(«федеральный стандарт стоимости жилищно-коммунальных услуг за 1 кв.м») ,

т.к. SF

выше нежели SG .

Тогда уравнение (5.1) принимает вид

Si

a b1 * Ei l b3 * Fi ,

 

 

 

(5.8)

а оценивание его параметров дает следующие результаты

 

Si

544 135,9* Ei l 0,81* Fi ,

 

 

 

 

ta =7,41

tb =2,16

tb

=27,26.

 

 

 

 

 

1

3

 

 

 

 

Коэффициент

детерминации

равен

R2

=0,947,

t -статистики всех

 

 

 

 

 

S ,El ,G,F

 

 

коэффициентов регрессии говорят о значимости с вероятностью более 99%. Эти показатели говорят о высоком качестве откорректированной модели. Однако коэффициент Дарбина-Уотсона резко уменьшается и составляет всего 0,66, что говорит о коррелированности ошибок регрессии и следовательно, о присутствии систематической ошибки в модели. Сведение модели к парной регрессии с одной объясняющей переменной «стоимость фиксированного набора потребительских товаров и услуг на одного человека» дает хороший

результат. Расчетное значение Fфактич - критерия и

t -статистик говорит о

значимости модели как в целом так и фактора,

DW =1,62. Несколько

уменьшается коэффициент детерминации RS2,El ,G,F =0,94.

 

Полученные оценки позволяют сделать вывод: региональные органы власти устанавливают уровень прожиточного минимума, ориентируясь преимущественно, на «стоимость фиксированного набора потребительских товаров и услуг» - «потребительской корзины». При этом прожиточный минимум оказывается меньше, нежели стоимость «потребительской корзины».

При использовании моделей в логарифмической форме

ln( Si

) 1

* ln( Ei l ) 2

* ln( Gi

) 3 * ln( Fi

) ,

(5.9)

или

 

 

 

 

 

 

 

ln( Si

) 1

* ln( Ei l ) 3

* ln( Fi

),

 

 

(5.10)

где , i

i 1,2....n - коэффициенты условно

чистой

регрессии, результаты

оценивания качественно повторяют результаты

оценивания для

(5.7) и (5.8).

Для моделей в логарифмической форме коэффициенты условно чистой регрессии i имеют смысл эластичности изменения показателя «уровень

прожиточного минимума» по отобранным факторам.

Оценка (5.9) и (5.10) показала, что изучаемый социально-экономический показатель наиболее эластичен по фактору Fi - стоимость фиксированного

набора потребительских товаров и услуг на одного человека. При оценивании модели с тремя факторами получены следующие результаты. При изменении стоимости фиксированного набора потребительских товаров и услуг на 1% величина прожиточного минимума изменяется на 0,96%, при изменении стандарта стоимости жилищно-коммунальных услуг на 1% величина прожиточного минимума изменяется на 0,14%, при изменении стоимости 1

45

кВтч. для населения на 1% величина прожиточного минимума изменяется на 0,017%. Таким образом, оценка модели в логарифмической форме подтверждает выводы сделанные выше.

5. 4.2 Эконометрическое моделирование уровней цен

Эконометрические модели успешно применяется в маркетинговых исследованиях. В данном разделе рассматривается задача моделирования уровней цен на комплектующие для вычислительной техники.

Рассмотрим модели для уровней цен на мониторы и CD - диски3. Для построения обеих моделей были использованы открытые рекламные данные, представленные на Интернет-сайтах компаний. При проведении исследований возможности получения дополнительных данных о деятельности коммерческих предприятий и ситуации на рынке комплектующих не было. Поэтому не было возможности уточнить модель, т.е. улучшить ее качество.

Целями моделирования являются:

a)выявление из доступных характеристик комплектующих для вычислительной техники факторов, влияющих на уровень цены;

b)построение аналитической зависимости уровня цены от объясняющих параметров;

c)прогнозирование уровней цен на основании построенных аналитических зависимостей.

Рассмотрим модель уровня цен на мониторы. Источником данных является информационный сайт farpost.com4.

Для построения модели необходимо подобрать аналитическую зависимость цены на мониторы от качественных и количественных характеристик

Цена _ монитора f ( размер _ экрана,тип_ экрана,фирма) .

На основании качественного анализа данных и требований к простоте модели была выбрана модель в форме линейной множественной регрессии

Pr ice _ M a b1 D b2Type b3 Fr , (5.11)

где Pr ice _ M

- цена монитора (в долларах США),

D размер экрана (в дюймах),

Type - тип

монитора

(жидкокристаллический

или ЭЛТ), Fr - фирма

производитель,

a , bi

i 1,2,3- коэффициенты

условно чистой регрессии.

Переменные

D , Type

являются фиктивными. Т.к. оба показателя являются

качественными

характеристиками мониторов, то значения этих переменных

3Исходные данные и некоторые результаты моделирования были получены студентами Шимановым К. и Зубрицким Д. при выполнении индивидуальных заданий по эконометрике в 2003-2004 учебном году

4Доступно из URL: www.farpost.com [октябрь 2003]

46

дискретны. Переменная D является бинарной и принимает значение 0,если экран ЭЛТ и значение 1, если монитор жидкокристаллический. Переменная F , определяющая фирму-производителя, также является фиктивной. Однако т.к. представлена продукция трех фирм, то переменная Fr принимает три дискретных значения: 0-Samsung , 1- LG , 2- IIYMAL.

Как и в предыдущем случае, оценку модели будем проводить в последовательности и в соответствии с рекомендациями разделов 5.1, 5.2. Матрица коэффициентов парной корреляции для уровня цены на мониторы и

объясняющих факторов

модели (5.11) - параметров мониторов - приведена в

Таблице 5.2.

 

 

 

 

Таблица 5.2 - Матрица коэффициентов парной корреляции

 

Price_M

D

Type

F

 

Price_M

1

 

 

 

 

 

 

 

 

D

0,58555

1

 

 

 

Type

0,58179

-0,2507

1

 

 

F

0,24673

0,09484

0,15774

1

 

Проанализируем выборки

исходных данных (см. Таблицу 5.3). Во-

первых, оценим тесноту связи объясняемого и объясняющих параметров (см. раздел 5.2). Значения коэффициентов корреляции объясняющих параметров «размер экрана (в дюймах)» и «тип монитора» с объясняемым параметром достаточно высоки. Однако понятно, что модель парной регрессии с одним из этих параметров в качестве объясняющих переменных будет не качественной. Во-вторых, из выборки данных видно, что цена даже в том случае, если все

рассматриваемые характеристики мониторов

одинаковы,

незначительно

изменяется в зависимости от модели монитора.

Отсюда возникает опасение,

что эконометрическая модель будет не значимой, т.к. не учтены все факторы,

влияющие на уровень цены.

 

 

 

 

 

В соответствии с рекомендациями раздела 5.1, оценим качество модели

до проведения оценки её параметров.

 

 

 

 

Значение коэффициента детерминации вычисленное из матрицы

коэффициентов корреляции RD2

,Nype,F =0,912. Предложенная модель значима, и

следует оценить параметры модели.

 

 

 

 

Оценка уравнения регрессии дает следующий результат

 

Pr ice _ M 2329 148,22* D 487,67* Type 21,67Fr

 

ta = 14

tb = 15,8

tb =15,5

tb

=1,06.

 

 

1

 

2

3

Коэффициент детерминации,

рассчитанный

из

остатков регрессии

RD2

,Nype,F =0,912, и совпадает с предварительной оценкой. Расчетное значение

Fфактич - критерия 137,8 , что превышает критическое значение. Коэффициент Дарбина-Уотсона для модели (5.11) имеет почти идеальное значение –

47

Таблица 5.3 - Уровень цен на мониторы и параметры мониторов

 

 

Размер

 

 

Модель

Цена

экрана

тип монитора

Фирма

(дюйм)

Vision Master Pro 1413

256

17

ЭЛТ

LG

Vision Master Pro 413

284

17

ЭЛТ

LG

Vision Master Pro 704

301

17

ЭЛТ

LG

Vision Master Pro 455

430

19

ЭЛТ

LG

Vision Master Pro 454

547

19

ЭЛТ

LG

Vision Master Pro 513

920

22

ЭЛТ

LG

Vision Master Pro 514

1064

22

ЭЛТ

LG

Pro Lite E380S-B

506

15

жидкокрист.

LG

Pro Lite E43099, speakers

660

17

жидкокрист.

LG

AS4612UT

826

18

жидкокрист.

LG

VE155s

482

15

жидкокрист.

IIYMAL

VG500

497

15

жидкокрист.

IIYMAL

VX500

506

15

жидкокрист.

IIYMAL

VE700

602

17

жидкокрист.

IIYMAL

VG700

622

17

жидкокрист.

IIYMAL

VP171s

734

17

жидкокрист.

IIYMAL

VG800

732

18

жидкокрист.

IIYMAL

VP181s

777

18

жидкокрист.

IIYMAL

VG900

876

19

жидкокрист.

IIYMAL

VP191s

998

19

жидкокрист.

IIYMAL

VX900

920

19

жидкокрист.

IIYMAL

VP201s

1640

20

жидкокрист.

IIYMAL

NeoView AL150

390

15

жидкокрист.

Samsung

NeoView AL150

390

15

жидкокрист.

Samsung

NeoView AL157

426

15

жидкокрист.

Samsung

NeoView AL157

426

15

жидкокрист.

Samsung

NeoView AL181N

780

18

жидкокрист.

Samsung

NeoView AL190

899

19

жидкокрист.

Samsung

SM 755DFX

182

17

ЭЛТ

LG

SM 757 MB

207

17

ЭЛТ

IIYMAL

SM 757NF

248

17

ЭЛТ

IIYMAL

SM 753DFX

170

17

ЭЛТ

Samsung

SM 763MB

174

17

ЭЛТ

Samsung

SM 765MB

185

17

ЭЛТ

LG

Samtron 76E

180

17

ЭЛТ

LG

Samsung763MB

185

17

ЭЛТ

LG

Samsung765MB

190

17

ЭЛТ

LG

Samsung757MB

183

17

ЭЛТ

LG

F 700B

220

17

ЭЛТ

IIYMAL

700P

221

17

ЭЛТ

IIYMAL

FLATRON Ez 710BH

230

17

ЭЛТ

IIYMAL

FLATRON Ez 710PH

170

17

ЭЛТ

Samsung

F 900B

501

19

ЭЛТ

Samsung

F 900P

540

19

ЭЛТ

LG

DW =1,95. Следовательно ошибки не коррелированны, и полученная модель множественной регрессии соответствует классической нормальной регрессионной модели.

48

Fr , получаем модель
(5.12)

Оценим значимость объясняющих факторов. Для коэффициентов регрессии при переменных D , Type и свободного члена регрессии значения t -

статистик намного превышает критическое значение. Таким образом, a , b1 , b2 не равны нулю с вероятностью более 99% (см. таблицу значений t , N -

статистики Стьюдента Приложения 2). А для переменной Fr , определяющей фирму-производителя, значение t -статистики ниже критического уровня. Следовательно, переменная Fr не значима. Учитывая так же низкую коррелированность Fr и объясняемой переменной Pr ice _ M , можем в дальнейшем вывести переменную Fr из модели регрессии.

Из оценки модели мы можем сделать вывод: при увеличении размера экрана на 1 дюйм цена монитора возрастает в среднем на 148,22 $; использование жидкокристаллического экрана увеличивает цену монитора на 487,37 $; вариация цены в зависимости от фирмы производителя составляет

21,67 $.

Исключив из модели незначимую переменную регрессии

Pr ice _ M a b1 D b2Type ,

и её оценку

Pr ice _ M 2331 149,67* D 493.82* Type

ta = 14

tb = 16

tb =16.

 

1

2

Коэффициент детерминации RD2 ,Nype,F =0,91, доля необъясненной регрессией дисперсии составляет только 9%. Расчетное значение Fфактич - критерия 205,37,

что указывает на укрепление значимости модели в целом. Коэффициент Дарбина-Уотсона DW =2,03, т.е. практически равен 2. Все объясняющие переменные, включенные в модель значимы на уровне 0,1%.

Полученная нами модель (5.12) почти идеальна, что крайне редко случается с моделями, построенными на реальных экономических показателях.

Рассмотрим модель уровня цен на CD-диски. Источником данных об уровне цен и характеристиках CD-дисков является информационный сайт

Navi.com.ru5.

Модель уровня цен на CD-диски с учетом доступных данных будем искать в виде зависимости

Цена _CD f ( емкость,тип )

5 Доступно из URL: www.navi.com.ru [октябрь 2003]

49

Модели была выбрана модель в форме линейной множественной регрессии, как наиболее соответствующей данным

Pr ice _ CD a b1Vol _ D b2Type ,

(5.13)

 

где Pr ice _ CD - цена

CD-диска (в рублях), Vol _ D

- емкость в

Mb,

Type -

определяет тип диска

R / RW – «для чтения» или «чтение и запись»,

a , bi

i 1,2,- коэффициенты

условно чистой регрессии.

Переменная

Type

дает

качественную оценку диска, является фиктивной, бинарной переменной. Переменная Type принимает значение 0, если диск предназначен только для считывания информации «R» и значение 1, если диск предназначен как для считывания, так и для записи информации.

Качественный анализ исходных данных (см. Таблицу 5.5) показывает:

при равной емкости CD-дисков дороже стоят диски типа «чтение и запись»;

наиболее дорогими являются CD-диски емкостью 700 Mb и типа «чтение и запись»;

цена диски одинаковой емкости и типа незначительно изменяется в

зависимости от модели диска.

Матрица коэффициентов парной корреляции для уровня цены на мониторы и объясняющих факторов модели (5.13) – характеристик CD-дисков - приведена в Таблице 5.4.

Таблица 5.4 - Матрица коэффициентов парной корреляции

 

Price_CD

Vol_D

Type

Price_CD

1

 

 

Vol_D

0,63

1

 

Type

0,60

0,09

1

По результатам расчетов коэффициентов корреляции можно сделать вывод, что выбранные объясняющие переменные соответствуют рекомендациям по построения эконометрической модели (см. п. 5.2). Объясняющие переменные (факторы) находятся в причинно-следственной взаимосвязи с объясняющей переменной признаком. Существование корреляционной связи объясняющих параметров «цена CD-диска» и «тип CDдиска» подтверждается высокими значениями коэффициентов корреляции – 63% и 60% соответственно. Объясняющие переменные независимы -

Vol _ D ,Type =9%.

Значение коэффициента детерминации вычисленное из матрицы коэффициентов корреляции RVol2 _ D,Type =0,66. Предложенная модель объясняет

дисперсию уровня цен на CD-диски только на 69%, 31% дисперсии остается не объясненной.

50