Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекции - Раздел 1

.pdf
Скачиваний:
9
Добавлен:
03.06.2015
Размер:
933.51 Кб
Скачать

Раздел 1. Эконометрика и ее связь с экономической теорией. Линейные и нелинейные модели связи между экономическими переменными. Метод наименьших квадратов.

Аннотация

Обсуждается связь эконометрики с экономической теорией, соотношение между теоретическими моделями связи между различными экономическими факторами, моделями наблюдений, согласованными с имеющимися статистическими данными,

эконометрическими моделями. Рассматривается метод наименьших квадратов для оценивания параметров модели прямолинейной связи между двумя переменными, его геометрическая интерпретация, содержательная интерпретация полученных результатов.

Рассматриваются модели наблюдений, соответствующие нелинейной связи между переменными в теоретической модели, и особенности их оценивания.

Тема1.1. Эконометрикаиеесвязь сэкономической теорией.Модели связиимодели наблюдений; эконометрическаямодель,подобраннаямодель.

План лекции

1.Эконометрика и ее связь с экономической теорией. Модели связи и модели наблюдений.

2.Процесс порождения данных, статистическая (эконометрическая) модель,

подобранная модель.

3.Задачи вводного курса.

4.Две переменные: меры изменчивости и связи.

5.Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции.

Текстовыйматериаллекции

Эконометрика (Econometrics) – совокупность методов анализа связей между различными экономическими показателями (факторами) на основании реальных статистических данных с использованием аппарата теории вероятностей и математической статистики. При помощи этих методов можно уточнять или отвергать различные гипотезы о существовании определенных связей между экономическими показателями, предлагаемые экономической теорией, выявлять новые, ранее не известные связи, производить прогнозирование будущих значений экономических показателей.

9

В течение многих лет основной задачей эконометрики являлось по возможности наиболее эффективное оценивание параметров математических моделей, предлагаемых

экономической теорией. При этом было принято исходить из предположения о

правильности спецификации модели, предлагаемой экономистами. В соответствии с таким подходом эконометрист только оценивал модель на основании статистических данных, не пытаясь ее изменить, и по результатам оценивания делал выводы о подтверждении или неподтверждении заявленных теоретических связей между экономическими факторами, а

также априорных значений некоторых параметров теоретических моделей. В этом отношении можно сослаться на определение эконометрики, приведенное в работе

[Samuelson, Koopmans, Stone (1954)]: “…the application of mathematical statistics to economic data to lend empirical support to models constructed by mathematical economics and to obtain numerical estimates”.

С течением времени в прикладных эконометрических исследованиях значительное место стал занимать так называемый “разведочный анализ” (Data Mining) , при котором исследователь в первую очередь обращается именно к имеющимся статистическим данным и пытается подобрать к ним несколько альтернативных моделей, прежде чем остановиться на какой-то одной из них и принимать результаты, полученные для этой “предпочтительной модели”. Анализируя характер имеющихся статистических данных, исследователь делает определенные заключения о возможной форме подходящей теоретической модели, что помогает при построении окончательной модели. Более того, если в процессе такого анализа предложенная теоретическая модель отвергается, сами данные могут указать на то, в каком направлении следует изменить спецификацию исходной теоретической модели.

В настоящее время построение окончательной модели производится и с учетом представлений экономической теории, и с учетом информации, содержащейся в эмпирических данных. Последняя может, например, указать на необходимость включения в модель,

предлагаемую экономической теорией, дополнительных переменных или на исключение из модели тех или иных “лишних” переменных, на необходимость изменения функциональной формы связи между рассматриваемыми переменными и т. п. В процессе построения подходящей модели естественно учитывать и результаты предшествующих эконометрических исследований.

Заметим только, что в основе всякого эконометрического исследования лежит представление о существовании некоторого “истинного” механизма порождения эмпирических данных, о котором мы будем говорить в дальнейшем как о процессе порождения данных (ППД, или DGP – data generatingprocess).

10

Рассмотрим, например, связь между располагаемым доходом домашнего

хозяйства (disposable personal income) DPI и расходами домашнего хозяйства на личное потребление (personal consumption expenditures) Cons. В своей знаменитой книге [Keynes (1936)]

Кейнс отметил как фундаментальный закон психологии склонность людей (как правило, и в среднем) увеличивать расходы на личное потребление по мере возрастания их доходов, но не в той степени, в какой возрастает их доход. Это означает, что если расходы на личное потребление связанысрасполагаемымдоходомсоотношением

Cons f DPI ,

гдеобепеременныеизмереныводних итех жеединицах, то

функция f DPI должнабыть возрастающей;

скоростьизменения этой функции1 должнабыть меньше1.

Вместе с тем Кейнс не указал явную форму такой функциональной связи, справедливо замечая, что онадолжна соответствовать реальнымстатистическимданным.

Простейшей моделью функциональной связи между DPI и Cons, удовлетворяющей указанным требованиям, является линейная модель связи (linear relation) – модель линейной зависимости Cons от DPI :

Cons DPI ,

где – постоянная величина, 0 1, характеризующая в данномкруге домашних хозяйствих склонность к потреблению (propensity to consumption), связанную с традициями и привычками, а

– автономное потребление (autonomous consumption). Для подтверждения правильности выбора такой теоретической модели и для проверки гипотез о ее параметрах (например, о том, что для некоторой совокупности домашних хозяйств в определенный период времени склонность к потреблению непревышалазначения 0.9)надо обратиться к статистическимданным.

Пусть мы имеем данные о размерах располагаемого дохода и расходах на личное потребление для n домашних хозяйств, так что DPIi и Consi представляют соответственно располагаемый доход и расходы на личное потребление i-го домашнего хозяйства. (Заметим, что получение подобных статистических данных само по себе является далеко не простой задачей,

поскольку требует от всех выбранных домохозяйств ежедневного учета их доходов и расходов и сообщения итоговых результатовбез какого-либо их искажения.)

Если разместить на плоскости впрямоугольной системекоординат точки DPIi ,Consi с

абсциссами DPIi и ординатами Consi (такое построение называется диаграммой рассеяния

1 Предельная склонность к потреблению (предельная норма потребления)

11

scatterplot, scatter diagram, scatter graph), то, как правило, эти точки не будут лежать на одной прямой вида Cons DPI , соответствующей линейной модели связи. Вместо этого они будут образовывать облако рассеяния (scatter cloud), вытянутое вдоль гипотетической прямой

Cons DPI .

Подобную форму облака можно наблюдать на диаграмме рассеяния (рис. 1.1),

соответствующей смоделированным данным о годовом располагаемом доходе и годовых расходах на личное потребление (в 1999 г., в условных единицах) 20 домашних хозяйств РФ. (Эти данные приведены в табл. 1.6, помещенной в конце раздела 1.)

2700

2500

CONS

2300

2100

2200 2400 2600 2800

DPI

Рис. 1.1

Значение

i Consi DPIi

представляет отклонение реально наблюдаемых расходов на потребление Consi от значения

DPIi , предсказываемого гипотетической линейной моделью связи для i-го домашнего хозяйства, имеющего располагаемый доход DPIi . Это отклонение отражает совокупное влияние на конкретные значения Consi множества дополнительных факторов, не учитываемых принятой моделью связи, так что реальное соотношение между DPIi и Consi принимает форму модели наблюдений (observation model)

Consi DPIi i, i 1, ,n .

Соответственно, о величине i Consi DPIi говорят как об ошибке наблюдений

(observationerror,disturbance),точнее, обошибкев i-мнаблюдении.

Особенность эконометрического подхода состоит в том, что отклонения i

рассматриваются как случайные величины (реализации случайных величин), так что связь между

переменными,

в данном случае, DPIi

и Consi ,

является не детерминированной, а

стохастической.

При этом несколько

расплывчатые рассуждения о теоретической

12

(усредненной) функции связи становятся более формализованными, если предположить, что модель порождения данных имеет вид

Consi

f DPIi i , i 1, ,n,

где 1, , n

- случайные величины (random variables), условные математические ожидания

(conditional expectations) которых при фиксированных значениях располагаемого доходаравны0:

E i

 

DPIi 0,

i 1, ,n.

 

При такомпредположенииимеем:

E Consi DPIi f DPIi , i 1, ,n,

так что f DPIi можно трактоватькак “ожидаемую” величинурасходовналичноепотребление домохозяйства,имеющего располагаемый доход DPIi .

Пусть процесс порождения данных имеет вид:

Consi DPIi i , i 1, ,n ,

где DPI1, ,DPIn - заданные (фиксированные) величины, а

1, , n - случайные величины, для

которых E i

 

DPIi 0,

i 1, ,n, так что

E Consi

 

 

DPIi DPIi , i 1, ,n, и

 

 

коэффициент выражает изменение ожидаемой величины расходов домохозяйства на личное

потребление при увеличении располагаемого дохода домохозяйства на единицу. В реальных условиях эконометрист имеет в своем распоряжении только статистические данные и не знает

вида функции

f DPI .

Выбирая ту или иную функцию f DPI ,

он формирует

соответствующую статистическуюмодель(statisticalmodel)

 

Consi f DPIi i

, i 1, ,n,

 

рассматривая

1, , n как

случайные величины. Такую модель часто

называют также

эконометрическоймоделью(econometricmodel),имея в видудваобстоятельства:

эта модель не является детерминированной (усредненной) моделью связи и предусматривает возможные отклонения реально наблюдаемых значений Consi от значений f DPIi ,предсказываемых детерминированной моделью связи;

эта модель выбирается эконометристом, и ее вид может отличаться от истинного

процессапорождения данных,который эконометристунеизвестен.

Определение эконометрической модели в явном виде (т.е. задание ее в виде уравнения, с

указанием задействованных переменных и функциональной формы связи между переменными, задание априорных ограничений на параметры и вероятностного описания

13

последовательности 1, , n) называется спецификацией эконометрической модели

(specification of an econometric model).

Врассмотренных условиях

i Consi f DPIi DPIi i f DPIi ,

так что

E i

 

DPIi DPIi f DPIi . При этом значение

E i

 

DPIi

может быть не

 

 

равным

нулю,

 

и тогда E Consi

 

DPIi f DPIi , т.е.

f DPI

уже нельзя

трактовать как

 

 

ожидаемую величину расходов на личное потребление домохозяйства, имеющего располагаемый

доход DPIi . При подобном неправильном выборе формы функции связи говорят, что статистическая модельнеправильноспецифицирована (misspecified model).

Представим теперь, что выбранная статистическая модель все же специфицирована правильно и, каки процесспорождения данных, имеет линейную форму:

Consi DPIi i , i 1, ,n .

Однако при этом эконометрист все равно не знает значений параметров и процесса

порождения данных. Поэтому он должен оценить эти параметры, используя имеющиеся

статистические данные, т.е. наблюдаемые пары значений DPIi ,Consi , i 1, ,n. При этом

интерес могут представлять не только точечные оценки этих параметров, но и доверительные интервалыдля них.

Если модель специфицирована правильно и оценки a для и b для каким-то образомполучены, топодобраннаямодель (fittedmodel)

Cons a b DPI

может использоваться для прогнозирования объема расходов на личное потребление для домохозяйства, имеющего располагаемый доход DPI . Разумеется, такой прогноз может иметь смысл

если полученныеоценки достаточно близкик истиннымзначениямпараметров и ;

для домохозяйств, имеющих ту же склонность к потреблению, что и у домохозяйств, по которым производилось оценивание параметров модели (или хотя бы близкую к ней склонностьк потреблению).

После оценивания эконометрической модели обычной практикой является проверка адекватности модели имеющимся статистическимданным, атакжепроверка тех или иных гипотез

означениях параметров модели.

Может оказаться, например, что наблюдаемое облако рассеяния больше

соответствует

модели,

в которой “теоретическая” (усредненная)

функция

связи

Cons f DPI

имеет вид

Сons lnDPI , 0, 0 . Заметим,

что в такой модели

14

предельная склонность к потреблению уже не является постоянной величиной, а зависит от

уровня

располагаемого дохода:

dCons

 

 

, убывая с возрастанием располагаемого

 

 

 

 

dDPI

DPI

дохода.

(При этом условие DPI обеспечивает выполнение предположения о том, что

предельная склонность к потреблению положительна и принимает значения, меньшие единицы.) Подобные ситуации более характерны для описания связи между располагаемым личным доходом и расходами на потребление отдельных продуктов или группы продуктов

(например, молочных продуктов).

Подобранная модель, прошедшая проверку на адекватность имеющимся статистическим данным, может использоваться как для целей прогнозирования, так и для целей управления (проведения определенной экономической политики).

Таким образом, эконометрический анализ можно понимать как совокупность следующих элементов:

Наличие исходных представлений о существовании связей между определенными экономическими факторами, получаемых на основании экономической теории

(экономическая гипотеза).

Выражение этих представлений в математической форме в виде соответствующих уравнений или систем уравнений (математическая модель).

Сбор необходимых (и доступных) статистических данных.

Согласование выбранной математической модели с имеющимися в распоряжении статистическими данными (модель наблюдений), спецификация статистической

(эконометрической) модели.

Оценивание статистической (эконометрической) модели.

Проверка гипотезы о правильности выбранной спецификации статистической

(эконометрической) модели (проверка адекватности подобранной модели имеющимся статистическим данным). Сохранение или изменение этой спецификации по результатам проверки гипотезы адекватности.

Уточнение математической модели связи путем проверки тех или иных гипотез о значениях параметров выбранной модели (с учетом результатов проверки эконометрической модели на адекватность имеющимся данным). Проверка возможности упрощения модели. Проверка экономических гипотез (единичная эластичность и т.п.).

Использование подобранной модели для целей прогнозирования или для целей управления.

15

В процессе эконометрического анализа исследователи часто придерживаются

принципа парсимонии” (экономичности, простоты – parsimony principle): модель должна быть простой, насколько это возможно, пока не доказана ее неадекватность имеющимся статистическим данным. Исследователи используют также “принцип охвата” (encompassing principle): модель должна быть в определенном смысле “неулучшаемой”, должна объяснять результаты, получаемые по конкурирующим с ней моделям (в конкурирующих моделях не должно содержаться информации, которая позволила бы улучшить выбранную модель). При проведении исследования рекомендуется также придерживаться метода от общего к частному” (general-to-specific approach), т.е. в качестве первоначальной брать более полную модель, а затем пробовать редуцировать ее к более простой модели.

Наряду с микроэкономикой и макроэкономикой эконометрика является одним из базовых предметов современного экономического образования. Эконометрика использует для анализа статистических данных методы теории вероятностей и математической статистики. При этом некоторые модели и методы чаще применяются к исследованиям на микроуровне, тогда как другие модели и методы чаще применяются к исследованиям на макроуровне. Соответственно, иногда говорят о подразделении эконометрики на микроэконометрику и макроэконометрику. В этом отношении можно сослаться, например,

на монографии [Favero (2001)] и [Cameron, Trivedi (2005)]. Заметим, что первая из этих книг предназначена для студентов, обучающихся в магистратуре, а вторая – для аспирантов, так что обе эти книги, как и многие другие, требуют предварительной подготовки, наличия базовых знаний в области эконометрики.

В первой части издания рассматриваются базовые понятия и элементарные эконометрические методы, без освоения которых невозможно изучение более сложных моделей и методов, применяемых в настоящее время в эконометрических исследованиях.

Освоив этот вводный курс, студент

может строить простейшие эконометрические модели, которые в ряде случаев вполне пригодны для описания соответствующих статистических данных,

понимает проблемы, которые возникают при построении таких моделей,

получает базовые знания и навыки для перехода к изучению более сложных моделей

иболее продвинутых методов исследования, специфических для различных типов статистических данных:

моделей временных рядов (описывающих динамику изменения тех или иных экономических показателей во времени)

16

моделей одновременных уравнений (описывающих, например, модели спроса и предложения),

векторных авторегрессий (описывающих динамику совместного изменения нескольких временных рядов, например, денежной массы, уровня цен и валового внутреннего продукта в масштабах страны),

моделей, объясняющих наличие или отсутствие некоторого признака у субъекта (например, работает – не работает) значениями некоторых характеристик субъекта,

моделей, служащих для описания “панельных” данных, имеющих как пространственную, так и временную направленность (например, квартальных данных по регионам Российской Федерации за десятилетний период).

Эконометрические методы находятся в постоянном совершенствовании и развитии.

Разработке и применению этих методов посвящается огромное количество статей,

публикуемых в десятках зарубежных экономических журналов. Укажем лишь на некоторые из них: Econometrica, The Econometrics Journal, The Economic Journal, Economic Letters, Economic of Transition, International Journal of Forecasting, Journal of Monetary Economics, Oxford Bulletin of Economics & Statistics, Review of Economic Studies, Journal of Econometrics, Journal of Business and Economic Statistics, Journal of Time Series Analysis. Соответственно,

для чтения этих журналов необходим словарный запас эконометрических терминов на английском языке. Более того, многие широко используемые на практике и в научных исследованиях специализированные пакеты эконометрического анализа, в том числе и пакет

Econometric Views (EViews), который предлагается к использованию на практических занятиях, не русифицированы. Поэтому в лекциях мы будем приводить англоязычные варианты используемых терминов, как это было уже сделано выше с терминами

эконометрика(econometrics),процесспорожденияданных(data generatingprocess),располагаемый доход (disposablepersonalincome)и некоторыми другими.

 

Две переменные: меры изменчивости и связи

 

 

 

 

 

В приводимой ниже таблице 1.1 указаны уровни безработицы

(в процентах) среди

белого – BEL и цветного – ZVET населения США в период с марта 1968 года по июль 1969

год (месячные данные).

 

 

 

 

 

 

 

 

 

 

 

Табл. 1.1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

Период

BEL

ZVET

 

i

Период

BEL

 

ZVET

 

1

Март 1968

3.2

6.9

 

10

Декабрь 1968

3.0

 

6.5

 

2

Апрель 1968

3.1

6.7

 

11

Январь 1969

3.0

 

6.0

 

 

 

 

 

 

 

 

 

 

 

 

17

3

Май 1968

3.2

6.5

 

12

Февраль 1969

2.9

5.7

4

Июнь 1968

3.3

7.1

 

13

Март 1969

3.1

6.0

5

Июль 1968

3.3

6.8

 

14

Апрель 1969

3.1

6.9

6

Август 1968

3.2

6.4

 

15

Май 1969

3.1

6.5

7

Сентябрь 1968

3.2

6.6

 

16

Июнь 1969

3.0

7.0

8

Октябрь 1968

3.1

7.3

 

17

Июль 1969

3.2

6.4

9

Ноябрь 1968

3.0

6.5

 

18

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим графики изменения уровней безработицы в обеих группах в течение указанного периода времени (рис. 1.2).

Первое впечатление от просмотра этих графиков – уровень безработицы среди цветного населения существенно выше и изменяется со временем со значительными колебаниями; уровень безработицы среди белого населения изменяется плавно и в довольно узком диапазоне.

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

68

 

68

 

68

 

68

 

68

 

68

 

68

 

68

 

68

 

68

 

69

 

69

 

69

 

69

 

69

 

69

 

69

-

 

 

-

 

 

 

-

 

 

 

-

 

 

 

 

-

 

 

-

 

 

 

Mar

 

 

-

May

 

 

-

-

Aug

 

 

-

 

-

Nov

 

 

-

 

-

 

-

Mar

 

 

-

May

 

 

-

-

 

Apr

 

 

Jun

 

Jul

 

 

Sep

 

Oct

 

 

Dec

 

Jan

 

Feb

 

 

Apr

 

 

Jun

 

Jul

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BEL

 

 

 

ZVET

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 1.2

Обозначим через x1, ,x17 последовательно наблюдаемые уровни безработицы среди цветного населения, а через y1, , y17 – соответствующие им уровни безработицы

среди белого населения США, так что мы можем говорить о наблюдаемых значениях двух переменных: переменной x – уровня безработицы среди цветного населения, и переменной y – уровня безработицы среди белого населения. Всего мы имеем здесь n 17 наблюдаемых пар значений переменных x и y : (x1, y1), ,(xn , yn ).

Наиболее простыми показателями, характеризующими последовательности x1, ,xn

и y1, , yn , являются их средние значения (means)

 

 

1

n

 

x1 xn

 

x

 

xi

 

,

 

 

 

 

n i 1

 

n

 

 

1

n

 

y1 yn

 

y

 

yi

 

,

 

 

 

 

n i 1

 

n

18

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]