Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
общий документ эконометрика.docx
Скачиваний:
129
Добавлен:
05.06.2015
Размер:
3 Mб
Скачать

30.Какие способы устранения мультиколлинеарности существуют?

Для устранения или уменьшения мультиколлинеарности используется

ряд методов. Самый простой из них (но далеко не всегда возможный) состоит в том, что из двух объясняющих переменных,имеющих высокий коэффициент корреляции (больше 0,8), одну переменную исключают из рассмотрения. При этом, какую переменную

оставить, а какую удалить из анализа, решают в первую очередь на основании экономических соображений. Если с экономической точки зрения ни одной из переменных нельзя отдать предпочтение, то оставляют ту из двух переменных, которая имеет больший коэффициент корреляции с зависимой переменной.

Другой метод устранения или уменьшения мультиколлинеарности заключается в переходе от несмещенных оценок, определенных по методу наименьших квадратов, к смещенным оценкам,обладающим, однако, меньшим рассеянием относительно оцениваемогопараметра, т. е. меньшим математическим ожиданием

квадрата отклонения оценки bj от параметра Р/ или М (bj— р/)^.

31.Причины появления мультиколлинеарности и в чем сказывается ее проявление в модели

Причины возникновения мультиколлинеарности:

Изучаемые факторные признаки, характеризуют одну и ту же сторону явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

Использование в качестве факторных признаков показателей, суммарное значение которых представляет собой постоянную величину;

Факторные признаки, являющиеся составными элементами друг друга;

Факторные признаки, по экономическому смыслу дублирующие друг друга.

Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 (rxi xj) и др.

Последствия мультиколлинеарности:

Оценки коэффициентов остаются несмещенными

Стандартные ошибки коэффициентов увеличиваются

Вычисленные t-статистики занижены.

Оценки становится очень чувствительными к изменению спецификации и изменению отдельных наблюдений.

Общее качество уравнения, а также оценки переменных, не связанных мультиколлинеарностью, остаются незатронутыми.

Чем ближе мультиколлинеарность к совершенной (строгой), тем серьезнее ее последствия.

32. Что такое гетерокедастичность регрессионных остатков и причины ее появления

Гетероскедастичность - нарушение условия постоянства дисперсии некоррелированных остатков, обычно связанное с их зависимостью от регрессоров.

Причины возникновения:

Гсо может возникать, если значение переменных, входящих в выборку значительно различаются между собой.

Гсо может возникать при исследовании данных временных рядов, если величины x и y со временем растут. Тогда и σ(ε) может расти тоже.

Последствия гетероскедастичности:

оценки параметров уравнения регрессии, полученные с помощью МНК, становятся неэффективными.

оценки стандартных ошибок коэф. уравнения будут неверными. Они вычислялись в предположении о постоянстве дисперсии ошибок. Если это не так, то их расчет по прежним формулам будет неточен. Скорее всего стандартные ошибки будут занижены, а t-стат-ка завышена. Поэтому можно сделать вывод о значимом отличии к-л коэф. от нуля, хотя на самом деле это не так.

33. Что такое автокорреляция регрессионных остатков и причины ее появления

Автокорреляция — это взаимосвязь последовательных элементов временного или пространственного ряда данных.

В эконометрических исследованиях часто возникают и такие ситуации, когда дисперсия остатков постоянная, но наблюдается их ковариация. Это явление называют автокорреляцией остатков.

Автокорреляция остатков чаще всего наблюдается тогда, когда эконометрическая модель строится на основе временных рядов. Если существует корреляция между последовательными значениями некоторой независимой переменной, то будет наблюдаться и корреляция последовательных значений остатков.

Среди основных причин автокорреляции можно выделить следующие:

а) ошибки спецификации – неучет в модели какой-то важной объясняющей переменной или неверный выбор вида функции, что ведет к систематическим отклонениям точек наблюдения от линии регрессии;

б) инерция – запаздывание реакции экономической системы на изменение факторов;

в) сглаживание данных;

г) наличие «скрытых» регрессоров, влияние которых в результате проявляется через случайный член.

Последствия автокорреляции в остатках такие же, как и в случае гетероскедастичности (потеря эффективности, смещение дисперсий оценок параметров, занижение стандартных ошибок и завышение t–статистик параметров), а это может повлечь признание незначимых факторов значимыми. Вследствие перечисленных обстоятельств прогнозные качества модели ухудшаются.

34. Методы выявления гетероскедастичности случайных остатков регрессионных моделей

1 способ: Если есть основание предполагать, что по мере увеличения значения x σ2(ε) будет расти (уменьшаться), то можно воспользоваться коэф. ранговой корреляции Спирмена для оценки значимости ранговой корреляционной связи между показателем x и абсолютными значениями остатков. Выдвигается гипотеза Н0 об отсутствии ГСО. Если коэф. ранговой корреляции Спирмена значимый, то Н0 отклоняется, если не значим, то принимается.

где t(α; n-2) – критическое значение t-статистики с уровнем значимости α и (n – 2) степенями свободы. Если |ρ| < Tкр ,то выборочный коэф. ранговой корреляции Спирмена является не значимым и гипотеза H0 принимается.  2 способ. Тест Голдфельда – Кванта: Чтобы проводить этот тест, необходимо предположить, что вел-на ε имеет нормальное распределение и автокорреляция отсутствует. Кроме того, предполагается, что остатки в i-ом наблюдении пропорциональны значению объясняющей переменной в этом же наблюдении. ШАГ 1. Выбирается число С так, чтобы (n-С)/2> m, где m- число оцениваемых в уравнении параметров. После чего С центральных (средних) наблюдений удаляется. Предварительно необходимо упорядочить наблюдения по мере возрастания объясняющей переменной. ШАГ 2. Разделить оставшиеся наблюдения на 2 группы: с малыми и большими наблюдениями X. И построить уравнение регрессии для каждой из этих групп. ШАГ 3. Рассчитать сумму квадратов остатков в каждом из уравнений S1 и S2.  Найти их отношение S2/S1. Оно должно иметь распределение Фишера с (n- 2m- C)/2 и (n-2m – C)/2 степенями свободы. По табличным значениям F-статистики находят F(α; (n-2m-C)/2; (n-2m-C)/2). Если S2/S10 принимается. В противном случае H0 отклоняется.

35. Построение точечного и интервального прогноза по линейным моделям регрессии: классической и обобщенной

Классическая:

Точечная

36.Характеристики точности построенного уравнения регрессии. Проверить значимость уравнения регрессии — значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Коэффициент детерминации, оказывает, какая часть (доля) вариации зависимойпеременной обусловлена вариацией объясняющей переменной. Чем ближе R2 к единице, тем выше качество модели. Если R2=0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных.

Для полученного уравнения регрессии определяется -статистика – характеристика точности уравнения регрессии, представляющая собой отношение той части дисперсии зависимой переменной которая объяснена уравнением регрессии к необъясненной (остаточной) части дисперсии. Уравнение для определения-статистики в случае многомерной регрессии имеет вид:, где: n – число наблюдений в выборке; р – число переменных в уравнении регрессии. Для выбранного уровня значимости по распределению Фишера определяется табличное значение Fтабл. Если Fн>Fтабл , то гипотеза о равенстве всех коэ-тов 0 отвергается. Если Fн<Fтабл , то уравнение регрессии статистически не значимо. Иными словами существует реальная вероятность того, что по выборке установлена не существующая в реальности связь между переменными.

Надежность получаемых оценок а и b зависит от ошибки ε. Нужно найти среднюю квадратическую ошибку :, где. Для значимого ур-я регрессии строятинтервальные оценки параметров:,.Замечание: если интервальные границы в разные по знаку, то такие уравнения в прогнозировании использовать нельзя, т.е. непонятно какое направление.

Ошибка прогноза - величина, характеризующая расхождение между фактическим и прогнозным значением показателя.

Также используются средние ошибки по модулю (абсолютные и относительные):

Если абсолютная и относительная ошибка больше 0, то это свидетельствует о "завышенной" прогнозной оценке, если - меньше 0, то прогноз был занижен.

На практике при проведении сравнительной оценки моделей могут использоваться такие характеристики качества как дисперсия (S2) или среднеквадратическая ошибка прогноза (S):

. Чем меньше значения этих характеристик, тем выше точность модели.

37.Что такое фиктивные переменные, и в каких задачах их используют. При анализе реальных социально-экономических явлений часто со временем под влиянием вновь появившихся условий, факторов и масштаба взаимосвязи между переменными меняются. В этом случае прибегают к построению моделей с переменной структурой. Если в ходе сбора стат.данных имеет место косвенное воздействие на них во времени или пространстве некоторых качественных факторов (сопутствующих перем.), то линейные модели с переменной структурой учитывают скачкообразные сдвиги в значениях коэффициентов регрессии. Для оценки коэф-в регрессии, на которые влияют сопутствующие перем., вводят фиктивные переменные. В качестве фиктивных переменных обычно используются дихотомические (бинарные, булевы) переменные, которые принимают всего два значения: «0» или «1». Фиктивные перем вводятся для учета качественных факторов в ур-нии регрессии. Напр: зависим-ть среднего заработка от пола, зав-ть между ценой и спросом на мороженое в зависимости от времени года, зав-ть темпа роста ВВП от эк-ких пок-лей для стран с различной формой правления.. Коэф-нт при фиктивной переменной показывает, на сколько отличаются константы. Если рассматриваемый качественный признак имеет k (градаций), то модель надо ввести k-1 фиктивных переменных.

38.Принципы организации фиктивных переменных в эконометрической модели.

В качестве фиктивных переменных обычно используются дихотомические (бинарные, булевы) переменные, которые принимают всего два значения: «0» или «1». Введение фиктивных переменных в модель никак не влияет на методы оценивания, формулы МНК и ОМНК остаются прежними. Фиктивные перем вводятся для учета качественных факторов в ур-нии регрессии. Если рассматриваемый качественный признак имеет k (градаций), то модель надо ввести k-1 фиктивных переменных. Включение в уравнение k фиктивных переменных приведет к строгой мультиколлинеарности, поэтому одну из градаций выбирают за эталон и не учитывают фиктивной переменной. Для фиктивных переменных также проверяется гипотеза о наличии или отсутствии влияния на результативный показатель. Пример:

39.Интерпретация коэффициентов регрессии при фиктивных переменных.

Фиктивные переменные сдвига и наклона. Коэф-нт при фиктивной переменной показывает, на сколько отличаются константы.

На первой части выборки регрессия имеет коэффициенты a и b. На второй части выборки они возрастают, соответственно, на величину коэффициентов при фиктивных переменных сдвига и наклона. Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории (женский пол) к другой (мужской пол) при неизменных значениях остальных параметров. На основе t-критерия Стьюдента делается вывод о значимости влияния фиктивной переменной, существенности расхождения между категориями. Оценки неизвестных коэффициентов моделей регрессии с переменной структурой рассчитываются с помощью классического метода наименьших квадратов. При введении фиктивных переменных надежность коэф-тов будет выше, чем коэф-тов, оцениваемых по подвыборке. Для фиктивных перем.также проверяется гипотеза о наличии или отсутствии влияния на результативный показатель.

40.Каким образом фиктивные переменные могут быть использованы для учета сезонности в эконометрической модели.

Фиктивные переменные часто используют для учета сезонного фактора. Если сезонность не учитывать в модели, то она вносит свой вклад в остаточную компоненту, в результате чего эффективность оценок коэф-тов регрессии снижается. Пример: для учета сезонности по квартальным данным вводят 3 фикт перем.(y-продажи, база - Iкв).

коэф-ты при фиктивных переменных окажутся статистически значимыми. Тогда ожидаемое значение Y по кварталам определяется следующими соотношениями:

  1. Что такое автокорреляционная функция. Для чего используется процедура Кохрейна-Оркатта

Автокорреляция  — статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом, например, для случайного процесса — со сдвигом по времени.

АКФ (автокорреляционная функция) показывает связь сигнала (функции ) с копией самого себя, смещённого на величину .

График автокорреляционной функции можно получить, отложив по оси ординат коэффициент корреляции двух функций (базовой и функции сдвинутой на величину ), а по оси абсцисс величину . Если исходная функция строго периодическая, то на графике автокорреляционной функции тоже будет строго периодическая функция. Таким образом, из этого графика можно судить о периодичности базовой функции, а следовательно, и о её частотных характеристиках. Автокорреляционная функция применяется для анализа сложных колебаний, например, электроэнцефалограммы человека.

Процедура Кохрейна-Оркатта используется для оценивания коэффициента автокорреляции «p».

  1. Что такое автокорреляционная функция и как ее анализировать

«Смотри вопрос 41». Анализ АКФ:

Анализ автокорреляционной функции и коррелограммы позволяет найти лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями временного ряда наиболее тесная. Анализ коэффициентов автокорреляции

Если максимальным оказался коэффициент автокорреляции первого порядка, временной ряд содержит только тенденцию (тренд). Если максимальным оказался коэффициент автокорреляции порядка n, ряд содержит циклические колебания с периодичностью в n моментов времени.

Если ни один из коэффициентов автокорреляции не является значимым (близок к 0), можно сказать, что либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит нелинейную тенденцию, для выявления которой проводят дополнительный анализ.

  1. Какие критерии могут быть использованы для проверки гипотезы о гомоскедастичности регрессионных остатков

Одной из предпосылок регрессионного анализа явл. предположение о постоянстве дисперсии случ. члена для всех наблюдений(гомоскедастичность) Это значит что для каждого значения объясняющей переменной случ. член имеют одинаковые дисперсии. Предложено масса тестов на проверку, например, такие как ранговый критерий Спирмена, тест Голдфелда-Кандта и тест Глейзера. 

  1. Классы нелинейных регрессионных моделей

Выделяют два класса:

Нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;

Примером нелинейной регрессии по включаемым в нее объясняющим переменным могут служить следующие функции:

полиномы разных степеней  –у = а +bх + с2 + ε,

                                у =а + bх +сх +dx3+ ε,

 

равносторонняя гипербола  

Нелинейные по оцениваемым параметрам.

К нелинейным регрессиям по оцениваемым параметрам относятся функции:

степенная — y = axbε

показательная – у = аbх ε

экспоненциальная – y=ea+bxε

  1. Подходы к оценке параметров нелинейных моделей

Для оценки параметров нелинейных моделей используется два подхода. Первый основан на линеаризации модели и заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными. Второй подход обычно применяется в случае, когда подобрать соответствующее линеаризующее преобразование не удается. В этом случае применяют методы нелинейной оптимизации на основе исходных переменных.