- •К лабораторной работе № 7
- •Севастополь
- •1 Цель работы
- •2 Теоретические сведения
- •2.1 Данные временных рядов и проблема автокорреляции
- •2.2 Тест Дарбина-Уотсона для серийной корреляции
- •2.3 Решение проблемы автокорреляции
- •2.4 Модели авторегрессии
- •2.5 Данные временных рядов и проблема гетероскедастичности
- •2.6 Использование регрессии для прогноза сезонных данных
- •3 Практическая часть
- •3.1 Постановка задачи
- •3.2 Пример использования Minitab for Windows для построения регрессионной модели прогнозирования сезонных данных
- •3.3 Пример использования Minitab for Windows для построения модели авторегрессии
- •4 Порядок выполнения работы
- •5 Контрольные вопросы
- •Библиографический список
2.2 Тест Дарбина-Уотсона для серийной корреляции
Один из подходов, часто используемых для выявления наличия серийной корреляции, состоит в применении критерия Дарбина-Уотсона. Этот критерий определяет, можно ли считать равным нулю параметр , присутствующий в уравнении:
Необходимо выбрать одну из двух гипотез:
Если регрессионная модель не свободна от автокорреляции, остатки будут автокоррелирующими. Поэтому в критерии Дарбина-Уотсона выводы строятся на основании величин остатков, полученных при регрессионном анализе.
Статистика Дарбина-Уотсона определяется следующим равенством:
где - остаток для периода времени t;
- остаток для периода времени t-1.
При положительной серийной автокорреляции последовательные серийные остатки имеют тенденцию быть близкими по величине и сумма квадратов разностей в числителе статистики Дарбина-Уотсона будет сравнительно мала. Наличие малых значений у статистики Дарбина-Уотсона указывает на положительную серийную корреляцию.
Коэффициент автокорреляции можно также оценить с помощью величины автокорреляции остатков с запаздыванием, равным 1 – r1(e). С помощью несложных преобразований можно показать, что значение статистики Дарбина-Уотсона связано с величиной r1(e). Для средних и больших выборок
DW= 2(1 – r1(e))
Поскольку -1 < r1(e) < 1, то 0 < DW< 4. Для r1(e), близкого к нулю, статистика DW будет близка к 2. Положительная автокорреляция с запаздыванием 1 связана со значениями DW, меньшими 2, а отрицательная автокорреляция с запаздыванием 1 связана со значениями DW, большими 2.
Полезный (но не всегда определяющий) критерий серийной корреляции основан на сравнении вычисленного значения статистики Дарбина-Уотсона с нижней (L) и верхней (U) границами. Выводы делаются на основании следующих правил.
1 Если значение статистики Дарбина-Уотсона больше верхней границы (U), коэффициент автокорреляции равен нулю (нет положительной автокорреляции).
2 Если значение статистики Дарбина-Уотсона меньше нижней границы (L), коэффициент автокорреляции больше нуля (есть положительная автокорреляция).
3 Если значение статистики Дарбина-Уотсона находится между нижней и верхней границами, критерий не дает ответа (неизвестно, имеет ли место положительная автокорреляция).
Значения границ L и U приведены в специальных таблицах. Чтобы найти необходимые значения L и U, требуется знать размер выборки, уровень значимости и количество независимых переменных.
Как следует из уравнения, можно делать выводы о знаке и величине коэффициента автокорреляции остатков с запаздыванием 1 по значению статистики Дарбина-Уотсона и наоборот. Так, для ситуации, в которой критерий DW не дает ответа, значимость серийной корреляции может быть исследована через сравнение r1(e) с величиной . Если r1(e) попадает в интервал , правомочно сделать вывод о том, что автокорреляция мала и может не учитываться.
2.3 Решение проблемы автокорреляции
Если в данных временных рядов обнаружена автокорреляция, ее необходимо нейтрализовать или как-то учесть, прежде чем полученную функцию регрессии можно будет использовать для прогноза. Выбор подходящего метода обработки данных при наличии серийной корреляции зависит от того, что является ее первопричиной. Автокорреляция может появиться из-за некоторой систематической ошибки - например, пропущенной переменной. В других случаях коррелируют слагаемые ошибок в корректно определенной во всех остальных отношениях модели.
Решение проблемы серийной автокорреляции начинается с оценки модели регрессии. Подходит ли ее функциональная форма? Не пропущена ли важная независимая переменная? Имеются ли какие-то повторяющиеся явления, которые накладывают свой отпечаток на значения данных во времени и вызывают эффект автокорреляции ошибок?
Поскольку основной причиной автокорреляции ошибок в регрессионной модели является пропуск одной или нескольких важных переменных, наилучший подход к решению проблемы - найти их. В некоторых случаях подобные действия называют процедурой улучшения спецификации модели. Спецификация модели включает не только выбор необходимых независимых переменных, но и введение этих переменных в функцию регрессии должным образом. К сожалению, модель может быть улучшена не всегда - пропущенные переменные могут не поддаваться количественному определению или же данные по ним могут быть просто недоступны. Тем не менее, когда это возможно, спецификация модели обязательно должна быть согласована с теоретическим смыслом и интуитивным пониманием величин данных.
Один из методов устранения влияния автокорреляции - добавление в функцию регрессии пропущенной переменной, объясняющей связь значений зависимой переменной в разные периоды времени.
При другом методе устранения этого влияния используется общее понятие дифференциации. В данном случае регрессионная модель определяется в терминах изменений величин. Например, использование в регрессии выраженного в процентах изменения зависимой переменной вместе с выраженными в процентах изменениями независимых переменных. Наконец, вместо простых или первых разностей для устранения влияния автокорреляции в модели регрессии может потребоваться использовать обобщенные разности.
Для того чтобы устранить серийную корреляцию для сильно автокоррелирующих данных, можно использовать разности их значений. Так, вместо записи уравнения регрессии относительно переменных Y и Х данное уравнение может быть записано для разностей. Разности следует использовать, когда значение статистики Дарбина-Уотсона, вычисленное для начальных переменных, близко к нулю.
Тогда используется следующая модель
где штрих обозначает обобщенные разности:
Преобразованное уравнение включает ошибки , которые представляют собой независимые случайные величины с нулевым математическим ожиданием и постоянной дисперсией. Следовательно, к данной регрессионной модели можно применять обычные методы регрессии.
Если корреляция между последовательными ошибками велика ( близко к 1), то обобщенные разности, по существу, равны простым или первым разностям:
и свободный член в модели близок к нулю (пропадает).
Использование регрессионных моделей, построенных для обобщенных разностей, часто позволяет устранить серийную корреляцию. Если серийная корреляция особенно велика, целесообразно использовать обычные разности.