Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР5.doc
Скачиваний:
23
Добавлен:
05.11.2018
Размер:
733.7 Кб
Скачать

2.7 Анализ остатков

Подбор модели методом наименьших квадратов, построение интервалов прогноза и про­верка гипотез не завершают изучение регрессии. В большинстве случаев вовсе не очевидно, что некоторая ча­стная модель является подходящей.

Выводы могут оказаться ошибочными, если сделанные для выбранной модели предположения не подтверждаются данными. Важно тщательно проверить данные с целью учета возможных нарушений любых сделанных предположений:

  1. Связь между переменными является линейной.

  2. Ошибки являются независимыми.

  3. Дисперсии ошибок равны.

  4. Значения ошибки нормально распределены.

Информация о вариации, которая не может быть объяснена функцией регрессии, содержится в остатках. Для того чтобы проверить соответствие предполагаемой модели, можно рассмотреть остатки, различными способами располагая соответствующие точки на координатной плоскости.

  1. Построить гистограмму значений остатков.

  2. Расположить остатки по значениям оцениваемых величин.

  3. Расположить остатки по значениям объясняющих переменных.

  4. Расположить остатки по времени их появления, если исходные данные хронологически упорядочены.

Построение гистограммы остатков позволяет проверить предположение об их нормальном распределении. Как правило, небольшие отклонения от кривой наилучшего приближения не противоречат заключениям, полученным с помощью тестов или интервалов прогноза, основанных на t-распределении. Нарушение условия нормальности обычно не так серьезно, как нарушение любого из других предположений.

Если расположение соответствующих остаткам точек по оцениваемым значениям указывает, что общий вид взаимосвязи между Y и Х характеризуется не прямой линией, а некоторой кривой, то можно применить подходящее случаю преобразование данных, позволяющее уменьшить нелинейность и получить приблизительно линейную зависимость между этими величинами. Преобразование может также помочь стабилизировать дисперсию.

На рис. 1 представлен график остатков, указывающий на увеличение их разброса с возрастанием значений оцениваемой величины. Отсюда следует, что в данном случае условие неизменности дисперсии остатков не выполняется. В подобной ситуации проведение анализа логарифма значений Y по отношению к X может дать вариацию остатков, в большей сте­пени согласующуюся с требованием постоянства дисперсии.

Рис. 1. График остатков, демонстрирующий возрастающий разброс их значений

Предположение о независимости значений остатков наиболее критично. Наличие некоторой зависимости в значениях остатков способно чрезмерно искажать заключения, получаемые из анализа t-критерия. Нарушения условия независимости весьма вероятны в случае временных рядов.

Для остатков временных рядов, т.е. остатков, полученных при использовании регрессионных методов для данных, упорядоченных по времени, независимость может быть проверена посредством представления этих остатков на графике по времени их появления. На таком графике не должно быть систематически повторяющихся структур — например, регулярное появление серии малых значений после серии больших значений.

Кроме того, независимость значений остатков можно проверить, вычислив для них выборочную автокорреляцию.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]