Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Регрессионный анализ.doc
Скачиваний:
20
Добавлен:
27.11.2018
Размер:
1.41 Mб
Скачать

Выбор формы уравнения регрессии

Форма уравнения регрессии выбирается из числа рассмотренных регрессионных зависимостей, для этого выполняют следующие операции:

1) Для каждой зависимости определяют:

  • Неизвестные параметры (ak, bk, ) и их значимость;

  • Корреляционное отношение (для линейной зависимости коэффициент корреляции r) и значимость или ;

  • Значимость уравнения в целом;

  • Критерий автокорреляции DW;

  • Точность аппроксимации .

2) Из зависимостей выбирают такие, у которых автокорреляция остатков отсутствует, т.е. d2 DW< 4-d2 ,все параметры значимы, значим или , уравнение в целом значимо.

3) Из числа выбранных зависимостей выбирается зависимость, имеющая наибольшее значение корреляционного отношения (r – для линейной зависимости). Если таких зависимостей несколько, то предпочтение отдается той, у которой коэффициент меньше, при этом линейной зависимости независимо от величин отдается предпочтение.

Множественная регрессия

В множественной регрессии в отличие от парной на зависимую случайную переменную (результирующий показатель) воздействуют одновременно n (n>1) независимых факторов x1, x2, .. , xn. Уравнение множественной регрессии записывается в виде: .

Коэффициент корреляции зависимости между результирующим показателем y и каждым j – м () фактором xj должен быть отличен от нуля: .

При проверке по нулевой гипотезе, которая утверждает, что в генеральной совокупности связи между y и xj нет , хотя по выборке корреляционная связь имеется, нулевая гипотеза не должна подтверждаться при P = 0,9.

Факторы x1, x2, .. , xn должны быть попарно независимыми: . При проверке значимости коэффициентов корреляции зависимости между xk и xj по нулевой гипотезе, она должна подтверждаться () при P = 0,9.

В отличие от парной регрессии в множественной отдельно рассматриваются только два вида зависимостей: линейная и нелинейная.

Они отличаются только алгоритмами построения уравнений регрессии. Общим для них является способ выбора из заданного множества факторов, попарно независимых.

Пусть на результирующий показатель y воздействуют факторы х12 3, х4 . Для каждой пары факторов определяются коэффициенты корреляции, которые примем равными: r1,2 = 0,85; r1,3 = 0,22; r1,4 = 0,64; r2,3 = 0,75; r2,4 = 0,08; r3,4 = 0,45.

В результате проверки значений rk,j по нулевой гипотезе получим 1,3 = 2,4 = 0, а остальные k,j  0.

Отсюда следует, что попарно независимыми являются следующие пары факторов: х13 и х2, х4 .

Таким образом, в рассматриваемом случае в качестве независимых факторов могут быть взяты либо х13 , либо х2, х4 . Какой группе факторов отдать предпочтение, зависит от величины совокупного воздействия каждой из них на результирующий показатель y. Берется та пара, у которой коэффициент корреляции совокупного воздействия R на y больше.

В случае, когда число независимых факторов равно n D – определитель вида

,

- определитель D без первой строки и первого столбца:

.

Предположим, что в рассматриваемом примере

Тогда для пары x1 , x3 имеем

.

Для пары x2 , x4, выполняя аналогичные действия, находим .

Так как для пары x1, x3 Rx1x3 больше, чем для пары x2,x4 , то в качестве независимых факторов предпочтительнее взять x1 и x3.