Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций за 3й семестр.doc
Скачиваний:
44
Добавлен:
20.09.2019
Размер:
1.71 Mб
Скачать

После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:

r(x1 , x4) =

Аналогично рассчитаем коэффициенты парной корреляции между всеми остальными факторами и запишем их значения в виде матрицы:

Таблица 11.3

Матрица коэффициентов парной корреляции

x1

x2

x3

x4

x5

y

x1

1

0,5662

0,8356

-0,4303

0,9094

-0,2587

x2

0,5662

1

0,1355

0,4684

0,7996

0,5692

x3

0,8356

0,1355

1

-0,6870

0,5900

-0,5848

x4

-0,4303

0,4684

-0,6870

1

-0,1370

0,8955

x5

0,9094

0,7996

0,5900

-0,1370

1

0,1019

y

-0,2587

0,5692

-0,5848

0,8955

0,1019

 1

Легко убедиться, что определитель этой матрицы равен 0,00000332, то есть очень близок к нулю. Следовательно, мультиколлинеарность в данной системе факторов отсутствует. Проанализировав коэффициенты парной корреляции, можно увидеть, что наиболее тесная связь между фактором x4 и y. Следовательно, целесообразно построить уравнение парной линейной регрессии y = a0 + a1 x4.

Теперь рассмотрим, какие факторы можно включить в модель двухфакторной линейной множественной регрессии.

Коэффициенты парной корреляции между x1 и x5, а также между x1 и x3 превышают 0,8. Следовательно, эти факторы включать в модель не целесообразно. Также очень высок (близок к 0,8) коэффициент корреляции между факторами x2 и x5. К тому же коэффициент корреляции между фактором x5 и y очень мал.

В целом, анализ матрицы коэффициентов парной корреляции показывает, что наиболее целесообразно включать в модель следующие пары факторов: x2 и x3 , либо x2 и x4.

Принципиально можно было бы также включить в модель факторы x3 и x4. Коэффициент корреляции между ними менее 0,7, а коэффициент корреляции между x3 и y около –0,6, то есть почти такого же порядка.

Теоретически можно также построить модель трехфакторной линейной множественной регрессии, включив в модель три фактора: x2 , x3 и x4.

Итак, мы пришли к выводу, что целесообразно выполнить расчет параметров пяти различных уравнений регрессии:

1) y = a0 + a1 x4;

2) y = a0 + a1 x2+ a2 x3;

3) y = a0 + a1 x2+ a2 x4;

4) y = a0 + a1 x3+ a2 x4;

5) y = a0 + a1 x2 + a1 x3+ a2 x4;

Для дальнейшего анализа необходимо рассчитать, пользуясь методом наименьших квадратов параметры каждого из этих уравнений, а затем сравнить их между собой по значениям ошибки аппроксимации и индекса детерминации. Чем меньше ошибка аппроксимации и чем ближе значение индекса детерминации к 1, тем лучше соответствующее уравнение описывает существующую статистическую зависимость, Существуют и другие, более сложные методы анализа построенных уравнений регрессии, но они более подробно изучаются в дисциплине «Эконометрика».