После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:

r(x₁, x₄) =

Аналогично рассчитаем коэффициенты парной корреляции между всеми остальными факторами и запишем их значения в виде матрицы:

Таблица 11.3

Матрица коэффициентов парной корреляции

	x₁	x₂	x₃	x₄	x₅	y
x₁	1	0,5662	0,8356	-0,4303	0,9094	-0,2587
x₂	0,5662	1	0,1355	0,4684	0,7996	0,5692
x₃	0,8356	0,1355	1	-0,6870	0,5900	-0,5848
x₄	-0,4303	0,4684	-0,6870	1	-0,1370	0,8955
x₅	0,9094	0,7996	0,5900	-0,1370	1	0,1019
y	-0,2587	0,5692	-0,5848	0,8955	0,1019	1

Легко убедиться, что определитель этой матрицы равен 0,00000332, то есть очень близок к нулю. Следовательно, мультиколлинеарность в данной системе факторов отсутствует. Проанализировав коэффициенты парной корреляции, можно увидеть, что наиболее тесная связь между фактором x₄и y. Следовательно, целесообразно построить уравнение парной линейной регрессии y = a₀+ a₁x₄.

Теперь рассмотрим, какие факторы можно включить в модель двухфакторной линейной множественной регрессии.

Коэффициенты парной корреляции между x₁ и x₅, а также между x₁и x₃превышают 0,8. Следовательно, эти факторы включать в модель не целесообразно. Также очень высок (близок к 0,8) коэффициент корреляции между факторами x₂ и x₅. К тому же коэффициент корреляции между фактором x₅ и y очень мал.

В целом, анализ матрицы коэффициентов парной корреляции показывает, что наиболее целесообразно включать в модель следующие пары факторов: x₂ и x₃, либо x₂ и x₄.

Принципиально можно было бы также включить в модель факторы x₃иx₄. Коэффициент корреляции между ними менее 0,7, а коэффициент корреляции между x₃и y около –0,6, то есть почти такого же порядка.

Теоретически можно также построить модель трехфакторной линейной множественной регрессии, включив в модель три фактора: x₂, x₃и x₄.

Итак, мы пришли к выводу, что целесообразно выполнить расчет параметров пяти различных уравнений регрессии:

1) y = a₀+ a₁x₄;

2) y = a₀+ a₁x₂+ a₂x₃;

3) y = a₀+ a₁x₂+ a₂x₄;

4) y = a₀+ a₁x₃+ a₂x₄;

5) y = a₀+ a₁x₂+ a₁x₃+ a₂x₄;

Для дальнейшего анализа необходимо рассчитать, пользуясь методом наименьших квадратов параметры каждого из этих уравнений, а затем сравнить их между собой по значениям ошибки аппроксимации и индекса детерминации. Чем меньше ошибка аппроксимации и чем ближе значение индекса детерминации к 1, тем лучше соответствующее уравнение описывает существующую статистическую зависимость, Существуют и другие, более сложные методы анализа построенных уравнений регрессии, но они более подробно изучаются в дисциплине «Эконометрика».

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 2728 / 3628 29 30 31 32 33 34 35 36 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
06.07.2019290.3 Кб7Имею право или обязан.doc
#
19.04.2015515.07 Кб55Исследование функции. Лекция на 18.03.15.doc
#
28.08.2019908.29 Кб6Итоговая программа на 30 марта2012 г..doc
#
03.09.2019107.7 Кб4караоке бар.docx
#
10.09.2019199.68 Кб4Коммерческое право1.doc
#
20.09.20191.71 Mб44Конспект лекций за 3й семестр.doc
#
09.11.20181.61 Mб5Контрольная работа 1 семестр.doc
#
17.09.2019229.15 Кб9КРИМИНАЛИСТИКА.docx
#
19.04.2015115.2 Кб29культурология тестирование.doc
#
19.04.2015146.36 Кб21Курс.docx
#
19.04.2015679.6 Кб8Курс.docx