katya_uravnenie_lineynoy_regressii
.rtf
Уравнение парной регрессии.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X («Осведомлённость») и Y («Аналогия») носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
34a + 311 b = 225
311 a + 2871.5 b = 2086.5
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 1.06, a = -3.09
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 1.06 x - 3.09
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
1. Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
1.1. Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
1.2. Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 1.06 x -3.09
1.3. Коэффициент эластичности.
Коэффициент эластичности находится по формуле:
1.4. Ошибка аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
1.5. Эмпирическое корреляционное отношение.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
Индекс корреляции.
Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.3741.
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
1.6. Коэффициент детерминации.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= 0.37412 = 0.1399
Для расчета параметров линейной регрессии построим расчетную таблицу (табл.)
x |
y |
x 2 |
y 2 |
x • y |
y(x) |
(yi-ycp) 2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
9.5 |
7 |
90.25 |
49 |
66.5 |
6.99 |
0.15 |
5.9E-05 |
0.12 |
0.001099 |
9.5 |
7 |
90.25 |
49 |
66.5 |
6.99 |
0.15 |
5.9E-05 |
0.12 |
0.001099 |
9.5 |
4 |
90.25 |
16 |
38 |
6.99 |
6.85 |
8.95 |
0.12 |
0.75 |
8 |
2 |
64 |
4 |
16 |
5.4 |
21.32 |
11.56 |
1.32 |
1.7 |
10 |
10 |
100 |
100 |
100 |
7.52 |
11.44 |
6.14 |
0.73 |
0.25 |
7 |
5 |
49 |
25 |
35 |
4.34 |
2.62 |
0.44 |
4.61 |
0.13 |
10 |
7 |
100 |
49 |
70 |
7.52 |
0.15 |
0.27 |
0.73 |
0.0747 |
10 |
4 |
100 |
16 |
40 |
7.52 |
6.85 |
12.41 |
0.73 |
0.88 |
8.5 |
7 |
72.25 |
49 |
59.5 |
5.93 |
0.15 |
1.14 |
0.42 |
0.15 |
9.5 |
10 |
90.25 |
100 |
95 |
6.99 |
11.44 |
9.05 |
0.12 |
0.3 |
9 |
10 |
81 |
100 |
90 |
6.46 |
11.44 |
12.52 |
0.0216 |
0.35 |
9 |
9 |
81 |
81 |
81 |
6.46 |
5.68 |
6.44 |
0.0216 |
0.28 |
9.5 |
9.5 |
90.25 |
90.25 |
90.25 |
6.99 |
8.31 |
6.29 |
0.12 |
0.26 |
10 |
5 |
100 |
25 |
50 |
7.52 |
2.62 |
6.37 |
0.73 |
0.5 |
10 |
6 |
100 |
36 |
60 |
7.52 |
0.38 |
2.32 |
0.73 |
0.25 |
7 |
4 |
49 |
16 |
28 |
4.34 |
6.85 |
0.11 |
4.61 |
0.0846 |
10 |
9 |
100 |
81 |
90 |
7.52 |
5.68 |
2.18 |
0.73 |
0.16 |
8.5 |
2 |
72.25 |
4 |
17 |
5.93 |
21.32 |
15.45 |
0.42 |
1.97 |
9 |
5 |
81 |
25 |
45 |
6.46 |
2.62 |
2.14 |
0.0216 |
0.29 |
8.5 |
6 |
72.25 |
36 |
51 |
5.93 |
0.38 |
0.004793 |
0.42 |
0.0115 |
9.5 |
7 |
90.25 |
49 |
66.5 |
6.99 |
0.15 |
5.9E-05 |
0.12 |
0.001099 |
9.5 |
7 |
90.25 |
49 |
66.5 |
6.99 |
0.15 |
5.9E-05 |
0.12 |
0.001099 |
9.5 |
4 |
90.25 |
16 |
38 |
6.99 |
6.85 |
8.95 |
0.12 |
0.75 |
8 |
2 |
64 |
4 |
16 |
5.4 |
21.32 |
11.56 |
1.32 |
1.7 |
10 |
10 |
100 |
100 |
100 |
7.52 |
11.44 |
6.14 |
0.73 |
0.25 |
7 |
5 |
49 |
25 |
35 |
4.34 |
2.62 |
0.44 |
4.61 |
0.13 |
10 |
7 |
100 |
49 |
70 |
7.52 |
0.15 |
0.27 |
0.73 |
0.0747 |
10 |
4 |
100 |
16 |
40 |
7.52 |
6.85 |
12.41 |
0.73 |
0.88 |
8.5 |
7 |
72.25 |
49 |
59.5 |
5.93 |
0.15 |
1.14 |
0.42 |
0.15 |
9.5 |
10 |
90.25 |
100 |
95 |
6.99 |
11.44 |
9.05 |
0.12 |
0.3 |
9 |
10 |
81 |
100 |
90 |
6.46 |
11.44 |
12.52 |
0.0216 |
0.35 |
9 |
9 |
81 |
81 |
81 |
6.46 |
5.68 |
6.44 |
0.0216 |
0.28 |
9.5 |
9.5 |
90.25 |
90.25 |
90.25 |
6.99 |
8.31 |
6.29 |
0.12 |
0.26 |
10 |
5 |
100 |
25 |
50 |
7.52 |
2.62 |
6.37 |
0.73 |
0.5 |
311 |
225 |
2871.5 |
1704.5 |
2086.5 |
225 |
215.53 |
185.37 |
26.76 |
14.06 |
2. Оценка параметров уравнения регрессии.
2.1. Значимость коэффициента корреляции.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=32 находим tкрит:
tкрит (n-m-1;α/2) = (32;0.025) = 2.021
где m = 1 - количество объясняющих переменных.
2.2. Интервальная оценка для коэффициента корреляции (доверительный интервал).
r(0.076;0.6722)
2.3. Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2y = 5.79 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
Sy = 2.41 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
2.4. Доверительные интервалы для зависимой переменной.
(a + bxp ± ε)
где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 10