Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Уравнение парной регрессии

..rtf
Скачиваний:
23
Добавлен:
18.04.2015
Размер:
176.51 Кб
Скачать

Уравнение парной регрессии.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение регрессии имеет вид y = bx + a + ε

Система нормальных уравнений.

a•n + b∑x = ∑y

a∑x + b∑x2 = ∑y•x

Для наших данных система уравнений имеет вид

12a + 1042 b = 1709

1042 a + 91556 b = 149367

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 0.9, a = 64.21

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 0.9 x + 64.21

Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

Для расчета параметров линейной регрессии построим расчетную таблицу (табл. 1)

x

y

x2

y2

x • y

83

137

6889

18769

11371

88

142

7744

20164

12496

75

128

5625

16384

9600

89

140

7921

19600

12460

85

133

7225

17689

11305

79

153

6241

23409

12087

81

142

6561

20164

11502

97

154

9409

23716

14938

79

132

6241

17424

10428

90

150

8100

22500

13500

84

132

7056

17424

11088

112

166

12544

27556

18592

1042

1709

91556

244799

149367

1. Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

1.1. Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

1.2. Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 0.9 x + 64.21

1.3. Коэффициент эластичности.

Коэффициент эластичности находится по формуле:

1.4. Ошибка аппроксимации.

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

1.5. Эмпирическое корреляционное отношение.

Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

где

Индекс корреляции.

Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.79.

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

1.6. Коэффициент детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= 0.792 = 0.62

Для оценки качества параметров линейной регрессии построим расчетную таблицу (табл. 2)

x

y

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y - yx|:y

83

137

138.96

29.34

3.86

14.69

0.0143

88

142

143.47

0.17

2.15

1.36

0.0103

75

128

131.76

207.84

14.13

140.03

0.0294

89

140

144.37

5.84

19.08

4.69

0.0312

85

133

140.77

88.67

60.3

3.36

0.0584

79

153

135.36

112.01

311.12

61.36

0.12

81

142

137.16

0.17

23.4

34.03

0.0341

97

154

151.57

134.17

5.89

103.36

0.0158

79

132

135.36

108.51

11.3

61.36

0.0255

90

150

145.27

57.51

22.38

10.03

0.0315

84

132

139.86

108.51

61.85

8.03

0.0596

112

166

165.08

556.17

0.84

633.36

0.00552

1042

1709

1709

1408.92

536.31

1075.67

0.43

2. Оценка параметров уравнения регрессии.

2.1. Значимость коэффициента корреляции.

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=10 находим tкрит:

tкрит (n-m-1;α/2) = (10;0.025) = 2.228

где m = 1 - количество объясняющих переменных.

2.2. Интервальная оценка для коэффициента корреляции (доверительный интервал).

r(0.54;1.03)

2.3. Анализ точности определения оценок коэффициентов регрессии.

Несмещенной оценкой дисперсии возмущений является величина:

S2y = 53.63 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

Sy = 7.32 - стандартная ошибка оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a.

Sb - стандартное отклонение случайной величины b.

2.4. Доверительные интервалы для зависимой переменной.

(a + bxp ± ε)

где

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 107

Индивидуальные доверительные интервалы для Y при данном значении X.

(a + bxi ± ε)

где

tкрит (n-m-1;α/2) = (10;0.025) = 2.228

2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.

1) t-статистика. Критерий Стьюдента.

tкрит (n-m-1;α/2) = (10;0.025) = 2.228

Доверительный интервал для коэффициентов уравнения регрессии.

(b - tкрит Sb; b + tкрит Sb)

(a - tкрит Sa; a + tкрит Sa)

2) F-статистика. Критерий Фишера.

Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл = 4.96