Задача 1. По территориям региона приводятся данные за 199Х год.
Требуется:
построить линейное уравнение парной регрессии y от x.
рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
оценить статистическую значимость параметров регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющем 107% от среднего уровня.
оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
на одном графике построить исходные данные и теоретическую прямую.
Решение:
№ региона |
Cреднедушевой прожиточный минимум в день на одного трудоспособного, тыс.руб., x |
Среднедневная заработная плата, тыс.руб.,y |
1 |
85 |
132 |
2 |
88 |
137 |
3 |
89 |
138 |
4 |
90 |
139 |
5 |
91 |
143 |
6 |
93 |
148 |
7 |
97 |
151 |
8 |
98 |
155 |
9 |
102 |
157 |
10 |
104 |
157 |
11 |
106 |
161 |
12 |
112 |
162 |
Для удобства дальнейших вычислений составим таблицу.
|
|
|
|
|
|
|
|
|
|
1 |
85 |
132 |
11220 |
7225 |
17424 |
137,5145 |
-5,5145 |
30,40971 |
4.18 |
2 |
88 |
137 |
12056 |
7744 |
18769 |
140,3996 |
-3,3996 |
11,55728 |
2.48 |
3 |
89 |
138 |
12282 |
7921 |
19044 |
141,3613 |
-3,3613 |
11,29834 |
2.44 |
4 |
90 |
139 |
12510 |
8100 |
19321 |
142,323 |
-3,323 |
11,04233 |
2.39 |
5 |
91 |
143 |
13013 |
8281 |
20449 |
143,2847 |
-0,2847 |
0,081054 |
0.2 |
6 |
93 |
148 |
13764 |
8649 |
21904 |
145,2081 |
2,7919 |
7,794706 |
1.89 |
7 |
97 |
151 |
14647 |
9409 |
22801 |
149,0549 |
1,9451 |
3,783414 |
1.29 |
8 |
98 |
155 |
15190 |
9604 |
24025 |
150,0166 |
4,9834 |
24,83428 |
3.22 |
9 |
102 |
157 |
16014 |
10404 |
24649 |
153,8634 |
3,1366 |
9,83826 |
1.998 |
10 |
104 |
157 |
16328 |
10816 |
24649 |
155,7868 |
1,2132 |
1,471854 |
0.77 |
11 |
106 |
161 |
17066 |
11236 |
25921 |
157,7102 |
3,2898 |
10,82278 |
2.04 |
12 |
112 |
162 |
18144 |
12544 |
26244 |
163,4804 |
-1,4804 |
2,191584 |
0.91 |
Сумма |
1155 |
1780 |
172234 |
111933 |
265200 |
1780,004 |
-0,0035 |
125,1256 |
23.808 |
Сред.знач |
96,25 |
148,3333 |
14352,83 |
9327,75 |
22100 |
148,3336 |
|
10,42713 |
1.984 |
|
7,9804 |
9,8606 |
|
|
|
|
|
|
|
|
63,6875 |
97,2321 |
|
|
|
|
|
|
|
Рассчитаем параметры линейного уравнения парной регрессии . Для этого воспользуемся следующими формулами:
Получили уравнение: . Т.е. с увеличением среднедневной заработной платы на …. , среднедушевой прожиточный минимум в день на одного трудоспособного увеличится на 962 руб.
Уравнение линейной регрессии всегда дополняется показателем тесноты связи -линейным коэффициентом корреляции:
В соответствии со шкалой Чеддока можем сказать, что коэффициента корреляции указывает на заметную линейную связь между признаками.
Коэффициент детерминации показывает, что уравнением регрессии объясняется 60,6% дисперсии результативного признака, а на долю прочих факторов приходиться 39,4%
Оценим качество уравнения регрессии в целом с помощью F-критерия Фишера.
Сосчитаем фактическое значение F-критерия:
Табличное значение
Т.к. , то признается статистическая значимость уравнения в целом.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем t-критерий Стьюдента и доверительные интервалы каждого из показателей. Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:
Фактические значения t-статистик:
Табличное значение t-критерия Стьюдента при и числе степеней свободы есть
Т.к. , то признаем статистическую зависимость параметров регрессии и показателя тесноты связи.
Рассчитаем доверительные интервалы для параметров регрессии a и b: и . Получим, что и
Средняя ошибка аппроксимации
говорит о хорошем качестве уравнения регрессии, т.е. свидетельствует о хорошем подборе модели к исходным данным.
Найдем прогнозное значение результативного фактора при значении признака-фактора, составляющем 107% от среднего уровня:
т.е. найдем среднедневную заработную плату, если среднедушевой прожиточный минимум в день одного трудоспособного составляет 102,99 руб.
Если среднедневная заработная плата составляет 154,815 руб., то среднедушевой прожиточный минимум в день на одного трудоспособного составит 102,99 руб.
Найдем доверительный интервал прогноза. Ошибка прогноза:
А доверительный интервал , где
,
Т.е. прогноз является статистически надежным.
Теперь на одно графике изобразим исходные данные и линию регрессии.
Задача №2. решить задачу №1, предположив, что связь между признаками носит нелинейный характер, и найдем параметры следующих нелинейных уравнений: , и