- •Методика проведения анализа
- •Исходные данные для анализа
- •2В) Проверить распределение на нормальность можно путем расчета показателей асимметрии первого, второго и третьего порядков и показатель эксцесса.
- •2Е) Для оценки статистической надежности результатов используем f-критерий Фишера.
- •2Ж) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.
- •3) Равносторонняя гипербола:
- •5)Прогноз значения результативного признака при прогнозном значении факторного, составляющем 125% от его среднего уровня (т.Е. 125% от ).
3) Равносторонняя гипербола:
Уравнение равносторонней гиперболы имеет вид:
Данная функция нелинейна относительно переменной, но линейна по параметрам. Прежде, чем проводить анализ необходимо перейти от нелинейной формы к линейной. В нелинейных регрессиях относительно переменных процедура лианеризации (аноморфоза) производится путем замены переменных.
Сделаем замену:
Вновь полученное уравнение будет иметь вид:
Таблица 5. Расчетные величины, необходимые для определения параметров уравнения
№ |
X |
Y |
Z |
Z^2 |
Y^2 |
Z*Y |
28 |
10,12745 |
253,6498 |
0,098742 |
0,00975 |
64338,22 |
25,04577 |
29 |
16,61017 |
413,3492 |
0,060204 |
0,003625 |
170857,6 |
24,88531 |
30 |
20,32456 |
435,9925 |
0,049202 |
0,002421 |
190089,5 |
21,45151 |
31 |
11,48305 |
289,801 |
0,087085 |
0,007584 |
83984,62 |
25,23728 |
32 |
20,23 |
317,7906 |
0,049432 |
0,002443 |
100990,9 |
15,70888 |
36 |
13,49289 |
462,2961 |
0,074113 |
0,005493 |
213717,7 |
34,2622 |
39 |
21,69718 |
479,7696 |
0,046089 |
0,002124 |
230178,9 |
22,11207 |
40 |
16,20817 |
333,6026 |
0,061697 |
0,003807 |
111290,7 |
20,58237 |
42 |
20,94382 |
214,2828 |
0,047747 |
0,00228 |
45917,12 |
10,23131 |
43 |
15,40594 |
324,5566 |
0,06491 |
0,004213 |
105337 |
21,06698 |
44 |
11,60748 |
274,5077 |
0,086151 |
0,007422 |
75354,48 |
23,64921 |
45 |
11,52 |
239,3227 |
0,086806 |
0,007535 |
57275,35 |
20,77454 |
46 |
6,931818 |
116,4529 |
0,144262 |
0,020812 |
13561,28 |
16,79976 |
48 |
11,31373 |
296,1518 |
0,088388 |
0,007812 |
87705,89 |
26,17632 |
49 |
17,3209 |
290,4255 |
0,057734 |
0,003333 |
84346,97 |
16,76734 |
50 |
15,47904 |
246,5045 |
0,064603 |
0,004174 |
60764,47 |
15,92505 |
51 |
16,64017 |
179,5247 |
0,060096 |
0,003611 |
32229,12 |
10,78863 |
Итого |
257,33637 |
5167,981 |
1,22726 |
0,098439 |
1727940 |
351,4645 |
Ср.знач |
15,137433 |
303,9989 |
0,072192 |
0,005791 |
101643,5 |
20,67439 |
G |
4,1214866 |
96,06353 |
0,024059 |
|
|
|
Найдем среднее квадратическое отклонение по Z:
Для расчета параметров уравнения регрессии воспользуемся готовыми формулами:
Уравнение принимает вид:
Коэффициент эластичности рассчитывается по формуле:
В нашем случае
И формула коэффициента эластичности парной линейной регрессии принимает вид:
Валовая продукция растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,4995%.
Для нелинейной парной корреляции рассчитывается индекс корреляции:
Для расчета индекса корреляции выполним вспомогательные расчеты (таблица 8).
Таблица 8. Расчетные величины, необходимые для расчета индекса корреляции и определения показателей аппроксимации.
№ |
Х |
У |
|
|
|
|
|
|||
28 |
10,12745 |
253,6498 |
362,3321 |
2535,0278 |
11811,85 |
42,8474 |
0,000705 |
|||
29 |
16,61017 |
413,3492 |
277,6604 |
11957,497 |
18411,45 |
32,82668 |
0,000144 |
|||
30 |
20,32456 |
435,9925 |
253,4864 |
17422,321 |
33308,46 |
41,85991 |
0,000529 |
|||
31 |
11,48305 |
289,801 |
336,721 |
201,57923 |
2201,482 |
16,1904 |
0,000222 |
|||
32 |
20,23 |
317,7906 |
253,9917 |
190,21209 |
4070,294 |
20,07575 |
0,000518 |
|||
36 |
13,49289 |
462,2961 |
308,2203 |
25058,016 |
23739,35 |
33,32838 |
3,69E-06 |
|||
39 |
21,69718 |
479,7696 |
246,6476 |
30895,353 |
54345,85 |
48,5904 |
0,000681 |
|||
40 |
16,20817 |
333,6026 |
280,9412 |
876,38142 |
2773,228 |
15,78568 |
0,00011 |
|||
42 |
20,94382 |
214,2828 |
250,2901 |
8048,9714 |
1296,527 |
16,80364 |
0,000598 |
|||
43 |
15,40594 |
324,5566 |
288 |
422,62067 |
1336,387 |
11,26356 |
5,3E-05 |
|||
44 |
11,60748 |
274,5077 |
334,6699 |
869,72852 |
3619,486 |
21,91638 |
0,000195 |
|||
45 |
11,52 |
239,3227 |
336,1072 |
4183,0057 |
9367,249 |
40,44102 |
0,000214 |
|||
46 |
6,931818 |
116,4529 |
462,3471 |
35173,487 |
119642,8 |
297,025 |
0,005194 |
|||
48 |
11,31373 |
296,1518 |
339,5845 |
61,576351 |
1886,397 |
14,66568 |
0,000262 |
|||
49 |
17,3209 |
290,4255 |
272,2327 |
184,2361 |
330,9778 |
6,264187 |
0,000209 |
|||
50 |
15,47904 |
246,5045 |
287,3265 |
3305,6014 |
1666,433 |
16,56033 |
5,76E-05 |
|||
51 |
16,64017 |
179,5247 |
277,4219 |
15493,817 |
9583,866 |
54,53134 |
0,000146 |
|||
Итого |
257,3364 |
5167,981 |
5167,981 |
156879,43 |
299392,1 |
730,9757 |
0,009841 |
|||
Ср.знач |
15,13743 |
303,9989 |
|
|
|
42,99857 |
|
Индекс корреляции показывает, что между валовой продукцией и среднегодовым заработком, означает наличие сильной связи.
Коэффициент детерминации для нелинейных функций рассчитывается по формуле:
Следовательно, вариация валовой продукции на 100 га сельскохозяйственных угодий на 90,83% объясняется вариацией среднегодового заработка 1 работника сельскохозяйственного предприятия, а остальные 9,17% вариации валовой продукции растениеводства, приходящийся на 100 га сельскохозяйственных угодий обусловлены изменением других, не учтенных в модели факторов.
Оценим модель через среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации равна 42,9%, т.е. в среднем расчетные значения валовой продукции на 100 га сельскохозяйственных угодий, отличаются от фактических на 42,99%, что не входит в допустимый предел.
Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи.
Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.
Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.
Fтабл=4,54
Так как Fфакт>Fтабл , то при заданном уровне вероятности α=0,05 мы не принимаем нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
; ;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
;
tтабл при уровне значимости α=0,05 и числе степеней свободы , равном 15, равно 1,753.
Так как |tb| <tтабл и tr <tтабл , следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.
Взаимосвязь между t-статистикой и F-статистикой:
4). Построению показательной модели у=∙х предшествует процедура линеаризации переменных.
Данная функция нелинейна относительно параметров, но линейна по переменным. В нелинейных регрессиях относительно параметров процедура линеаризации производится путем логарифмирования обеих частей уравнения:
lg y = lg+lgх*
Введем обозначения:
P= lg y , А= lg ,L = lgх
Тогда уравнение запишется в виде:
У= A+ L∙.
Для нахождения параметров полученной линейной модели воспользуемся вспомогательными расчетами (табл. 3)
|
№ |
X |
Y |
L |
P |
L*P |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
28 |
10,13 |
254 |
1,006 |
2,404 |
2,417 |
1,011 |
5,7803 |
226,9 |
26,8 |
718,04 |
10,56 |
2,3557 |
0,0024 |
0,0245 |
0,0106 |
0,003 |
|||||||||||||||
29 |
16,61 |
413 |
1,22 |
2,616 |
3,193 |
1,489 |
6,8451 |
314,2 |
99,1 |
9830,2 |
23,99 |
2,4972 |
0,0142 |
0,0034 |
0,0015 |
0,0248 |
|||||||||||||||
30 |
20,32 |
436 |
1,308 |
2,639 |
3,452 |
1,711 |
6,9668 |
358,8 |
77,1 |
5951,1 |
17,69 |
2,5549 |
0,0072 |
0,0213 |
0,0092 |
0,0326 |
|||||||||||||||
31 |
11,48 |
290 |
1,06 |
2,462 |
2,61 |
1,124 |
6,0619 |
246,4 |
43,4 |
1882,5 |
14,97 |
2,3917 |
0,005 |
0,0104 |
0,0045 |
1E-05 |
|||||||||||||||
32 |
20,23 |
318 |
1,306 |
2,502 |
3,268 |
1,706 |
6,2607 |
357,7 |
-40 |
1596,7 |
12,57 |
2,5536 |
0,0026 |
0,0207 |
0,009 |
0,0019 |
|||||||||||||||
36 |
13,49 |
462 |
1,13 |
2,665 |
3,012 |
1,277 |
7,1018 |
274 |
188 |
35448 |
40,73 |
2,4378 |
0,0516 |
0,001 |
0,0004 |
0,0425 |
|||||||||||||||
39 |
21,7 |
480 |
1,336 |
2,681 |
3,583 |
1,786 |
7,1879 |
374,6 |
105 |
11055 |
21,92 |
2,5736 |
0,0115 |
0,0304 |
0,0132 |
0,0494 |
|||||||||||||||
40 |
16,21 |
334 |
1,21 |
2,523 |
3,052 |
1,463 |
6,3667 |
309,2 |
24,4 |
596,72 |
7,322 |
2,4902 |
0,0011 |
0,0023 |
0,001 |
0,0041 |
|||||||||||||||
42 |
20,94 |
214 |
1,321 |
2,331 |
3,079 |
1,745 |
5,4335 |
366 |
-152 |
23021 |
70,81 |
2,5635 |
0,0541 |
0,0253 |
0,011 |
0,0163 |
|||||||||||||||
43 |
15,41 |
325 |
1,188 |
2,511 |
2,983 |
1,411 |
6,3066 |
299 |
25,5 |
652,48 |
7,87 |
2,4757 |
0,0013 |
0,0007 |
0,0003 |
0,0028 |
|||||||||||||||
44 |
11,61 |
275 |
1,065 |
2,439 |
2,596 |
1,134 |
5,9465 |
248,2 |
26,3 |
693,8 |
9,595 |
2,3947 |
0,0019 |
0,0095 |
0,0041 |
0,0004 |
|||||||||||||||
45 |
11,52 |
239 |
1,061 |
2,379 |
2,525 |
1,127 |
5,6596 |
246,9 |
-7,61 |
57,942 |
3,181 |
2,3926 |
0,0002 |
0,0101 |
0,0044 |
0,0064 |
|||||||||||||||
46 |
6,932 |
116 |
0,841 |
2,066 |
1,737 |
0,707 |
4,269 |
176,7 |
-60,3 |
3635 |
51,77 |
2,2473 |
0,0328 |
0,1032 |
0,0447 |
0,1542 |
|||||||||||||||
48 |
11,31 |
296 |
1,054 |
2,472 |
2,604 |
1,11 |
6,1084 |
244 |
52,1 |
2718,3 |
17,6 |
2,3874 |
0,0071 |
0,0118 |
0,0051 |
0,0002 |
|||||||||||||||
49 |
17,32 |
290 |
1,239 |
2,463 |
3,051 |
1,534 |
6,0665 |
323 |
-32,6 |
1060,4 |
11,21 |
2,5092 |
0,0021 |
0,0059 |
0,0025 |
2E-05 |
|||||||||||||||
50 |
15,48 |
247 |
1,19 |
2,392 |
2,846 |
1,415 |
5,7208 |
299,9 |
-53,4 |
2856 |
21,68 |
2,477 |
0,0073 |
0,0008 |
0,0003 |
0,0045 |
|||||||||||||||
51 |
16,64 |
180 |
1,221 |
2,254 |
2,753 |
1,491 |
5,0811 |
314,6 |
-135 |
18239 |
75,23 |
2,4977 |
0,0593 |
0,0035 |
0,0015 |
0,0419 |
|||||||||||||||
Итого |
257,3 |
5168 |
19,76 |
41,8 |
48,76 |
23,24 |
103,16 |
4980 |
|
120013 |
418,7 |
41,8 |
0,2616 |
0,2846 |
0,1234 |
0,385 |
|||||||||||||||
Ср.знач |
15,14 |
304 |
1,162 |
2,459 |
2,868 |
1,367 |
6,0684 |
293 |
|
7059,6 |
24,63 |
|
|
|
|
|
|||||||||||||||
Σ |
4,121 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
σ2 |
16,986 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
Построим линейное уравнение парной регрессии У по х. используя данные таблицы 2, имеем:
=2,459-0,6584*1,162=1,6938
Получим линейное уравнение регрессии:
Ŷ= 1,6938+0,6584∙х.
Тесноту полученной линейной модели характеризует линейный коэффициент парной корреляции:
Коэффициент детерминации при этом равен:
R2=r2хУ=0,3203
Это означает, что чуть более 30% вариации фактора Y объясняется вариацией фактора x.
Средняя ошибка линейной аппроксимации составляет:
= ∙100% = %.
В среднем по полученной линейной модели расчетные значения отклоняются от фактических на 24,62%, что не входит в допустимый предел.
Проведя потенцирование уравнения (4), получим искомую нелинейную (показательную) модель.
49,41∙х0,6583
ρxy= = .=
Найдем коэффициент детерминации
R2= ρ2xy·100%=0,5662=0,3203
Полученное значение коэффициента детерминации говорит о том, что 32,03% вариации выход валовой продукции объясняется вариацией фактора х – среднегодового заработка.
Рассчитаем фактическое значение F-критерия при заданном уровне значимости =0,05:
Fфакт = = · (n-2)= =7,070378
Сравнивая табличное Fтабл=4,54 и фактическое Fфакт=7,07 значение отмечаем , что Fфакт.> Fтабл.,
Это означает, что при заданном уровне вероятности =0,05 мы не принимаем нулевую гипотезу о статистической незначимости параметров уравнения регрессии (5).