Решение
-
Построить поле рассеяния и на основе его визуального анализа выдвинуть гипотезу о виде зависимости заработной платы от прожиточного минимума; записать эту гипотезу в виде математической модели.
Гипотеза: существует линейная зависимость между среднемесячной заработной платой (Х) и прожиточным минимумом (У).
Модель: Y=aX+b+e
-
Вычислить коэффициент корреляции между заработной платой и прожиточным минимумом; проверить значимость корреляции между ними с вероятностью 0,9.
№ |
xi |
yi |
xi^2 |
yi^2 |
xi*yi |
1 |
1,964 |
4,130 |
3,857 |
17,057 |
8,111 |
2 |
1,944 |
3,144 |
3,779 |
9,885 |
6,112 |
3 |
1,967 |
3,875 |
3,869 |
15,016 |
7,622 |
4 |
2,069 |
3,374 |
4,281 |
11,384 |
6,981 |
5 |
2,302 |
3,119 |
5,299 |
9,728 |
7,180 |
6 |
2,191 |
4,009 |
4,800 |
16,072 |
8,784 |
7 |
2,125 |
3,701 |
4,516 |
13,697 |
7,865 |
8 |
2,144 |
3,336 |
4,597 |
11,129 |
7,152 |
9 |
1,861 |
3,999 |
3,463 |
15,992 |
7,442 |
10 |
2,565 |
5,214 |
6,579 |
27,186 |
13,374 |
11 |
2,048 |
3,758 |
4,194 |
14,123 |
7,696 |
12 |
2,100 |
3,928 |
4,410 |
15,429 |
8,249 |
13 |
1,925 |
3,118 |
3,706 |
9,722 |
6,002 |
14 |
2,177 |
4,011 |
4,739 |
16,088 |
8,732 |
15 |
1,916 |
3,764 |
3,671 |
14,168 |
7,212 |
16 |
2,162 |
4,526 |
4,674 |
20,485 |
9,785 |
17 |
3,297 |
7,123 |
10,870 |
50,737 |
23,485 |
18 |
2,431 |
5,201 |
5,910 |
27,050 |
12,644 |
19 |
2,846 |
6,755 |
8,100 |
45,630 |
19,225 |
20 |
2,684 |
5,582 |
7,204 |
31,159 |
14,982 |
Сумма |
44,718 |
85,667 |
102,519 |
391,736 |
198,634 |
= 0,535
Из того что rxy=0,535 следует что между показателями существует сильная линейная зависимость. rxy>0 => переменные положительно коррелированны.
Гипотеза:
-теоретический коэффициент корреляции
Проверим нулевую гипотезу:
= 2,865
tквант=1,714
tстат<tквант => с надежностью 0,9 rxy существенно отличается от нуля, и, следовательно между переменными Х и Y существует значимая тесная связь, являющая либо линейной либо близкой к линейной.
-
Методом наименьших квадратов найти точечные оценки параметров линейной регрессионной модели.
№ |
xi |
yi |
xi^2 |
yi^2 |
xi*yi |
y*=f(x) |
1 |
1,964 |
4,130 |
3,857 |
17,057 |
8,111 |
|
2 |
1,944 |
3,144 |
3,779 |
9,885 |
6,112 |
|
3 |
1,967 |
3,875 |
3,869 |
15,016 |
7,622 |
|
4 |
2,069 |
3,374 |
4,281 |
11,384 |
6,981 |
|
5 |
2,302 |
3,119 |
5,299 |
9,728 |
7,180 |
|
6 |
2,191 |
4,009 |
4,800 |
16,072 |
8,784 |
|
7 |
2,125 |
3,701 |
4,516 |
13,697 |
7,865 |
|
8 |
2,144 |
3,336 |
4,597 |
11,129 |
7,152 |
|
9 |
1,861 |
3,999 |
3,463 |
15,992 |
7,442 |
|
10 |
2,565 |
5,214 |
6,579 |
27,186 |
13,374 |
|
11 |
2,048 |
3,758 |
4,194 |
14,123 |
7,696 |
|
12 |
2,100 |
3,928 |
4,410 |
15,429 |
8,249 |
|
13 |
1,925 |
3,118 |
3,706 |
9,722 |
6,002 |
|
14 |
2,177 |
4,011 |
4,739 |
16,088 |
8,732 |
|
15 |
1,916 |
3,764 |
3,671 |
14,168 |
7,212 |
|
16 |
2,162 |
4,526 |
4,674 |
20,485 |
9,785 |
|
17 |
3,297 |
7,123 |
10,870 |
50,737 |
23,485 |
|
18 |
2,431 |
5,201 |
5,910 |
27,050 |
12,644 |
|
19 |
2,846 |
6,755 |
8,100 |
45,630 |
19,225 |
|
20 |
2,684 |
5,582 |
7,204 |
31,159 |
14,982 |
|
Сумма |
44,718 |
85,667 |
102,519 |
391,736 |
198,634 |
|
Среднее |
2,236 |
4,283 |
5,126 |
19,587 |
9,932 |
|
= 2,798
= -1,974
y*=2,798*x-1,974
4. Найти интервальные оценки для параметров модели и проверить их значимость при доверительной вероятности 0,9.
Sa*==
Sb*==
=
=0.901
C вероятностью 0,9 истинные значения a и b накрываются данными интервалами.
Проверим значимость. (не является ли отличие от нуля случайным)
ta*=a*/Sa*=9.548 и tb*=b*/Sb*=-2.838
Т.к. модуль значений обоих t-статистик больше 1,714 (tквант), то a и b значимо отличны от нуля ну уровне значимости 0,1. Оба коэффициента статистически значимы.
5. Построить доверительные полосы для уравнения регрессии и модели при доверительной вероятности 0,9 и представить их графически.
№ |
xi |
yi |
y*=f(x) |
(xi-xср)^2 |
(yi-y*)^2 |
(y*-yср)^2 |
(yi-yср)^2 |
Syi* |
yiн |
yiв |
1 |
1,494 |
3,229 |
2,606 |
0,092 |
0,388 |
0,691 |
0,043 |
0,132 |
2,379 |
2,833 |
2 |
1,474 |
2,243 |
2,551 |
0,104 |
0,095 |
0,785 |
1,426 |
0,136 |
2,318 |
2,785 |
3 |
1,497 |
2,974 |
2,614 |
0,090 |
0,129 |
0,677 |
0,214 |
0,132 |
2,388 |
2,840 |
4 |
1,599 |
2,473 |
2,894 |
0,039 |
0,177 |
0,295 |
0,930 |
0,115 |
2,697 |
3,091 |
5 |
1,832 |
2,218 |
3,533 |
0,001 |
1,730 |
0,009 |
1,486 |
0,100 |
3,362 |
3,705 |
6 |
1,721 |
3,108 |
3,229 |
0,006 |
0,015 |
0,043 |
0,108 |
0,102 |
3,054 |
3,404 |
7 |
1,655 |
2,800 |
3,048 |
0,020 |
0,061 |
0,152 |
0,406 |
0,108 |
2,863 |
3,232 |
8 |
1,674 |
2,435 |
3,100 |
0,015 |
0,442 |
0,114 |
1,004 |
0,106 |
2,919 |
3,281 |
9 |
1,391 |
3,098 |
2,324 |
0,165 |
0,600 |
1,240 |
0,115 |
0,153 |
2,061 |
2,586 |
10 |
2,095 |
4,313 |
4,255 |
0,089 |
0,003 |
0,668 |
0,767 |
0,131 |
4,030 |
4,480 |
11 |
1,578 |
2,857 |
2,836 |
0,048 |
0,000 |
0,361 |
0,337 |
0,118 |
2,634 |
3,038 |
12 |
1,630 |
3,027 |
2,979 |
0,028 |
0,002 |
0,210 |
0,168 |
0,111 |
2,790 |
3,169 |
13 |
1,455 |
2,217 |
2,499 |
0,117 |
0,080 |
0,880 |
1,489 |
0,140 |
2,259 |
2,739 |
14 |
1,707 |
3,110 |
3,190 |
0,008 |
0,006 |
0,061 |
0,107 |
0,103 |
3,014 |
3,367 |
15 |
1,446 |
2,863 |
2,474 |
0,123 |
0,151 |
0,927 |
0,330 |
0,142 |
2,231 |
2,717 |
16 |
1,692 |
3,625 |
3,149 |
0,011 |
0,226 |
0,083 |
0,035 |
0,104 |
2,971 |
3,328 |
17 |
2,827 |
6,222 |
6,262 |
1,060 |
0,002 |
7,983 |
7,756 |
0,312 |
5,727 |
6,797 |
18 |
1,961 |
4,300 |
3,887 |
0,027 |
0,171 |
0,202 |
0,745 |
0,110 |
3,698 |
4,076 |
19 |
2,376 |
5,854 |
5,025 |
0,335 |
0,687 |
2,523 |
5,841 |
0,194 |
4,693 |
5,358 |
20 |
2,214 |
4,681 |
4,581 |
0,174 |
0,010 |
1,308 |
1,547 |
0,156 |
4,314 |
4,848 |
21 |
1,882 |
4,214 |
3,670 |
0,007 |
0,296 |
0,054 |
0,604 |
0,103 |
3,495 |
3,846 |
22 |
1,936 |
3,266 |
3,818 |
0,019 |
0,305 |
0,145 |
0,029 |
0,107 |
3,635 |
4,002 |
23 |
1,831 |
3,308 |
3,530 |
0,001 |
0,049 |
0,009 |
0,017 |
0,100 |
3,359 |
3,702 |
24 |
1,560 |
2,602 |
2,787 |
0,056 |
0,034 |
0,423 |
0,697 |
0,121 |
2,580 |
2,994 |
25 |
2,404 |
4,891 |
5,102 |
0,368 |
0,045 |
2,772 |
2,114 |
0,201 |
4,758 |
5,446 |
сумм |
44,931 |
85,928 |
85,946 |
3,006 |
5,705 |
22,615 |
28,315 |
|
|
|
yiн=yi*-
yiв=yi*+
=tквант*Syi*
Syi*=S*
S=
6. Провести дисперсионный анализ рассматриваемой модели: определить долю вариации потребительских расходов, объясняемую уравнением регрессии, и долю вариации потребительских расходов, объясняемую случайными причинами.
Qy=
Qy*=
R^2=Qy*/Qy
R^2 |
0,799 |
=>79.9% изменения переменной объясняется построенным уравнением регрессии, случайными причинами объясняется 20,1% вариации.
7. При помощи критерия Фишера проверить адекватность выбранной модели имеющимся данным с доверительной вероятностью 0,9.
F=R^2(n-2)/(1-R^2)
F |
91,251 |
Fквант0,9(1;23) |
2,937 |
Уравнение регрессии адекватно исходным данным на уровне значимости 0,1.
8. Дать с вероятностью 0,9 точечный и интервальный прогноз для среднего и ожидаемого значений заработной платы в наудачу выбранном субъекте РФ в 2012 г., если ожидается, что денежные доходы в этом субъекте РФ уменьшатся на 10% по сравнению со средним значением в 2010 г.
Точечный:
xp=0.9xcp=1,618
yp*=y*(xp)= 2,944
Интервальный:
здесь ищем доверительный интервал по аналогии с заданием 5 с заменой xi на xp, yi* на yp* и т.д.
Доверительный интервал: |
|
2,614 |
3,274 |
|
|
Если в неск. регионах СДЗ будет равно 1,618, то ПМ с вероятностью 0,9 будет покрыт данным интервалом.
9. Проверить выполнение основных предположений регрессионного и корреляционного анализа относительно «возмущений» модели с доверительной вероятностью 0,9:
а) постоянство дисперсии;
=-0,14846
t= = -0,71998
|t|=0.71998 <tквант=1,714 =>
На уровне значимости 0,1 нет оснований отвергнуть гипотезу об отсутствии гетероскедастичности и потому принимается нулевая гипотеза о постоянстве дисперсии «возмущений» в модели.
№ |
xi |
yi |
y*=f(x) |
ei |
ei-1 |
|ei| |
r(xi) |
r(ei) |
di^2 |
(ei-ei-1)2 |
1 |
1,494 |
3,229 |
2,606 |
-0,623 |
|
0,623 |
5 |
21 |
256 |
0,388 |
2 |
1,474 |
2,243 |
2,551 |
0,308 |
-0,623 |
0,308 |
4 |
13 |
81 |
0,867 |
3 |
1,497 |
2,974 |
2,614 |
-0,360 |
0,308 |
0,360 |
6 |
14 |
64 |
0,446 |
4 |
1,599 |
2,473 |
2,894 |
0,421 |
-0,360 |
0,421 |
9 |
17 |
64 |
0,610 |
5 |
1,832 |
2,218 |
3,533 |
1,315 |
0,421 |
1,315 |
17 |
25 |
64 |
0,799 |
6 |
1,721 |
3,108 |
3,229 |
0,121 |
1,315 |
0,121 |
15 |
7 |
64 |
1,427 |
7 |
1,655 |
2,800 |
3,048 |
0,248 |
0,121 |
0,248 |
11 |
11 |
0 |
0,016 |
8 |
1,674 |
2,435 |
3,100 |
0,665 |
0,248 |
0,665 |
12 |
22 |
100 |
0,174 |
9 |
1,391 |
3,098 |
2,324 |
-0,774 |
0,665 |
0,774 |
1 |
23 |
484 |
2,071 |
10 |
2,095 |
4,313 |
4,255 |
-0,058 |
-0,774 |
0,058 |
21 |
4 |
289 |
0,513 |
11 |
1,578 |
2,857 |
2,836 |
-0,021 |
-0,058 |
0,021 |
8 |
1 |
49 |
0,001 |
12 |
1,630 |
3,027 |
2,979 |
-0,048 |
-0,021 |
0,048 |
10 |
3 |
49 |
0,001 |
13 |
1,455 |
2,217 |
2,499 |
0,282 |
-0,048 |
0,282 |
3 |
12 |
81 |
0,109 |
14 |
1,707 |
3,110 |
3,190 |
0,080 |
0,282 |
0,080 |
14 |
5 |
81 |
0,041 |
15 |
1,446 |
2,863 |
2,474 |
-0,389 |
0,080 |
0,389 |
2 |
15 |
169 |
0,220 |
16 |
1,692 |
3,625 |
3,149 |
-0,476 |
-0,389 |
0,476 |
13 |
18 |
25 |
0,008 |
17 |
2,827 |
6,222 |
6,262 |
0,040 |
-0,476 |
0,040 |
25 |
2 |
529 |
0,267 |
18 |
1,961 |
4,300 |
3,887 |
-0,413 |
0,040 |
0,413 |
20 |
16 |
16 |
0,206 |
19 |
2,376 |
5,854 |
5,025 |
-0,829 |
-0,413 |
0,829 |
23 |
24 |
1 |
0,173 |
20 |
2,214 |
4,681 |
4,581 |
-0,100 |
-0,829 |
0,100 |
22 |
6 |
256 |
0,531 |
21 |
1,882 |
4,214 |
3,670 |
-0,544 |
-0,100 |
0,544 |
18 |
19 |
1 |
0,197 |
22 |
1,936 |
3,266 |
3,818 |
0,552 |
-0,544 |
0,552 |
19 |
20 |
1 |
1,201 |
23 |
1,831 |
3,308 |
3,530 |
0,222 |
0,552 |
0,222 |
16 |
10 |
36 |
0,109 |
24 |
1,560 |
2,602 |
2,787 |
0,185 |
0,222 |
0,185 |
7 |
8 |
1 |
0,001 |
25 |
2,404 |
4,891 |
5,102 |
0,211 |
0,185 |
0,211 |
24 |
9 |
225 |
0,001 |
сумм |
44,931 |
85,928 |
85,946 |
0,018 |
0,211 |
0,018 |
|
|
2986 |
10,376 |
б) некоррелированность;
d== 1,751 – статистика Дарбина- Уотсона
dн=0,033
dв=1,211
1,211<d<2,789 => автокорреляция отсутствует в модели Y=2.743*X-1.492+у на уровне значимости 0,01.
в) нормальность распределения.1
|
ei |
ei-ecp |
ei-ecp2 |
ei-ecp3 |
ei-ecp4 |
1 |
-0,623 |
-0,624 |
0,389 |
0,151 |
0,023 |
2 |
0,308 |
0,308 |
0,095 |
0,009 |
0,000 |
3 |
-0,360 |
-0,360 |
0,129 |
0,017 |
0,000 |
4 |
0,421 |
0,421 |
0,177 |
0,031 |
0,001 |
5 |
1,315 |
1,315 |
1,730 |
2,992 |
8,951 |
6 |
0,121 |
0,121 |
0,015 |
0,000 |
0,000 |
7 |
0,248 |
0,248 |
0,061 |
0,004 |
0,000 |
8 |
0,665 |
0,665 |
0,442 |
0,195 |
0,038 |
9 |
-0,774 |
-0,774 |
0,600 |
0,360 |
0,129 |
10 |
-0,058 |
-0,058 |
0,003 |
0,000 |
0,000 |
11 |
-0,021 |
-0,021 |
0,000 |
0,000 |
0,000 |
12 |
-0,048 |
-0,048 |
0,002 |
0,000 |
0,000 |
13 |
0,282 |
0,282 |
0,080 |
0,006 |
0,000 |
14 |
0,080 |
0,080 |
0,006 |
0,000 |
0,000 |
15 |
-0,389 |
-0,389 |
0,151 |
0,023 |
0,001 |
16 |
-0,476 |
-0,476 |
0,226 |
0,051 |
0,003 |
17 |
0,040 |
0,040 |
0,002 |
0,000 |
0,000 |
18 |
-0,413 |
-0,413 |
0,171 |
0,029 |
0,001 |
19 |
-0,829 |
-0,829 |
0,687 |
0,471 |
0,222 |
20 |
-0,100 |
-0,100 |
0,010 |
0,000 |
0,000 |
21 |
-0,544 |
-0,544 |
0,296 |
0,087 |
0,008 |
22 |
0,552 |
0,552 |
0,305 |
0,093 |
0,009 |
23 |
0,222 |
0,222 |
0,049 |
0,002 |
0,000 |
24 |
0,185 |
0,185 |
0,034 |
0,001 |
0,000 |
25 |
0,211 |
0,211 |
0,045 |
0,002 |
0,000 |
m2 |
0,22822 |
m3 |
0,181065 |
m4 |
0,375419 |
b1 |
1,661 |
b2 |
4,208 |
σb1 |
0,470 |
σb2 |
0,731 |
u0.975=1.96<3,531477(|b1|/ σb1) и <6,07034((|b2+6/26)/ σb2) =>оба неравенства выполнены, поэтому гипотеза о нормальном законе распределения возмущения модели не отвергается на уровне значимости 0.05<a<0.1.
|
|
1 для проверки нулевой гипотезы о нормальности «возмущения» модели задается вероятность, близкая к 1. (взяла гамма=0,975)