- •Решение.
- •1. Для получения матрицы парных коэффициентов корреляции воспользуемся программными ресурсами ms Excel. С ее помощью получаем следующую матрицу:
- •Параметры линейной парной регрессии для x3
- •4. На основании полученных результатов оценим качество модели через коэффициент детерминации, среднюю ошибку аппроксимации и f-критерий Фишера.
- •7. В соответствии с полученными результатами оценим качество линейной множественной регрессии через коэффициент детерминации, среднюю ошибку аппроксимации и f-критерий Фишера.
- •Решение.
- •3.2. Оценка адекватности построенной модели по свойству независимости остаточной компоненты определяется по d-критерию Дарбина-Уотсона (проверяется наличие/отсутствие автокорреляции).
- •5. Осуществим точечный прогноз спроса на следующие две недели.
- •Список литературы.
4. На основании полученных результатов оценим качество модели через коэффициент детерминации, среднюю ошибку аппроксимации и f-критерий Фишера.
Коэффициент детерминации характеризует долю вариации результативного показателя под воздействием ведущего фактора, включенного в модель парной регрессии. Может изменяться от 0 до 1. В соответствии с расчетом коэффициента детерминациидля факторов X1, X3, X5 наибольшее значение имеет фактор X3 (R2 = 0,714957), следовательно, факторный признак ХЗ (общая площадь квартиры), на 71,5% определяет вариацию результативного показателя Y (цену квартиры). Значение коэффициента детерминации R2 = 0,714957 достаточно близко к 1, поэтому качество модели можно признать удовлетворительным.
Для факторов Х1, X5 коэффициент детерминации во много раз меньше единицы, поэтому качество моделей не является удовлетворительным.
Оценка статистической значимости уравнения парной регрессии осуществляется по F-критерию Фишера.
Определим табличное значение F-критерия с помощью функции MS Excel FPACПOБP (для α = 0,1, k1 = 1, k2 = 40-1-1): Fтабл = 2,842442
Приведем расчетные значения F-критерия для трех факторов
Для X1 F = 7,382799711 т.к. F > Fтабл, уравнение регрессии признается статистически значимым.
Для X3 F = 95,3132216 т.к. F > Fтабл, уравнение регрессии признается статистически значимым.
Для X5 F = 0,832088977 т.к. F < Fтабл, уравнение регрессии признается статистически незначимым.
Произведем оценку статистической значимости фактора парной регрессии с помощью t-критерия Стьюдента. С помощью функции MS Excel СТЬЮДРАСПОБР определим табличное значение критерия Стьюдента (для α = 0,1, n = 40, k = 1): t табл. = 1,685954
Приведем расчетное значения критерия Стьюдента
Для X1 t = -2,717130787 т.к t > tтабл, уравнение регрессии признается статистически значимым.
Для X3 t = 9,76284905 т.к t > tтабл, уравнение регрессии признается статистически значимым.
Для X5 t = 0,912189 т.к t < tтабл, уравнение регрессии признается статистически незначимым. Следовательно, его включение в модель было нецелесообразным.
При заданном уровне значимости , факторы Х1 (город области) Х3 (общая площадь квартиры) являются статистически значимыми, а фактор Х5 (этаж квартиры) является статистически незначимым
Определим среднюю ошибку аппроксимации по формуле:
,
где n - число наблюдений.
Для фактора X1
Наблюдение |
Y цена квартиры |
Предсказанное Y^ |
ABS((Y-Y^)/Y) |
||
|
115 |
117,5035 |
0,021769565 |
||
|
85 |
76,0195 |
0,105652941 |
||
|
69 |
76,0195 |
0,101731884 |
||
|
57 |
76,0195 |
0,333675439 |
||
|
184,6 |
117,5035 |
0,363469664 |
||
|
56 |
76,0195 |
0,357491071 |
||
|
85 |
117,5035 |
0,382394118 |
||
|
265 |
117,5035 |
0,556590566 |
||
|
60,65 |
76,0195 |
0,253413026 |
||
|
130 |
117,5035 |
0,096126923 |
||
|
46 |
76,0195 |
0,652597826 |
||
|
115 |
117,5035 |
0,021769565 |
||
|
70,96 |
117,5035 |
0,655911781 |
||
|
39,5 |
76,0195 |
0,924544304 |
||
|
78,9 |
117,5035 |
0,489271229 |
||
|
60 |
76,0195 |
0,266991667 |
||
|
100 |
76,0195 |
0,239805 |
||
|
51 |
76,0195 |
0,490578431 |
||
|
157 |
117,5035 |
0,251570064 |
||
|
123,5 |
76,0195 |
0,38445749 |
||
|
55,2 |
117,5035 |
1,128686594 |
||
|
95,5 |
76,0195 |
0,203984293 |
||
|
57,6 |
117,5035 |
1,039991319 |
||
|
64,5 |
76,0195 |
0,178596899 |
||
|
92 |
76,0195 |
0,173701087 |
||
|
100 |
76,0195 |
0,239805 |
||
|
81 |
117,5035 |
0,450660494 |
||
|
65 |
76,0195 |
0,169530769 |
||
|
110 |
117,5035 |
0,068213636 |
||
|
42,1 |
76,0195 |
0,805688836 |
||
|
135 |
117,5035 |
0,129603704 |
||
|
39,6 |
76,0195 |
0,919684343 |
||
|
57 |
76,0195 |
0,333675439 |
||
|
80 |
117,5035 |
0,46879375 |
||
|
61 |
76,0195 |
0,246221311 |
||
|
69,6 |
76,0195 |
0,092234195 |
||
|
250 |
76,0195 |
0,695922 |
||
|
64,5 |
76,0195 |
0,178596899 |
||
|
125 |
117,5035 |
0,059972 |
||
|
152,3 |
117,5035 |
0,228473408 |
||
|
|||||
|
36,90462133 |
В среднем расчетные значения для линейной модели фактора X3 отличаются от фактических значений на 36,9%.
Для фактора X3
Наблюдение |
Y цена квартиры |
Предсказанное Y^ |
ABS((Y-Y^)/Y) |
|
115 |
95,48979316 |
0,169653972 |
|
85 |
114,6179545 |
0,348446524 |
|
69 |
86,38849057 |
0,25200711 |
|
57 |
71,88811017 |
0,261194915 |
|
184,6 |
116,3148076 |
0,369908951 |
|
56 |
36,56271535 |
0,347094369 |
|
85 |
87,1597874 |
0,025409264 |
|
265 |
248,3608249 |
0,06278934 |
|
60,65 |
101,0431303 |
0,666003798 |
|
130 |
121,0968479 |
0,068485785 |
|
46 |
54,76532054 |
0,190550447 |
|
115 |
79,4468191 |
0,309158095 |
|
70,96 |
88,23960296 |
0,243511879 |
|
39,5 |
51,68013322 |
0,308357803 |
|
78,9 |
62,94106694 |
0,202267846 |
|
60 |
86,38849057 |
0,439808176 |
|
100 |
131,5864848 |
0,315864848 |
|
51 |
85,61719374 |
0,678768505 |
|
157 |
138,0653782 |
0,120602687 |
|
123,5 |
152,720018 |
0,236599336 |
|
55,2 |
60,93569518 |
0,103907521 |
|
95,5 |
110,2986923 |
0,154960129 |
|
57,6 |
85,46293437 |
0,4837315 |
|
64,5 |
76,51589115 |
0,186292886 |
|
92 |
114,9264733 |
0,249200797 |
|
100 |
100,1175741 |
0,001175741 |
|
81 |
57,07921103 |
0,295318382 |
|
65 |
36,25419662 |
0,442243129 |
|
110 |
87,46830613 |
0,204833581 |
|
42,1 |
49,057724 |
0,165266603 |
|
135 |
97,95794302 |
0,274385607 |
|
39,6 |
42,42457126 |
0,071327557 |
|
57 |
81,91496896 |
0,437104719 |
|
80 |
41,65327443 |
0,47933407 |
|
61 |
76,51589115 |
0,254358871 |
|
69,6 |
114,9264733 |
0,651242432 |
|
250 |
221,3654358 |
0,114538257 |
|
64,5 |
86,38849057 |
0,339356443 |
|
125 |
70,19125714 |
0,438469943 |
|
152,3 |
124,1820352 |
0,184622224 |
11,14815404 |
|||
27,8703851 |
В среднем расчетные значения для линейной модели фактора X3 отличаются от фактических значений на 27,87%.
Для фактора X5
Наблюдение |
Y цена квартиры |
Предсказанное Y^ |
ABS((Y-Y^)/Y) |
|
115 |
95,48979316 |
0,169653972 |
|
85 |
114,6179545 |
0,348446524 |
|
69 |
86,38849057 |
0,25200711 |
|
57 |
71,88811017 |
0,261194915 |
|
184,6 |
116,3148076 |
0,369908951 |
|
56 |
36,56271535 |
0,347094369 |
|
85 |
87,1597874 |
0,025409264 |
|
265 |
248,3608249 |
0,06278934 |
|
60,65 |
101,0431303 |
0,666003798 |
|
130 |
121,0968479 |
0,068485785 |
|
46 |
54,76532054 |
0,190550447 |
|
115 |
79,4468191 |
0,309158095 |
|
70,96 |
88,23960296 |
0,243511879 |
|
39,5 |
51,68013322 |
0,308357803 |
|
78,9 |
62,94106694 |
0,202267846 |
|
60 |
86,38849057 |
0,439808176 |
|
100 |
131,5864848 |
0,315864848 |
|
51 |
85,61719374 |
0,678768505 |
|
157 |
138,0653782 |
0,120602687 |
|
123,5 |
152,720018 |
0,236599336 |
|
55,2 |
60,93569518 |
0,103907521 |
|
95,5 |
110,2986923 |
0,154960129 |
|
57,6 |
85,46293437 |
0,4837315 |
|
64,5 |
76,51589115 |
0,186292886 |
|
92 |
114,9264733 |
0,249200797 |
|
100 |
100,1175741 |
0,001175741 |
|
81 |
57,07921103 |
0,295318382 |
|
65 |
36,25419662 |
0,442243129 |
|
110 |
87,46830613 |
0,204833581 |
|
42,1 |
49,057724 |
0,165266603 |
|
135 |
97,95794302 |
0,274385607 |
|
39,6 |
42,42457126 |
0,071327557 |
|
57 |
81,91496896 |
0,437104719 |
|
80 |
41,65327443 |
0,47933407 |
|
61 |
76,51589115 |
0,254358871 |
|
69,6 |
114,9264733 |
0,651242432 |
|
250 |
221,3654358 |
0,114538257 |
|
64,5 |
86,38849057 |
0,339356443 |
|
125 |
70,19125714 |
0,438469943 |
|
152,3 |
124,1820352 |
0,184622224 |
18,31199294 |
|||
45,77998235 |
В среднем расчетные значения для линейной модели фактора X3 отличаются от фактических значений на 45,78%.
Следовательно, по всем критериям лучшей является модель Y3 = -13,1088005 + 1,54259366*X3 для фактора X3.
5. Осуществим прогнозирование среднего значения показателя Y (цены квартиры) при прогнозном значении фактора ХЗ (общая площадь квартиры), которое согласно условию задачи составляет 80% от его максимального значения. Максимальное значение X3 = 169,5, соответственно, прогнозное значение X3прогн. = 169,5*0,8 = 135,6.
Определим точечный прогноз по уравнению парной регрессии:
Yпрогн. = -13,1088005 + 1,54259366*Х3прогн.
Yпрогн. = 196,0668998
Произведем расчет интервального прогноза, для этого определим ширину доверительного интервала.
,
где S – стандартная ошибка оценки [1, стр.58], которая определяется по формуле:
В соответствии с расчетными данными имеем . При расчете используем Кр=1,12 (для заданной вероятности расчета 80%), n=40, m=1. Результаты расчета представлены в таблице 9.
Таблица 9.
№ |
Х3 |
|
|
|
70,4 |
1,1925 |
1,422056 |
|
82,8 |
13,5925 |
184,7561 |
|
64,5 |
-4,7075 |
22,16056 |
|
55,1 |
-14,1075 |
199,0216 |
|
83,9 |
14,6925 |
215,8696 |
|
32,2 |
-37,0075 |
1369,555 |
|
65 |
-4,2075 |
17,70306 |
|
169,5 |
100,2925 |
10058,59 |
|
74 |
4,7925 |
22,96806 |
|
87 |
17,7925 |
316,5731 |
|
44 |
-25,2075 |
635,4181 |
|
60 |
-9,2075 |
84,77806 |
|
65,7 |
-3,5075 |
12,30256 |
|
42 |
-27,2075 |
740,2481 |
|
49,3 |
-19,9075 |
396,3086 |
|
64,5 |
-4,7075 |
22,16056 |
|
93,8 |
24,5925 |
604,7911 |
|
64 |
-5,2075 |
27,11806 |
|
98 |
28,7925 |
829,0081 |
|
107,5 |
38,2925 |
1466,316 |
|
48 |
-21,2075 |
449,7581 |
|
80 |
10,7925 |
116,4781 |
|
63,9 |
-5,3075 |
28,16956 |
|
58,1 |
-11,1075 |
123,3766 |
|
83 |
13,7925 |
190,2331 |
|
73,4 |
4,1925 |
17,57706 |
|
45,5 |
-23,7075 |
562,0456 |
|
32 |
-37,2075 |
1384,398 |
|
65,2 |
-4,0075 |
16,06006 |
|
40,3 |
-28,9075 |
835,6436 |
|
72 |
2,7925 |
7,798056 |
|
36 |
-33,2075 |
1102,738 |
|
61,6 |
-7,6075 |
57,87406 |
|
35,5 |
-33,7075 |
1136,196 |
|
58,1 |
-11,1075 |
123,3766 |
|
83 |
13,7925 |
190,2331 |
|
152 |
82,7925 |
6854,598 |
|
64,5 |
-4,7075 |
22,16056 |
|
54 |
-15,2075 |
231,2681 |
|
89 |
19,7925 |
391,7431 |
|
|
В результате расчета имеем U(k)= 33,69518066.
Таким образом, прогнозное значение будет находиться между верхней границей, равной , и нижней границей, равной .
На графике представлены фактические и модельные значения, точки прогноза.
6. Используя пошаговую множественную регрессию (метод исключения или метод включения), строим модель формирования цены квартиры за счёт значимых факторов – фактор ХЗ (общая площадь квартиры) и фактор X6 (площадь кухни). Фактор Х5 (этаж квартиры) исключаем т.к. коэффициент парной корреляции для признака X5 меньше чем для X3 и X6.
Расчет параметров линейной множественной регрессии , произведем с использованием программы MS Excel.
Полученные данные представлены в таблицах 10, 11, 12.
Таблица 10.
Регрессионная статистика |
|
Множественный R |
0,859112903 |
R-квадрат |
0,73807498 |
Нормированный R-квадрат |
0,723916871 |
Стандартная ошибка |
27,05586127 |
Наблюдения |
40 |
Таблица 11.
Дисперсионный анализ |
|||||
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
2 |
76321,68483 |
38160,84242 |
52,13090048 |
1,72296E-11 |
Остаток |
37 |
27084,72627 |
732,0196288 |
|
|
Итого |
39 |
103406,4111 |
|
|
|
Таблица 12.
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
14,040351 |
18,890597 |
0,7432455 |
0,4620265 |
-24,23563 |
52,316336 |
-24,23563 |
52,316336 |
Переменная X3 |
1,696496 |
0,1755400 |
9,6644435 |
1,153E-11 |
1,3408189 |
2,0521747 |
1,3408189 |
2,0521747 |
Переменная X6 |
-3,759364 |
2,0803056 |
-1,807121 |
0,0788803 |
-7,974463 |
0,4557352 |
-7,974463 |
0,4557352 |
В соответствии с полученными расчетными данными запишем модель регрессии в линейной форме:
Коэффициенты уравнения регрессии показывают, что при увеличении только общей площади квартиры (Х3) на 1 кв.м. цена квартиры увеличится на тыс. долл., а при изменении площади кухни на 1 кв.м. (X6) цена квартиры уменьшится на тыс. долл.