- •«Финансовый университет при Правительстве Российской Федерации» Кировский филиал
- •Киров 2012г. (2013г.) Содержание
- •Исходные данные Задача 1. Эконометрическое моделирование стоимости квартир в Московской области
- •Задача 2. Исследовать динамику экономического показателя на основе анализа одномерного временного ряда
- •Решение Задача 1.1. Матрица парных коэффициентов корреляции
- •Задача 1.2. Поле корреляции результативного признака
- •Задача 1.3. Параметры линейной парной регрессии
- •Задача 1.4. Оценка качества моделей
- •Задача 1.5. Прогнозирование среднего значения
- •Задача 1.6. Пошаговая множественная регрессия
- •Задача 1.7. Оценка качества многофакторной модели
- •Задача 2.1. Проверка наличия аномальных наблюдений
- •Задача 2.2. Построение линейной модели
- •Задача 2.3. Оценка адекватности модели
- •Задача 2.4. Оценка точности модели
- •Задача 2.5. Осуществление прогноза
- •Задача 2.6. Графическое представление результатов моделирования и прогнозирования
- •Список литературы
Задача 1.7. Оценка качества многофакторной модели
Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, - и -коэффициентов.
Для оценки качества выбранной множественной модели (6) , аналогично п.1.4 данной задачи, используем коэффициент детерминации R-квадрат, среднюю относительную ошибку аппроксимации и F-критерий Фишера.
Коэффициент детерминации R-квадрат возьмем из итогов «Регрессии» (таблица «Регрессионная статистика» для модели (6)).
, следовательно, вариация (изменение) цены квартиры Y на 76,77% объясняется по данному уравнению вариацией города области Х1, числа комнат в квартире Х2 и жилой площади Х4.
Используем исходные данные Yi и найденные инструментом «Регрессия» остатки (таблица «Вывод остатка» для модели (6)). Рассчитаем относительные погрешности и найдем среднее значение.
ВЫВОД ОСТАТКА
Наблюдение |
Предсказанное Y |
Остатки |
Отн. погрешность |
1 |
45,95089273 |
-7,95089273 |
20,92340192 |
2 |
86,10296493 |
-23,90296493 |
38,42920407 |
3 |
94,84442678 |
30,15557322 |
24,12445858 |
4 |
84,17648426 |
-23,07648426 |
37,76838667 |
5 |
40,2537216 |
26,7462784 |
39,91981851 |
6 |
68,70572376 |
24,29427624 |
26,12287768 |
7 |
143,7464899 |
-25,7464899 |
21,81905923 |
8 |
106,0907598 |
25,90924022 |
19,62821228 |
9 |
135,357993 |
-42,85799303 |
46,33296544 |
10 |
114,4792566 |
-9,47925665 |
9,027863476 |
11 |
41,48765602 |
0,512343975 |
1,219866607 |
12 |
103,2329236 |
21,76707636 |
17,41366109 |
13 |
130,3567798 |
39,64322022 |
23,3195413 |
14 |
35,41901876 |
2,580981242 |
6,7920559 |
15 |
155,4129693 |
-24,91296925 |
19,0903979 |
16 |
84,32108188 |
0,678918123 |
0,798727204 |
17 |
98,0552279 |
-0,055227902 |
0,056355002 |
18 |
144,2104618 |
-16,21046182 |
12,66442329 |
19 |
122,8677535 |
-37,86775351 |
44,55029825 |
20 |
100,0221225 |
59,97787748 |
37,48617343 |
21 |
53,27196558 |
6,728034423 |
11,21339071 |
22 |
35,06605378 |
5,933946225 |
14,47303957 |
23 |
114,4792566 |
-24,47925665 |
27,19917406 |
24 |
113,1343153 |
-30,13431529 |
36,30640396 |
25 |
40,43190991 |
4,568090093 |
10,15131132 |
26 |
39,34427892 |
-0,344278918 |
0,882766457 |
27 |
144,4794501 |
-57,57945009 |
66,25943623 |
28 |
56,4827667 |
-16,4827667 |
41,20691675 |
29 |
95,38240332 |
-15,38240332 |
19,22800415 |
30 |
228,6988826 |
-1,698882564 |
0,748406416 |
31 |
222,8067278 |
12,19327221 |
5,188626473 |
32 |
38,81483144 |
1,185168555 |
2,962921389 |
33 |
48,36325811 |
18,63674189 |
27,81603267 |
34 |
126,6080021 |
-3,608002113 |
2,933335051 |
35 |
84,85052935 |
15,14947065 |
15,14947065 |
36 |
116,7991162 |
-11,79911625 |
11,23725357 |
37 |
84,17648426 |
-13,87648426 |
19,73895342 |
38 |
113,9412801 |
-31,94128011 |
38,95278062 |
39 |
215,494184 |
64,50581599 |
23,03779142 |
40 |
141,7795953 |
58,22040472 |
29,11020236 |
Среднее |
101,2375 |
|
22,51770962 |
По столбцу относительных погрешностей найдем среднее значение =22.51% (с помощью функции СРЗНАЧ).
Сравнение показывает, что 22.51%>7%. Следовательно, точность модели неудовлетворительная.
С помощью F – критерия Фишера проверим значимость модели в целом. Для этого выпишем из итогов применения инструмента «Регрессия» (таблица «дисперсионный анализ» для модели (6)) F=39,6702.
С помощью функции FРАСПОБР найдем значение Fкр=3.252 для уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37.
F>Fкр, следовательно, уравнение модели (6) является значимым, его использование целесообразно, зависимая переменная Y достаточно хорошо описывается включенными в модель (6) факторными переменными Х1, Х2. и Х4.
Дополнительно с помощью t–критерия Стьюдента проверим значимость отдельных коэффициентов модели.
t–статистики для коэффициентов уравнения регрессии приведены в итогах инструмента «Регрессия». Получены следующие значения для выбранной модели (6) :
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
-5,643572321 |
12,07285417 |
-0,46745966 |
0,642988 |
-30,1285 |
18,84131 |
-30,1285 |
18,84131 |
X4 |
2,591405557 |
0,461440597 |
5,61590284 |
2,27E-06 |
1,655561 |
3,52725 |
1,655561 |
3,52725 |
X1 |
6,85963077 |
9,185748512 |
0,74676884 |
0,460053 |
-11,7699 |
25,48919 |
-11,7699 |
25,48919 |
X2 |
-1,985156991 |
7,795346067 |
-0,25465925 |
0,800435 |
-17,7949 |
13,82454 |
-17,7949 |
13,82454 |
Критическое значение tкр найдено для уровня значимости α=5% и числа степеней свободы k=40–2–1=37. tкр=2.026 (функция СТЬЮДРАСПОБР).
Для свободного коэффициента α=–5.643 определена статистика , <tкр, следовательно, свободный коэффициент не является значимым, его можно исключить из модели.
Для коэффициента регрессии β1=6.859 определена статистика , <tкр, следовательно, коэффициент регрессии β1 не является значимым, его и фактор города области можно удалить из модели.
Для коэффициента регрессии β2=-1,985 определена статистика , <tкр, следовательно, коэффициент регрессии β2 не является значимым, его и фактор числа комнат в квартире можно исключить из модели.
Для коэффициента регрессии β4=2.591 определена статистика , >tкр, следовательно, коэффициент регрессии β4 является значимым, его и фактор жилой площади квартиры можно сохранить в модели.
Выводы о значимости коэффициентов модели сделаны на уровне значимости α=5%. Рассматривая столбец «P-значение», отметим, что свободный коэффициент α можно считать значимым на уровне 0.64 = 64%; коэффициент регрессии β1 – на уровне 0,46 = 46%; коэффициент регрессии β2 – на уровне 0,8 = 80%; а коэффициент регрессии β4 – на уровне 2,27E-06= 2,26691790951854E-06 = 0,0000002%.
При добавлении в уравнение новых факторных переменных автоматически увеличивается коэффициент детерминации R2 и уменьшается средняя ошибка аппроксимации, хотя при этом не всегда улучшается качество модели. Поэтому для сравнения качества модели (3) и выбранной множественной модели (6) используем нормированные коэффициенты детерминации.
Модель |
Нормированный R-квадрат |
(3) |
0,757683880132941 |
(6) |
0,748404306989435 |
Таким образом, при добавлении в уравнение регрессии фактора «город области» Х1 и фактора «число комнат в квартире» Х2 качество модели ухудшилось, что говорит в пользу удаления факторов Х1 и Х2 из модели.
Проведем дальнейшие расчеты.
Средние коэффициенты эластичности в случае линейной модели определяются формулами .
С помощью функции СРЗНАЧ найдем: =0.45,=2.6,=42.05, =101.24.
Тогда ,,
Следовательно, увеличение жилой площади Х4 при том же кол-ве комнат и городе области на 1% приводит к увеличению цены квартиры в среднем на 1,076%.
При изменении города области (Х1) и неизменной жилой площади и числе комнат в квартире цена квартиры увеличится в среднем на 0,03%.
При изменении числа комнат в квартире (Х2) и неизменной жилой площади и городе области цена уменьшается в среднем на 0,05%.
Бета-коэффициенты определяются по формулам: ,
где среднее квадратическое отклонение j – го фактора - .
,
С помощью функции СТАНДОТКЛОН найдем SX1= 0,504, SX2= 1,194, SX4=20.223; SY= 57,291.
Тогда ;;
Таким образом, при увеличении только фактора Х1 на одно свое стандартное отклонение результат Y увеличивается в среднем на 0.06 своего стандартного отклонения SY, при увеличении только фактора Х2 на одно его стандартное отклонение – уменьшается на 0,041 SY, при увеличении только фактора Х4 на одно его стандартное отклонение – увеличивается на 0,914 SY
Дельта-коэффициенты определяются формулами .
Найдем коэффициенты парной корреляции с использованием инструмента «Корреляция» пакета «Анализ данных» в Excel.
|
Y |
X1 |
X2 |
X4 |
Y |
1 |
|
|
|
X1 |
-0,01126 |
1 |
|
|
X2 |
0,751061 |
-0,0341 |
1 |
|
X4 |
0,874012 |
-0,0798 |
0,868524 |
1 |
Коэффициент детерминации был определен ранее и равен 0.7677.
Вычислим дельта-коэффициенты:
;
Поскольку Δ1<0 и Δ2<0, то факторные переменные Х1 и Х2 выбрана неудачно, и их нужно удалить из модели. Значит, по уравнению полученной линейной трехфакторной модели изменение результирующего фактора Y (цены квартиры) на 104% объясняется воздействием фактора Х4 (жилой площадью квартиры), на 4% воздействием фактора Х2 (число комнат), на 0,0859% воздействием фактора Х1 (город области).