Эконометрика_Практикум
.pdfGenerated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
2. Имеются данные газеты «Из рук в руки» о стоимости двухкомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 11.11.2010 г.
n |
y |
x |
1 |
1900 |
51 |
2 |
2160 |
62 |
3 |
2150 |
54 |
4 |
3650 |
73,7 |
5 |
3900 |
74 |
6 |
2520 |
54 |
7 |
2100 |
52 |
8 |
2080 |
52 |
9 |
1600 |
46 |
10 |
2750 |
61,4 |
11 |
1880 |
50,4 |
12 |
2070 |
50 |
13 |
3550 |
50 |
14 |
1500 |
43 |
15 |
2250 |
54 |
16 |
3500 |
69 |
17 |
1470 |
46 |
18 |
2100 |
54 |
19 |
1890 |
43,5 |
20 |
2300 |
54,1 |
21 |
2140 |
44 |
22 |
2350 |
54 |
23 |
3490 |
67 |
24 |
2180 |
50 |
25 |
2450 |
54 |
26 |
2150 |
53 |
27 |
2150 |
50,5 |
28 |
1970 |
51 |
29 |
2270 |
50 |
30 |
2270 |
56 |
31 |
2050 |
50 |
32 |
1580 |
45 |
33 |
1600 |
45 |
34 |
2900 |
78 |
35 |
2200 |
51,3 |
36 |
5900 |
72 |
37 |
3550 |
72 |
38 |
2990 |
56 |
39 |
1750 |
47 |
40 |
1460 |
45 |
n - № п/п.
y – цена, тыс.руб.
x – общий метраж, кв.м.
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Построить поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.
4)Рассчитать параметры уравнения линейной регрессии (Y от Х).
5)Оценить общее качество полученного уравнения.
6)Рассчитать F- статистику.
7)Проверить значимость коэффициентов уравнения.
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод.
10)Спрогнозировать цену квартиры общей площадью 75 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.
31
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
3. Имеются данные газеты «Из рук в руки» о стоимости однокомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 01.11.2010 г.
n |
y |
x |
1 |
1430 |
18 |
2 |
2400 |
22 |
3 |
1800 |
17 |
4 |
1500 |
16,7 |
5 |
1550 |
19 |
6 |
1630 |
18 |
7 |
1600 |
17 |
8 |
1750 |
19 |
9 |
1210 |
18 |
10 |
1400 |
19 |
11 |
1450 |
18,5 |
12 |
1550 |
18 |
13 |
1380 |
19 |
14 |
1330 |
19 |
15 |
1890 |
16 |
16 |
2300 |
19 |
17 |
1650 |
17 |
18 |
1550 |
18 |
19 |
1640 |
19 |
20 |
1650 |
20 |
21 |
1480 |
17 |
22 |
1500 |
21 |
23 |
1460 |
17,1 |
24 |
1575 |
20 |
25 |
1550 |
17,4 |
26 |
1430 |
17 |
27 |
1435 |
18,5 |
28 |
1460 |
18 |
29 |
1498 |
17,2 |
30 |
1550 |
17,4 |
31 |
2100 |
25 |
32 |
1850 |
21,4 |
33 |
1350 |
15,3 |
34 |
1400 |
16,7 |
35 |
1390 |
15 |
36 |
1500 |
17 |
37 |
1550 |
18 |
38 |
1460 |
18 |
39 |
1900 |
19 |
40 |
1550 |
17,9 |
n - № п/п.
y – цена, тыс.руб.
x – жилая площадь, кв.м.
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Построить поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.
4)Рассчитать параметры уравнения линейной регрессии (Y от Х).
5)Оценить общее качество полученного уравнения.
6)Рассчитать F- статистику.
7)Проверить значимость коэффициентов уравнения.
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод.
10)Спрогнозировать цену квартиры с жилой площадью 24 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.
32
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
4. Имеются данные газеты «Из рук в руки» о стоимости двухкомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 11.11.2010 г.
n |
y |
x |
1 |
1900 |
30 |
2 |
2160 |
35 |
3 |
2150 |
28 |
4 |
3650 |
39,2 |
5 |
3900 |
42,5 |
6 |
2520 |
32 |
7 |
2100 |
28 |
8 |
2080 |
30 |
9 |
1600 |
29 |
10 |
2750 |
36 |
11 |
1880 |
29,4 |
12 |
2070 |
29 |
13 |
3550 |
26 |
14 |
1500 |
29 |
15 |
2250 |
30 |
16 |
3500 |
33 |
17 |
1470 |
32 |
18 |
2100 |
28 |
19 |
1890 |
26,1 |
20 |
2300 |
28,3 |
21 |
2140 |
29 |
22 |
2350 |
32 |
23 |
3490 |
40 |
24 |
2180 |
30 |
25 |
2450 |
32 |
26 |
2150 |
30 |
27 |
2150 |
29,3 |
28 |
1970 |
29,1 |
29 |
2270 |
30 |
30 |
2270 |
35 |
31 |
2050 |
30 |
32 |
1580 |
29 |
33 |
1600 |
29,5 |
34 |
2900 |
42 |
35 |
2200 |
30 |
36 |
5900 |
42 |
37 |
3550 |
35 |
38 |
2990 |
30 |
39 |
1750 |
33,2 |
40 |
1460 |
28 |
n - № п/п.
y – цена, тыс.руб.
x – жилая площадь, кв.м.
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Построить поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.
4)Рассчитать параметры уравнения линейной регрессии (Y от Х).
5)Оценить общее качество полученного уравнения.
6)Рассчитать F- статистику.
7)Проверить значимость коэффициентов уравнения.
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод.
10)Спрогнозировать цену квартиры с жилой площадью 45 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.
33
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
5. Имеются данные газеты «Из рук в руки» о стоимости однокомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 01.11.2010 г.
n |
y |
x |
1 |
1430 |
8 |
2 |
2400 |
15 |
3 |
1800 |
11,5 |
4 |
1500 |
5,6 |
5 |
1550 |
9 |
6 |
1630 |
6,8 |
7 |
1600 |
8 |
8 |
1750 |
9 |
9 |
1210 |
5,6 |
10 |
1400 |
6 |
11 |
1450 |
6,6 |
12 |
1550 |
6 |
13 |
1380 |
8 |
14 |
1330 |
5 |
15 |
1890 |
13 |
16 |
2300 |
13,3 |
17 |
1650 |
8 |
18 |
1550 |
14,2 |
19 |
1640 |
7 |
20 |
1650 |
10 |
21 |
1480 |
8 |
22 |
1500 |
8 |
23 |
1460 |
8 |
24 |
1575 |
6,5 |
25 |
1550 |
7,5 |
26 |
1430 |
8 |
27 |
1435 |
8 |
28 |
1460 |
7,8 |
29 |
1498 |
7,9 |
30 |
1550 |
8,5 |
31 |
2100 |
9 |
32 |
1850 |
9,2 |
33 |
1350 |
6,8 |
34 |
1400 |
5,5 |
35 |
1390 |
8,5 |
36 |
1500 |
6 |
37 |
1550 |
7,8 |
38 |
1460 |
6,5 |
39 |
1900 |
13 |
40 |
1550 |
8,9 |
n - № п/п.
y – цена, тыс.руб.
x – площадь кухни, кв.м.
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Построить поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.
4)Рассчитать параметры уравнения линейной регрессии (Y от Х).
5)Оценить общее качество полученного уравнения.
6)Рассчитать F- статистику.
7)Проверить значимость коэффициентов уравнения.
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод.
10)Спрогнозировать цену квартиры, в которой площадь кухни составляет 17 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.
34
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
6. Имеются данные газеты «Из рук в руки» о стоимости двухкомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 11.11.2010 г.
n |
y |
x |
1 |
1900 |
9 |
2 |
2160 |
8 |
3 |
2150 |
9 |
4 |
3650 |
13,8 |
5 |
3900 |
11,4 |
6 |
2520 |
9 |
7 |
2100 |
8,8 |
8 |
2080 |
8 |
9 |
1600 |
6 |
10 |
2750 |
10 |
11 |
1880 |
8,3 |
12 |
2070 |
8,4 |
13 |
3550 |
12 |
14 |
1500 |
6 |
15 |
2250 |
9 |
16 |
3500 |
20 |
17 |
1470 |
6 |
18 |
2100 |
9,5 |
19 |
1890 |
5,6 |
20 |
2300 |
9,1 |
21 |
2140 |
6 |
22 |
2350 |
9 |
23 |
3490 |
12 |
24 |
2180 |
9 |
25 |
2450 |
9 |
26 |
2150 |
9 |
27 |
2150 |
8,6 |
28 |
1970 |
8,5 |
29 |
2270 |
8,5 |
30 |
2270 |
8 |
31 |
2050 |
9 |
32 |
1580 |
6 |
33 |
1600 |
6 |
34 |
2900 |
12,8 |
35 |
2200 |
9 |
36 |
5900 |
12 |
37 |
3550 |
13 |
38 |
2990 |
12 |
39 |
1750 |
6 |
40 |
1460 |
6 |
n - № п/п.
y – цена, тыс.руб.
x – площадь кухни, кв.м.
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Построить поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.
4)Рассчитать параметры уравнения линейной регрессии (Y от Х).
5)Оценить общее качество полученного уравнения.
6)Рассчитать F- статистику.
7)Проверить значимость коэффициентов уравнения.
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод.
10)Спрогнозировать цену квартиры, в которой площадь кухни составляет 15 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.
35
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Контрольные задания (домашняя контрольная работа):
Для анализа зависимости объема потребления y (у.е.) домохозяйства
от располагаемого дохода x (у.е.) отобрана выборка объема n 12 (помесячно в течение года), результаты которой приведены в таблице:
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
100 k1 |
109 |
110 |
113 |
120 |
122 |
123 |
120 k2 |
136 |
140 |
145 |
150 |
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
102 |
105 |
100 k2 |
110 |
100 2k2 |
110 k1 |
119 |
125 |
132 |
130 |
141 |
140 2k1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
(где k1 – число букв в полном имени студента, k2 – число букв в фамилии)
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Проверить свое предположение, построив поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффици-
ента корреляции.
4)Рассчитать параметры уравнения линейной регрессии y на x .
5)Оценить общее качество полученного уравнения.
6)Проверить значимость уравнения в целом, используя F- статистику.
7)Проверить значимость коэффициентов уравнения (t – статистики).
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод по построенной модели.
10)Спрогнозировать значение объема потребления, если прогнозное значение располагаемого дохода составит 120% от его средней величины.
Рассчитать 95%-й доверительный интервал для данного предсказания.
Семинары 5-6. Проверка гомоскедастичности ошибок регрессии.
Тест Гольдфельда–Квандта
Решение типовых задач:
Пример. В таблице приведены данные о поступлении доходов в бюд-
жет города N (у – млрд. руб.) в зависимости от численности работающих на крупных и средних предприятиях (х – тыс. чел.) экономики районов за 2005г.
36
|
Generated by Foxit PDF Creator © Foxit Software |
||
|
http://www.foxitsoftware.com |
For evaluation only. |
|
|
|
|
|
Район города |
х |
|
у |
|
|
|
|
1 |
5 |
|
6,4 |
|
|
|
|
2 |
8 |
|
10,1 |
|
|
|
|
3 |
10 |
|
14,9 |
|
|
|
|
4 |
20 |
|
22,8 |
|
|
|
|
5 |
22 |
|
17,5 |
|
|
|
|
6 |
25 |
|
30,8 |
|
|
|
|
7 |
41 |
|
39,5 |
|
|
|
|
8 |
51 |
|
50,7 |
|
|
|
|
9 |
62 |
|
70,6 |
|
|
|
|
10 |
76 |
|
106,6 |
|
|
|
|
11 |
81 |
|
92,5 |
|
|
|
|
12 |
97 |
|
90,3 |
|
|
|
|
13 |
108 |
|
134,4 |
|
|
|
|
14 |
114 |
|
124 |
|
|
|
|
15 |
117 |
|
101,1 |
|
|
|
|
16 |
127 |
|
116,2 |
|
|
|
|
17 |
134 |
|
152,6 |
|
|
|
|
18 |
151 |
|
158,1 |
|
|
|
|
19 |
159 |
|
211,5 |
|
|
|
|
20 |
284 |
|
344,9 |
|
|
|
|
Требуется:
1)Построить уравнение линейной регрессии y a b x e .
2)Оценить качество построенного уравнения.
3)Проверить наличие гетероскедастичности, используя:
А) графический анализ ошибок регрессии; Б) параметрический тест Гольдфельда–Квандта.
4) Предложить преобразование, чтобы получить несмещённые, состоятельные и эффективные оценки, в предположении о том, что гетероскедастичность имеет место и дисперсии отклонений пропорциональны значениям
х.
37
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Решение: |
|
|
|
|
|
|
|
1) Построим корреляционное поле: |
|
|
|
||||
|
Зависимость поступлений в бюджет города от |
|
|||||
|
|
численности работающих на предприятии |
|
||||
|
400 |
|
|
|
|
|
|
бюджет |
350 |
|
|
y = 1,1785x - 4,9221 |
|
||
|
|
|
|
||||
300 |
|
|
|
|
|
|
|
250 |
|
|
|
|
|
|
|
в |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Поступления |
200 |
|
|
|
|
|
|
150 |
|
|
|
|
|
|
|
100 |
|
|
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
250 |
300 |
|
|
|
Численность работающих |
|
|
Вывод: Анализ графика показывает наличие сильной линейной зависимости между поступлениями доходов в бюджет города и численностью работающих на крупных и средних предприятиях
Оценим параметры уравнения линейной зависимости поступлений доходов в бюджет города от численности работающих на крупных и средних предприятиях, используя Пакет анализа РЕГРЕССИЯ.
Результаты будут следующими: Уравнение регрессии:
y4,9221 1,1785 x
2)Проведём краткий анализ качества полученного уравнения: y 4,9221 1,1785 x
Sa,b [5,625] [0,052] ta,b ( 0,875) (22,598)
R2 0,964; F 510,68.
Коэффициент детерминации R2 свидетельствует о высокой доле объяснённой дисперсии (96,4%) зависимой переменной.
Величина F–критерия свидетельствует о значимости уравнения в целом, то есть о наличии значимой статистической связи между переменными (уровень значимости 1,158Е 14 0,001).
Значения t–статистик для оценок коэффициентов уравнения могут свидетельствовать о значимом отличии от нуля коэффициента регрессии b (зна-
38
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
чимость 1,158Е 14 0,001) и о возможности исключения из уравнения свободного члена а (значимость 0,393 0,1).
Таким образом, можно сделать вывод о хорошем качестве построенного уравнения и о возможности его переоценки на тех же данных с исключением из него свободного члена.
3) В соответствии с четвёртой предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки еi имеют одинаковую дисперсию 2 . Если это
условие применения МНК не соблюдается, то имеет место гетероскедастичность.
Для оценки гетероскедастичности можно использовать: А) графический анализ ошибок регрессии; Б) параметрический тест Гольдфельда–Квандта.
А) Проведём графический анализ остатков. |
|
|
|
|||||
Для этого построим график зависимости остатков еi |
от значений неза- |
|||||||
висимой переменной хi . |
|
|
|
|
|
|
||
|
|
|
График остатков |
|
|
|
|
|
|
40 |
|
|
|
|
|
|
|
Остатки |
20 |
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
0 |
50 |
100 |
150 |
200 |
250 |
300 |
|
|
|
-20 |
|
|
|
|
|
|
|
|
-40 |
|
|
|
|
|
|
|
|
|
|
Переменная Х |
|
|
|
Замечания:
1.Этот график был получен в Пакете анализа РЕГРЕССИЯ.
2.В случае множественной регрессии при большом числе объясняющих переменных рекомендуется использовать график зависимости остатков
еi от теоретических значений результативного признака |
|
yx . |
Вывод: График остатков показывает увеличение дисперсии ошибок регрессии с ростом значений x . Таким образом, в данной задаче можно предположить наличие гетероскедастичности (предпосылка МНК нарушена).
Б) Для оценки гетероскедастичности может использоваться парамет-
рический тест (критерий) Гольдфельда – Квандта:
39
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Все наблюдения в выборке упорядочим по величине x. В нашей задаче данные упорядочены.
Замечание. Если данные неупорядочены, то выделите столбцы с данными; в главном меню выберете Данные/Сортировка по х или на панели инструментов Стандартная нажмите на кнопку Сортировка по возрастанию.
Всю упорядоченную выборку разобьём на три подвыборки (объё-
мом k, С, k), где С 4 k n C 20 4 8.
2 2
Исключим из рассмотрения С центральных наблюдений.
Замечание. По рекомендациям специалистов, объём исключаемых данных С должен быть примерно равен четверти общего объёма выборки n, в
частности, при n =20, С=4; при n =30, С = 8; при n =60, С=16.
Оценим отдельные регрессии для первой подвыборки (8 первых наблюдений) и для последней подвыборки (8 последних наблюдений).
Для 1-8 наблюдений имеем: |
y 3,136 0,921 x . |
|
Для наблюдений 13-20: |
y 31,817 1,338 x . |
|
Определим остаточные |
суммы квадратов |
для первой |
8 |
20 |
|
S1 ei2 68,642 и второй групп S2 ei2 2639,312.
i 1 |
S2 S1 , |
|
i 13 |
|
|
|
|||
Т.к. |
следовательно, предположение о |
|
пропорциональности |
||||||
дисперсий отклонений значениям x верно. |
|
|
|
||||||
Выдвинем |
нулевую гипотезу H 0 : е2 |
е2 |
... е2 |
, которая |
|||||
|
|
|
|
|
1 |
2 |
п |
|
|
предполагает отсутствие гетероскедастичности, т.е. гомоскедастичность. |
|||||||||
Для проверки этой гипотезы рассчитаем отношение |
|
||||||||
F |
|
S2 |
|
2639,312 |
38,45, |
|
|
|
|
|
|
|
|
|
|||||
набл |
|
S1 |
68,642 |
|
|
|
|
||
|
|
|
|
|
|
||||
которое имеет распределение Фишера с k m 1;k m 1 |
степенями |
свободы (здесь m – число объясняющих переменных). Определим критиче-
ское значение |
F–критерия, |
воспользовавшись встроенной |
функцией |
||
FРАСПОБР. |
|
|
0,01, |
|
|
Выберем |
уровень |
значимости |
тогда |
получим |
Fкрит (0,01; 6; 6) 8,466 .
Так как Fнабл 38,45 Fкр 8,466, то гипотеза об отсутствии гетероскеда-
стичности отклоняется при выбранном уровне значимости.
Вывод. Таким образом, можно сделать вывод о том, что четвёртая предпосылка МНК действительно нарушена, и имеет место гетероскедастичность.
40