Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика_Практикум

.pdf
Скачиваний:
80
Добавлен:
01.06.2015
Размер:
820.09 Кб
Скачать

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

2. Имеются данные газеты «Из рук в руки» о стоимости двухкомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 11.11.2010 г.

n

y

x

1

1900

51

2

2160

62

3

2150

54

4

3650

73,7

5

3900

74

6

2520

54

7

2100

52

8

2080

52

9

1600

46

10

2750

61,4

11

1880

50,4

12

2070

50

13

3550

50

14

1500

43

15

2250

54

16

3500

69

17

1470

46

18

2100

54

19

1890

43,5

20

2300

54,1

21

2140

44

22

2350

54

23

3490

67

24

2180

50

25

2450

54

26

2150

53

27

2150

50,5

28

1970

51

29

2270

50

30

2270

56

31

2050

50

32

1580

45

33

1600

45

34

2900

78

35

2200

51,3

36

5900

72

37

3550

72

38

2990

56

39

1750

47

40

1460

45

n - № п/п.

y – цена, тыс.руб.

x – общий метраж, кв.м.

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Построить поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии (Y от Х).

5)Оценить общее качество полученного уравнения.

6)Рассчитать F- статистику.

7)Проверить значимость коэффициентов уравнения.

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод.

10)Спрогнозировать цену квартиры общей площадью 75 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.

31

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

3. Имеются данные газеты «Из рук в руки» о стоимости однокомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 01.11.2010 г.

n

y

x

1

1430

18

2

2400

22

3

1800

17

4

1500

16,7

5

1550

19

6

1630

18

7

1600

17

8

1750

19

9

1210

18

10

1400

19

11

1450

18,5

12

1550

18

13

1380

19

14

1330

19

15

1890

16

16

2300

19

17

1650

17

18

1550

18

19

1640

19

20

1650

20

21

1480

17

22

1500

21

23

1460

17,1

24

1575

20

25

1550

17,4

26

1430

17

27

1435

18,5

28

1460

18

29

1498

17,2

30

1550

17,4

31

2100

25

32

1850

21,4

33

1350

15,3

34

1400

16,7

35

1390

15

36

1500

17

37

1550

18

38

1460

18

39

1900

19

40

1550

17,9

n - № п/п.

y – цена, тыс.руб.

x – жилая площадь, кв.м.

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Построить поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии (Y от Х).

5)Оценить общее качество полученного уравнения.

6)Рассчитать F- статистику.

7)Проверить значимость коэффициентов уравнения.

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод.

10)Спрогнозировать цену квартиры с жилой площадью 24 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.

32

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

4. Имеются данные газеты «Из рук в руки» о стоимости двухкомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 11.11.2010 г.

n

y

x

1

1900

30

2

2160

35

3

2150

28

4

3650

39,2

5

3900

42,5

6

2520

32

7

2100

28

8

2080

30

9

1600

29

10

2750

36

11

1880

29,4

12

2070

29

13

3550

26

14

1500

29

15

2250

30

16

3500

33

17

1470

32

18

2100

28

19

1890

26,1

20

2300

28,3

21

2140

29

22

2350

32

23

3490

40

24

2180

30

25

2450

32

26

2150

30

27

2150

29,3

28

1970

29,1

29

2270

30

30

2270

35

31

2050

30

32

1580

29

33

1600

29,5

34

2900

42

35

2200

30

36

5900

42

37

3550

35

38

2990

30

39

1750

33,2

40

1460

28

n - № п/п.

y – цена, тыс.руб.

x – жилая площадь, кв.м.

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Построить поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии (Y от Х).

5)Оценить общее качество полученного уравнения.

6)Рассчитать F- статистику.

7)Проверить значимость коэффициентов уравнения.

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод.

10)Спрогнозировать цену квартиры с жилой площадью 45 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.

33

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

5. Имеются данные газеты «Из рук в руки» о стоимости однокомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 01.11.2010 г.

n

y

x

1

1430

8

2

2400

15

3

1800

11,5

4

1500

5,6

5

1550

9

6

1630

6,8

7

1600

8

8

1750

9

9

1210

5,6

10

1400

6

11

1450

6,6

12

1550

6

13

1380

8

14

1330

5

15

1890

13

16

2300

13,3

17

1650

8

18

1550

14,2

19

1640

7

20

1650

10

21

1480

8

22

1500

8

23

1460

8

24

1575

6,5

25

1550

7,5

26

1430

8

27

1435

8

28

1460

7,8

29

1498

7,9

30

1550

8,5

31

2100

9

32

1850

9,2

33

1350

6,8

34

1400

5,5

35

1390

8,5

36

1500

6

37

1550

7,8

38

1460

6,5

39

1900

13

40

1550

8,9

n - № п/п.

y – цена, тыс.руб.

x – площадь кухни, кв.м.

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Построить поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии (Y от Х).

5)Оценить общее качество полученного уравнения.

6)Рассчитать F- статистику.

7)Проверить значимость коэффициентов уравнения.

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод.

10)Спрогнозировать цену квартиры, в которой площадь кухни составляет 17 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.

34

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

6. Имеются данные газеты «Из рук в руки» о стоимости двухкомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 11.11.2010 г.

n

y

x

1

1900

9

2

2160

8

3

2150

9

4

3650

13,8

5

3900

11,4

6

2520

9

7

2100

8,8

8

2080

8

9

1600

6

10

2750

10

11

1880

8,3

12

2070

8,4

13

3550

12

14

1500

6

15

2250

9

16

3500

20

17

1470

6

18

2100

9,5

19

1890

5,6

20

2300

9,1

21

2140

6

22

2350

9

23

3490

12

24

2180

9

25

2450

9

26

2150

9

27

2150

8,6

28

1970

8,5

29

2270

8,5

30

2270

8

31

2050

9

32

1580

6

33

1600

6

34

2900

12,8

35

2200

9

36

5900

12

37

3550

13

38

2990

12

39

1750

6

40

1460

6

n - № п/п.

y – цена, тыс.руб.

x – площадь кухни, кв.м.

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Построить поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии (Y от Х).

5)Оценить общее качество полученного уравнения.

6)Рассчитать F- статистику.

7)Проверить значимость коэффициентов уравнения.

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод.

10)Спрогнозировать цену квартиры, в которой площадь кухни составляет 15 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.

35

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Контрольные задания (домашняя контрольная работа):

Для анализа зависимости объема потребления y (у.е.) домохозяйства

от располагаемого дохода x (у.е.) отобрана выборка объема n 12 (помесячно в течение года), результаты которой приведены в таблице:

 

1

2

3

4

5

6

7

8

9

10

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

x

100 k1

109

110

113

120

122

123

120 k2

136

140

145

150

 

 

 

 

 

 

 

 

 

 

 

 

 

y

102

105

100 k2

110

100 2k2

110 k1

119

125

132

130

141

140 2k1

 

 

 

 

 

 

 

 

 

 

 

 

 

(где k1 число букв в полном имени студента, k2 – число букв в фамилии)

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Проверить свое предположение, построив поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффици-

ента корреляции.

4)Рассчитать параметры уравнения линейной регрессии y на x .

5)Оценить общее качество полученного уравнения.

6)Проверить значимость уравнения в целом, используя F- статистику.

7)Проверить значимость коэффициентов уравнения (t – статистики).

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод по построенной модели.

10)Спрогнозировать значение объема потребления, если прогнозное значение располагаемого дохода составит 120% от его средней величины.

Рассчитать 95%-й доверительный интервал для данного предсказания.

Семинары 5-6. Проверка гомоскедастичности ошибок регрессии.

Тест Гольдфельда–Квандта

Решение типовых задач:

Пример. В таблице приведены данные о поступлении доходов в бюд-

жет города N (у – млрд. руб.) в зависимости от численности работающих на крупных и средних предприятиях (х – тыс. чел.) экономики районов за 2005г.

36

 

Generated by Foxit PDF Creator © Foxit Software

 

http://www.foxitsoftware.com

For evaluation only.

 

 

 

 

Район города

х

 

у

 

 

 

 

1

5

 

6,4

 

 

 

 

2

8

 

10,1

 

 

 

 

3

10

 

14,9

 

 

 

 

4

20

 

22,8

 

 

 

 

5

22

 

17,5

 

 

 

 

6

25

 

30,8

 

 

 

 

7

41

 

39,5

 

 

 

 

8

51

 

50,7

 

 

 

 

9

62

 

70,6

 

 

 

 

10

76

 

106,6

 

 

 

 

11

81

 

92,5

 

 

 

 

12

97

 

90,3

 

 

 

 

13

108

 

134,4

 

 

 

 

14

114

 

124

 

 

 

 

15

117

 

101,1

 

 

 

 

16

127

 

116,2

 

 

 

 

17

134

 

152,6

 

 

 

 

18

151

 

158,1

 

 

 

 

19

159

 

211,5

 

 

 

 

20

284

 

344,9

 

 

 

 

Требуется:

1)Построить уравнение линейной регрессии y a b x e .

2)Оценить качество построенного уравнения.

3)Проверить наличие гетероскедастичности, используя:

А) графический анализ ошибок регрессии; Б) параметрический тест Гольдфельда–Квандта.

4) Предложить преобразование, чтобы получить несмещённые, состоятельные и эффективные оценки, в предположении о том, что гетероскедастичность имеет место и дисперсии отклонений пропорциональны значениям

х.

37

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Решение:

 

 

 

 

 

 

1) Построим корреляционное поле:

 

 

 

 

Зависимость поступлений в бюджет города от

 

 

 

численности работающих на предприятии

 

 

400

 

 

 

 

 

 

бюджет

350

 

 

y = 1,1785x - 4,9221

 

 

 

 

 

300

 

 

 

 

 

 

250

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

Поступления

200

 

 

 

 

 

 

150

 

 

 

 

 

 

100

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0

50

100

150

200

250

300

 

 

 

Численность работающих

 

 

Вывод: Анализ графика показывает наличие сильной линейной зависимости между поступлениями доходов в бюджет города и численностью работающих на крупных и средних предприятиях

Оценим параметры уравнения линейной зависимости поступлений доходов в бюджет города от численности работающих на крупных и средних предприятиях, используя Пакет анализа РЕГРЕССИЯ.

Результаты будут следующими: Уравнение регрессии:

y4,9221 1,1785 x

2)Проведём краткий анализ качества полученного уравнения: y 4,9221 1,1785 x

Sa,b [5,625] [0,052] ta,b ( 0,875) (22,598)

R2 0,964; F 510,68.

Коэффициент детерминации R2 свидетельствует о высокой доле объяснённой дисперсии (96,4%) зависимой переменной.

Величина F–критерия свидетельствует о значимости уравнения в целом, то есть о наличии значимой статистической связи между переменными (уровень значимости 1,158Е 14 0,001).

Значения t–статистик для оценок коэффициентов уравнения могут свидетельствовать о значимом отличии от нуля коэффициента регрессии b (зна-

38

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

чимость 1,158Е 14 0,001) и о возможности исключения из уравнения свободного члена а (значимость 0,393 0,1).

Таким образом, можно сделать вывод о хорошем качестве построенного уравнения и о возможности его переоценки на тех же данных с исключением из него свободного члена.

3) В соответствии с четвёртой предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xj остатки еi имеют одинаковую дисперсию 2 . Если это

условие применения МНК не соблюдается, то имеет место гетероскедастичность.

Для оценки гетероскедастичности можно использовать: А) графический анализ ошибок регрессии; Б) параметрический тест Гольдфельда–Квандта.

А) Проведём графический анализ остатков.

 

 

 

Для этого построим график зависимости остатков еi

от значений неза-

висимой переменной хi .

 

 

 

 

 

 

 

 

 

График остатков

 

 

 

 

 

40

 

 

 

 

 

 

 

Остатки

20

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0

50

100

150

200

250

300

 

 

-20

 

 

 

 

 

 

 

 

-40

 

 

 

 

 

 

 

 

 

 

Переменная Х

 

 

 

Замечания:

1.Этот график был получен в Пакете анализа РЕГРЕССИЯ.

2.В случае множественной регрессии при большом числе объясняющих переменных рекомендуется использовать график зависимости остатков

еi от теоретических значений результативного признака

 

yx .

Вывод: График остатков показывает увеличение дисперсии ошибок регрессии с ростом значений x . Таким образом, в данной задаче можно предположить наличие гетероскедастичности (предпосылка МНК нарушена).

Б) Для оценки гетероскедастичности может использоваться парамет-

рический тест (критерий) Гольдфельда – Квандта:

39

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Все наблюдения в выборке упорядочим по величине x. В нашей задаче данные упорядочены.

Замечание. Если данные неупорядочены, то выделите столбцы с данными; в главном меню выберете Данные/Сортировка по х или на панели инструментов Стандартная нажмите на кнопку Сортировка по возрастанию.

Всю упорядоченную выборку разобьём на три подвыборки (объё-

мом k, С, k), где С 4 k n C 20 4 8.

2 2

Исключим из рассмотрения С центральных наблюдений.

Замечание. По рекомендациям специалистов, объём исключаемых данных С должен быть примерно равен четверти общего объёма выборки n, в

частности, при n =20, С=4; при n =30, С = 8; при n =60, С=16.

Оценим отдельные регрессии для первой подвыборки (8 первых наблюдений) и для последней подвыборки (8 последних наблюдений).

Для 1-8 наблюдений имеем:

y 3,136 0,921 x .

 

Для наблюдений 13-20:

y 31,817 1,338 x .

 

Определим остаточные

суммы квадратов

для первой

8

20

 

S1 ei2 68,642 и второй групп S2 ei2 2639,312.

i 1

S2 S1 ,

 

i 13

 

 

 

Т.к.

следовательно, предположение о

 

пропорциональности

дисперсий отклонений значениям x верно.

 

 

 

Выдвинем

нулевую гипотезу H 0 : е2

е2

... е2

, которая

 

 

 

 

 

1

2

п

 

предполагает отсутствие гетероскедастичности, т.е. гомоскедастичность.

Для проверки этой гипотезы рассчитаем отношение

 

F

 

S2

 

2639,312

38,45,

 

 

 

 

 

 

 

 

набл

 

S1

68,642

 

 

 

 

 

 

 

 

 

 

которое имеет распределение Фишера с k m 1;k m 1

степенями

свободы (здесь m – число объясняющих переменных). Определим критиче-

ское значение

F–критерия,

воспользовавшись встроенной

функцией

FРАСПОБР.

 

 

0,01,

 

 

Выберем

уровень

значимости

тогда

получим

Fкрит (0,01; 6; 6) 8,466 .

Так как Fнабл 38,45 Fкр 8,466, то гипотеза об отсутствии гетероскеда-

стичности отклоняется при выбранном уровне значимости.

Вывод. Таким образом, можно сделать вывод о том, что четвёртая предпосылка МНК действительно нарушена, и имеет место гетероскедастичность.

40