Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Упражнения на гетероскедастичность

.doc
Скачиваний:
11
Добавлен:
10.02.2015
Размер:
93.7 Кб
Скачать

Упражнения по гетероскедастичности

  1. Известны данные (в у.е.) по доходам (Х) и расходам (Y) на непродовольственные товары для 30 домохозяйств:

X

26,2

33,1

42,5

47,0

48,5

49,0

49,1

50,9

52,4

53,2

Y

10,0

11,2

15,0

20,5

21,2

19,5

23,0

19,0

19,5

18,0

X

54,0

54,8

59,0

61,3

62,5

63,1

64,0

66,2

70,0

71,5

Y

24,5

21,5

35,4

25,0

17,3

21,6

15,3

32,6

34,0

23,8

X

73,2

75,4

76,0

80,6

81,2

83,3

92,0

95,5

103,2

110,4

Y

22,5

27,4

40,0

23,5

20,0

40,1

15,5

39,0

47,4

21,3

  1. Определить по МНК оценки параметров парного уравнения регрессии и оцените его статистическую значимость. Использовать пакет анализа (Сервис - Анализ данных - Регрессия) с выводом остатков.

  2. Примените к полученным в пункте a) результатам тест ранговой корреляции Спирмена, Он сводится к анализу статистической значимости коэффициента ранговой корреляции Спирмена:

Здесь - сумма квадратов разностей между рангами хi и рангами абсолютных величин остатков регрессии .

Поэтому сначала надо рассчитать ранги абсолютных величин остатков и ранги значений фактора.

Чтобы рассчитать ранги абсолютных величин остатков, надо предварительно все остатки регрессии скопировать на лист с исходными данными (рядом с ними), взять по абсолютному значению (математическая функция АBS) и воспользоваться статистической функцией РАНГ. В этой функции использовать только первые два аргумента: адрес ячейки со значением, для которого определяется ранг (в порядке убывания от 1 до n) и диапазон ячеек, среди которых этот ранг находится. Диапазон ячеек следует зафиксировать клавишей F4, чтобы было удобно протаскивать за маркер автозаполнения.

То же самое проделать со значениями фактора х.

Затем рассчитывается сумма квадратов разностей рангов.

Вычислить статистику Стьюдента коэффициента корреляции по формуле:

(для парной регрессии)

и сравнить с критическим значением t(, n-2) на уровне =0,05. (Использовать функцию СТЬЮДРАСПОБР). Отклоняется ли гипотеза , предполагающая отсутствие гетероскедастичности?

  1. Применить для указанных статистических данных ВНК, предполагая, что , и оценить новые значения тех же параметров. В этом случае уравнение регрессии запишется так:

При этом исходные переменные y, x пересчитываются в переменные y/x и 1/х, а параметры регрессии а и b меняются ролями: а из свободного члена превращается в коэффициент при новом факторе, а b из коэффициента переходит в свободный член. Это надо учитывать при получении параметров регрессии.

  1. Определить, как повлияла гетероскедастичность на качество оценок в уравнении, построенном по МНК. Сравнить статистики по первоначальным оценкам параметров и после преобразования переменных.

  1. Для предприятий некоторой отрасли анализируют заработную плату (Y) сотрудников в зависимости от масштаба (количества сотрудников) предприятия (Х). Наблюдения по 30 случайно отобранным предприятиям представлены следующей таблицей:

Y

X

75,5 75,5 77,5 78,5 80,0 81,0

100

80,5 82,0 84,5 85,0 85,5 86,5

200

85,5 88,5 90,0 91,0 95,0 96,0

300

93,0 93,5 97,5 99,0 102,5 105,0

400

102,0 105,5 107,0 110,5 115,0 118,5

500

  1. Построить уравнение регрессии Y на X и оценить его статистическую значимость.

  2. Проверьте наличие гетероскедастичности, используя тест Голдфелда-Квандта. Рекомендуется использовать разбиение, при котором k=12.

Предварительно все исходные данные отсортировать по возрастанию значений xi. (Фактически это уже сделано). Затем провести две отдельные регрессии: для первых 12 наблюдений в отсортированной выборке и для 12 последних. В обеих регрессиях рассчитать значения остаточных СКО (использовать таблицу дисперсионного анализа). Затем большее значение остаточной СКО разделить на меньшее, получить статистику:

(при условии, что первая подвыборка дает большее значение остаточной СКО). Эту статистику сравнить с критической статистикой Фишера на уровне =0,05 и числах степеней свободы . (Использовать функцию FРАСПОБР). Сделать вывод о том, отклоняется ли статистическая гипотеза , предполагающая отсутствие гетероскедастичности.

  1. Если гетероскедастичность имеет место, предположить, что дисперсии отклонений пропорциональны значениям Х, построить новое уравнение регрессии на основе этого преобразования:

Это предполагает преобразование исходных переменных делением их значений на квадратные корни соответствующих значений х. Кроме того, при запуске пакета анализа (инструмент Регрессия) следует иметь в иду, вместо одного фактора х в новой регрессии появятся два фактора: и . Поскольку оба параметра регрессии стали коэффициентами при новых факторах, свободный член в новой регрессии отсутствует, и это надо указать в окне диалога флажком Константа-ноль.

  1. Сравнить полученные в пунктах а) и с) статистические характеристики параметров регрессий..

  1. Проводится анализ зависимости средней заработной платы Y от средней производительности Х на предприятиях различного масштаба. Проведенное обследование нашло отражение в следующей таблице:

Количество сотрудников предприятия

Средняя производительность, $

Средняя зарплата, $

Стандартное отклонение зарплаты, $

1-4

9320

3320

740

4-9

8630

3640

850

10-19

8050

3900

730

20-49

8320

4120

830

50-99

8600

4090

950

100-199

9120

4200

1100

200-499

9540

4380

1250

500-999

9730

4500

1290

1000-1999

10120

4610

1350

2000-4999

10740

4800

1100

>5000

11200

5000

1520

    1. Построить уравнение регрессии , используя обычный МНК.

    2. В данном случае дисперсия считается известной, и это приводит к уравнению регрессии в виде:

П ровести регрессию в преобразованных переменных, учитывая, что здесь также свободный член отсутствует.

    1. Сравнить полученные результаты с точки зрения статистик параметров до и после преобразования переменных.. Какое из уравнений предпочтетительнее и почему?