Упражнения на гетероскедастичность
.docУпражнения по гетероскедастичности
-
Известны данные (в у.е.) по доходам (Х) и расходам (Y) на непродовольственные товары для 30 домохозяйств:
X |
26,2 |
33,1 |
42,5 |
47,0 |
48,5 |
49,0 |
49,1 |
50,9 |
52,4 |
53,2 |
Y |
10,0 |
11,2 |
15,0 |
20,5 |
21,2 |
19,5 |
23,0 |
19,0 |
19,5 |
18,0 |
X |
54,0 |
54,8 |
59,0 |
61,3 |
62,5 |
63,1 |
64,0 |
66,2 |
70,0 |
71,5 |
Y |
24,5 |
21,5 |
35,4 |
25,0 |
17,3 |
21,6 |
15,3 |
32,6 |
34,0 |
23,8 |
X |
73,2 |
75,4 |
76,0 |
80,6 |
81,2 |
83,3 |
92,0 |
95,5 |
103,2 |
110,4 |
Y |
22,5 |
27,4 |
40,0 |
23,5 |
20,0 |
40,1 |
15,5 |
39,0 |
47,4 |
21,3 |
-
Определить по МНК оценки параметров парного уравнения регрессии и оцените его статистическую значимость. Использовать пакет анализа (Сервис - Анализ данных - Регрессия) с выводом остатков.
-
Примените к полученным в пункте a) результатам тест ранговой корреляции Спирмена, Он сводится к анализу статистической значимости коэффициента ранговой корреляции Спирмена:
Здесь - сумма квадратов разностей между рангами хi и рангами абсолютных величин остатков регрессии .
Поэтому сначала надо рассчитать ранги абсолютных величин остатков и ранги значений фактора.
Чтобы рассчитать ранги абсолютных величин остатков, надо предварительно все остатки регрессии скопировать на лист с исходными данными (рядом с ними), взять по абсолютному значению (математическая функция АBS) и воспользоваться статистической функцией РАНГ. В этой функции использовать только первые два аргумента: адрес ячейки со значением, для которого определяется ранг (в порядке убывания от 1 до n) и диапазон ячеек, среди которых этот ранг находится. Диапазон ячеек следует зафиксировать клавишей F4, чтобы было удобно протаскивать за маркер автозаполнения.
То же самое проделать со значениями фактора х.
Затем рассчитывается сумма квадратов разностей рангов.
Вычислить статистику Стьюдента коэффициента корреляции по формуле:
(для парной регрессии)
и сравнить с критическим значением t(, n-2) на уровне =0,05. (Использовать функцию СТЬЮДРАСПОБР). Отклоняется ли гипотеза , предполагающая отсутствие гетероскедастичности?
-
Применить для указанных статистических данных ВНК, предполагая, что , и оценить новые значения тех же параметров. В этом случае уравнение регрессии запишется так:
При этом исходные переменные y, x пересчитываются в переменные y/x и 1/х, а параметры регрессии а и b меняются ролями: а из свободного члена превращается в коэффициент при новом факторе, а b из коэффициента переходит в свободный член. Это надо учитывать при получении параметров регрессии.
-
Определить, как повлияла гетероскедастичность на качество оценок в уравнении, построенном по МНК. Сравнить статистики по первоначальным оценкам параметров и после преобразования переменных.
-
Для предприятий некоторой отрасли анализируют заработную плату (Y) сотрудников в зависимости от масштаба (количества сотрудников) предприятия (Х). Наблюдения по 30 случайно отобранным предприятиям представлены следующей таблицей:
Y |
X |
75,5 75,5 77,5 78,5 80,0 81,0 |
100 |
80,5 82,0 84,5 85,0 85,5 86,5 |
200 |
85,5 88,5 90,0 91,0 95,0 96,0 |
300 |
93,0 93,5 97,5 99,0 102,5 105,0 |
400 |
102,0 105,5 107,0 110,5 115,0 118,5 |
500 |
-
Построить уравнение регрессии Y на X и оценить его статистическую значимость.
-
Проверьте наличие гетероскедастичности, используя тест Голдфелда-Квандта. Рекомендуется использовать разбиение, при котором k=12.
Предварительно все исходные данные отсортировать по возрастанию значений xi. (Фактически это уже сделано). Затем провести две отдельные регрессии: для первых 12 наблюдений в отсортированной выборке и для 12 последних. В обеих регрессиях рассчитать значения остаточных СКО (использовать таблицу дисперсионного анализа). Затем большее значение остаточной СКО разделить на меньшее, получить статистику:
(при условии, что первая подвыборка дает большее значение остаточной СКО). Эту статистику сравнить с критической статистикой Фишера на уровне =0,05 и числах степеней свободы . (Использовать функцию FРАСПОБР). Сделать вывод о том, отклоняется ли статистическая гипотеза , предполагающая отсутствие гетероскедастичности.
-
Если гетероскедастичность имеет место, предположить, что дисперсии отклонений пропорциональны значениям Х, построить новое уравнение регрессии на основе этого преобразования:
Это предполагает преобразование исходных переменных делением их значений на квадратные корни соответствующих значений х. Кроме того, при запуске пакета анализа (инструмент Регрессия) следует иметь в иду, вместо одного фактора х в новой регрессии появятся два фактора: и . Поскольку оба параметра регрессии стали коэффициентами при новых факторах, свободный член в новой регрессии отсутствует, и это надо указать в окне диалога флажком Константа-ноль.
-
Сравнить полученные в пунктах а) и с) статистические характеристики параметров регрессий..
-
Проводится анализ зависимости средней заработной платы Y от средней производительности Х на предприятиях различного масштаба. Проведенное обследование нашло отражение в следующей таблице:
-
Количество сотрудников предприятия
Средняя производительность, $
Средняя зарплата, $
Стандартное отклонение зарплаты, $
1-4
9320
3320
740
4-9
8630
3640
850
10-19
8050
3900
730
20-49
8320
4120
830
50-99
8600
4090
950
100-199
9120
4200
1100
200-499
9540
4380
1250
500-999
9730
4500
1290
1000-1999
10120
4610
1350
2000-4999
10740
4800
1100
>5000
11200
5000
1520
-
Построить уравнение регрессии , используя обычный МНК.
-
В данном случае дисперсия считается известной, и это приводит к уравнению регрессии в виде:
П ровести регрессию в преобразованных переменных, учитывая, что здесь также свободный член отсутствует.
-
Сравнить полученные результаты с точки зрения статистик параметров до и после преобразования переменных.. Какое из уравнений предпочтетительнее и почему?