Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Эконометрика_методичка_2003 для заочников.doc

Скачиваний:

Добавлен:

13.08.2019

Размер:

1.18 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

Тема 2. Классическая и обобщенная линейные модели множественной регрессии.

Экономические явления определяются, как правило, большим числом совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной переменной Y от нескольких объясняющих переменных X₁, X₂, …,X_n. Эта задача решается с помощью множественного регрессионного анализа.

Построение уравнения множественной регрессии начинается с решения вопроса о спе-цификации модели, включающего отбор факторов и выбор вида уравнения регрессии. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

они должны быть количественно измеримы (качественным факторам необходимо придать количественную определенность);
между факторами не должно быть высокой корреляционной, а тем более функциональной зависимости, т.е. наличия мультиколлинеарности.

Включение в модель мультиколлинеарных факторов может привести к следующим последствиям:

затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом виде», поскольку факторы связаны между собой; параметры линейной регрессии теряют экономический смысл;
оценки параметров ненадежны, имеют большие стандартные ошибки и меняются с изменением объема наблюдений.

Пусть Y=(y₁, y₂, …,y_n)^т – матрица-столбец значений зависимой переменной размера n;

– матрица значений объясняющих переменных;

b=(b₀, b₁, …,b_m)^т – матрица-столбец (вектор) параметров размера m+1;

ε=(ε₀, ε₁, …, ε_n)^т – матрица-столбец (вектор) остатков размера n+1.

Тогда в матричной форме модель множественной линейной регрессии запишется следующим образом:

Y = Xb + ε. (1)

При оценке параметров уравнения регрессии (вектора b) применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки.

В модели (1) ε – случайный вектор, X – неслучайная (детерминированная) матрица.
Математическое ожидание величины остатков равно нулю: М(ε)=0_n.
Дисперсия остатков ε_i постоянна для любого i (условие гомоскедастичности), остатки ε_i и ε_j при i≠j не коррелированны: М(εε^Т)=σ²E_n.
ε – нормально распределенный случайный вектор, т.е. ε~N(0; σ²E_n).
r(X) = m+1<n. Столбцы матрицы Х должны быть линейно независимыми (ранг матрицы Х максимальный, а число наблюдений n превосходит ранг матрицы).

Модель (1), в которой зависимая переменная, остатки и объясняющие переменные удовлетворяют предпосылкам 1-5 называется классической нормальной линейной моделью множественной регрессии. Если не выполняется только предпосылка 4, то модель называется классической линейной моделью множественной регрессии (КЛММР).

Согласно методу наименьших квадратов неизвестные параметры выбираются таким образом, чтобы сумма квадратов отклонений фактических значений от значений, найденных по уравнению регрессии, была минимальной:

(Y-Xb)(Y-Xb)^Т → min

Решением этой задачи является вектор b = (X^ТX)^-1X^ТY.

Одной из наиболее эффективных оценок адекватности модели является коэффициент детерминации R², определяемый формулой:

Коэффициент детерминации характеризует долю вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющих переменных. Чем ближе R² к единице, тем лучше построенная регрессионная модель описывает зависимость между объясняющими и зависимой переменной.

Следует иметь в виду, что при включении в модель новой объясняющей переменной, коэффициент детерминации увеличивается, хотя это и не обязательно означает улучшение качества регрессионной модели. В этой связи лучше использовать скорректированный (поправленный) коэффициент детерминации , рассчитываемый по формуле:

где n – число наблюдений,

m – число параметров при переменных x.

Из формулы следует, что с включением в модель дополнительных переменных разница между значениями и R² увеличивается. Таким образом, скорректированный коэффициент детерминации может уменьшаться при добавлении в модель новой объясняющей переменной, не оказывающей существенного влияния на результативный признак.

Но использование только коэффициента детерминации для выбора наилучшего уравнения регрессии может оказаться недостаточным.

Средняя относительная ошибка аппроксимации рассчитывается по формуле:

Значимость уравнения регрессии в целом сводится к проверке гипотезы об одновременном равенстве нулю всех коэффициентов регрессии при факторных признаках, т.е. гипотезы:

Н₀: b₁ = b₂ =…= b_m =0.

Если данная гипотеза не отклоняется, то делается вывод о том, что совокупное влияние всех факторных признаков х₁, х₂,… х_m, включенных в модель, на зависимую переменную y можно считать статистически несущественным. Проверка данной гипотезы осуществляется на основе дисперсионного анализа.

Основной идеей дисперсионного анализа является разложение общей суммы квадратов отклонений результативной переменной y от среднего значения на «объясненную» и «остаточную»:

Общая сумма квадратов отклонений

Сумма квадратов отклонений, объясненная регрессией

Остаточная сумма квадратов отклонений

Для приведения дисперсий к сопоставимому виду, определяют дисперсии на одну степень свободы. Результаты вычислений заносят в специальную таблицу дисперсионного анализа:

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Оценка дисперсии на одну степень свободы
Общая		n - 1	-
Объясненная		m
Остаточная		n – m - 1

В данной таблице n – число наблюдений, m – число параметров при переменных x.

Сравнивая полученные оценки объясненной и остаточной дисперсии на одну степень свободы, определяют значение F-критерия, используемого для оценки значимости уравнения регрессии:

С помощью F-критерия проверяется нулевая гипотеза о равенстве дисперсий Н₀: s_R² = s².

Если нулевая гипотеза справедлива, то объясненная и остаточная дисперсии не отличаются друг от друга. Для того, чтобы уравнение регрессии было значимо в целом (гипотеза Н₀ была опровергнута) необходимо, чтобы объясненная дисперсия превышала остаточную в несколько раз. Критическое значение F-критерия определяется по таблице Фишера-Снедекора.

Расчетное значение сравнивается с табличным, и если оно превышает табличное (F_расч >F_табл), то гипотеза Н₀ отвергается, и уравнение регрессии признается значимым.

Если F_расч <F_табл, то уравнение регрессии считается статистически незначимым. Нулевая гипотеза Н₀ не может быть отклонена.

Расчетное значение F-критерия связано с коэффициентом детерминации R² следующим соотношением:

где m – число параметров при переменных x;

n – число наблюдений.

Оценка значимости коэффициентов регрессии сводится к проверке гипотезы о равенстве нулю коэффициента регрессии при соответствующем факторном признаке, т.е. гипотезы:

Н₀: b_i =0.

Проверка гипотезы проводится с помощью t-критерия Стьюдента. Для этого расчетное значение t-критерия:

где b_i – коэффициент регрессии при x_i;

– средняя квадратическая ошибка коэффициента регрессии b_i.

сравнивается с табличным t_табл при заданном уровне значимости α и числе степеней свободы (n-2).

Если расчетное значение превышает табличное, то гипотезу о несущественности коэффициента регрессии можно отклонить.

Рассмотрим интерпретацию параметров модели линейной множественной регрессии. В линейной модели множественной регрессии =b₀ + b₁∙x₁ + … + b_m∙x_m коэффициенты регрессии b_i характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.

На практике часто бывает необходимо сравнить влияние на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют стандартизованные коэффициенты регрессии β_i и коэффициенты эластичности Э_i (i=1, 2, …, m).

Уравнение регрессии в стандартизованной форме:

где , – стандартизованные переменные.

В результате такого нормирования средние значения всех стандартизованных переменных равны нулю, а дисперсии равны единице, т.е. = =…= =0, = =…= =1.

Коэффициенты «чистой» регрессии связаны со стандартизованными коэффициентами следующим соотношением: .

Стандартизованные коэффициенты показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор x_i изменится на одну сигму при неизменном среднем уровне других факторов. Сравнивая стандартизованные коэффициенты друг с другом, можно ранжировать факторы по силе их воздействия на результат.

Средние коэффициенты эластичности вычисляются по формуле:

Коэффициент эластичности показывает, на сколько процентов (от средней) изменится в среднем Y при увеличении только фактора X_i на 1%.

Рассмотрим пример построения модели множественной регрессии с помощью средств приложения Microsoft Excel.

Пример 1. По данным, представленным в таблице 2, изучается зависимость балансовой прибыли предприятия торговли (тыс. руб.) от следующих факторов:

- объем товарных запасов, тыс. руб.;

- фонд оплаты труда, тыс. руб.;

- издержки обращения, тыс. руб.;

- объем продаж по безналичному расчету, тыс. руб.

Таблица 2

Месяц	Y	Х₁	Х₂	Х₃	Х₄
	41321,57	300284,10	19321,80	42344,92	100340,02
	40404,27	494107,21	20577,92	49000,43	90001,35
	37222,12	928388,75	24824,91	50314,52	29301,98
	37000,80	724949,11	28324,87	48216,41	11577,42
	29424,84	730855,33	21984,07	3301,30	34209,84
	20348,19	2799881,13	11000,02	21284,21	29300,00
	11847,11	1824351,20	4328,94	28407,82	19531,92
	14320,64	1624500,80	7779,41	40116,00	17343,20
	18239,46	1115300,93	18344,11	32204,98	4391,00
	22901,52	1200947,52	20937,31	30105,29	14993,25
	27391,92	1117850,93	27344,30	40294,40	104300,00
	44808,37	1379590,02	31939,52	42239,79	119804,33
	40629,28	588365,77	29428,60	55584,35	155515,15
	31324,80	434281,91	30375,82	49888,17	60763,19
	34847,92	1428243,59	33000,94	59866,55	8763,25
	33241,32	1412181,59	31322,60	49975,79	4345,42
	29971,34	1448274,10	20971,82	3669,92	48382,15
	17114,90	4074616,71	11324,93	26032,95	10168,00
	8944,94	1874298,99	8341,52	29327,21	22874,40
	17499,58	1525436,47	10481,14	40510,01	29603,05
	19244,80	1212238,89	18329,90	37444,69	16605,16
	34958,32	1154327,22	29881,52	36427,22	32124,63
	44900,83	1173125,03	34928,60	51485,62	200485,00
	57300,25	1435664,93	41824,92	49959,92	88558,62

Задание:

Для заданного набора данных построить линейную модель множественной регрессии.
Оценить точность и адекватность построенного уравнения регрессии.
Выделить значимые и незначимые факторы в модели.
Построить уравнение регрессии со статистически значимыми факторами. Дать экономическую интерпретацию параметров модели.

Решение.

Для получения отчета по построению модели в среде EXCEL необходимо выполнить следующие действия:

В меню Сервис выбираем строку Анализ данных. На экране появится окно

Рис. 1.

В появившемся окне выбираем пункт Регрессия. Появляется диалоговое окно, в котором задаем необходимые параметры (рис. 2).

Рис. 2.

Диалоговое окно рис. 2 заполняется следующим образом:

Входной интервал – диапазон (столбец), содержащий данные со значениями объясняемой переменной;

Входной интервал – диапазон (столбцы), содержащий данные со значениями объясняющих переменных.

Метки – флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет;

Константа-ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении регрессии ( );

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели;

Новый рабочий лист – можно задать произвольное имя нового листа, в котором будет сохранен отчет.

Если необходимо получить значения и графики остатков ( ), установите соответствующие флажки в диалоговом окне. Нажмите на кнопку OK.

Вид отчета о результатах регрессионного анализа представлен на рис. 3.

Рис. 3.

Рассмотрим таблицу "Регрессионная статистика".

Множественный R – это , где – коэффициент детерминации.

R-квадрат – это . В нашем примере значение = 0,8178 свидетельствует о том, что изменения зависимой переменной (балансовой прибыли) в основном (на 81,78%) можно объяснить изменениями включенных в модель объясняющих переменных – Х₁, Х₂, Х₃, Х₄. Такое значение свидетельствует об адекватности модели.

Нормированный R-квадрат – поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.

Стандартная ошибка регрессии , где – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии); n – число наблюдений (в нашем примере равно 24), m – число объясняющих переменных (в нашем примере равно 4).

Наблюдения – число наблюдений n.

Рассмотрим таблицу с результатами дисперсионного анализа.

df – degrees of freedom – число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант (m+1).

SS – sum of squares – сумма квадратов (регрессионная (RSS –regression sum of squares), остаточная (ESS – error sum of squares) и общая (TSS – total sum of squares), соответственно).

MS – mean sum - сумма квадратов на одну степень свободы.

F - расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости уравнение регрессии признается значимым в целом, если Значимость , и незначимым, если Значимость .

Для нашего примера имеем следующие значения:

	df	SS	MS	F	Значи-мость F
Регрессия	m = 4	2,82Е+09	7,04Е+08	= 21,32	8,28Е-07
Остаток	n– m–1=19	6,27Е+08	3,30Е+07
Итого	n – 1 = 23	3,44Е+09

В нашем случае расчетное значение F-критерия Фишера составляет 21,32. Значимость F = 8,28Е-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

В последней таблице приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критерия Стьюдента для оценки значимости отдельных параметров модели.

	Коэффи-циенты	Стандартная ошибка	t- статистика	P-Значение	Нижние 95%	Верхние 95%
Y	b₀ = = 7825,51	5350,78	=7825,51/5350,78==1,4625	0,1599	-3373,80 19024,83
Х₁	b₁ = = -0,00098	0,00172	-0,569	0,5762	-0,0046 0,0026
Х₂	b₂ = = 0,8806	0,15891	5,5417	0,00002	0,5480 1,2132
Х₃	b₃ = 0,0094	0,09754	0,0961	0,9244	-0,1948 0,2135
Х₄	b₄ = 0,0617	0,02647	2,3312	0,0309	0,0063 0,1171

Анализ таблицы для рассматриваемого примера позволяет сделать вывод о том, что на уровне значимости значимыми оказываются лишь коэффициенты при факторах Х₂ и Х₄. , так как только для них Р-значение меньше 0,05. Таким образом, факторы Х₁ и Х₃. не существенны, и их включение в модель нецелесообразно.

Поскольку коэффициент регрессии в эконометрических исследованиях имеют четкую экономическую интерпретацию, то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, как например, -0,1948 0,2135. Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Это также подтверждает вывод о статистической незначимости коэффициентов регрессии при факторах Х₁ и Х₃.

Исключим несущественные факторы Х₁ и Х₃ и построим уравнение зависимости (балансовой прибыли) от объясняющих переменных Х₂, и Х₄. Результаты регрессионного анализа приведены в таблице 3.

Таблица 3

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,9024465
R-квадрат	0,8144098
Нормированный R-квадрат	0,7967345
Стандартная ошибка	5515,53984
Наблюдения	24

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	2803387968	1401693984	46,076253	2,08847E-08
Остаток	21	638844774,1	30421179,72
Итого	23	3442232742

	Коэффици-енты	Стандартная ошибка	t- статистика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	5933,1025	2844,611998	2,085733487	0,0493883	17,40698	11848,798
Х2	0,9162546	0,132496978	6,915286693	7,834E-07	0,640712	1,1917972
Х4	0,0645183	0,024940789	2,58686011	0,0172036	0,012651	0,1163856

Оценим точность и адекватность полученной модели.

Значение = 0,8144 свидетельствует о том, что вариация зависимой переменной (балансовой прибыли) по-прежнему в основном (на 81,44%) можно объяснить вариацией включенных в модель объясняющих переменных – Х₂, и Х₄. Это свидетельствует об адекватности модели.

Значение поправленного коэффициента детерминации (0,7967) возросло по сравнению с первой моделью, в которую были включены все объясняющие переменные (0,7794).

Стандартная ошибка регрессии во втором случае меньше, чем в первом (5515 < 5745).

Расчетное значение F-критерия Фишера составляет 46,08. Значимость F = 2,08847E-08, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

Далее оценим значимость отдельных параметров построенной модели. Из таблицы 3 видно, что теперь на уровне значимости все включенные в модель факторы являются значимыми: Р-значение < 0,05.

Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:

с надежностью 0.95 коэффициент b₁ лежит в интервале 0,64 ≤ b₁ ≤ 1,19;
с надежностью 0.95 коэффициент b₂ лежит в интервале 0,01 ≤ b₂ ≤ 0,12

Таким образом, модель балансовой прибыли предприятия торговли запишется в следующем виде:

Рассмотрим теперь экономическую интерпретацию параметров модели.

Коэффициент b₁ = 0,916, означает, что при увеличении фонда оплаты труда (Х₂) на 1 тыс. руб. балансовая прибыль возрастает на 0,916 тыс. руб., а то, что коэффициент b₂ = 0,065, означает, что увеличение объема продаж по безналичному расчету (Х₄) на 1 тыс. руб. приводит к увеличению балансовой прибыли на 0,065 тыс. руб. Как было отмечено выше, анализ P-значений показывает, что оба коэффициента значимы.

При эконометрическом моделировании реальных экономических процессов предпосылки КЛММР нередко оказываются нарушенными: дисперсии остатков модели не одинаковы (гетероскедастичность остатков), или наблюдается корреляция между остатками в разные моменты времени (автокоррелированные остатки). Тогда предпосылка 3 запишется следующим образом:

3. М(εε^Т)=Ω, где Ω – положительно определенная матрица.

Принимая, что дисперсии объясняющих переменных могут быть произвольными, мы получаем обобщенную линейную модель множественной регрессии (ОЛММР).

В этом случае оценка параметров модели осуществляется обобщенным методом наименьших квадратов (ОМНК):

b* =(X^ТΩ^-1X)^-1X^ТΩ^-1Y.

Если модель гетероскедастична, то матрица Ω – диагональная. Тогда имеем:

b* =(X^ТΩ^-1X)^-1X^ТΩY.

В этом случае обобщенный метод наименьших квадратов называется взвешенным методом наименьших квадратов, поскольку мы «взвешиваем» каждое наблюдение с помощью коэффициента 1/σ_i.

На практике, однако, значения σ_i почти никогда не бывают известны. Поэтому сначала находят оценку вектора параметров обычным методом наименьших квадратов. Затем находят регрессию квадратов остатков на квадратичные функции объясняющих переменных, т.е. уравнение

е²_i =f(x_i) + u_i, i = 1, …, n,

где f(x_i) – квадратичная функция.

Далее по полученному уравнению рассчитывают теоретические значения и определяют набор весов . Затем вводят новые переменные Y^*_i = Y/σ_i, X^*_ji = X_ji/σ_i, (j = 1,…,m; i = 1,…, n) и находят уравнение . Полученная оценка и есть оценка взвешенного метода наименьших квадратов.

Проверить модель на гетероскедастичность можно с помощью следующих тестов: ранговой корреляции Спирмена; Голдфельда-Квандта; Уайта; Глейзера.

Рассмотрим тест на гетероскедастичность, применяемый в случае, если ошибки регрессии можно считать нормально распределенными случайными величинами, – тест Голдфельда-Квандта.

Все n наблюдений упорядочиваются в порядке возрастания значений фактора X. Затем выбираются m первых и m последних наблюдений.

Гипотеза о гомоскедастичности равносильна тому, что значения остатков e₁,…,e_m и e_n_-_m₊₁,…,e_n представляют собой выборочные наблюдения нормально распределенных случайных величин, имеющих одинаковые дисперсии.

Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей проверяется с помощью F-критерия Фишера.

Расчетное значение вычисляется по формуле:

Гипотеза о равенстве дисперсий двух наборов по m наблюдений (т.е. гипотеза об отсутствии гетероскедастичности остатков) отвергается, если расчетное значение превышает табличное F >F_α_;_m_-_p_;_m_-_p, где p – число регрессоров.

Мощность теста (вероятность отвергнуть гипотезу об отсутствии гетероскедастичности, когда гетероскедастичности действительно нет) максимальна, если выбирать m порядка n/3.

Тест Голдфельда-Квандта позволяет выявить факт наличия гетероскедастичности, но не позволяет описать характер зависимостей дисперсий ошибок регрессии количественно.

Если прослеживается влияние результатов предыдущих наблюдений на результаты последующих, случайные величины (ошибки) ε_i в регрессионной модели не оказываются независимыми. Такие модели называются моделями с наличием автокорреляции.

Как правило, если автокорреляция присутствует, то наибольшее влияние на последующее наблюдение оказывает результат предыдущего наблюдения. Наличие автокорреляции между соседними уровнями ряда можно определить с помощью теста Дарбина-Уотсона. Расчетное значение определяется по следующей формуле:

Затем по таблицам находятся пороговые значения d_в и d_н. Если расчетное значение:

d_в< d <4-d_в, то гипотеза об отсутствии автокорреляции не отвергается (принимается);
d_н< d <d_в, или 4-d_в< d <4-d_н, то вопрос об отвержении или принятии гипотезы остается открытым;
0< d <d_н, то принимается альтернативная гипотеза о наличии положительной автокорреляции;
4-d_н< d <4, то принимается альтернативная гипотеза о наличии отрицательной автокорреляции.

Недостаток теста Дарбина-Уотсона заключается прежде всего в том, что он содержит зоны неопределенности. Во-вторых, он позволяет выявить наличие автокорреляции только между соседними уровнями, тогда как автокорреляция может существовать и между более отдаленными наблюдениями.

Поэтому наряду с тестом Дарбина-Уотсона для проверки наличия автокорреляции используются тест серий (Бреуша-Годфри), Q-тест Льюинга-Бокса и другие.

Наиболее распространенным приемом устранения автокорреляции во временных рядах является построение авторегрессионных моделей.

Пример 2. Рассмотрим полученную в предыдущем примере модель зависимости балансовой прибыли предприятия торговли (тыс. руб.) от следующих переменных:

- фонд оплаты труда, тыс. руб.;

- объем продаж по безналичному расчету, тыс. руб.

Задание: Для полученной модели проверить выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.

Решение.

Для выполнения этого задания снова воспользуемся "Пакетом анализа", встроенным в EXCEL.

В соответствии со схемой теста Голдфельда-Квандта упорядочим данные по возрастанию переменной Х₄, предполагая, что дисперсии ошибок зависят от величины этой переменной.

В нашем примере m = n/3 = 8.

Результаты дисперсионного анализа модели множественной регрессии, построенной по первым 8 наблюдениям (после ранжирования по возрастанию переменной Х₄), приведены в таблице 4.

Таблица 4

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	5,07E+08	2,53E+08	20,95996	0,003707
Остаток	5	ESS₁ = = 6,04E+07	1,21Е+07
Итого	7	5,67E+08

Результаты дисперсионного анализа модели, построенной по последним 8 наблюдениям, приведены в таблице 5.

Таблица 5

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия	2	1,77E+08	88459011	1,111617	0,398654
Остаток	5	ESS₂ = = 3,98E+08	79576906
Итого	7	5,75E+08

Рассчитаем статистику F_расч = ESS₁/ESS₂. Для нашего примера получаем: F = 3,98E+08/6,04E+07= 6,58.

Для того, чтобы узнать табличное значение, воспользуемся встроенной в EXCEL функцией FРАСПОБР(0,05;6;6) с параметрами 0,05 – заданная вероятность ошибки гипотезы ; m-p = 8-2 = 6; m-p = 6 – параметры распределения Фишера. Данная функция находится в категории «статистических» функций.

Статистика F_расч больше табличного значения F= FРАСПОБР(0,05;6;6) = 4,28. Следовательно, модель гетероскедастична. 

Пример 3. Рассмотрим полученную в примере 1 модель зависимости балансовой прибыли предприятия торговли (тыс. руб.) от следующих переменных:

- фонд оплаты труда, тыс. руб.; - объем продаж по безналичному расчету, тыс. руб.

Задание: Проверить полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.

Решение.

Прежде всего, по эмпирическим данным необходимо методом наименьших квадратов построить уравнение регрессии и определить значения отклонений для каждого наблюдения i (i = 1, 2, …, n).

Для этого в диалоговом окне Регрессия в группе Остатки следует установить одноименный флажок Остатки.

Затем рассчитываем статистику Дарбина-Уотсона по формуле:

Результаты расчетов представлены в таблице 6.

Таблица 6

e_i	e_i_-₁	(e_i- e_i_-1)^2	(e_i)^2
11211,00896			1,3E+08
9809,816986	11211,01	1963338,9	9,6E+07
6652,565001	9809,817	9968240,1	4,4E+07
4367,949639	6652,565	5219467,4	1,9E+07
1141,570741	4367,95	10409521	1303184
2445,881613	1141,571	1701226,8	5982337
687,4294812	2445,882	3092153,9	472559
140,6630821	687,4295	298953,5	19786,1
-4784,81741	140,6631	24260358	2,3E+07
-3182,828283	-4784,82	2566369,2	1E+07
-10324,78476	-3182,83	51007542	1,1E+08
1880,960336	-10324,8	148980213	3538012
-2301,490224	1880,96	17492893	5296857
-6360,626521	-2301,49	16476587	4E+07
-1887,83539	-6360,63	20005861	3563922
-1671,617647	-1887,84	46750,112	2794306
1701,17565	-1671,62	11375735	2893999
149,2560547	1701,176	2408454,4	22277,4
-6106,936579	149,2561	39139946	3,7E+07
53,14551195	-6106,94	37946611	2824,45
-4554,494657	53,14551	21230348	2,1E+07
-426,4897698	-4554,49	17040424	181894
-5970,720141	-426,49	30738490	3,6E+07
7331,218328	-5970,72	176941567	5,4E+07
СУММА:		6,5E+08	6,4E+08

Таким образом, расчетное значение равно d = 6,5E+08/ 6,4E+08 = 1,02.

По таблице критических точек распределения Дарбина–Уотсона для заданного уровня значимости , числа наблюдений и количества объясняющих переменных m определить два значения: d_н- нижняя граница и d_в - верхняя граница (таблица 7).

Таблица 7

Статистика Дарбина–Уотсона, уровень значимости 0,05
m	1		2		3		4		5
	d_н	d_в	d_н	d_в	d_н	d_в	d_н	d_в	d_н	d_в
20	1,20	1,41	1,1	1,54	1,00	1,67	0,90	1,83	0,79	1,99
21	1,22	1,42	1,13	1,54	1,03	1,66	0,93	1,81	0,83	1,96
22	1,24	1,43	1,15	1,54	1,05	1,66	0,96	1,80	0,86	1,94
23	1,26	1,44	1,17	1,54	1,08	1,66	0,99	1,79	0,90	1,92
24	1,27	1,45	1,19	1,55	1,10	1,66	1,01	1,78	0,93	1,90
25	1,29	1,45	1,21	1,55	1,12	1,66	1,04	1,77	0,95	1,89

В нашем случае модель содержит 2 объясняющие переменные (m=2), нижняя и верхняя границы равны соответственно d_н = 1,19 и d_в = 1,55.

Расчетное значение d-статистики лежит в интервале 0≤d≤d_н. Следовательно, в ряду остатков существует положительная автокорреляция. 

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
05.06.2015331.26 Кб24Экз маркетинг.doc
#
05.06.2015215.83 Кб16Экз УиА.docx
#
05.06.2015403.06 Кб5Экз УЧР.docx
#
05.06.2015644.45 Кб85Экзамены МИЭТ.pdf
#
18.09.2019672.81 Кб1экологическая часть.docx
#
13.08.20191.18 Mб8Эконометрика_методичка_2003 для заочников.doc
#
19.09.2019133.82 Кб3экономика зачёт.docx
#
17.08.201938.59 Кб0экономическая теория.docx
#
25.04.2019134.66 Кб1Экономические основы соц раб.doc
#
05.11.2018368.64 Кб2ЭКТ 21-27 семестровый план.doc
#
03.11.2018284.16 Кб5ЭКТ 21-27.doc