Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

эм.docx

Скачиваний:

165

Добавлен:

11.05.2015

Размер:

3.62 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1916 17 18 19 > Следующая >>>

22.Модель множественной регрессии. Интерпретация уравнения регрессии

При решении задач экономического анализа и прогнозирования часто надо определить влияние на показатель Y значений более чем одного связанных с ним показателей (факторов) Х₁, Х₂, …, Х_n, наблюдаемых в разные моменты времени t.

Если между показателями Y и X_iнет функциональной зависимости, то рассматривают стохастическую модель вида

Y = F(Х₁, Х₂…X_р) + U _t_,(5.30)

где переменная Y называется зависимой (эндогенной) переменной, Х₁, …, Х_р– независимые (экзогенные) переменные (факторы), F – некоторая функция, U_tслучайная величина (характеризует влияние неучтенных факторов), t – момент (период) наблюдения. Как и в случае простой регрессии U _tобычно считается нормально распределенной случайной величиной с математическим ожиданием равным нулю M(U_t) = 0, постоянной дисперсией D(U_t) = const и ковариацией cov(U_t, U_t₊_s) = 0, s > 0.

Функция F называется функцией множественной (многофакторной)

регрессии, а уравнение

_∧

^Y⁼^F(^X₁^,^X₂^,...,^X_k⁾

(5.31

уравнением или моделью множественной регрессии, k – количество факторов.

Если функция F – нелинейная функция, то регрессия называется нелинейной, иначе – линейной. Уравнение множественной линейной

регрессией имеет вид:

^∧

^y⁼^a⁰⁺^a¹^X¹⁺^a²^X²⁺^...⁺^a^k^X^k^.^(5.32)

^Коэффи^ц^{иенты
(}^а_i^,ⁱ^{=
1 –}^k^{)
называются коэффициентами}

множественной регрессии.

Основная задача теории линейных регрессионных моделей заключается в определении коэффициентов {а_i, i = 1 – k} по наблюдаемым значениям переменных (Y(t), X₁(t), …, X_k(t)) в различные моменты времени t = 1, 2, …, n, где n – количество наблюдений вектора (Y, X₁, …, X_k).

^Для^{определения}^{коэффициентов}⁽^а_i^,ⁱ⁼⁰^–^k⁾^{запишем}^{уравнение}^(5.32)

для различных моментов времени наблюдений (t = 1, 2, …, n). Получим

^сис^т^ем^уⁿ^{уравнений
относительно}^k
–^{неизвестных
(}^а_i^,ⁱ^{=
0 –}^k^),

предполагается, что k < n:

^∧

t t t t

^y⁼^a⁰⁺^a¹^x¹⁺^a²^x²⁺^...⁺^a^k^x^k^,

^(5.33)

_t₌₁_,₂_,...,_n_.

Систему уравнений (5.34) можно записать в матричном виде:

^∧

^Y⁼^X^а^,
(5.34)

где а = (а₀…а_k)^Т– неизвестный вектор параметров модели (5.32);

^Х^–^{матрица
набл}^ю^даемых^з^н^ачений^{факторов}^Х_i^:

_{1 1 1}

_⎡₁_x₁

_x₂_..._x_k_⎤

_⎢_{2 2 2}_⎥

_X₌_⎢¹^x₁

^x₂^...^x_k_⎥_.
(5.35)

_⎢_{....................}_⎥

^⎢

_⎢_⎣₁_xⁿ

^⎥

_xⁿ_..._xⁿ_⎥_⎦

1 2 k

_Сис_т_{ема
уравнений (5.34) имеет}_n_{уравнений
и (}_{к +
1}_{)
неизвестных}

^а⁼⁽^а₀^…^а_k⁾^Т^.

В стандартном регрессионном анализе предполагается, что k < n и

rang(X) = k.

Как и в простой линейной регрессии, для определения вектора неизвестных параметров а = (а₀, …, а_k)^Тмодели (5.32) по результатам наблюдений используется метод наименьших квадратов (МНК).

Построим вектор наблюдаемых значений показателя Y:

Y = (y^t_., y², …, yⁿ)^T(5.36)

_и_вектор_р_е_{грессионных}_{значений
согласно (5.32):}

_∧_∧_∧_∧

_Y₌₍_y¹_,_y²_,...,_yⁿ_).

_∧_∧_∧_∧

Вектор

_{регресси}_и_.

^e⁼^Y⁻^Y⁼⁽^y¹⁻^y¹^,^y²⁻^y²^,...,^yⁿ⁻^yⁿ⁾^{называе}^т^ся^{вектором}^остатк^о^в

Параметры (а₀, …, а_k) находятся методом наименьших квадратов (МНК)

из задачи минимизации суммы квадратов остатков:

_∑

Коэффициенты (а_i) выбираются так, чтобы сумма квадратов остатков регрессии была минимальной. Если ввести функцию

L ( a ₀, a ₁,...,

^a^k⁾⁼

^∑

^t⁼¹

( y ^t

⁻^∑

ⁱ⁼⁰

a _iX _i

)

t 2

(5.38)

то задача (5.37) эквивалентна системе уравнений:

^∂^L⁽^a⁰^,^a¹^,...,^a^k⁾₌₀_,

^∂^aⁱ

ⁱ⁼⁰^,1^,²^,...,^k^.

Для обеспечения качества модели необходимо, чтобы было n > 3k, где n – количество наблюдений, k – количество факторов. Модель множественной регрессии оценивается с помощью следующих критериев:

_1._{Коэффициент
детерминации}₍_R²₎_:

^Всегда^{0 <}^R²^<^1.^Чем^ближе^R²^к^1,^т^е^м^точнее^моде^л^ь^.^Если^R²^>^0,8,^то

модель считается точной, если R²< 0,5, то модель надо улучшить, либо выбрав другие факторы, либо увеличив количество наблюдений.

_2._{Коэффициент
множественной}_{корреляци}_и_:

_R₌_R²_._(5.44)

_3._{Скорректированный}_{коэффициент
детерминаци}_и_:

^R²⁼¹⁻⁽¹⁻^R²⁾

^4.^Стан^д^{артная
ошибка:}

ⁿ⁻¹

ⁿ⁻^k⁻¹

. (5.45)

_∑⁽^Y_t

^∧

⁻^Y^t⁾²

^SE⁼

^t⁼¹^.
(5.46)

ⁿ⁻^k⁻¹

5. Оценка значимости модели, т.е. оценка того насколько верна гипотеза о линейности регрессии между Y и факторами X_iосуществляется по F-критерию Фишера. По наблюдаемым значениям определяется значение

_F₌^R

⁽ⁿ⁻^k⁻¹⁾_.
(5.47)

набл

₍₁₋_R²₎_k

Если F_н_а_б_л> F_кр= F_та_б_л(0,95; n – 1; n – k – 1), где 0,95 – уровень доверительной вероятности, (n – 1) и (n – k – 1) степени свободы модели, то модель считается значимой, и принимается гипотеза о линейной регрессии между переменными Y и X_i, где F_табл– табличное значение F-критерия Фишера.

Иначе гипотеза о линейной регрессии отвергается и надо изменять модель: выбрать другие факторы, увеличить количество наблюдений или построить нелинейную регрессию.

6. Оценка значимости коэффициентов регрессии (кроме свободного члена) осуществляется сравнением статистики

_a_j

_t_j₌_(5.48)

^{SE b}_jj

с табличным значением t-статистики Стьюдента. В (5.48) b_jj– диагональный элемент матрицы (Х^ТХ)^–1. Если значение (5.48) превосходит табличное значение t-статистики Стьюдента, то j-й коэффициент считается значимым, в

противном случае фактор, соответствующий данному коэффициенту следует исключить из модели.

7. Доверительный интервал для прогнозных значений линии регрессии определяется по формуле

_∧_∧

⁽^Y^t⁻^V_t^,^Y^t⁺^V_t^),

(5.49)

где

^V_t⁼^SE^⋅^t⁽^α^,ⁿ⁻^k⁻¹⁾

^x^T⁽^t⁾⁽^X^T^X⁾⁻¹^x

(t ) , (5.50)

_t₍_a_,_n₋_k₋₁₎₋

_{табличное
значение критерия С}_ть_ю_дента_пр_и
зада_н_ном

^уровне^значим^о^с^ти^α^и^числе^{степеней}^{свободы}⁽ⁿ^–^k^–
1);

^х^п⁽^t⁾^–^век^то^р^{-столбец
факторов д}^л^я
прог^но^{зных
значений време}^н^и

₍_{t
= n + 1}_,_{n + 2}_,_{n
+ 3}_,_…₎_.

_{Матрица}₍_Х^Т_Х₎^–1_{соответств}_у_{ет
наблюдаемым значениям факторов}_.

8. Влияние факторов Х на показатель Y оценивается с помощью коэффициентов эластичности Э_jи бета-коэффициентов:

Коэффициенты эластичности Э_jпоказывают, на сколько процентов изменится значение переменной Y при изменении Х_jна 1%. Бета коэффициенты показывают, на какую часть среднеквадратичного

отклонения изменится Y при изменении Х_jна величину своего среднеквадратичного отклонения.

Долю влияния j-го фактора в суммарном влиянии всех факторов на показатель Y оценивают с помощью дельта-коэффициентов^r_y_j^–^{коэффициент
корреляции между}^j^-м^{фактором
и пе}^р^е^менной^Y^.

При k = 1 получаются оценки для модели простой (однофакторной)

регрессии.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1916 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.03.2016193.46 Кб49ЭкП КР1 Буйницкий.docx
#
08.11.20192.79 Mб14ЭЛ_ ПРИВОД (двигатель) доработать.doc
#
17.03.20161.06 Mб71ЭЛЕКТРОННАЯ ТЕХНИКА ПОСОБИЕ ПО РАЗВИТИЮ НАВЫКОВ ЧТЕНИЯ НА АНГЛИЙСКОМ ЯЗЫКЕ ДЛЯ СТУДЕНТОВ 1-го КУРСА.pdf
#
11.05.201519.08 Mб637Электронные приборы. doc.doc
#
22.11.201940.95 Кб6Элементы языка SQL.docx
#
11.05.20153.62 Mб165эм.docx
#
11.05.20152.17 Mб71эмимм.docx
#
11.05.201518.18 Кб73эммим.docx
#
11.05.2015335.87 Кб16ЭП Контроша+++++++++++.doc
#
11.05.20152.81 Mб17ЭП лаба метода..pdf
#
11.05.20151.04 Mб11ЭП сделать.doc