Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный университет им. аль-Фараби

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Алгебра линейной регрессии.docx

Скачиваний:

Добавлен:

24.03.2015

Размер:

2.5 Mб

Скачать

☆

<<< < Предыдущая 12 / 152 3 4 5 6 7 8 9 10 11 12 13 14 15 > Следующая >>>

6.2. Простая регрессия

В случае, когда ограничения на вектор a (α) имеют вид a_j= 1 ( α_j= 1), возникают простые регрессии. В таких регрессиях в левой части уравнения оста- ется одна переменная (в данном случае j-я), а остальные переменные переносятся в правую часть, и уравнение в исходной форме приобретает вид (регрессия j-й переменной по остальным, j-я регрессия):

X_j= X₋_ja₋_j+ 1_Nb_j+ e_j, (6.8) где X_j— вектор-столбец наблюдений за j-й переменной — объясняемой,

X₋_j— матрица наблюдений размерности N × (n − 1) за остальными перемен- ными — объясняющими (композиция X_jи X₋_jобразует матрицу X ), a₋_j— вектор a без j-го элемента (равного 1), взятый с обратным знаком (компози- ция 1 и −a₋_jобразует вектор a), b_jи e_j— соответственно свободный член и вектор-столбец остатков в j-й регрессии. В сокращенной форме:

X^ˆ_j= X^ˆ₋_ja₋_j+ e_j. (6.9)

В таких регрессиях ошибки e_ij— расстояния от гиперплоскости регрессии до точек облака наблюдения — измеряются параллельно оси x_j.

Остаточная дисперсия приобретает следующую форму:

_s₂1 1 ^_ˆ

_ˆ _ˆ ˆ

_ej= _Ne^te_j= _N

X^t− a^tX^t

^Xj ⁻^X−j ^a−j

. (6.10)

j j −j −j

202 Глава 6. Алгебра линейной регрессии

Из равенства нулю ее производных по параметрам a₋_jопределяется, что

−j _j−j

a = M ⁻¹m , (6.11)

−

где M₋_j=

_ˆt

_NX

−j

₋_j— матрица ковариации объясняющих переменных x₋_j

_Xˆ

−j _N

между собой, m = ¹X^ˆ^t

_Xˆ_j

— вектор-столбец ковариации объясняющих пе-

−j

ременных с объясняемой переменной x_j; и

cov (X₋_j, e_j) = _NX^ˆ

−j

e_j= 0. (6.12)

Действительно,

∂s²₂

^ˆ ˆ



^^^−2(m₋_j− M₋_ja₋_j),

∂a₋_j

= X^ˆ^r

−

_N−j

X_j− X₋_j

^a−j

^_X_ˆr

₋_N

₋_je_j.

Кроме того, очевидно, что матрица вторых производных равна 2M₋_j, и она, как всякая ковариационная матрица, положительно полуопределена. Следовательно, в найденной точке достигается минимум остаточной дисперсии.

Справедливость утверждения о том, что любая матрица ковариации (теоретическая или ее оценка) положительно полуопределена, а если переменные линейно незави- симы, то — положительно определена, можно доказать в общем случае.

Пусть x — случайный вектор-столбец с нулевым математическим ожиданием. Его

теоретическая матрица ковариации по определению равна E (xx^r). Пусть ξ ƒ= 0 — детерминированный вектор-столбец. Квадратичная форма

(

ξ^rE(xx^r)ξ = E(ξ^rxx^rξ) = E ^ξ^rx)²^“ 0,

т.е. матрица положительно полуопределена. Если не существует такого ξ ƒ= 0, что

ξ^rx = 0, т.е. переменные вектора x линейно не зависят друг от друга, то неравенство

выполняется строго, и соответствующая матрица положительно определена.

Пусть X — матрица N наблюдений за переменными x. Оценкой матрицы ко-

вариации этих переменных является

¹X^ˆ^rX^ˆ. Квадратичная форма

¹ξ^rX^ˆ^rX^ˆξ =

= u^ru “ 0, где u = X^ˆξ, т.е. матрица положительно полуопределена. Если не

существует такого ξ ƒ= 0, что X^ˆξ = 0, т.е. переменные x линейно не зависят друг от друга, то неравенство выполняется строго, и соответствующая матрица положи- тельно определена.

Оператор МНК-оценивания образуется соотношениями (6.11) и (6.5), которые в данном случае записываются следующим образом:

b_j= x¯_j− x¯₋_ja₋_j(6.13)

Простая регрессия 203

(соотношения МНК-оценивания (4.37), данные в пункте 4.2 без доказательства, являются частным случаем этого оператора).

Уравнения

m₋_j= M₋_ja₋_j, (6.14)

решение которых дает первую часть оператора МНК-оценивания (6.11), называ- ется системой нормальных уравнений.

МНК-оценки остатков имеют нулевую среднюю (6.6) и не коррелированы (ор- тогональны) с объясняющими переменными уравнения (6.12).

Систему нормальных уравнений можно вывести, используя иную логику. Если

обе части уравнения регрессии (6.9) умножить слева на ^ˆ^t

−

и разделить на N ,

−j

то получится условие m₋_j= M₋_ja₋_j+ _NX^ˆ^t

e_j, из которого получается искомая

система при требованиях

e¯_j= 0 и cov(X₋_j, e_j) = 0, следующих из полученных

свойств МНК-оценок остатков.

_Zˆ^t_Xˆ

Такая же логика используется в методе инструментальных переменных. Пусть имеется матрица Z размерности N × (n − 1) наблюдений за некоторыми величи- нами z, называемыми инструментальными переменными, относительно которых известно, что они линейно не зависят от ε_jи коррелированы с переменными X₋_j. Умножение обеих частей уравнения регрессии слева на Z^ˆ^tи деление их на N да-

ет условие

Z^ˆ^tX^ˆ_j=

_N−j ^a−j ⁺

Z^ˆ^te_j, из которого — после отбрасывания

второго члена правой части в силу сделанных предположений — следует система

нормальных уравнений метода инструментальных переменных:

_mz

₋_j= M a

, (6.15)

где m^z

−

−j

= cov (z, x_j), M ^z

−j −j

= cov (z, x₋_j).

Значения j-й (объясняемой) переменной, лежащие на гиперплоскости регрес- сии, называются расчетными (по модели регрессии):

_Xc

_j= X₋_ja₋_j+ 1_Nb_j, (6.16)

_Xˆ ^cˆ

_j= X₋_ja₋_j. (6.17)

Их дисперсия называется объясненной (дисперсия, объясненная регрессией) и может быть представлена в различных вариантах:

_s₂¹_c_ˆ_c(6.17)

(6.11) ₁

_q_j= _NX^ˆ^tX

= a^t

^M−j ^a−j

= a^t

m₋_j= m^t

a₋_j= m^t

M ⁻m₋_j.

j j −j

−j −j

⁻^j−j

(6.18)

204 Глава 6. Алгебра линейной регрессии

Если раскрыть скобки в выражении остаточной дисперсии (6.10) и прове-

_s2

сти преобразования в соответствии с (6.11, 6.18), то получается s²

= s²− s²,

где

_j— дисперсия j-й (объясняемой) переменной, или

ej j qj

_s2 2 2

_j= s_qj+ s_ej. (6.19)

Это — дисперсионное тождество, показывающее разложение общей диспер- сии объясняемой переменной на две части — объясненную (регрессией) и оста- точную.

Доля объясненной дисперсии в общей называется коэффициентом детерми- нации:

_R2

j ₂

^q^j= 1 −

_s2

₂, (6.20)

который является показателем точности аппроксимации исходных значений объ- ясняемой переменной гиперплоскостью регрессии (объясняющими переменными). Он является квадратом коэффициента множественной корреляции между объ- ясняемой и объясняющими переменными r_j_,₋_j, который, по определению, равен

коэффициенту парной корреляции между исходными и расчетными значениями

объясняемой переменной:

cov ^x_j, x^c^

_X_ˆt _X_ˆc

X^ˆ^tX^ˆa

¹_j_j(6.17) ¹_j− j − j

^rj,−j ⁼

^sj ^sqj

= =

N s_js_qjN

^sj ^sqj

_m^t²

₌₋_j^a−j (6.18)

^sj ^sqj

(6.20)

R².

Из (6.19) следует, что коэффициент корреляции по абсолютной величине не пре- вышает единицы.

Эти утверждения, начиная с (6.16), обобщают положения, представленные в конце пункта 4.2.

Композиция 1 и −a_jобозначается a(j) и является одной из оценок вектора α. Всего таких оценок имеется n — по числу простых регрессий, в левой части уравнения которых по очереди остаются переменные x_j, j = 1, . . . , n. Эти вектор- столбцы образуют матрицу A. По построению ее диагональные элементы равны единице ( a_jj= 1 вслед за a_j(j) = 1).

Все эти оценки в общем случае различны, т.е. одну из другой нельзя получить алгебраическим преобразованием соответствующих уравнений регрессии:

. _t. _t

a (j) ƒ=

(j^t) ^a^j

, j ƒ= j . (6.21)

Ортогональная регрессия 205

Это утверждение доказывалось в пункте 4.2 при n = 2. В данном случае спра- ведливо утверждение, что соотношение (6.21) может (при некоторых j, j^t) вы- полняться как равенство в том и только том случае, если среди переменных x_j, j = 1, . . . , n существуют линейно зависимые.

Достаточность этого утверждения очевидна. Действительно, пусть переменные неко- торого подмножества J линейно зависимы, т.е. существует такой вектор ξ, в кото-

ром ξ_jƒ= 0 при j ∈ J и ξ_j= 0 при j ∈/ J , и

X^ˆξ = 0. Тогда для любого j ∈ J

^ξj

справедливо: a(j) = ¹ξ, причем a_j^r(j) = 0 при j^r∈/ J , и e_j= 0, т.е. некоторые

соотношения (6.21) выполняются как равенства.

Для доказательства необходимости утверждения предполагается, что существует такой ξ ƒ= 0, что

Aξ = 0 (6.22)

(т.е., в частности, некоторые соотношения из (6.21) выполняются как равенства).

Сначала следует обратить внимание на то, что вслед за (6.14) все компоненты век- тора M a(j) ( M — матрица ковариации всех переменных x: M = ¹X^ˆ^rX^ˆ), кроме

j -й, равны нулю, а j -я компонента этого вектора в силу (6.18, 6.19) равна s², т.е.

MA = S², (6.23)

где S²— диагональная матрица ^.s²^..

e ej

Теперь, после умножения обеих частей полученного матричного соотношения справа на вектор ξ, определенный в (6.22), получается соотношение: 0 = S²ξ, которое

означает, что для всех j , таких, что ξ_jƒ= 0, s²

= 0, т.е. переменные x_jлинейно

зависят друг от друга.

Что и требовалось доказать.

Все возможные геометрические иллюстрации простых регрессий в простран- стве наблюдений и переменных даны в пункте 4.2.

<<< < Предыдущая 12 / 152 3 4 5 6 7 8 9 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.03.2015440.23 Кб17АКР ОТВЕТЫ.docx
#
24.03.2015395.26 Кб141Алаш озалысы жне Алашорда.doc
#
24.03.201556.32 Кб31Алаш Орда (1).doc
#
24.03.2015841.73 Кб35Алаш Орда (2).doc
#
24.03.201525.72 Кб34Алашорда кіметіні ызметі мен кйреуі.docx
#
24.03.20152.5 Mб27Алгебра линейной регрессии.docx
#
04.12.20183.1 Mб4Алексеев-ИЗЛ-Средние века и Возрождение-Учеб. п....doc
#
24.03.2015264.7 Кб17Алимжанова.doc
#
24.03.201516.68 Кб28АЛИНА социометрия.docx
#
24.03.201518.64 Кб13АЛИНА-ертегі.docx
#
24.03.201523.93 Кб21АЛИНА-сауалнама.docx