Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный технический университет им. К. И. Сатпаева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

stat_umk.doc

Скачиваний:

173

Добавлен:

13.03.2015

Размер:

10.64 Mб

Скачать

☆

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 3414 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Тема 11. Множественная регрессия. Многомерная регрессионая модель. Фиктивные переменные. Кодирование значений качественных переменных. Мультиколлинеарность.

Множественная регрессия

Обобщением линейной регрессионной модели с двумя переменными является многомерная регрессионная модель (или модель множественной регрессии), которая позволяет прогнозировать значения одной переменной на основе значений двух или нескольких независимых переменных Уравнение линейной множественной регрессии имеет вид:

где - теоретические значения результативного признака, полученные путем подстановки соответствующих значений факторных признаков в уравнении регрессии; - значения факторных признаков; - параметры уравнения (коэффициенты регрессии).

При определении параметров модели методом наименьших квадратов минимизируется сумма квадратов остатков.

Рассматривая Q_ocm в качестве функции параметров , и выполняя математические преобразования (дифференцирование), получаем систему нормальных уравнений с т неизвестными (по числу параметров):

где п — число наблюдений, а т — число факторов в уравнении регрессии Решением этой системы уравнений находятся значения параметров являющихся коэффициентами искомого теоретического уравнения регрессии.

Фиктивные переменные

С помощью фиктивных переменных, или псевдопеременных, в регрессию включают качественные переменные, которые невозможно адекватно представить обычными числовыми значениями.

Фиктивная переменная (или индикаторная переменная) - это количественная переменная, которая принимает только два значения 0 и 1. Так, при исследовании зависимости величины заработной платы от стажа работы и пола сотрудника, пол как раз и является такой фиктивной переменной, которая может принимать значения, например, равной 1 для женщин и 0 для мужчин. Если качественная переменная представлена всего лишь двумя категориями (например, мужчины/женщины, годный/просроченный и т.д.), то ее можно представить непосредственно как индикаторную переменную, присвоив одной категории значение 1, а другой - 0 (базовое значение).

Качественная переменная X с k-категориями кодируется с помощью (k - 1)-й индикаторной переменной.

Рассмотрим пример определения трех индикаторных переменных с использованием категории стандартная упаковка в качестве базовой.

Качественная Индикаторные переменные

Вид упаковки	Пластиковая коробка (X₁)	Пластиковый пакет (X₂)	Бумажный пакет (X₃)
Стандартная упаковка	0	0	0
Пластиковая коробка	1	0	0
Пластиковый пакет	0	1	0
Бумажный пакет	0	0	1

После того как категориальные переменные заменены на индикаторные, множественную регрессию можно рассчитывать в обычным способом (с помощью функции Regression в MS Excel).

Мультиколлинеарность - это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. При наличии мультиколлинеарности МНК-оценки формально существуют, но обладают рядом недостатков:

1) небольшое изменение исходных данных приводит к существенному изменению оценок регрессии;

2) оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение R²).

Если при оценке уравнения регрессии несколько факторов оказались незначимыми, то нужно выяснить, нет ли среди них сильно коррелированных между собой.

При наличии корреляции один из пары связанных между собой факторов исключается либо в качестве объясняющего фактора берется какая-то их функция. Если статистически незначим лишь один фактор, то он должен быть исключен либо заменен другим показателем.

Для отбора факторов в модель регрессии и оценки их мультиколлинеарности можно использовать матрицу парных коэффициентов корреляции.

В модель регрессии включаются те факторы, которые более сильно связаны с зависимой переменной, но слабо связаны с другими факторами.

Таким образом были рассмотрены принципы регрессионного анализа - статистического метода, который позволяет прогнозировать значения некоторой переменной на основе значений одной, двух или более переменных. Были рассмотрены принципы построения простой и множественной регрессии.

Современные статистические пакеты располагают разнообразными средствами проведения регрессионого анлиза, включая функции, которая позволяют определить параметры уравнения регрессии, проверить качество уравнения регрессии, а также провести проверку статистической значимости каждого коэффициента уравнения регрессии и определить их доверительные интервалы.

Литература:

1осн. [285-292], 2 осн. [49-57], 3 осн. [90-120], 6 осн. [55-58], 2доп. [81-87], 4 доп. [142-146], 6 доп. [206-214].

Контрольные вопросы

1. Каков смысл применения многофакторного регрессионного анализа?

2. Какой метод применяется при определении параметров множественной регрессии ?

3. Каковы особенности применения МНК при множественной регрессии ?

4. Каков смысл включения фиктивных переменных в регрессионное уравнение?

6. Что означает свойство мультиколлинеарности в уравнении регрессии?

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 3414 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
23.03.20161.26 Mб57SRS_Fizika-2 (1).docx
#
23.03.201661.69 Кб12srs_mas_os.docx
#
06.11.201869.12 Кб5SRS_Univ_osv_Mosk_09.doc
#
13.03.2015375.27 Кб23standart.pdf
#
13.03.201593.7 Кб17standarttau.doc
#
13.03.201510.64 Mб173stat_umk.doc
#
13.03.201571.68 Кб7StudentBank.ru_71200.doc
#
25.05.2015683.22 Кб7Swift_Essential_Training.docx
#
25.05.2015144.38 Кб6Swift_Osnovy.doc
#
13.03.2015747.42 Кб55sydykov_sajasattanu.pdf
#
13.03.2015545.59 Кб5syrlyb_umk_polit_050702_050716_2010.pdf