Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Орловский филиал РАНХиГС

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

эконометрика.doc

Скачиваний:

Добавлен:

25.08.2019

Размер:

1.82 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

2. Многомерная линейная регрессия.

Имеется множество объектов и множество ответов . Также имеется набор вещественнозначных признаков . Введём матричные обозначения: матрицу информации , целевой вектор , вектор параметров и диагональную матрицу весов:

Алгоритм:

Оценим качество его работы на выборке методом наименьших квадратов:

, или, в матричных обозначениях,

Задача с произвольной матрицей весов легко приводится к единичной матрице весов заменой :

Таким образом, в дальнейшем будем рассматривать только задачу с единичными весами.

Найдём минимум по α:

Если , то можно обращать матрицу , где введено обозначение .

В таком случае функционал качества записывается в более удобной форме:

, где — проекционная матрица:

— вектор, являющийся проекцией на .

Теперь рассмотрим сингулярное разложение матрицы F:

В таких обозначениях:

, а так как , то в силу диагональности матрицы D.

А решение метода наименьших квадратов запишется в следующем виде:

А так как , то

Мультиколлинеарность

Основной проблемой многомерной линейной регресии является вырожденность, или, в более общем случае, мультиколлинеарность матрицы F^TF, которую приходится обращать. Подобные проблемы возникают, когда среди признаков f_j(x) есть почти линейно зависимые. Мультиколлинеарность матрицы определяется её числом обусловленности:

, где λ — собственные значения матрицы F^TF.

Чем больше число обусловленности, тем ближе матрица F^TF к вырожденной и тем неустойчивее обратная к ней матрица. Плохая обусловленность матрицы: λ_min << λ_max. Матрицу принято считать плохо обусловленной, если её число обусловленности превышает 10³...10⁶.

Последствия:

Разброс значений α_j. Появляются большие положительные и большие отрицательные коэффициенты α_j. По абсолютной величине коэффициента становится невозможно судить о степени важности признака f_j . Коэффициенты утрачивают интерпретируемость.
Неустойчивость решения α* при (кажущейся) устойчивости Fα*. Малые изменения данных, например, шум или добавление нового объекта, могут сильно изменить вектор коэффициентов.
Отсюда следует опасность переобучения, так как снижается обобщающая способность алгоритма.

Для борьбы с мультиколлинеарностью применяются существуют методы:

Регуляризация. Накладываются дополнительные ограничения на норму вектора коэффициентов α. Примером могут служить гребневая регрессия или L₁-регуляризация)
Преобразование признаков. Исходные n признаков с помощью некоторых преобразований переводятся в меньшее число m новых признаков. В частности, линейные преобразования приводят к методу главных компонент.
Отбор признаков. Производится явный перебор всевозможных подмножеств признаков. Для линейной регрессии удаётся строить эффективные методы, совмещающие перебор подмножеств с оптимизацией коэффициентов. К таким методам относятся, опять-таки, лассо Тибширани и ортогонализация Грама–Шмидта.

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.09.2019148.08 Кб10экзамен по педагогике.docx
#
15.09.2019290.82 Кб12Экзамен, 4 курс.doc
#
07.12.2018387.07 Кб29экзамен.статистика.doc
#
24.09.2019315.59 Кб9экон анализ подготовка..docx
#
16.08.201953.65 Кб16эконом анализ 1.docx
#
25.08.20191.82 Mб22эконометрика.doc
#
23.09.2019178.18 Кб14экономика в колонках.doc
#
22.07.2019217.49 Кб6экономика ещё один семинар, который последний.rtf
#
17.08.2019214.02 Кб2ЭКОНОМИКА НЕДВИЖИМОСТИ И ОЦЕНКА БИЗНЕСА.doc
#
04.03.201678.11 Кб49экономика организаций.docx
#
04.03.20161.01 Mб92Экономика.doc