Основные методы устойчивого оценивания параметров выбороч. Совокупности.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Российский экономический университет им. Г.В. Плеханова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

MSM.doc

Скачиваний:

Добавлен:

27.04.2019

Размер:

1.8 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 199 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

Основные методы устойчивого оценивания параметров выбороч. Совокупности.

Главный вопрос – устранять или винзорировать?

Если устранять, то уменьшается выборка и потеря объекта или периода.

Метод Пуанкаре (логический критерий)

- усеченное значение по Пуанкаре

, где - целая часть от произв-я , , где - степень засор-я (%)

Например, если в выборке объема n 2 грубые ошибки, то

, - находится по таблице

Е сли (k – предполагаемое количество грубых ошибок), то устойчивая оценка МО может быть получена по данной формуле Пуанкаре.

Винзорированная оценка МО

Среднее по Винзору:

, где - степень засорения выборки (%)

Физический смысл формулы – смотри рисунок

- устойчивая оценка МО по Винзору.

Метод Хубера

Алгоритм:

n - объем первоначальной выборки

h – функция от степени засорения выборки: (табличное значение из таблицы Хубера)

n₁ – количество наблюдений из совокупности, отличающихся наименьшим значением, т.е. число точек, для которых

n₂ – количество наблюдений из совокупности, отличающихся наибольшим значением, т.е. число точек, для которых

 - начал. оценка МО (сред. арифметическая) или уже известное МО (может быть мода или медиана)

На каждом шаге происходит разделение выборки на 3 части.

1 шаг: - определение , если оно не заданно

- выборка делится на 3 части в соответствии с вышеприведенными соображениями

2 шаг: - Получение новой оценки МО по формуле

- наименьшие значения заменяются на

- наибольшие данные заменяются на

- повтор 1го шага (деление на 3 части).

Итерации выполняются до тех пор, пока все не попадут в

Если невелика, то метод Хубера сходится достаточно быстро и дает эффективную оценку.

В многомерном случае засорением будет не отдельные значения, а вектора.

Чтобы удостовериться, что проверяемое значение является выбросом пользуются расстоянием Махаланобиса:

- вектор, подозреваемый на выбросы

Если > , то проверяемая многомерная величина Х признается грубой ошибкой или выбросом.

Каждая отдельная величина проверяется как компонента грубой ошибки.

Корреляционно-дисперсионный анализ многомерных количественных данных.

Исследование лин. завис-ти результирующего признака от единственной объясняющей переменной

Коэффициент детерминации (характеризует долю вариации (разброса) зависимой переменной, объясненную с помощью уравнения регрессии):

Коэф-ент корреляции (показатель тесноты связи):

Исследование линейной зависимости результирующего признака от нескольких переменных

Парная корреляция – измерение силы линейных связей различных пар признаков из их множества, при этом связь каждой пары находится под воздействием связей всех других признаков между собой и признаками данной пары:

Частная корреляция – измерение силы чистых линейн. связей пар признаков, при этом связи всех других признаков с признаками из данной пары не действуют, нивелированы: , где , , - алгебраические дополнения к соответствующим элементам матрицы парных корреляций R.

Коэффициент множественной корреляции – численная характеристика силы связи отклика со всеми предикторами: R₀= (1 - |R|/|R_j|)^1/2, где |R| - определитель матрицы парных корреляций R, |R_j| - минор к матрице парных корреляций (в матрице R вычеркивается строка и столбец, представляющие характеристики связи с j-м признаком, выступающим в качестве отклика).

Коэффициент множественной детерминации – численная характеристика доли вариации признака, объясненной вариацией всех предикторов: R₀²= 1 - |R|/|R_j| = (R₀)²

Для определения статистической значимости коэффициента детерминации используется F-статистика: , где m – кол-во факторов. Если F < F_кр (степени свободы v₁ = 1, v₂= n-m-2), то R² считается незначимым; если F > F_кр, то R² считается значимым.

Значимость лин. коэф-та корреляции проверяется на основе величины ошибки коэф-та корреляции: . Фактич. значение t-критерия Стьюдента определяется как:

В случае пар. регрессии: , следовательно, . Также существует следующая связь: . Сл-но, проверка гипотез о знач-ти коэф-тов регрессии и кор-ции равносильна проверке гипотезы о знач-ти ур-ния регрес-и.

Исследование парной нелинейной связи

К орреляционное отношение вбирает в себя идеологию коэф-та детерминации, но в случае нелин. связи.

Необходимо найти все интервалы скопления точек. Интервалов может быть . Индекс корреляции строится, если получить проекцию каждой точки на ось ординат. Очень важно то, что корреляционное отношение не обладает симметрией, т.е.: . Необходимо найти частные средние ординаты в каждом j-ом интервале:

, где - количество точек в j-м интервале.

Аналогом факторной дисперсии в случае нелин. связи явл-ся: , где

Оценка для нелинейного коэффициента детерминации (корреляционного отношения): ,

где - все отклонения по точкам:

Иногда этот коэффициент служит мерой нелинейности. Он совпадет с коэффициентом корреляции только в случае линейной связи. След. величина показывает отклонение от линейности:  = |r_yx| - |_yx|

_yx  0, при этом _yx = 0, если связь полностью отсутствует, и _yx = 1, если связь абсолютна (однозначное функциональное отображение y через x). Всегда |_yx||r_yx| (равенство только в случае линейности вязи)

Критериальная проверка:

H₀ - свидетельствует о незначимости коэф-та (равенстве нулю). Проверяется по критерию Фишера:

, , следовательно, значимость корреляцион. отношения.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 199 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.12.201874.75 Кб2monografia.doc
#
16.03.20156.01 Mб12MOS.pdf
#
16.03.2015464.38 Кб13MOYa_KURSOVAYa.doc
#
14.11.2019200.08 Кб2moya_kursovaya_okonch.docx
#
16.03.2015155.21 Кб62Moy_diplom.docx
#
27.04.20191.8 Mб41MSM.doc
#
23.04.2019216.58 Кб4MU Bez i ust ekon sistem (Kaz, Har).doc
#
12.11.2019327.17 Кб2MU Fed i reg IP (Isupova, matronina).doc
#
14.04.20192.04 Mб4MU Matematika Ekonom. fak. CH1.doc
#
14.09.2019131.58 Кб0MU MI v reklame d.o (Plyushcheva).doc
#
20.11.2019520.19 Кб4MU Nalogi i nalog po vip KR (Vashchilova).doc

Основные методы устойчивого оценивания параметров выбороч. Совокупности.

Корреляционно-дисперсионный анализ многомерных количественных данных.