Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MSM.doc
Скачиваний:
41
Добавлен:
27.04.2019
Размер:
1.8 Mб
Скачать
  1. Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные

Линейная зависимость

Парная корреляция – измерение силы линейных связей различных пар признаков из их множества, при этом связь каждой пары находится под воздействием связей всех других признаков между собой и признаками данной пары:

Частная корреляция – измерение силы чистых линейн. связей пар признаков, при этом связи всех других признаков с признаками из данной пары не действуют, нивелированы: , где , , - алгебраические дополнения к соответствующим элементам матрицы парных корреляций R.

Коэффициент множественной корреляции – численная характеристика силы связи отклика со всеми предикторами: R0 = (1 - |R|/|Rj|)1/2, где |R| - определитель матрицы парных корреляций R, |Rj| - минор к матрице парных корреляций (в матрице R вычеркивается строка и столбец, представляющие характеристики связи с j-м признаком, выступающим в качестве отклика).

Коэффициент множественной детерминации – численная характеристика доли вариации признака, объясненной вариацией всех предикторов: R02 = 1 - |R|/|Rj| = (R0)2

Для определения статистической значимости коэффициента детерминации используется F-статистика: , где m – кол-во факторов. Если F < Fкр (степени свободы v1 = 1, v2 = n-m-2), то R2 считается незначимым; если F > Fкр, то R2 считается значимым.

Значимость лин. коэф-та корреляции проверяется на основе величины ошибки коэф-та корреляции: . Фактич. значение t-критерия Стьюдента определяется как:

В случае пар. регрессии: , следовательно, . Также существует следующая связь: . Сл-но, проверка гипотез о знач-ти коэф-тов регрессии и кор-ции равносильна проверке гипотезы о знач-ти ур-ния регрес-и.

Парная нелинейная связь

К орреляционное отношение вбирает в себя идеологию коэф-та детерминации, но в случае нелин. связи.

Необходимо найти все интервалы скопления точек. Интервалов может быть . Индекс корреляции строится, если получить проекцию каждой точки на ось ординат. Очень важно то, что корреляционное отношение не обладает симметрией, т.е.: . Необходимо найти частные средние ординаты в каждом j-ом интервале:

, где - количество точек в j-м интервале.

Аналогом факторной дисперсии в случае нелин. связи явл-ся: , где

Оценка для нелинейного коэффициента детерминации (корреляционного отношения): ,

где - все отклонения по точкам:

Иногда этот коэффициент служит мерой нелинейности. Он совпадет с коэффициентом корреляции только в случае линейной связи. След. величина показывает отклонение от линейности:  = |ryx| - |yx|

yx  0, при этом yx = 0, если связь полностью отсутствует, и yx = 1, если связь абсолютна (однозначное функциональное отображение y через x). Всегда |yx||ryx| (равенство только в случае линейности вязи)

Критериальная проверка:

H0 - свидетельствует о незначимости коэф-та (равенстве нулю). Проверяется по критерию Фишера:

, , следовательно, значимость корреляцион. отношения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]