- •1. Статистический вывод. Проверка гипотез
- •2. Общая схема проверки статистической гипотезы
- •5 Сравнение средних значений ранжированных признаков двух независимых выборок
- •7. Сравнение дисперсий двух независимых выборок
- •8. Сравнение дисперсий двух зависимых (связанных) выборок
- •9,10 Анализ взаимосвязей количественных признаков. Коэффициент корреляции пирсона
- •11. Значимость коэффициента корреляции
- •13Алгоритм вычисления крк Спирмена.
- •14Значимость крк Спирмена.
- •15. Коэффициент ранговой корреляции кендалла
- •16Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •17. Бисериальный коэффициент корреляции (бкк)
- •18. Ранговый бисериальный коэффициент корреляции
16Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
Иногда оба признака (переменные) могут быть измерены в номинальной шкале. Рассмотрим частный случай номинальной шкалы, которая называется дихотомической, т.е. признак может принимать только два значения: либо 0, либо 1.
В этом случае исходные данные, т.е. две выборки, представляют собой два столбца, состоящие из 0 и 1, причем каждая строка соответствует значениям двух признаков для одного и того же лица.
Пример: пусть переменная х – это семейное положение, причем 1 – женат и 0 – холост; переменная у – исключение из колледжа, 1 – исключен и 0 – учится.
Для анализа взаимосвязи между двумя номинальными признаками можно воспользоваться формулой КК Пирсона. Однако в нашем случае эту формулу можно заменить на более простую, эквивалентную. КК для номинальных признаков обычно обозначается . Пусть рх – доля людей, для которых переменная х = 1; gх – доля людей, для которых переменная х = 0. Очевидно, что gх = 1 - рх. pу – доля людей, для которых переменная у = 1.gу – доля людей, для которых у = 0. рху – доля людей, для которых и х и у = 1. Тогда КК вычисляется по формуле:
= (pxy – px py) : px gx py gy
Вычислим этот коэффициент для нашего примера. Для этого сначала найдем рх = 5/12 = 0,4167
gх = 1 – 0,4167 = 0,5833
pу = 6/12 = 0,5
gy = 1 – 0,5 = 0,5
pху = 4/12 = 0,3333
= (0,3333 – 0,4167 0,5) : 0,4167 0,5833 0,5 0,5 = 0,507
После вычисления КК нужно осуществить проверку его значимости. Проверка значимости проводится аналогично проверке значимости КРК Кендалла, только наблюдаемое значение статистики критерия вычисляется по формуле:
Zнабл = n
Проверим на значимость вычисленный в примере выше КК .
= 0,507 n = 12
Zнабл = 12 0,507 = 1,76
= 0,05 из таблицы Zкр = 1,96
Так как – Zкр < Zнабл < Zкр, то мы должны принимать гипотезу Н0, т.е. делаем вывод о том, что на уровне значимости 0,05 КК статистически = 0.
17. Бисериальный коэффициент корреляции (бкк)
Данный КК вычисляется, когда одна переменная измерена в номинальной дихотомической шкале (0 или 1), а вторая переменная в количественной шкале. Одним из способов описания связи между такими переменными является просто вычисление КК Пирсона по исходным данным. Однако можно воспользоваться более простой формулой для вычисления. В этом случае КК называется точечный бисериальный КК и обозначается prb. Он вычисляется по следующей формуле:
rpb = (x 1 – x 0) : Sx (n1 n0 : n (n – 1) , где x 1 – среднее значение для тех лиц, у которых номинальная переменная у = 1; x 0 – среднее значение для тех лиц, у который номинальная переменная у = 0; Sx – стандартное отклонение для значений по переменной х; n1 – количество лиц, для которых переменная у = 1; n0 – количество лиц, для которых переменная у = 0; n – общее количество лиц, т.е. n = n1 + n0.
Этот КК называется бисериальным, т.к. фактически имеется две серии лиц. Одна серия лиц, для которых номинальная переменная у = 1,а вторая серия лиц, для которых номинальная переменная у = 0.
Пример вычисления бисериального КК.
Пусть переменная х – это рост в см, а переменная у – это пол (1 – мальчики, 0 – девочки). В эксперименте участвовали 15 подростков. Были получены следующие результаты:
n = 15 n1 = 8 n0 = 7
x 1 = (150+160+…+157) : 8 = 163,25
x 0 = (170+140+…+152) : 7 = 156,57
x = 8,94
rpb = (163,25 – 156,57) : 8,94 8 7; (15 (15 – 1)) = 0,41
n = 15 = 0,05
tнабл = n – 2 rpb : 1 – rpb = 15 – 2 0,41 : 1 – (0,41) = 1,62
/2 = 0,05/2 = 0,025 = n – 2 = 15 – 2 = 13 tкр = 2,16
Так как - tкр < tнабл < tкр, то делаем вывод о том, что КК статистически = 0, т.е. корреляционной связи между полом подростков и их ростом нет.