- •Тема 4. Характеристики взаимосвязи признаков
- •Материалы лекции. Понятие статистической зависимости
- •Общий обзор мер связи
- •Коэффициент контингенции
- •Критерий «хи-квадрат» Пирсона
- •Ранжирование
- •Правила ранжирования
- •Бисериальные коэффициенты корреляции
- •Коэффициент взаимной сопряженности Чупрова
- •Коэффициент взаимной сопряженности Пирсона
- •Ранговой коэффициент корреляции Спирмена
- •Коэффициент линейной корреляции Пирсона
Общий обзор мер связи
Измерительные шкалы |
Шкала наименований |
Шкала порядка |
Интервальная, пропорциональная шкалы |
||||||
k = 2 |
k > 2 |
||||||||
Шкала наименований |
k = 2 |
Коэффициент контингенции |
|
|
|
||||
k > 2 |
Критерий 2 |
Коэффициент взаимной сопряженности Чупрова К Коэффициент взаимной сопряженности Пирсона С
|
|
|
|||||
Шкала порядка |
Рангово-бисериальный коэффициент корреляции rRbis |
Ранговые коэффициенты корреляции: Спирмена Кендэлла |
|
||||||
Интервальная, пропорциональная шкалы |
Бисериальный коэффициент корреляции rbis |
Коэффициент линейной корреляции Пирсона r
Корреляционное отношение |
Коэффициент контингенции
Если оба признака измерены по шкале наименований и каждый из них может иметь только два значения, то мерой связи является коэффициент контингенции «фи» — φ. В некоторых книгах по статистике этот коэффициент называется четырехклеточный коэффициент или четырехпольный коэффициент, или тетрахорический показатель связи.
Удобнее всего этот коэффициент рассчитывать по 4-хпольной таблице сопряженности признаков (таблица 14) — таблице, показывающей частоту совместного появления у испытуемых пар значений по 2-м признакам.
Таблица 14
Значение признаков |
X1 = 0 |
X2 = 1 |
Σ |
Y1 = 0 |
f00 = a |
f10 = b |
a + b |
Y2 = 1 |
f01 = c |
f11 = d |
c + d |
Σ |
a + c |
b + d |
N = a + b + c + d |
Расчетное значение коэффициента контингенции вычисляется по следующей формуле:
Поскольку таблиц с критическими значениями для данного коэффициента не существует, то значимость этой меры связи оценивают при помощи критерия χ2.
Правило принятия решения:
Расчетное значение критерия необходимо сравнить с критическим (или табличным) значением. Критическое значение находится в зависимости от числа степеней свободы (приложение с таблицами критических значений). Однако, для 4-хпольной таблицы число степеней свободы всегда равно 1 (ν = 1), поэтому можно привести эти значения, которыми всегда следует пользоваться для 4-хклеточных таблиц: χ2табл. = 3,84 для р = 0,95 и = 6,64 для р = 0,99.
Если χ2расч ≥ χ2табл , то связь между признаками статистически значима, т. е. признаки изменяются согласованно. О направлении зависимости свидетельствует знак коэффициента взаимной сопряженности φ.
Если χ2расч < χ2табл , то связи между признаками нет.