- •1. Статистический вывод. Проверка гипотез
- •2. Общая схема проверки статистической гипотезы
- •5 Сравнение средних значений ранжированных признаков двух независимых выборок
- •7. Сравнение дисперсий двух независимых выборок
- •8. Сравнение дисперсий двух зависимых (связанных) выборок
- •9,10 Анализ взаимосвязей количественных признаков. Коэффициент корреляции пирсона
- •11. Значимость коэффициента корреляции
- •13Алгоритм вычисления крк Спирмена.
- •14Значимость крк Спирмена.
- •15. Коэффициент ранговой корреляции кендалла
- •16Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •17. Бисериальный коэффициент корреляции (бкк)
- •18. Ранговый бисериальный коэффициент корреляции
14Значимость крк Спирмена.
Для КРК проверка значимости полностью аналогична проверке значимости КРК Пирсона (см. параграф 22).
Осуществим проверку значимости найденных в вышерассмотренных примерах КРК.
rs = -0,455 n = 10 = 0,65
2 2
tнабл. = n – 2 (rs : 1 – rs ) = 10 – 2 (-0,455 : 1 – (-0,455) ) = -1,466
/2 = 0,05/2 = 0,025 = n – 2 = 10 – 2 = 8 tкр = 2,306
-2,306 -1,466 2,306
-tкр < tнабл. < tкр , то мы должны принимать гипотезу Н0, т.е. делаем вывод о том, что на уровне значимости 0,05 КРК Спирмена равен 0, т.е. не является значимым. В результате получаем окончательный вывод о том, что между количеством ошибок на тренажере и невербальным интеллектом корреляционной связи нет.
15. Коэффициент ранговой корреляции кендалла
Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.
Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен.
КРК Кендалла обычно обозначается и вычисляется по формуле:
= (P – Q) : ((n (n – 1)) :2), где P – общее количество совпадений; Q – общее количество инверсий. При вычислении КРК Кендалла для упрощения расчетов данные располагают по одной переменной (например, х) в порядке возрастания.
Так как для каждой пары может быть или совпадение или инверсия, то после подсчета совпадений количество инверсий равно количеству сравниваемых лиц (исключая себя) минус количество совпадений.
= (21 – 7) : (8 (8 – 1) : 2) = 0,5.
Отсюда видно, что между переменными х и у имеется прямая (положительная) средняя корреляционная связь.
В случае связанных (одинаковых) КРК Кендалла, как и КРК Спирмена, вычисляется по формуле:
= (P – Q) : [ n (n – 1) :2 – Kx ] [ n (n – 1) :2 – Ky ] , где поправки Кх и Ку вычисляются по следующим формулам:
k
Кх = [ fi (fi – 1)] : 2, где k - количество групп совпадающих
i=1
рангов по переменной х; fi - количество значений в i-той группе совпадений.
m
Ky = [gi (gi – 1)] : 2, где m - количество групп совпадающих
i=1
рангов по переменной у, gi - количество значений в i-той группе совпадений.
Наиболее часто на практике используется КРК Спирмена. Следует также отметить, что КРК Спирмена и КРК Кендалла связаны следующим приблизительным соотношением:
rs = 1,3
Значимость КРК Кендалла.
После вычисления КРК Кендалла необходимо проверить полученное значение КРК на значимость. Для этого воспользуемся общей схемой проверки статистической гипотезы.
1. Выдвигаются две статистические гипотезы:
Н0 о том, что КРК Кендалла статистически равен 0 и
Н1 о том, что этот КРК статистически отличен от 0.
Н0 : =0
Н1 : =0.
2. Выбирается уровень значимости .
3. Вычисляется наблюдаемое значение статистического критерия. Для этого сначала вычисляем величину
P – Q + 1 , P < Q
S=
P – Q – 1, P > Q, тогда наблюдаемое значение вычисляется по следующей формуле:
Zнабл. = S : (n (n – 1) (2n + 5)) : 18
4. Находим критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения критического значения необходимо воспользоваться статистической таблицей стандартного нормального распределения (см. параграф 17). Zкр
1 - /2
5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если - Zкр < Zнабл. < Zкр , то принимается нулевая гипотеза (Н0), т.е. делаем вывод о том, что КРК Кендалла статистически равен 0, т.е. является незначимым; 2) если Zнабл < - Zкр или Zнабл > Zкр, то принимается альтернативная гипотеза Н1, т.е. делаем вывод о том, что КРК Кендалла на уровне значимости статистически отличен от 0, т.е. является значимым.
т.е. - Zкр < Zнабл. < Zкр, то в нашем случае делаем вывод о том, что на уровне значимости 0,05 КРК Кендалла статистически равен 0, т.е. не является значимым.
Проверка гипотезы о равенстве двух коэффициентов корреляции.
Иногда может возникать задача сравнения для двух различных групп лиц. Например: сильнее ли коррелированы способности и успеваемость у мальчиков, чем у девочек?
Для решения такой задачи воспользуемся общей схемой проверки статистической гипотезы.
1. Выдвигаются две статистические гипотезы, основная нулевая Н0 о том, что КК двух рассматриваемых ГС статистически одинаковы и альтернативная Н1 о том, что эти КК статистически различны.
Н0: 1 = 2, где 1 – КК между двумя исследуемыми показателями в первой ГС
Н1: 1 = 2, где 2 – КК между двумя исследуемыми показателями во второй ГС.
2. Выбираем уровень значимости .
3. Вычисляется наблюдаемое значение статистики критерия. Для этого сначала по исходным данным вычисляется КК, r1 и r2. После этого вычисленные КК с помощью преобразования Фишера преобразуются величины Z1 и Z2.
Z1 = ½ ln (1+r1) : (1 – r1)
Z2 = ½ ln (1+r2) : (1 – r2)
Тогда наблюдаемое значение статистики критерия вычисляется по следующей формуле:
Zнабл. = (Z1 – Z2) : (1 : (n – 3) + 1 : (m – 3), где n – количество лиц первой группы, а m – количество лиц второй группы.
4. Находится критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения Zкр нужно воспользоваться статистической таблицей стандартного нормального распределения (см. параграф 17).
5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если –Zкр < Zнабл < Zкр, то принимается гипотеза Н0, т.е. делаем вывод о том, что КК между исследуемыми показателями в двух рассматриваемых ГС статистически одинаковы на уровне значимости . 2) если Zнабл < -Zкр или Zнабл > Zкр, то принимается гипотеза Н1, т.е. делаем вывод о том, что эти КК статистически различны на уровне значимости
Пример. В выборке из 200 детей в возрасте от 6 до 15 лет корреляция между интеллектом и скоростью обмена веществ определяется величиной r1 = 0,71. В выборке из 78 взрослых людей в возрасте от 18 до 25 лет интеллект и скорость обмена веществ имеют корреляционную связь, оцениваемую величиной r2 = 0,28. Проверить их статистическое совпадение.
Решение. Выбираем = 0,01.
Z1 = ½ ln (1+0,71) : (4 – 0,71) = 0,887
Z2 = ½ ln (1+0,28) : (1 – 0,28) = 0,288
Zнабл= (0,887 – 0,288) : 1 : (200 – 3) + 1 : (78 – 3) =4,4
Ищем критическое значение
1 - /2 = 1 – 0,01/2 = 0,995
Из таблиц находим, что Zкр = 2,58
Так как Zнабл > Zкр, то принимаем гипотезу Н1, т.е. корреляция между интеллектом и скоростью обмена веществ у детей сильнее (т.к. r1 > r2), чем у взрослых.