НЕПАРАМЕТРИЧЕСКИЕ СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами
G – КРИТЕРИЙ ЗНАКОВ
Т – критерий Вилкоксона
Угловой φ – критерий Фишера
Q – критерий Розенбаума
U – критерий Манна-Уитни
X² – критерий Фридмена
Н – критерий Крускала-Уоллиса
L – критерий тенденций Пейджа
Основные преимущества непараметрических критериев:
- при распределениях, близких к нормальному, они дают хороший результат;
- при распределениях, далеких от нормального, позволяют обнаружить существенные различия, когда t-критерий их не выявляет;
- не все психологические признаки распределяются нормально;
- применимость к порядковым, а не строго к количественным показателям;
- рассмотрение качественных признаков, которые выражаются порядковыми номерами или индексами;
- небольшая трудоемкость исследования и относительная простота математического аппарата.
G – КРИТЕРИЙ ЗНАКОВ
Назначение: G-критерий знаков применяется при выяснении направления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых
Ограничения: Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n1 ≤ 300 и 5 ≤ n2 ≤ 300
Алгоритм использования:
Проверить выполнение ограничений;
Занести данные измерений в таблицу;
Подсчитать количество нулевых реакций n0 и вычесть их из объема выборки п. Новый объем выборки найти по формуле: n = n - n0;
Определить, каких сдвигов больше: положительных или отрицательных. Считать «типичными» те сдвиги, которых больше. А «нетипичными» - те, которых меньше;
Сформулировать гипотезы (Но: Сдвиг в типичную сторону является случайным; H1: Сдвиг в типичную сторону является неслучайным)
Подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G-критерия: G эмп. равно количеству «нетипичных» сдвигов;
По таблице 1 приложения по значению n найти G кр. (p ≤ 0,05) и G кр. (p ≤ 0,01), изобразить все полученные значения на оси значимости
Т – критерий Вилкоксона
Назначение: Т-критерий Вилкоксона применяется для сопоставления показателей, измеренных на одной и той же выборке, и позволяет оценить не только направленность сдвигов, но и их интенсивность.
Ограничения: Объем выборки должен быть 5 ≤ n ≤ 50
Алгоритм использования:
Проверить выполнение ограничений;
Составить список испытуемых (упорядочить);
Вычислить разность между индивидуальными значениями в первом и втором измерениях: «после»и «до». Определить, что будет считаться типичным сдвигом, сформировать соответствующую гипотезу;
Перевести разности в абсолютные величины и записать их по разным столбцам;
Проранжировать абсолютные величины разности, начисляя меньшему значению меньший ранг;
Подсчитать сумму рангов в нетипичном направлении. Данная сумма рангов и будет эмпирическим значением.
Угловой φ – критерий Фишера
Назначение: Угловой φ - критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, заинтересовавшего исследователя. Особенно удобно его использовать при проверке «отсутствия - наличия эффекта» при сравнении контрольной и экспериментальной групп.
Ограничения:
- если n A и n B - объемы выборок, то n A ≥ 5, n B ≥ 5. Допускаются также случаи:
n A = 2, n B ≥ 30;
n A = 3, n B ≥ 7;
n A = 4, n B ≥ 5.
ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.
Алгоритм использования:
Проверить выполнение ограничений;
Определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект». И на тех, у которых «нет эффекта». Подсчитать количество таких испытуемых в группах А и В. Проверить совпадение контрольной суммы A + B + C + D = n A + n B;
Подсчитать процентные доли испытуемых, у которых «есть эффект», и тех, у кого «нет эффекта», в обеих выборках. Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы;
Сформулировать гипотезы: Н 0: доля испытуемых, у которых «есть эффект» в группе А, не выше доли испытуемых в группе В; Н 1: доля испытуемых, у которых «есть эффект» в группе А, выше доли испытуемых в группе В.
Подсчитать эмпирическое значение критерия по формуле: φ эмп. = (φ 1 – φ 2) √ n 1 n 2 / n 1 + n 2;
Изобразить найденные значения на оси значимости.
Q – критерий Розенбаума
Назначение: Q-критерий Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно
Ограничения: В каждой выборке должно быть не менее 11 наблюдений, т.е. n 1 ≥ 11, n 2 ≥ 11, n 1 ≈ n 2.
При этом:
если n 1 ≤ 50, n 2 ≤ 50, то (n 1 – n2) ≤ 10;
если 51 ≤ n 1 ≤ 100, то (n l – n 2) ≤ 20;
если n 1 ≥ 100, n 2 ≥ 100, то n 1 : n 2 ≤ 1,5, где n 1 ≥ n
Алгоритм использования:
Выполнить проверку на ограничения количества элементов в выборке (n1; n2>=11);
Упорядочить в порядке возрастания элементы в каждой из выборок. Будем считать выборкой № 1 ту, чьи значения явно выше, № 2 – явно ниже;
Определить максимальное значение выборки № 2;
Подсчитать количество значений выборки № 1, превышающее максимальное значение выборки № 2. S1 – количество полученных значений;
Найти минимальное значение выборки № 1. Подсчитать количество элементов выборки № 2, меньших минимальному значению выборки № 1. Полученное число – S2;
Сумма чисел S1, S2 = Q эмп.;
Сравнить Q эмп. с табличным значением на уровнях значимости 0,01 и 0,05. Если Q эмп. = Q кр. На уровне 0,05 или превышает его, Но отвергается.
X² – критерий Фридмена
Назначение: χ² - используется для сравнения частот двух распределений: двух эмпирических или эмпирического и теоретического.
Ограничения: Объем сопоставляемых распределений не менее 20-30 вариантов, а минимальная их частота не менее 5.
Алгоритм использования:
Выполнить проверку на ограничения количества элементов в выборке ;
Прранжировать индивидуальные значения первого испытуемого, полученные им в 1 – м, 2 – м, 3-м. и т.д. замерах. Проделать то же самое по отношению ко всем другим испытуемым;
Просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчётной суммой;
Определить эмп.значение X² ;
Сравнить эмп.значение X² с табличным;
Н – критерий Крускала-Уоллиса
Назначение: Критерий предназначен для оценки одновременно между тремя, четырьмя и так далее выборками по уровню какого-либо признака. Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Ограничения:
1. При сопоставлении 3-x выборок допускается, чтобы в одной из них n=3, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (p≤0,05). Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (p≤0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2;
2. Критические значения критерия Н и соответствующие им уровни значимости приведены в таблице. Таблица предусмотрена только для трех выборок и {n 1, n 2, n 3} ≤ 5. При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться таблицей критических значении критерия χ², поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению χ ² . Количество степеней свободы при этом определяется по формуле: v=c-1, где с - количество сопоставляемых выборок;
При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½ * [с * (с-1) ], где с – количество выборок, для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ.
Алгоритм использования:
Гипотезы:
Н 0: между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака;
Н 1: между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.
L – критерий тенденций Пейджа
Назначение: Критерий L Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых. Критерий позволяет выявить тенденции в измерении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений.
Ограничения:
1. нижний порог - 2 испытуемых, каждый из которых прошел не менее 3-х замеров в разных условиях. Верхний порог - 12 испытуемых и 6 условий (n≤12, c≤6). Критические значения критерия L даны по руководству J. Greene, М. D'Olivera (1989). Они предусматривают три уровня статистической значимости: p≤0,05; p≤0,01; p≤0,001;
2. необходимым условием применения теста является упорядоченность столбцов данных: слева должен располагаться столбец с наименьшей ранговой суммой показателей, справа – с наибольшей. Можно просто пронумеровать заново все столбцы, а потом вести расчеты не слева направо, а по номерам, но так легче запутаться
Алгоритм использования: