- •Проверка гипотезы об однородности двух гс по критерию Манна-Уитни (по критерию числа инверсий)
- •Ранжирование выборки
- •Проверка гипотезы об однородности двух гс в случае связанных выборок
- •Проверка гипотезы по классическому критерию знаков
- •Ранговый критерий знаков Уилкоксона для связанных выборок
- •Проверка гипотезы о независимости двух признаков по критерию Спирмена
ПРОВЕРКА ГИПОТЕЗ ДЛЯ ДАННЫХ, ИЗМЕРЕННЫХ В ПОРЯДКОВОЙ ШКАЛЕ
Гипотеза об однородности двух ГС
Пусть ГС I и ГС II - две генеральные совокупности со случайным признаком Х, измеряемым в порядковой шкале.
F(x) - ФР признака Х в ГС I,
G(x) - ФР признака Х в ГС II.
Гипотеза : - распределения Х в ГС I и в ГС II совпадают.
Гипотеза : .
Пример 1. ГС I - студены – физики, ГС II - студенты – психологи.
Х – коэффициент IQ студента.
Проверка гипотезы об однородности двух гс по критерию Манна-Уитни (по критерию числа инверсий)
Обработка выборок.
Пусть - выборка из ГС I,
- выборка из ГС II, допустимо m ≠ n .
Условие 1. Выборки должны быть независимыми.
Условие 2. Среди чисел нет совпадающих.
Это выполнено с вероятностью 1, если Х - непрерывная случайная величина.
Проводится подсчёт числа инверсий в упорядоченных парах из элементов данных выборок: Число таких упорядоченных пар равно
Определение. Пара даёт одну инверсию, если . Если , то в паре инверсии нет. Случай пока исключается.
Вернёмся к примеру 1. Пусть получены выборки:
физики: 111, 104, 107, 90, 115, 106 m = 6,
психологи: 113, 108, 123, 122, 117, 112, 105 n = 7,
Число инверсий
Для другого порядка выборок
Проверка. (см. свойства статистики критерия).
Статистика критерия Манна-Уитни
= число инверсий в выборках
Свойства статистики.
,
так как одна и только одна из пар обязательно даёт одну инверсию, а число пар равно
Основа статистики
Если гипотеза верна (законы распределения ГСI и ГСII совпадают), то для любых i, j
, (*)
поэтому, в среднем, Таким образом, при верной
Возьмём для простоты m = n. При верной , так как репрезентативные выборки достаточно хорошо отражают свойства генеральных совокупностей, общий вариационный ряд сделанных выборок имеет вид
При неверной (*) нарушается, например и тогда в общем вариационном ряду большая часть элементов расположится в левой половине вариационного ряда, из-за чего станет значительно меньше, чем При самой большой неоднородности распределений ГС I и ГС II общий вариационный ряд имеет вид
Следовательно, статистика критерия оценивает близость распределений ГСI и ГСII по близости её выборочного значения к mn/2.
3. По данному УЗ α при использовании двустороннего критерия Манна-Уитни по таблицам его критических значений находят левое и правое критические значения. Допустимая для принятия m и n область имеет вид
4. По выборкам находят выборочное значение статистики критерия. Если , то принимается и вероятность ошибки в принятии в точности равна α . В противном случае отклоняется.
Замечания
1. Часто в таблицах приводится только левое или правое критическое значение. Тогда недостающее критическое значение находят из равенства .
2. При больших m и n (≥ 50) критические значения статистики критерия приближённо находятся по таблицам квантилей стандартного нормального распределения. Известно, что при больших m и n
Поэтому, если - квантиль стандартного нормального распределения, то отклоняется.
3. Важно. Если в выборках имеется l совпадений, то статистику критерия считают по поправочной формуле
Если число совпадений превышает число инверсий, то пользоваться критерием Манна-Уитни не рекомендуется.
Окончание примера 1.
Возьмём α = 0,05, тогда α/2 = 0,025.
По таблицам (0,025; 6; 7) = 6, тогда (0,025; 6; 7) =36. Так как ,
принимается.
Лучше применить левосторонний критерий, так как = 8 ближе к 0 (к левому краю), чем к 21 (к середине). По таблицам (0,05; 6; 7) = 8, , поэтому принимается.
Общее правило. Если выборочное значение статистики критерия близко к середине (mn/2), то применяют двусторонний критерий, а если к краю (к 0 или к mn) – то соответствующий односторонний критерий.