- •Министерство образования, науки и спорта Украины
- •Какие критерии выбрать: параметрические или непараметрические?
- •Какой может быть вариация?
- •Как определить, является ли распределение нормальным?
- •Алгоритм выбора конкретного статистического критерия
- •Алгоритм выбора параметрического критерия
- •1. Анализ действия экспериментального фактора.
- •Алгоритм выбора непараметрического критерия
- •1. Анализ действия экспериментального фактора.
- •2. Анализ различий.
- •Общая характеристика статистических критериев.
- •1. Критерий t Стьюдента для связанных выборок.
- •2. Критерий t Стьюдента для несвязанных выборок
- •3. Критерий t Стьюдента для сопоставления выборочной средней с заданной средней величиной
- •6. Критерий w Вилкоксона для сопряженных рядов
- •7. Критерий q Розенбаума
- •8. Критерий т Уайта
- •9. Критерий u Манна-Уитни
- •10. Критерий λ Смирнова-Колмогорова
- •11. Критерий х Ван-дер-Вардена
- •12. Критерий s Вальда - Вольфовица
- •13. Критерий t Сиджела-Тьюки
- •14. Критерий 2r Фридмана
- •15. Критерий тенденций l Пейджа
- •16. Критерий н Крускала-Уоллиса
- •21. Критерий 2 в многопольных таблицах.
- •22. Критерий Пирсона - Павлика.
- •23. Критерий Мак-Нимара
- •24. Угловое преобразование Фишера (критерий φ*).
- •25. Показатель корреляции Пирсона (r).
- •26. Показатель корреляции Спирмэна (rs).
- •27. Показатель ассоциации Юла rA(показатель контингенции)
- •28. Критерий множественной ранговой корреляции (rw)
- •29. Параметрический критерий множественной корреляции
- •30. Бисериальный коэффициент корреляции.
- •31. Дисперсионный анализ.
- •32. Критерий g Кохрена.
- •2). Средняя длина побега растений данного вида
- •Примеры использования z и φ – преобразования
- •Доли площади под нормальной кривой, отсекаемые t справа и слева от средней
- •Доли площади под нормальной кривой, отсекаемые t слева от средней
- •Доли площади под нормальной кривой, отсекаемые t справа от средней
- •Значения t при различных уровнях значимости р
- •Значения f при уровне значимости p 0,05
- •Стандартные значения критерия t для исключения
- •Значения критерия w Вилкоксона (для сопряженных рядов)
- •Значения к для приблизительного определения σ при разных объемах выборки
- •Критические значения показателя 2 (хи-квадрат)
- •Критические значения критерия r Фридмана
- •Критические значения критерия 2r Фридмана
- •Критические значения критерия тенденций l Пейджа
- •Для 3 с 6 и 2 n 12)Таблица 29
- •Критические значения критерия н Крускала-Уоллиса
- •Критические значения критерия тенденций s Джонкира
- •Значение r при разных величинах z
- •Объем выборки, необходимый для признания корреляции достоверной
- •Критические значения f - критерия для проверки результатов дисперсионного анализа р 0,05
- •Критические значения f - критерия для проверки результатов дисперсионного анализа р 0,01
- •Перевод процентов летальных исходов в пробиты
- •Критические значения q-критерия Кохрена
- •Ответы на задания по определению характера вариации (стр. 8)
- •Литература
Как определить, является ли распределение нормальным?
Если установлено, что исследуемые значения имеют количественный характер, следует проверить выборку на нормальность распределения. Это можно сделать несколькими способами.
Первый способ проверки выборки на нормальность распределения
Прежде всего, нужно вычислить показатели асимметрии и эксцесса, используя программу Excel, имеющуюся практически на всех компьютерах. Для этого в таблицу программы следует поместить результаты измерений. Пусть это будет ряд значений, полученных на выборке из 25 объектов: 9 10 10 10 11 11 11 11 12 12 12 12 12 12 12 13 13 13 13 14 14 15 15 16 17
Данные могут располагаться как в виде строки, так и в виде колонки. Далее, нажатием кнопки с символами fx, расположенной ниже панели инструментов, вызываем мастер функций. В верхнем окне выбираем категорию «Статистические», а в нижнем - пункт «Скос». Возвращаемся к таблице с результатами измерений, и, выделяя набранные ранее цифры, помещаем их значения в открывшееся окно «Аргументы функций». На правой стороне окна появляется результат вычислений – 0,579. Это и есть значение показателя асимметрии, характеризующего степени отклонения вершины кривой распределения от его центра. Можно сказать, что показатель асимметрии отражает отклонение вершины реальной кривой распределения от идеальной по оси абсцисс.
По схожему алгоритму вычисляем величину показателя эксцесса характеризующего подъем или снижение вершины распределения, то есть – отклонения по оси ординат. Для того, чтобы произвести расчет данного показателя, следует выбрать пункт «эксцесс». В окне «Аргументы функций» получим его значение – 0,116.
При наличии статистических таблиц критических значений асимметрии и эксцесса (в данном учебном пособии это таблицы 9 и 10) вычисленные значения сравниваются с табличными. Если оба (!) показателя окажутся меньше табличных величин, то распределение может считаться нормальным.
Для нашего примера табличное значение показателя асимметрии находим на пересечении строки n = 25 и колонки р ≤ 0,01 (предположим, что мы анализируем результаты достаточно важных экспериментов и считаем, что вероятность ошибки статистического заключения не должна превышать 1%). Это число составляет 1,061. Так как вычисленное значение показателя асимметрии 0,579 оказывается гораздо меньше табличной величины 1,061, можно сделать заключение, что отклонение вершины распределения по оси абсцисс не столь значительно, чтобы отказаться от применения параметрических методов.
В таблице 10 находим критическое значение показателя эксцесса. Для n = 26 (так как в таблице отсутствует строка для n = 25, переходим к ближайшей строке) и
р ≤ 0,01 оно составляет 0,869. И снова фактическое значение показателя 0,116 оказывается меньше табличного 0, 869. Отсюда следует, что отклонение вершины распределения по оси ординат также несущественно и его можно считать нормальным. То, что оба показателя оказались меньше критических табличных величин, дает основание для последующего применения параметрических критериев.
Второй способ проверки выборки на нормальность распределения
При отсутствии таблиц критических значений асимметрии и эксцесса следует произвести расчеты не только этих показателей, но и их выборочных ошибок.
Ошибка показателя асимметрии производится по формуле:
Для нашего примера она составит:
Выборочная ошибка эксцесса рассчитывается по другой формуле:
в результате получим:
Далее следует разделить показатели асимметрии и эксцесса на их ошибки.
Частное от деления показателей асимметрии и эксцесса на их ошибки определяется как tф (фактическое значение) и сравнивается с tт,табличное значение), взятым из таблицы Стьюдента (таблица 6), при соответствующем уровне значимости и числе степеней свободы. Если фактическое значение критерия Стьюдента окажется меньше табличного, распределение признается нормальным, и, наоборот, если фактическое значение окажется больше табличного, следует сделать вывод о несоответствии распределения нормальному закону.
Для показателя асимметрии получаем следующее значение t-критерия:
Число степеней свободы (df), определяющее строку в таблице Стьюдента, находим как n-1. Следовательно, df = 25-1=24. Уровень значимости (вероятность ошибки статистического заключения), определяющий колонку в таблице Стьюдента, оставляем 1%. На пересечении строки df =24 и колонки р ≤ 0,01 находим табличное значение критерия tт = 2,80. Так как tф (1,25) оказывается гораздо меньше чем tт (2,80), можно заключить, что и второй способ проверки указывает на незначительность асимметрии кривой распределения.
Фактическое значения t-критерия для показателя эксцесса рассчитываем по формуле Таким образом, не только для асимметрии, но и для эксцесса tф (0,129) оказывается существенно меньше чем tт (2,80), что опять же указывает на нормальность распределения.
Третий способ проверки выборки на нормальность распределения
Проще всего задача решается, если имеется компьютер с установленной на ней программой Statistica. После ввода данных в таблицу вызывается стартовая панель модуля Основные статистики и таблицы (Basic Statistics/Tables). В средней части окна Descriptive Statistics (Описательные статистики) слева находится блок проверки распределений (Distribution). Чтобы проверить, относятся ли показатели выбранной переменной к распределяемым по нормальному закону, нужно поставить галочку в окне возле пункта K-S and Lilliefors test for normality (Критерий Колмогорова-Смирнова и Лилиефорса для нормальности) и нажать на кнопку Histograms (гистограммы). В появившемся окне приводятся гистограмма распределения значений переменной и наложенная на нее кривая нормального распределения, сопоставление которых позволяет визуально оценить характер распределения.
В верхней части окна указывается достоверность отличия проверяемого распределения от нормального, характеризуемая уровнем значимости р (вероятность неправильного отвержения гипотезы, если она верна). Если уровень значимости р<0,05, то распределение отлично от нормального на основании соответствующего критерия. И наоборот, если р>0,05, как на рисунке, то наблюдаемая величина распределена нормально. Зная вид распределения, в дальнейшей обработке можно применить оптимальные статистические методы.