Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СПРАВОЧНЫЙ МАТЕРИАЛ ДЛЯ ВСТУПИТЕЛЬНЫХ ЭКЗАМЕНОВ В АСПИРАНТУРУ ПО ПРОФИЛЮ ОБУЧЕНИЯ «ИСКУССВТЕННЫЙ ИНТЕЛЛЕКТ И МАШИННОЕ ОБУЧЕНИЕ».docx
Скачиваний:
46
Добавлен:
04.09.2023
Размер:
6.41 Mб
Скачать
  1. Статистические гипотезы и статистические критерии. Односторонние и двусторонние критерии. Критерии согласия. Параметрические критерии. Ошибки первого и второго рода. Мощность критерия.

Статистические гипотезы и статистические критерии. Статистическая гипотеза – это утверждение или предположение о параметре популяции, который мы хотим проверить. Это может быть либо нулевая гипотеза ( ), либо альтернативная гипотеза ( ). Нулевая гипотеза представляет собой статус-кво или предположение по умолчанию, а альтернативная гипотеза представляет собой утверждение или теорию, которую мы хотим поддержать.

Чтобы оценить достоверность гипотезы, мы используем статистические критерии или тесты. Эти тесты обеспечивают систематический способ принятия решений на основе наблюдаемых данных. Выбор подходящего статистического теста зависит от характера данных и вопроса исследования.

Односторонние и двусторонние критерии. Односторонние и двусторонние критерии относятся к направленности статистического теста. При одностороннем тесте мы заинтересованы в том, чтобы определить, значительно ли отличается параметр популяции от определенного значения в одном направлении (больше или меньше). Например, мы можем захотеть проверить, является ли средний рост определенной группы значимо больше 170 см. В двустороннем тесте нас интересует, отличается ли параметр популяции значимо от конкретного значения в любом направлении. Используя тот же пример, мы можем захотеть проверить, значительно ли отличается средний рост от 170 см, не уточняя, больше он или меньше.

Критерии согласия. Критерии согласия используются при сравнении наблюдаемых данных с ожидаемым или теоретическим распределением. Эти критерии определяют, значительно ли отклоняются наблюдаемые данные от того, что ожидалось бы при определенном допущении. Примерами являются тесты на добросовестность, такие как критерий Колмогорова-Смирнова, где сравниваются различия кумулятивных функций для ответа на вопрос о принадлежности исследуемых выборок одному распределению, или -квадрат Пирсона, который оценивает, значительно ли отличаются наблюдаемые частоты от ожидаемых.

Однако, сравнение частот в двух группах не всегда используется для оценки их согласия, например, -квадрат Пирсона может быть также примерен в сравнении частот/долей категориальных переменных, таких как любимые музыкальные альбомы, для двух абстрактных групп, например, мужчины и женщины. С этой же целью был разработан точный критерий Фишера, который, впрочем, эффективней на малых независимых выборках. Непараметрическими аналогами упомянутых тестов могут служить: тест Мак-Немара и Q-критерий Кохрена.

Параметрические критерии. Параметрические критерии – это статистические тесты, которые предполагают определенные распределения для изучаемой популяции. Эти тесты делают предположения о базовом распределении данных, например, о нормальности. Примерами параметрических тестов являются t-тесты, дисперсионный анализ (ANOVA) и многофакторный дисперсионный анализ (MANOVA). Тест Стьюдента может использоваться для оценки некоторого параметра, например, среднего, в паре зависимых или независимых групп, при этом ANOVA может быть использован на трех и более группах. Параметрические тесты часто имеют большую статистическую мощность по сравнению с непараметрическими тестами, но требуют более строгих предположений. Непараметрическими аналогами упомянутых тестов могут служить: критерий Уилкоксона (для зависимых выборок) и Мана-Уитни (для независимых выборок).

Ошибки первого и второго рода. Ошибки первого и второго рода, также известные как ошибки типа I и типа II, являются возможными результатами проверки гипотез.

Ошибка типа I возникает, когда мы отвергаем нулевую гипотезу, хотя на самом деле она верна. Это эквивалентно ложному срабатыванию или ложной тревоге. Уровень значимости (альфа) теста определяет вероятность ошибки типа I. Ошибка типа II, с другой стороны, возникает, когда мы не отвергаем нулевую гипотезу, когда она на самом деле ложная. Это эквивалентно ложноотрицательному результату или пропущенному обнаружению.

Мощность критерия. Мощность статистического теста – это вероятность правильно отвергнуть нулевую гипотезу, если она ложная. На мощность влияют такие факторы, как объем выборки, размер эффекта и выбранный уровень значимости.