- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Метод максимального правдоподобия
- •Байесовский подход
- •Допустимость байесовских оценок
- •Теорема об апостериорном риске
- •Вычисление байесовских оценок при квадратичной функции потерь
- •Минимаксный подход
- •Минимаксность байесовских решений
- •Проверка статистических гипотез
- •Основные понятия теории проверки статистических гипотез
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
Проверка двух простых гипотез
Если обе гипотезы простые, т.е. и , содержат по одной вероятностной мере, соответственно, и , то естественной функцией потерь является следующая
т.е. потери равны нулю, если ошибки нет, и равны единице, если ошибка есть.
Ошибка
,
традиционно называется ошибка первого рода
Ошибка
,
называется ошибка второго рода
Функция риска принимает для каждого критерия два значения
и
которые называются вероятностями ошибки первого и второго рода, соответственно. Величину называют также объемом или уровнем значимости критерия , величину - мощностью критерия . Наиболее просто получить решение задачи различения двух простых гипотез в байесовской постановке.
Байесовский подход
Пусть гипотезы и простые и имеют априорные вероятности и соответственно. Тогда байесовский риск решения
Выбор
очевидно, минимизирует байесовский риск. Таким образом, решающее правило байесовского критерия имеет вид
Наиболее мощный критерий. Лемма Неймана- Пирсона
Любое множество такое, что определяет некоторый стастистический критерий, имеющий вероятность ошибки 1-ого рода .
Критерий , имеющий наименьшую вероятность ошибки второго рода среди всех таких критериев, называется наиболее мощным критерием ( у него наибольшая мощность )
Определение.
Критерий называется наиболее мощным критерием объема , если
Следующая теорема содержит достаточные условия существования наиболее мощного критерия.
Теорема (Лемма Неймана-Пирсона)
Пусть для некоторого существует такое , что
Тогда критерий с критической областью
является наиболее мощным критерием объема
Пример.
Пусть вектор данных представляет собой выборку из распределения .
Рассмотрим две простые гипотезы относительно действительного параметра
Положим для определенности, что
Тогда наиболее мощный критерий будет иметь критическую область
где определяется из уравнения
Заметим, что критическое множество в данном примере одно и то же для всех альтернатив вида
где .
Проверка непараметрических гипотез. Критерии согласия
Если семейство или не является параметрическим, то соответствующая гипотеза называется непараметрической.
Рассмотрим следующую постановку задачи. Пусть вектор данных представляет собой выборку из распределения с функцией распределения и необходимо проверить гипотезу
против альтернативы
В этом случае основная гипотеза простая, альтернатива непараметрическая.
Данная задача является задачей проверки согласия данных с гипотезой , а соответствующие критерии называются критериями согласия.
Общая идея построения критериев согласия следующая. Эмпирическая функция распределения представляет собой хорошую оценку для , следовательно значительные отклонения от свидетельствуют о справедливости гипотезы.
Поэтому, если определить расстояние между функциями распределения и - , то критическую область критерия согласия разумно выбрать в виде
где константа - выбирается из условия
В зависимости от выбора расстояния можно получить различные критерии согласия.
Критерий знаков
Положим
где - некоторая фиксированная точка.
Для того, чтобы рассчитать константу необходимо вычислить распределение расстояния при гипотезе . Это легко можно сделать, если заметить, что