Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по МатСтату.doc
Скачиваний:
18
Добавлен:
18.11.2018
Размер:
1.08 Mб
Скачать

Проверка двух простых гипотез

Если обе гипотезы простые, т.е. и , содержат по одной вероятностной мере, соответственно, и , то естественной функцией потерь является следующая

т.е. потери равны нулю, если ошибки нет, и равны единице, если ошибка есть.

Ошибка

,

традиционно называется ошибка первого рода

Ошибка

,

называется ошибка второго рода

Функция риска принимает для каждого критерия два значения

и

которые называются вероятностями ошибки первого и второго рода, соответственно. Величину называют также объемом или уровнем значимости критерия , величину - мощностью критерия . Наиболее просто получить решение задачи различения двух простых гипотез в байесовской постановке.

Байесовский подход

Пусть гипотезы и простые и имеют априорные вероятности и соответственно. Тогда байесовский риск решения

Выбор

очевидно, минимизирует байесовский риск. Таким образом, решающее правило байесовского критерия имеет вид

Наиболее мощный критерий. Лемма Неймана- Пирсона

Любое множество такое, что определяет некоторый стастистический критерий, имеющий вероятность ошибки 1-ого рода .

Критерий , имеющий наименьшую вероятность ошибки второго рода среди всех таких критериев, называется наиболее мощным критерием ( у него наибольшая мощность )

Определение.

Критерий называется наиболее мощным критерием объема , если

Следующая теорема содержит достаточные условия существования наиболее мощного критерия.

Теорема (Лемма Неймана-Пирсона)

Пусть для некоторого существует такое , что

Тогда критерий с критической областью

является наиболее мощным критерием объема

Пример.

Пусть вектор данных представляет собой выборку из распределения .

Рассмотрим две простые гипотезы относительно действительного параметра

Положим для определенности, что

Тогда наиболее мощный критерий будет иметь критическую область

где определяется из уравнения

Заметим, что критическое множество в данном примере одно и то же для всех альтернатив вида

где .

Проверка непараметрических гипотез. Критерии согласия

Если семейство или не является параметрическим, то соответствующая гипотеза называется непараметрической.

Рассмотрим следующую постановку задачи. Пусть вектор данных представляет собой выборку из распределения с функцией распределения и необходимо проверить гипотезу

против альтернативы

В этом случае основная гипотеза простая, альтернатива непараметрическая.

Данная задача является задачей проверки согласия данных с гипотезой , а соответствующие критерии называются критериями согласия.

Общая идея построения критериев согласия следующая. Эмпирическая функция распределения представляет собой хорошую оценку для , следовательно значительные отклонения от свидетельствуют о справедливости гипотезы.

Поэтому, если определить расстояние между функциями распределения и - , то критическую область критерия согласия разумно выбрать в виде

где константа - выбирается из условия

В зависимости от выбора расстояния можно получить различные критерии согласия.

Критерий знаков

Положим

где - некоторая фиксированная точка.

Для того, чтобы рассчитать константу необходимо вычислить распределение расстояния при гипотезе . Это легко можно сделать, если заметить, что