- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Метод максимального правдоподобия
- •Байесовский подход
- •Допустимость байесовских оценок
- •Теорема об апостериорном риске
- •Вычисление байесовских оценок при квадратичной функции потерь
- •Минимаксный подход
- •Минимаксность байесовских решений
- •Проверка статистических гипотез
- •Основные понятия теории проверки статистических гипотез
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
Общая статистическая модель
Определение.
Назовем общей статистической моделью следующий математический объект
где - измеримое пространство, - некоторое семейство вероятностных мер на .
В случае, когда семейство состоит из одной вероятностной меры , статистическая модель превращается в вероятностное пространство
Одной из основных задач математической статистики является задача разумного выбора меры из семейства на основании наблюдения значения , произошедшего в опыте, произведенном в соответствии с моделью . При этом результат опыта (наблюдение) известен, относительно вероятностной меры известно лишь, что
В данной модели представляет собой статистические данные, семейство - априорные сведения.
Пример.
Рассмотрим опыт, состоящий в бросании несимметричной монеты 1 раз.
Тогда , (единица интерпретируется как выпадение монеты гербом вверх)
Обозначим - вероятность выпадения монеты гербом вверх, -вероятность на , соответствующую вероятности выпадения гербом вверх .
Предположим, что семейство состоит из двух вероятностных мер и , тогда следующий способ выбора вероятностной меры в зависимости от значения будет разумным:
Если , то выбираем
Если , то выбираем
Разумность данного способа выбора состоит в том, что при его применении мы никогда не ошибемся.
Предположим теперь, что семейство состоит из двух вероятностных мер и , тогда следующий способ выбора вероятностной меры в зависимости от значения также будет разумным:
Если , то выбираем
Если , то выбираем
Разумность данного способа выбора состоит в том, что правильное решение принимается с вероятностью 0,9 (вероятность ошибки 0,1) независимо от того, какая в вероятностная мера реализуется в эксперименте. Три оставшихся способа выбора
2)Если , то выбираем
Если , то выбираем
3) Всегда выбираем
4) Всегда выбираем
имеют максимальную вероятность ошибки больше, либо равную 0,9
Если семейство состоит из двух вероятностных мер и , тогда разумность способа выбора:
если , то выбираем
если , то выбираем
представляется сомнительной, потому что вероятность ошибки не меньше 0,89. Более того, три оставшихся способа выбора имеют еще большие максимальные вероятности ошибок. В этом случае содержательные выводы о по наблюдению сделать невозможно, т.е. представленных статистических данных для решения задачи недостаточно.
Данный пример показывает, что, даже в простейшем случае, абсолютно достоверные выводы на основании статистических данных сделать, вообще говоря, невозможно.
Математическая статистика предлагает критерии качества выводов, позволяющие выбрать разумный или даже оптимальный, в некотором строго определенном смысле, способ обработки и интерпретации данных, установить точность и достоверность выводов, определить объемы статистических данных, необходимые для решения задачи с заданной точностью и достоверностью
Параметрические и непараметрические задачи
В зависимости от того, каким образом задано семейство , принято различать параметрические и, как дополнение к ним, непараметрические модели статистики.
Для того чтобы корректно определить параметрическую модель, введем следующее расстояние между вероятностными мерами.
Определение.
Величина называется расстоянием по вариации между вероятностными мерами .
Определение. Семейство вероятностных мер называется (k -) параметрическим, если существует взаимно однозначное соответствие между некоторым подмножеством и семейством
Покажите, что для параметрического семейства верно и обратное: из сходимости следует сходимость. |
такое, что из сходимости следует сходимость . |
Статистическая модель называется параметрической, если семейство параметрическое. В этом случае величину называют параметром, а - параметрическим множеством.
Если все меры семейства имеют плотность
относительно некоторой меры , то из теоремы Шеффе следует, что достаточным условием параметричности семейства является взаимно однозначность соответствия и непрерывность функции по для любого .
Это условие не является ограничительным и обычно выполняется во всех практически важных задачах |
В продолжение всего курса, будем предполагать, что все меры семейства имеют плотность относительно некоторой меры , которую будем в общем случае обозначать , а в параметрическом |
В частности, семейства распределений
и т.п. являются параметрическими.
В дальнейшем математическое ожидание по мере будем обозначать или, для параметрических семейств .