- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Метод максимального правдоподобия
- •Байесовский подход
- •Допустимость байесовских оценок
- •Теорема об апостериорном риске
- •Вычисление байесовских оценок при квадратичной функции потерь
- •Минимаксный подход
- •Минимаксность байесовских решений
- •Проверка статистических гипотез
- •Основные понятия теории проверки статистических гипотез
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
Асимптотические доверительные интервалы
Пусть - состоятельная и асимптотически нормальная оценка, например, оценка максимального прадоподобия или оценка, построенная по методу подстановки, т.е.
где функция и непрерывна. Тогда из свойств слабой сходимости и сходимости по вероятности следует, что
, т.е. случайная величина асимптотически свободна от распределения и используя ее можно строить асимптотические доверительные интервалы.
Доверительные интервалы для параметров нормального распределения
Рассмотрим практически важный случай доверительного оценивания параметров нормального распределения. Для решения этой задачи необходимо построить случайные величины, свободные от распределения.
-
Пусть вектор данных представляет собой выборку из распределения . Тогда свободна от распределения.
-
Пусть вектор данных представляет собой выборку из распределения . Тогда свободна от распределения.
-
Пусть вектор данных представляет собой выборку из распределения . Тогда свободна от распределения и случайная величина свободна от распределения. Последняя случайная величина имеет так называемое распределение Стьюдента с степенью свободы c плотностью
Примеры решения статистических задач в общей статистической модели.
В данном разделе рассмотрены некоторые задачи, статистические данные в которых не являются выборкой. Во всех этих задачах явный вид оценок необходимо найти самостоятельно.
Линейная регрессионная модель
Пусть вектор данных имеет следующую структуру
где случайные величины - независимы, одинаково распределены и
Требуется оценить по данным значение . Для решения этой задачи применим метод максимального правдоподобия. Плотность данных имеет вид
Максимизируя данное выражение по получим
т.е. оценка максимального правдоподобия совпадает с оценкой метода наименьших квадратов.
Оценка матрицы переходных вероятностей конечной цепи Маркова
Пусть вектор данных представляет собой реализацию простой конечной цепи Маркова с матрицей переходных вероятностей . Требуется построить оценки для элементов матрицы по данным . Для решения этой задачи применим метод максимального правдоподобия. Плотность данных имеет вид
где - количество переходов цепи Маркова из состояния в состояние за шагов. Теперь
Оценка параметра пуассоновского процесса
Пусть - наблюдение пуассоновского процесса с параметром на интервале Требуется построить оценку параметра. Для решения этой задачи найдем достаточную статистику. Заметим, что если - последовательные точки скачков пуассоновского процесса на интервале, то условное распределение вектора при условии совпадает с распределением вариационного ряда построенного по независимым равномерно распределенным на интервале случайным величинам, т.е. не зависит от . Так как пуассоновский процесс однозначно определяется моментами своих скачков получаем, что случайная величина равная числу точек процесса на интервале является достаточной статистикой. Распределение этой величины пуассоновское с параметром . Следовательно, она полная достаточная статистика и оценка - НОМД.