- •1. События, частота и вероятность
- •2. Классификация событий
- •3. Классический способ нахождения вероятности
- •1. Элементы комбинаторики и вычисление вероятности событий
- •2. Геометрические вероятности
- •4. Теорема сложения вероятностей событий
- •5. Формула полной вероятности
- •1. Формула Бернулли
- •1. Закон распределения дискретной случайной величины
- •1. Функция распределения непрерывной и дискретной случайной величины
- •2. Свойства функции распределения
- •3. Плотность распределения вероятностей непрерывной случайной величины
- •4. Свойства плотности вероятности
- •1. Равномерное распределение
- •2. Нормальное распределение
- •1. Математическое ожидание. Дискретные случайные величины
- •3. Дисперсия и среднее квадратическое отклонение случайной величины
- •4. Свойства дисперсии
- •Математичечская статистика
- •1. Генеральная и выборочная совокупность данных
- •2. Статистическое распределение выборки. Выборочный ряд, полигон, гистограмма и комулянта выборки.
- •1. Точечные оценки.
- •1. Простые и сложные статистические гипотезы.
- •2. Проверка статистических гипотез
1. Точечные оценки.
Точечной статистической оценкой параметров распределения или характеристик наблюдаемой случайной величины Х, называется построенная по данным выборки объема n величина:
.
Оценка *n является так же случайной величиной, т.к. зависит от случайной выборки, поэтому ее можно представить как функцию от случайных величин *n =*n(Х1, Х2,.., Хn), где Хi независимые случайные величины, распределенные так же как и сама величина Х. Для того, что бы оценки, получаемые по данным различных выборок соответствовали истинному значению параметра , оценка должна удовлетворять следующим требованиям.
Оценка должна быть несмещенной, т.е. ее математическое ожидание должно совпадать с истинным значением параметра для любого объема n
М(*n) = .
или хотя бы асимптотически несмещенной: .
Оценка должна быть состоятельной, т.е. с ростом объема выборки оценка должна сходится по вероятности к истинному значению параметра:
для любого > 0 .
Для состоятельности оценки достаточно выполнения следующего:
,
тогда из неравенства Чебышева для случайной величины *n
следует состоятельность оценки.
Построенная оценка для использования на практике должна быть эффективной, т.е. ее дисперсия должна быть минимальной среди всех возможных оценок при фиксированном объеме выборки:
D(*n,эф) = min D(*n).
Величину дисперсии эффективной оценки можно найти используя неравенство Рао-Крамера
,
где - информация Фишера. Коэффициент эффективности оценки kэф(*)= D(*n,эф)/ D(*n) показывает степень эффективности оценки *, если , то говорят об асимптотической эффективности оценки.
Отметим, что на практике не всегда удается удовлетворить всем перечисленным требованиям к оценке, но введенные свойства оценок всегда позволяют проранжировать имеющиеся оценки по их качеству.
В качестве примера рассмотрим оценки математического ожидания М(Х) = m и дисперсии D(Х) = 2 наблюдаемой случайной величины X. Построим точечные оценки:
,
и рассмотрим их свойства. Поскольку М(Хi) = m и D(Хi) = 2 то можно вычислить, что для оценки m* справедливо:
М(m*) = m; D(m*) = 2 /n 0 при n
Из этого следует несмещенность и состоятельность оценки m*.
Рассматривая же оценку 2* можно получить:
;
Из чего следует не только состоятельность, но и смещенность оценки 2*. Смещеность оценки здесь легко может быть исправлена. Рассмотрим оценку:
.
Оценка 2*=S2 является уже несмещенной и состоятельной оценкой. Величина S2 называется исправленной (уточненной) выборочной дисперсией, а величина S исправленным среднеквадратическим выборочным отклонением (выборочный стандарт).
В заключении напомним что относительная частота wn появления события в независимых испытаниях Бернулли является несмещенной, состоятельной и эффективной оценкой неизвестной вероятности этого события р*=wn (теорема Бернулли), а эмпирическая функция выборочного распределения является состоятельной несмещенной оценкой неизвестной функцией распределения наблюдаемой случайной величины (теорема Гливенко).
Проверка статистических гипотез
Имея дело со случайными величинами в различных областях человеческой деятельности, часто приходится высказывать предположения о виде распределения случайной величины или о значениях ее параметров. Эти предположения строятся с целью прогнозирования поведения случайной величины и принятия решений в условиях неопределенности.
Статистической гипотезой называется любое предположение о виде распределения случайной величины или/и о значении неизвестных параметров распределения .
– статистическая гипотеза
Высказанная статистическая гипотеза должна быть проверена по результатам наблюдений (измерений) случайной величины [11], в результате чего гипотеза принимается или отвергается с определенной степенью риска совершить ошибку.