- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
2. Статистические оценки параметров теоретического распределения
2.1. Точечные и интервальные оценки
Статистическое распределение репрезентативной выборки не должно значительно отличаться от закона распределения изучаемой генеральной совокупности (случайной величины ). Значит, и числовые характеристики случайных величин и Х должны быть примерно одинаковы.
Одной из задач математической статистики является оценивание неизвестных параметров теоретического распределения генеральной совокупности (случайной величины ) на основании выборки объема . До проведения опыта значения выборочных элементов неизвестны, следовательно, являются случайными величинами, которые обозначим . Распределения и одинаковы, следовательно, их числовые характеристики тоже совпадают.
Приближенное значение параметра теоретического распределения, вычисленное по выборочным значениям , называется статистической оценкой (или кратко статистикой). Для различных выборок из одной генеральной совокупности статистика будет принимать разные значения, поэтому следует считать тоже случайной величиной .
Статистическая оценка , задаваемая одним числом, называется точечной. Погрешность такой оценки, вычисленной по одной выборке, не известна, поэтому у соответствующей статистики проверяется наличие ряда свойств [3].
Оценка называется несмещенной, если ее математическое ожидание равно , т.е. . В противном случае оценка называется смещенной. Оценка называется асимптотически несмещенной, если
.
называется состоятельной оценкой, если
.
Последнее означает, что стремится по вероятности к оцениваемому параметру при увеличении объема выборки.
Оценка называется эффективной, если при данном объеме выборки из всех возможных оценок она имеет наименьшую дисперсию. Эффективная оценка меньше других меняется от выборки к выборке. Это свойство оценки может быть асимптотическим, если при увеличении объема выборки оценка приближается к эффективной.
Кроме точечных оценок, которые не дают возможности определить точность и надежность полученного значения , в статистике также применяются интервальные оценки. Интервальной называется статистическая оценка неизвестного параметра , задаваемая двумя числами и – концами доверительного интервала . При определении интервальной статистической оценки необходимо задать доверительную вероятность (надежность, коэффициент доверия) этой оценки. Концы доверительного интервала и определяются из условия
.
Тогда вероятность того, что интервал со случайными концами, меняющимися от выборки к выборке, покроет оцениваемый параметр , равна . Числа и называются доверительными границами. Между ними с надежностью содержится параметр . Половина длины доверительного интервала – это точность интервального оценивания. Более надежный интервал является менее точным [3]. В этом смысле точность и надежностью являются конкурирующими характеристиками интервальной оценки. При интервал становится бесконечным и не дает информации о точности оценки. Обычно доверительную вероятность задают равной 0,95; 0,99 или 0,999.
Если известна точечная оценка параметра распределения и доказано равенство , то число является точностью, а число – надежностью оценки . Действительно, неравенства и эквивалентны, следовательно, левая граница доверительного интервала , а правая граница .
Примеры расчета точечных оценок приведены в параграфе 2.4.