- •Выборочный метод
- •Способы отбора
- •Статистическое распределение выборки
- •Эмпирическая функция распределения
- •Полигон и гистограмма
- •Статистические оценки параметров распределения
- •Виды статистических оценок
- •Эмпирические моменты
- •Асимметрия и эксцесс эмпирического распределения
- •Интервальные оценки
- •Доверительные интервалы для параметров нормального распределения
- •Доверительный интервал для математического ожидания при известной дисперсии
- •Доверительный интервал для математического ожидания при неизвестной дисперсии
- •Доверительные интервалы для среднеквадратического отклонения нормального распределения
- •Статистические оценки статистических гипотез
- •Виды статистических гипотез
Асимметрия и эксцесс эмпирического распределения
Нормальное распределение является одним из самых распространенных в применениях математической статистики. Для оценки отклонения эмпирического распределения от нормального используют следующие характеристики.
Асимметрия эмпирического распределения определяется следующим равенством:
(13)
Эксцесс эмпирического распределения определяется следующим равенством:
(14)
В формулы (13) и (14) входят центральные эмпирические моменты, определяемые формулами (11), а также выборочное среднеквадратическое отклонение (9). Асимметрия и эксцесс служат для сравнения полигона эмпирического распределения с нормальным распределением: знак аs указывает на расположение длинной части ломаной относительно математического ожидания (справа при аs > 0 и слева при аs < 0): ek характеризует «крутизну» ломаной (при ek > 0 сравниваемая кривая более высокая и острая, при ek < 0 она более низкая и плоская).
Пример 6. Найти асимметрию и эксцесс эмпирического распределения:
-
варианта
1
2
3
4
5
6
10
частота
5
10
15
35
16
15
4
Решение. Найдем сначала и по формулам ( 6) — (9):
Далее, используя формулы (11), определяем центральные эмпирические моменты третьего и четвертого порядков:
m3 = (5 . (- 3,2)3 + 10 . (-2,2)3 + 15 . (- 1,2)3 + 35 . (- 0,2)3 + 16. 0,83 +
+15 . 1,83 + 4 . 5,83) / 100 =579,6/100 = 5,796
m4 = (5 . (- 3,2)4 + 10 . (-2,2)4 + 15 . (- 1,2)4 + 35 . (- 0,2)4 + 16. 0,84 +
+15 . 1,84 + 4 . 5,84) / 100 =5480,32/100 = 54,8032.
Затем по формулам (13) и (14) находим искомые величины:
аs = 5,796/1,8873 = 0,863 ek = 54,8032/1,8874 =4,324.
Интервальные оценки
Все оценки, приведенные ранее, определяются одним числом, т.е. являются точечными. Точечные оценки хороши при первичной обработке результатов наблюдений. При малых объемах выборки точечная оценка может приводить к большим ошибкам и значительно отличаться от оцениваемого параметра. Более широкое применение получил метод доверительных интервалов, разработанный американским статистиком Ю. Нейманом. Оценка неизвестного параметра называется интервальной, если она определяется двумя числами . Обычно выбирают симметричный интервал
Определение 2. Доверительным интервалом для параметра θ с надежностью оценки называется числовой промежуток (θ* - δ, θ* + δ), содержащий истинное значение данного параметра с вероятностью, равной р:
Р (θ* - δ < θ < θ* + δ) = , (15)
где θ* - оценка неизвестного параметра θ (например, точечная оценка), δ > θ - некоторое число.
Обычно надежность оценки или доверительная вероятность задается числом, близким к единице. Выбор этого числа зависит от конкретно решаемой задачи. Иными словами, доверительный интервал покрывает неизвестный параметр с заданной доверительной вероятностью. Число называется уровнем значимости. Общая схема построения доверительных интервалов сводится к следующему.
Рассматриваются теоретические выборки случайных величин, с распределениями которых связан параметр θ.
Подбирается случайная величина Y с известным распределением, значения которой определяются выборками и параметром θ: Y = Y (θ).
По известному распределению Y подбираются числа Y1 и Y2 такие, чтобы выполнялось равенство Р (Y1 < Y (θ) < Y2) = .
По значениям Y1 и Y2 определяется число δ > 0 при известном значении θ*. Таким образом, условие (15) будет выполнено и доверительный интервал построен.