Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат_статистика.doc
Скачиваний:
22
Добавлен:
22.09.2019
Размер:
370.18 Кб
Скачать

Асимметрия и эксцесс эмпирического распределения

Нормальное распределение является одним из самых распространенных в применениях математической статистики. Для оценки отклонения эмпирического распределения от нормального используют следующие характеристики.

Асимметрия эмпирического распределения определяется следующим равенством:

(13)

Эксцесс эмпирического распределения определяется следующим равенством:

(14)

В формулы (13) и (14) входят центральные эмпирические моменты, определяемые формулами (11), а также выборочное среднеквадратическое отклонение (9). Асимметрия и эксцесс служат для сравнения полигона эмпирического распределения с нормальным распределением: знак аs указывает на расположение длинной части ломаной относительно математического ожидания (справа при аs > 0 и слева при аs < 0): ek характеризует «крутизну» ломаной (при ek > 0 сравниваемая кривая более высокая и острая, при ek < 0 она более низкая и плоская).

Пример 6. Найти асимметрию и эксцесс эмпирического распределения:

варианта

1

2

3

4

5

6

10

частота

5

10

15

35

16

15

4

Решение. Найдем сначала и по формулам ( 6) — (9):

Далее, используя формулы (11), определяем центральные эмпирические моменты третьего и четвертого порядков:

m3 = (5 . (- 3,2)3 + 10 . (-2,2)3 + 15 . (- 1,2)3 + 35 . (- 0,2)3 + 16. 0,83 +

+15 . 1,83 + 4 . 5,83) / 100 =579,6/100 = 5,796

m4 = (5 . (- 3,2)4 + 10 . (-2,2)4 + 15 . (- 1,2)4 + 35 . (- 0,2)4 + 16. 0,84 +

+15 . 1,84 + 4 . 5,84) / 100 =5480,32/100 = 54,8032.

Затем по формулам (13) и (14) находим искомые величины:

аs = 5,796/1,8873 = 0,863 ek = 54,8032/1,8874 =4,324.

Интервальные оценки

Все оценки, приведенные ранее, определяются одним числом, т.е. являются точечными. Точечные оценки хороши при первичной обработке результатов наблюдений. При малых объемах выборки точечная оценка может приводить к большим ошибкам и значительно отличаться от оцениваемого параметра. Более широкое применение получил метод доверительных интервалов, разработанный американским статистиком Ю. Нейманом. Оценка неизвестного параметра называется интервальной, если она определяется двумя числами . Обычно выбирают симметричный интервал

Определение 2. Доверительным интервалом для параметра θ с надежностью оценки называется числовой промежуток (θ* - δ, θ* + δ), содержащий истинное значение данного параметра с вероятностью, равной р:

Р (θ* - δ < θ < θ* + δ) = , (15)

где θ* - оценка неизвестного параметра θ (например, точечная оценка), δ > θ - некоторое число.

Обычно надежность оценки или доверительная вероятность задается числом, близким к единице. Выбор этого числа зависит от конкретно решаемой задачи. Иными словами, доверительный интервал покрывает неизвестный параметр с заданной доверительной вероятностью. Число называется уровнем значимости. Общая схема построения доверительных интервалов сводится к следующему.

  1. Рассматриваются теоретические выборки случайных величин, с распределениями которых связан параметр θ.

  2. Подбирается случайная величина Y с известным распределением, значения которой определяются выборками и параметром θ: Y = Y (θ).

  3. По известному распределению Y подбираются числа Y1 и Y2 такие, чтобы выполнялось равенство Р (Y1 < Y (θ) < Y2) = .

  4. По значениям Y1 и Y2 определяется число δ > 0 при известном значении θ*. Таким образом, условие (15) будет выполнено и доверительный интервал построен.