Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
М2 4 4 Интервальные оценки.doc
Скачиваний:
6
Добавлен:
25.08.2019
Размер:
271.87 Кб
Скачать

34

5.2. Интервальное оценивание параметров распределения

5.2.1. Доверительный интервал и доверительная вероятность

Рассчитанная по выборке точечная оценка параметра является приближенным значением . Насколько велико отклонение этого приближения от истинного значения? Можно ли доверять этой оценке? Мерой нашего доверия оценке будем считать вероятность того, что погрешность оценки не превысит заданной точности

(5.1)

Это равенство иначе можно записать так: т.е. интервал вида с заранее заданной вероятностью «накрывает» истинное значение параметра При этом заранее выбранная вероятность называется доверительной вероятностью (или надежностью), а сам интервал — доверительным интервалом (или интервальной оценкой) для параметра

На практике выбирают доверительную вероятность из достаточно близких к единице значений и т.д. Затем по выборочным данным находят точечную оценку и точность оценки После этого определяют границы доверительного интервала .

Поступая таким образом, мы будем ошибаться при многократном проведении испытаний примерно в случаев. Например, если то ошибочное решение будет приниматься примерно 3 раза на 1000 опытов.

Отметим, что чем уже доверительный интервал для оценки неизвестного параметра, тем лучше. Длина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от величины доверительной вероятности (увеличивается с приближением к единице).

5.2.2. Интервальное оценивание центра генеральной совокупности

Рассмотрим вначале случай, когда выборка объема n извлечена из нормальной генеральной совокупности с неизвестным параметром a и известным Параметр является математическим ожиданием (генеральным средним) случайной величины Х. В качестве точечной оценки параметра возьмем выборочное среднее: Для уточнения приближенного равенства построим доверительный интервал, накрывающий параметр с заданной доверительной вероятностью

Если выборка объема n извлекается из нормальной генеральной совокупности то статистика имеет нормальное распределение с параметрами: Поэтому доверительная вероятность удовлетворяет соотношению:

(5.2)

В этом соотношении неизвестной величиной является точность оценки Обозначим отсюда

(5.3)

Значение найдем с помощью таблицы функции Лапласа (приложение 1), учитывая, что

Доверительный интервал для генерального среднего будет иметь вид

(5.4)

Этот метод построения доверительного интервала применяется и в случае, если генеральная совокупность Х не является нормальной. Согласно центральной предельной теореме, для выборки достаточно большого объема выборочное среднее будет иметь приближенно нормальное распределение с параметрами и где и — соответствующие параметры генеральной совокупности. В этом случае для построения доверительного интервала используют формулу (5.4), определяя значение по таблицам функции Лапласа, если При значение заменяют на которое определяют по таблице распределения Стьюдента (приложение 3), и формула (5.4) принимает вид:

(5.5)

где (область двусторонняя).

Если значение параметра неизвестно, то доверительный интервал строят по формуле (3.5), заменяя параметр с его оценкой

Величина называется средней ошибкой выборки и зависит от способа отбора: в случае конечной генеральной совокупности объема N вносится поправка на «бесповторность отбора», равная (табл. 5.1).

Таблица 5.1

Средняя ошибка выборки для генерального среднего

Генеральная совокупность

Бесконечная

Конечная

объема N

Тип отбора

Повторный

Бесповторный

Средняя ошибка выборки

Пример 1. Служба контроля Энергосбыта провела выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помощью случайного отбора было выбрано 10 квартир и определен расход электроэнергии в течение одного из летних месяцев : 125, 78, 102, 140, 90, 45, 50, 125, 115, 112.

С вероятностью 0.95 определите доверительный интервал для среднего расхода электроэнергии на одну квартиру во всем доме при условии, что отбор был: а) повторным; б) бесповторным, и в доме имеется 70 квартир.

Решение. По условию задачи объем выборки т.е. выборка малая. В случае повторного отбора найдем границы доверительного интервала для генерального среднего по формуле (3.5), считая

Найдем выборочное среднее арифметическое:

и несмещенную оценку дисперсии

Тогда оценка среднего квадратического отклонения равна

По таблице распределения Стьюдента (приложение 3) найдем значение для двусторонней критической области. Число степеней свободы k здесь равно а вероятность Тогда (двусторонняя область).

При повторном случайном отборе средняя ошибка выборки равна а предельная ошибка т.е. доверительный интервал имеет границы

При условии, что отбор квартир был повторным, с вероятностью 0.95 можно ожидать, что средний расход электроэнергии на одну квартиру во всем доме находится в интервале от 75.63 до 121.17 .

Найдем теперь границы доверительного интервала, считая отбор бесповторным. Предельную ошибку определим с учетом того, что генеральная совокупность конечна и имеет объем N (табл. 5.1).

Из условия задачи Отсюда предельная ошибка выборки и доверительный интервал имеет границы

При условии, что отбор квартир был бесповторным, с вероятностью 0.95 можно утверждать, что средний расход электроэнергии на одну квартиру во всем доме находится в интервале от 76.93 до 119.47 .

Формула (5.3) позволяет при заданной доверительной вероятности и требуемой точности определить объем выборки n, учитывая тип отбора данных.

Пример 4. С помощью случайного повторного отбора определяется средний стаж работы служащих фирмы. Предполагается, что он подчиняется нормальному закону распределения. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0.95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0.5 года, если стандартное отклонение равно 2.7 года?

Решение. По условию и требуется найти объём выборки n при повторном отборе. В этом случае где По таблице функции Лапласа (приложение 1) найдем, при каком значение Получим Отсюда необходимый объем выборки

Учитывая, что необходимо не превышать заданную ошибку, округляем результат до большего целого:

Итак, чтобы с вероятностью 0.95 и точностью года определить средний стаж работы в фирме, требуется опросить не менее 113 служащих.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]