Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Стат_лекц_2011.doc
Скачиваний:
1
Добавлен:
15.04.2019
Размер:
1.66 Mб
Скачать

Определение ошибок выборки

Разность между показателями выборочной и генеральной совокупностей называется ошибкой выборки:

- генеральное среднее;

- выборочное среднее;

- генеральная дисперсия;

- выборочная дисперсия;

Ошибки выборки подразделяют на ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за неправильных или неточных сведений. Источником таких ошибок могут быть непонимание вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности.

Среди ошибок регистрации выделяют систематические, т.е. обусловленные причинами, действующими в каком-то одном направлении и искажающие результаты работы (округление цифр, тяготение к полным десяткам и сотням и т.д.), и случайные, проявляющиеся в различных направлениях, уравновешивающих друг друга и лишь изредка дающих заметный суммарный итог.

Ошибки репрезентативности также могут быть систематическими и случайными.

Изучение и измерение случайных ошибок репрезентативности является основной задачей выборочного метода.

При случайном и механическом отборах средняя ошибка выборки для средней величины определяется по формуле:

- при повторном отборе;

- при бесповторном отборе,

- объем выборки,

- объем генеральной совокупности.

На практике значение генеральных параметров, как правило, не известно. Поэтому их заменяют исправленными выборочными характеристиками:

При

Формулы для расчета средней ошибки выборочной доли имеют следующий вид:

- при повтор. отборе;

- при бесповторном отборе;

- дисперсия доли;

Это так называемые средние или стандартные ошибки.

Предельная ошибка выборки представляет собой t-кратную среднюю ошибку.

Здесь t – коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной доверительной вероятности.

0,683

0,954

0,997

t

1

2

3

Зная предельную ошибку можно определить доверительные интервалы, в которых находятся значения генеральных параметров.

Пример:

Для определения среднего срока пользования краткосрочным кредитом в банке была произведена 5% механическая выборка, в которую попали 200 счетов. По результатам выборки установлено, что средний срок пользования кредитом составляет 60 дней при среднеквадратичном отклонении 20 дней.

В 8 счетах срок пользования кредитом превышал 6 месяцев. Необходимо с вероятностью 0,99 определить пределы, в которых находится срок пользования краткосрочным кредитом банка и доля краткосрочных кредитов со сроком пользования более полугода.

Решение:

Среднюю ошибку выборки определяют по формуле для бесповторного отбора.

Т.е. с вероятностью 0,99 можно утверждать, что средний срок пользования краткосрочным кредитом составляет от 56 до 64 дней.

По итогам выборки определим долю кредитов со сроком пользования более полугода.

С вероятностью 0,99 можно гарантировать, что доля кредитов банка со сроком использования более полугода оставляет общего числа кредитов.

Определение оптимальной численности выборки

На практике обычно расчет объема выборки производят по формуле для повторного отбора:

Если полученный объем выборки превышает 5% численности генеральной совокупности, то расчеты корректируют на бесповторность:

В данных формулах присутствуют значения генеральной дисперсии, которые как правило неизвестны. Для ее оценки можно использовать:

1. Выборочную дисперсию по данным прошлых или пробных обследований.

2. Дисперсию найденную из соотношения для среднего квадратичного отклонения:

(если все х >0 и х min  0)

3. Дисперсию, вычисленную из соотношения для нормального распределения

4. Дисперсию, определенную из соотношения для асимметричного распределения

В качестве оценки генеральной дисперсии доли используют максимально возможную дисперсию альтернативного признака:

Пример: Определить численность выборки по следующим данным. Для определения средней цены говядины на 5000 рынках города предполагается провести выборочную регистрацию цен. Известно, что цены на говядину колеблются от 40 до 70 руб/кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены не превышала 2 руб. за 1 кг.

Решение: Предположим, что распределение цен соответствует нормальному закону. Тогда

P(t) = 0,954. Следовательно t = 2.

Поскольку доля отбора не превышает 5%, то к формуле бемповторного отбора можно не переходить. Т.е. для того, чтобы с вероятностью 0, 954 гарантировать, что ошибка при определении функцией цены говядины не превысит 2 руб/кг необходимо исследовать 25 торговых точек на рынках города.

Определение: Относительная ошибка выборки– это отношение предельной ошибки выборки к среднему значению признака, выраженного в %.

Расчёт объема выборки при заданном уровне относительной ошибки выборки осуществляется по формулам:

- коэффициент вариации

Пример: В городе зарегистрировано 30000 безработных. Для определения средней продолжительности безработицы организуется выборочное обследование. По данным прошлых лет известно, что коэффициент вариации объема продолжительности безработицы составляет 40%. Какое число безработных необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997 утверждать, что полученным предельная ошибка выборки не превышает 5% средней продолжительности безработицы.

Решение: P(t) = 0,997. Следовательно t = 3.

Объем выборки всегда округляют в большую сторону.

Ответ: 566.