Вопрос 5.
Формулы (1), (2) и (3) используются для оценки результатов исследования при проведении случайного повторного отбора. Для всех остальных видов и способов отбора единиц из генеральной совокупности в выборочную оценку показателей можно производить по формулам, взятым из следующей таблицы. Все эти формулы являются математической трансформацией предыдущих трех.
Таблица
Формулы для оценки результатов выборочного исследования
Способ отбора |
Ошибка (предельная) выборки |
Объем выборки |
Примечание |
Случайный бесповторный |
|
|
– |
Серийно-гнездовой бесповторный |
nсер. – число отобранных серий |
|
- средняя по каждой серии - общая средняя |
Типический бесповторный |
|
|
- средняя дисперсия из частных внутри групповых (остаточных) дисперсий |
Вопрос 6.
Относительной ошибкой выборки считается доля абсолютной ошибки относительно средней характеристики анализируемого показателя.
Вопрос 7.
Малой выборкой считают выборку, объем которой находится в пределах от 5 до 30 единиц, т.е. 5<n30.
При малой выборке нельзя принимать равенство дисперсий , как это делается для большой выборки. Особенность малой выборки в том, что ее случайные ошибки не подчиняются закону нормального распределения.
Закон распределения случайных ошибок малой выборки был найден и опубликован английским ученым Вильямом Госсетом (1876–1937) в 1908 г под псевдонимом "Стьюдент"4.
Для малой выборки предельная ошибка находится по формуле:
где "t"– коэффициент доверия Стьюдента,
"μ" – стандартная ошибка малой выборки
Коэффициент доверия и величина стандартной ошибки могут быть найдены по формулам :
.
Разность n-1 называется числом степеней свободы и обозначается ν=n-1 (k).
Стьюдентом разработаны таблицы, которыми пользуются для определения предельного значения коэффициента доверия t при двух значениях доверительной вероятности Pν(t) 0,95 и 0,99
-
ν/Pν(t)
0.95
0.99
3
4
5
…
3.18
2.78
2.57
5.84
4.60
4.03
Рассмотрим несколько задач.
Задача 1.
Для определения средней урожайности сахарной свеклы в области проведена 20%-ная бесповторная выборка, в которую вошло 5 районов из 25. Средняя урожайность по каждому отобранному району составила: 250, 260, 275, 280, 300 ц с 1 га соответственно с площадей 800, 1000, 1200, 1200, 2800 га. Определить с вероятностью 0,954 пределы, в которых будет находиться средняя урожайность свеклы по области.
Решение. Это задача на повторный серийный отбор.
280 ц/га.
P=0.954; t=2; n=5; N=25
ц/га.
ц/га
272,66 287,34
Задача 2. (На использование механического бесповторного отбора.)
Условие:
При опросе покупателей на колхозном рынке отбирается каждой десятый покупатель со стоимостью покупки до 35 тыс. руб. и каждый десятый со стоимостью выше 35 тыс. руб. Покупатели распределились по выборке следующим образом:
Таблица.
Информация для решения задачи.
Стоимость покупок, тыс. руб. |
Количество покупок, n |
Средняя стоимость покупок, тыс. руб., |
Внутригрупповая дисперсия, тыс. руб., |
До 36 тыс. руб. 36 тыс. руб. и выше |
150 250 |
26 42 |
49 81 |
Итого |
400 |
36 |
69 |
По этому условию может быть решено три самостоятельные задачи:
Каковы возможные пределы ошибки выборочной средней, если ее надо гарантировать с вероятностью p=0,954.
Какова вероятность того, что предельная ошибка выборочной средней стоимости покупок на 1 покупателя не превысит 1.6 тыс. руб., а предельная ошибка частости покупателей, приобретших товаров на сумму более 60 тыс. руб., не превысит 0,04 при объеме выборки n=400, если по предыдущим обследованиям известно, что ω=0,2.
Каким должен быть объем выборки для того, чтобы можно было гарантировать с вероятностью p=0.954, что пределы возможной средней ошибки выборки не превзойдут 1,6 тыс. руб., а возможной ошибки доли (частости) не превзойдут 0,04, если по предыдущим обследованиям известно, что ω=0,2.
Решение.
0) Используя информацию из таблицы, вычислим среднюю общую стоимость покупок и среднюю общую дисперсию тыс. руб.
Средняя дисперсия из частных внутригрупповых дисперсий
тыс. руб.
Найдем предельную ошибку выборки тыс. руб.
t=2 при p=0.954 (таблицы нормального закона распределения)
N=4000 человек, т.к. десятипроцентный отбор и по условию n=400 человек.
а) ; P(4.06)=0.99;
б) 0,0066; P(0.0066)=
t=2 (из таблиц)
x=1,6
=0,04 =0,2
1 Плошко Б.Г., Елисеева И.И. История статистики: Учеб. пособие.–М.: Финансы и статистика, 1990.–295с.: порт. ,С. 31.
2 Там же, С. 161
3 Б.Г.Плошко, И.И.Елисеева История статистики: Учеб.пособие.–М.: Финансы и статистика, 1990.–295 с.: порт. С.160–166.
4 Там же