Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Охезина.pdf
Скачиваний:
13
Добавлен:
28.03.2015
Размер:
1.87 Mб
Скачать

чтобы в таких группах подвергать наблюдению все без исключения единицы. Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серии), чем из всех упаковок отбирать необходимое количество товара.

Можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и собственнослучайного отборов, при которых отдельные единицы отбираются внутри серии в собственнослучайном порядке.

Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:

N – объем генеральной совокупности (число входящих в нее единиц);

n– объем выборки (число обследованных единиц);

x генеральная средняя (среднее значение признака в генеральной совокупности);

~x – выборочная средняя;

р – генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);

w – выборочная доля;

σ2 – генеральная дисперсия (дисперсия признака в генеральной совокупности);

S2 выборочная дисперсия того же признака;

σ среднее квадратическое отклонение в генеральной совокупности; S – среднее квадратическое отклонение в выборке.

4.2. Ошибки выборочного наблюдения

Рассмотрим некоторые формулы ошибок для разных видов выборки. Применяя выборочный метод в статистике, обычно используют два ос-

новных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).

Выборочная доля w, или частость, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности n:

W = m / n.

(4.1)

33

Например, если из 100 деталей выборки (n = 100) 95 деталей оказались стандартными (n = 95), то выборочная доля равна:

w = 95/100 = 0,95.

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки (ε) или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:

а) для средней количественного признака:

ε~ =

 

~

 

;

 

 

 

 

 

x x

 

(4.2)

x

 

 

 

 

 

 

б) для доли (альтернативного признака):

 

εw =

 

W p

 

.

(4.3)

 

 

Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.

Выборочная средняя и выборочная доля по своей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать разные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки.

От чего зависит средняя ошибка выборки? При соблюдении принципа случайного отбора, чем больше численность генеральной совокупности при прочих равных условиях, тем меньше величина средней ошибки выборки. Средняя ошибка выборки также зависит от степени варьирования изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией σ2 или w(1 – w) – для альтернативного признака.

Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует) средняя ошибка выборки равна нулю, т.е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики ( x , р) неизвестны, и следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам (4.2), (4.3).

34

При случайном повторном отборе средние ошибки выборки рассчитывают по следующим формулам:

а) для средней количественного признака:

μx =

S 2

.

n

 

 

б) для доли (альтернативного признака):

μw =

w(1w) .

 

n

(4.4)

(4.5)

При случайном бесповторном отборе в приведенных выше формулах расчета средних ошибок выборки необходимо подкоренное выражение умножить на 1–(n/N), поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:

а) для средней количественного признака:

μ~ =

S 2

 

n

;

 

 

1

 

(4.6)

x

n

 

N

 

 

 

 

 

б) для доли (альтернативного признака):

μw =

w(1w)

n

(4.7)

n

1

.

 

 

 

N

 

Так как n всегда меньше N, то дополнительный множитель 1 – (n / N) всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном.

4.3. РАСПРОСТРАНЕНИЕ ВЫБОРОЧНЫХ РЕЗУЛЬТАТОВ НА ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов. Выборочные средние и относительные величины распространяют на генеральную совокупность

сучетом предела их возможной ошибки.

Вкаждой конкретной выборке расхождение между выборочной средней и

генеральной, т.е ~ может быть меньше средней ошибки выборки, и равно x x

ей или больше ее. Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактиче-

ские расхождения между выборочной средней и генеральной ~ можно x x

35

рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью (Р).

Предельную ошибку выборки для средней ( ~ ) при повторном отборе x

можно рассчитать по формуле:

~ =tμ~ =t

S 2

,

(4.8)

n

x

x

 

 

где t – нормированное отклонение – «коэффициент доверия», зависящий от

вероятности, с которой гарантируется предельная ошибка выборки;

μ~

x

средняя ошибка выборки.

 

Аналогичным образом может быть записана формула предельной ошибки

выборки для доли w при повторном отборе:

 

w = t w(1 w) .

(4.9)

n

 

При случайном бесповторном отборе в формулах расчета предельных ошибок выборки (4.8) и (4.9) необходимо умножить подкоренное выражение на 1 – ( n / N).

Значения нормированного отклонения (t) даются в таблицах нормального распределения вероятностей. Чаще всего используют следующие отклонения:

t

1,0

1,5

2,0

2,5

3,0

P

0,683

0,866

0,954

0,988

0,997

Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется коэффициентом t (в практических расчётах, как правило, заданная вероятность не должна быть менее 0,95). Так, при t = 1 предельная ошибка составит = μ. Следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±1μ.

При t = 2 с вероятностью 0,954 она не выйдет за пределы ±2μ, при t = 3 с вероятностью 0,997 – за пределы ±3μ и т.д.

Как видно из приведённых выше значений вероятности Р (см. последнее значение), вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т.е. > 3μ, крайне мала и равна 0,003, т.е. 1–0,997. Такие маловероятные события считаются практически невозможными, а поэтому величину = 3μ можно принять за предел возможной ошибки выборки.

Выборочное наблюдение проводится в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характери-

36

стик (параметров) генеральной совокупности. Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:

а) для средней:

~

±

~ ;

~

~

+

~ ;

(4.10)

x = x

x

~ x x

 

 

 

x

 

 

x

 

x

 

б) для доли:

p = w ±

w;

w

w p w +

w.

(4.11)

Это означает, что с заданной вероятностью можно утверждать, что значе-

ние генеральной средней следует ожидать в пределах от

~

~

до

~

+ ~ .

x

x

 

 

x

 

 

x

Аналогичным образом может быть записан доверительный интервал генеральной доли: w w; w + w .

4.4 ОПРЕДЕЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ

При проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки очень важно правильно определить численность (объем) выборочной совокупности, которая с определенной вероятностью обеспечит заданную точность результатов наблюдения. Формулы для определения необходимой численности выборки n легко получить непосредственно из формул ошибок выборки. Так, из формул предельной ошибки выборки для повторного отбора нетрудно (предварительно возведя в квадрат обе части равенства) выразить необходимую численность выборки:

а) для средней количественного признака:

n =

t 2 S

2

;

(4.12)

2

 

 

~

 

 

 

 

x

 

 

 

б) для доли (альтернативного признака):

n =

t 2 w(1

w)

.

(4.13)

2

 

w

Аналогично из формул предельной ошибки выборки для бесповторного отбора находим, что:

а) для средней:

n =

t 2 S 2 N

;

(4.14)

2~ N +t2 S 2

 

x

 

 

37