Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по теории статистики.doc
Скачиваний:
76
Добавлен:
12.03.2016
Размер:
1.24 Mб
Скачать

2. Ошибки выборки.

Основная задача выборочного наблюдения состоит в том, чтобы на основе характеристик выборочной совокупности получить достоверные суждения. При этом следует иметь в виду, что при любых статистических исследованиях возникают ошибки двух видов: регистрации и репрезентативности.

Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождения между значениями показателей этих же величин, которые были получены при проведенном с одинаковой степенью точности сплошном наблюдении, т. е. между величинами выборных и соотвесвующих генеральных показателей.

Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора. Случайные ошибки репрезентативности обязаны своим возникновением недостаточно равномерным представлением в выборочной совокупности различных категорий единиц совокупности.

Величина случайной ошибки репрезентативности зависит от: степени колеблемости изучаемого признака генеральной совокупности; способа формирования выборочной совокупности; объёма выборки.

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выбрки.

Средняя ошибка выборки - это средняя из возможных ошибок.

Расчетные формулы средней ошибки:

1. при повторном способе отбора

для средней количественного признака

, где

S2- выборочная дисперсия (дисперсия признака в выборочной совокупности);

n- объём выборки (число обследованных единиц/

для доли (альтернативного признака)

=, где

 - выборочная доля ( доля единиц, обладающих данным признаком в выборочной совокупности);

(1 - ) – доля единиц, не обладающих данным признаком.

2. при бесповторном способе отбора для средней количественного признака

, где

N- объем генеральной совокупности (число входящих в неё единиц);

- доля единиц выборочной совокупности в генеральной совокупности.

для доли (альтернативного признака)

.

Например, по выборочным данным об успеваемости студентов имеется информация

Экзаменационные оценки, баллы

Число студентов,

X*f

5

9

45

+1,2

1,44

12,96

4

25

100

+0,2

0,04

1,00

3

13

39

-0,8

0,64

8,32

2

3

6

-1,8

3,24

9,72

Итого

50

190

-

-

32

Найти среднюю ошибку количественного признака.

(балла)

= 0.64(балла)

(балл)

3. Распространение выборочных результатов на генеральную совокупность.

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.

Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выборочной средней и генеральной, т. е может быть меньше средней ошибки, равно ей или больше её.

Причем каждое из этих расхождений имеет различную вероятность ( объективную возможность появления события). Поэтому фактические расхождения выборочной средней и генеральной можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностьюp.

Предельную ошибку выборки для средней () при повторном отборе можно рассчитать по формуле:

,

t- где нормированное отклонение – «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки;

- средняя ошибка выборки.

Аналогичным образом может быть записана формула предельной ошибки выборки для доли при повторном отборе

=t*.

При случайном бесповторном отборе в формулах расчета предельных ошибок выборки необходимо умножить подкоренное выражение на (1- ):

Для количественного признака

x = t*=t*,

для доли

=t*=t* .

Формула предельной ошибки вытекает из основных положений теории выборочного метода, сформулированных в ряде теорем теории вероятностей, отражающих закон больших чисел.

На основании теоремы П. Л. Чебышева (с уточнением А. М. Ляпунова) с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объёме выборки и ограниченной генеральной дисперсии выборочные показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей.

Применительно к нахождению среднего значения признака эта теорема может быть записана так:

P   = Ф ( t ),

А для доли признака

P = Ф (t ),

Где генеральная доля ( доля единиц , обладающих данным значением признака в общем числе единиц генеральной совокупности):

Ф ( t) =

Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью. З значения функции Ф (t) при различных значенияхtкак коэффициент кратности средней ошибки выборки, специально составленных таблиц. Приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объёма (n ):

T 1,000 1,960 2,000 2,580 3,000

Ф (t) 0,683 0,950 0,954 0,990 0,997

Предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, значение которой определяется вероятностью, значение которой определяется коэффициентом t( в практических расчетах, как правило, заданная вероятность не должна менее 0,95). Так приt= 1 предельная ошибка составит=. Следовательно, с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы1. Приt= 2 с вероятностью 0,954 она не выйдет за пределы, приt= 3 с вероятностью 0,997 – за пределыи т. д.

Выборочное наблюдение проводиться в целях распространения выводов, полученных по данным выборки, на генеральную совокупность. Одной из основных задач является оценка по данным выборки исследуемых характеристик (параметров) генеральной совокупности.

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:

для средней

для доли p= 

Это означает, что с заданной вероятностью можно утверждать, что значения генеральной средней следует ожидать в пределах от до.

Аналогичным образом может быть записан доверительный интервал генеральной доли ;.

Наряду с абсолютным значением предельной ошибки выборки рассчитывается и предельная относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:

для средней, %: %=*100;

для доли, %: %=*100.