Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Объем и состав выборки.docx
Скачиваний:
5
Добавлен:
24.11.2019
Размер:
56.17 Кб
Скачать

Расчет объема выборки

Если размер генеральной совокупности более 1 000 000 или сложно оценить точно иначе чем фразой "ну очень много" — можно просто оставить поле пустым.

Пояснения

Доверительная вероятность показывает, с какой вероятностью случайный ответ попадет в доверительный интервал. Для простоты можно понимать её как точность выборки. Как правило, используется 95%, но в условиях малых бюджетов и для небольших выборок, когда высокая точность не нужна, вероятностью можно пожертвовать и понизить её уровень до 90% и даже до 85% (главное не забыть учесть это в процессе анализа и в выводах). И наоборот, чем большую выборку может себе позволить исследователь, тем выше можно установить точность полученных данных.

Доверительный интервал можно понимать как погрешность, задает размах части кривой распределения по обе стороны от выбранной точки, куда могут попадать ответы.

Необходимы пояснения для тех, кто в первый раз сталкивается с понятиями доверительной вероятности и доверительного интервала. Например, выборка в 384 человека для генеральной совокупности более 500 000 человек (например, один из административных округов Москвы) означают доверительную вероятность 95% и доверительный интервал ±5%. То есть при проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного.

Если еще упростить то, опросив 384 человка из полумиллиона и получив искомое значение "Х", можно утверждать, что 95% человек или 475 000 ответов попадут в интервал Х±5%, оставшиеся 25 000 ответов попадут "пальцем в небо", то есть за пределы полученного интервала.

Процент ответов. Применяемая формула предполагает, что на заданный вопрос существует два варианта ответа "да" или "нет", "белый" или "черный" и так далее. Чем более равноценны оба варианта ответов, чем ближе пропорция к 50/50, тем большую выборку надо брать. Поэтому если это соотношение заранее неизвестно (а это как правило так и бывает до начала исследований), то надо ставить 50 %. По умолчанию именно такой вариант и установлен в формуле калькулятора. Наоборот, проведя исследования и зная процент можно скорректировать доверительный интервал, полученный по факту.

Применяемые Формулы

Формулы расчета размера выборки, применяемые в калькуляторе.

Размер Выборки

SS =

Z2 * (p) * (1-p)

C2

где:

Z = Z фактор (например 1,96 для 95% доверительного интервала) p = процент интересующих респондентов или ответов, в десятичной форме (0,5 по умолчанию) c = доверительный интервал, в десятичной форме (например, 0,04 = ±4%)

Корректировка для малой генеральной совокупности

SS

CSS =

1 +

ss-1

pop

где:

ss = размер выборки css = скорректированная выборка pop = генеральная совокупность

где:

ss = размер выборки

css = скорректированная выборка

pop = генеральная совокупность

Доверительная вероятность ("точность"): от 85% до 99, 7%

Доверительный интервал ("погрешность" ± %): 5%

Ошибка выборки (доверительный интервал)

Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.

Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.

Пример:

Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.

Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.

Пример:

- Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома).

- Проблема респондентов, отказывающихся отвечать на вопросы анкеты (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%)

В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.