- •Тема 5. Определение выборочной совокупности Выборки. Типы выборок. Расчет ошибки выборки
- •Расчет ошибки и размера выборки (для случайной выборки)
- •Выборочный метод в социологических исследованиях
- •Генеральная и выборочная совокупность.
- •Репрезентативность и основные принципы формирования выборочной совокупности.
- •4. Основа и объем выборки.
- •Вероятностные способы формирования выборочной совокупности
- •Простая вероятностная выборка.
- •2.Неслучайные (не вероятностные) методы отбора.
- •Направленный отбор.
- •Многоступенчатые и комбинированные способы формирования выборочной совокупности
Расчет ошибки и размера выборки (для случайной выборки)
Доверительная вероятность Вероятность того, что доверительный интервал накроет неизвестное истинное значение параметра, оцениваемого по выборочным данным. В практике исследований чаще всего используют 95%-ую доверительную вероятность Ошибка выборки (доверительный интервал) Интервал, вычисленный по выборочным данным, который с заданной вероятностью (доверительной) накрывает неизвестное истинное значение оцениваемого параметра распределения. Доля признака Ожидаемая доля признака, для которого рассчитывается ошибка. В случае, если данные о доле признака отсутствуют, необходимо использовать значение равное 50, при котором достигается максимальная ошибка.
Выборочный метод в социологических исследованиях
Задача построения выборки возникает всякий раз, когда необходимо собрать информацию о некоторой группе или большой совокупности людей. Выборку в той или иной форме используют в ориентированных на «жесткие» статистические методы опросах, в исследованиях политических и культурных элит и даже при отборе «случаев» для включенного наблюдения и качественного анализа.
Статистические (или квазистатистические) обследования населения и ресурсов, судя по всему, зародились одновременно с первыми формами централизованной социальной и политической организации: развитые аграрные общества и древние города-государства нуждались в такой информации и использовали ее при решении разнообразнейших управленческих задач — от фискальной политики до строительства общественных бань. Эти обследования иногда принимали форму сплошных переписей населения. (Об одной такой переписи, имевшей, правда, самые печальные последствия, рассказывает нам книга пророка Самуила: когда царь Давид (X в. до н. э.) осуществил перепись населения древнего Израиля, в стране разразилась страшная эпидемия (2 Цар. 24). Однако значительно чаще приходилось довольствоваться сведениями о какой-то части совокупности: об урожайности судили по пробному обмолоту, о партии товара — по образцу, а о прихожанах — по их духовному наставнику.
Выборка — это подмножество заданной совокупности (популяции), позволяющее делать более или менее точные выводы относительно совокупности в целом. Зачем нужно строить выборки? Прежде всего, из практических соображений, так как выборка экономит силы и средства исследователей. Проведение полномасштабной переписи или сплошного опроса населения требует значительных финансовых и трудовых затрат, которые к тому же могут пропасть впустую в случае, если в разработке методики исследования были допущены принципиальные просчеты.
Другая причина заинтересованности в выборках связана с тем, что выборочная процедура представляет собой удобную и экономичную форму индуктивного вывода1. Третья причина заключается в том, что эта процедура реализует фундаментальный принцип рандомизации, т. е. случайного отбора (от англ. random — случайный, выбранный наугад).
Представление о том, что отбор наблюдений должен носить случайный, непредумышленный характер, в общем соответствует нашему интуитивному знанию об условиях вынесения объективного и непредвзятого суждения. Однако строгая, т. е. математико-статистическая, теория случайной выборки вплоть до конца XIX — начала XX вв. не пользовалась популярностью в среде профессиональных статистиков. Многим исследователям казалось, что в основе отбора должна лежать не «игра случая», а поиск типичных, характерных наблюдений. Это убеждение препятствовало применению в массовых обследованиях методов теории вероятности, достигшей высочайшего уровня развития уже в XVIII— первой половине XIX вв. Применимость выборочного метода для изучения случайно распределенных признаков, например дохода или размера семьи, была впервые обоснована в работах норвежца А. Киэра, англичан А. Боули и К. Пирсона, а также русского статистика А. И. Чупрова1.
Следующим принципиально важным шагом в развитии выборочного метода стала осуществленная Р. Фишером разработка техники рандомизации в эксперименте и выборочном наблюдении2. Что же касается выборочного обследования, то оно часто используется как «замена» экспериментального метода. Нельзя провести эксперимент, в котором людям в случайном порядке присваиваются определенные значения переменных «пол» или «цвет кожи». Однако применение выборочного метода и статистического анализа, как мы увидим в дальнейшем, позволяет справляться с этими ограничениями и делать выводы о взаимосвязях между самыми разными переменными, включая вышеупомянутые. Но для того, чтобы такие выводы были обоснованы, нужно устранить любое систематическое влияние «посторонних», смешивающих факторов на изучаемые переменные. Единственным средством для достижения этой цели является абсолютно случайный характер отбора наблюдений. Лишь равенство шансов попадания в выборку для каждого наблюдения, т. е. отбор «наугад», гарантирует от намеренных или ненамеренных искажений. Пусть, например, в ходе опроса мы изучаем влияние пола и рода занятий респондента на его отношение к планированию семьи и ограничению рождаемости. Если используемая нами выборочная процедура ведет к тому, что работающие женщины имеют несколько меньшие шансы стать респондентами, чем домохозяйки и пенсионерки (последних, как известно, проще застать дома), наши результаты наверняка окажутся смещенными.
Поэтому наилучшей моделью отбора считается вероятностная, или случайная, выборка3, в которой строго соблюдается принцип равенства шансов попадания в выборку и для всех единиц изучаемой совокупности, и для любых последовательностей таких единиц.
Американский профессор Лесли Киш, авторитетный специалист по формированию выборки для опросов населения, в начале ХХв. разработал метод формирования выборки, который до сих пор применяется как в демографических, так и в социологических исследованиях и опросах. Он взял ряд теоретических разработок в статистике, появившихся в конце 30-х годов, и обработал их для применения во всевозможных социологических проектах и исследованиях, проводимых во всем мире.
В 30-е годы социологи в основном использовали квотную выборку, по которой отбирается заданное числе респондентов, отвечающих определенным требованиям. Но небольшая группа американских статистиков начала использование вероятностной выборки, при которой респонденты отбираются с использованием вероятностных процедур. В 40-е годы обсуждался вопрос о том, какую из выборок принять за стандарт.
Профессору Кишу удалось добиться того, чтобы в Мичигане и других регионах вероятностную выборку признали и стали использовать в исследованиях, относящихся к изучению поведения людей.
Значимость разработанного метода вероятностной выборки была продемонстрирована во время президентской предвыборной кампании в 1948 году. Профессор Киш вместе со своими мичиганскими коллегами сформировал вероятностную выборку и опросил немногим менее тысячи американских семей. В то время как средства массовой информации и результаты коммерческих опросов предсказывали победу Дьюи, согласно опросу, проведенному по мичиганской выборке, Трумэн опережал своего соперника.
Как известно, именно Трумэн одержал победу на выборах. С тех пор вероятностная выборка является признанным исследовательским методом.
Профессор Киш также одним из первых разрабатывал метод формирования повторной выборки. Суть его состоит в проведении повторных опросов на регулярной основе, причем для каждого опроса составляется своя выборка.
В 1965 году профессор Киш написал книгу "Выборка социологического опроса", которая до сих пор продолжает переиздаваться.
Именно с рассмотрения разных подходов к построению вероятностной выборки мы и начнем наше обсуждение, чтобы в дальнейшем перейти к не столь совершенным видам целевого, т. е. не основанного на вероятностях отбора, и их роли в практике социологических исследований.