- •Тема 5. Определение выборочной совокупности Выборки. Типы выборок. Расчет ошибки выборки
- •Расчет ошибки и размера выборки (для случайной выборки)
- •Выборочный метод в социологических исследованиях
- •Генеральная и выборочная совокупность.
- •Репрезентативность и основные принципы формирования выборочной совокупности.
- •4. Основа и объем выборки.
- •Вероятностные способы формирования выборочной совокупности
- •Простая вероятностная выборка.
- •2.Неслучайные (не вероятностные) методы отбора.
- •Направленный отбор.
- •Многоступенчатые и комбинированные способы формирования выборочной совокупности
4. Основа и объем выборки.
Выбор типа выборки предопределяется не только задачами исследования, но часто и характером наличной информации.
Для организации обоснованного выборочного исследования необходима социальная информация о генеральной совокупности. Иногда ошибочно предполагается, что выборочный метод позволяет на небольшом количестве объектов изучить большие и совершенно незнакомые генеральные совокупности. Увы, это неверно, хотя в некоторых случаях социологу именно так и приходится поступать.
Рассмотрим сложившиеся представления о состоянии информации, необходимой для основных видов вероятностной выборки и других способов формирования выборочной совокупности.
Исторически первыми формами отбора были простые вероятностные выборки. Поэтому наиболее разработан вопрос о форме представления информации для таких выборок.
Для организации простых схем отбора (простой случайной выборки, систематической или серийной выборок) необходима информация о всех элементах генеральной совокупности, хотя бы их перечень.
Исходя из условий корректной организации вероятностного отбора, сложилось понятие основы выборки и требований к ней.
Основой выборки называют перечень элементов генеральной совокупности, если он удовлетворяет требованиям: полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц наблюдения. При обследованиях небольших групп и первичных коллективов основой могут служить алфавитные списки сотрудников учреждения, номера пропусков и т.п., по которым можно идентифицировать определенные социальные объекты. В широкомасштабных опросах общественного мнения и социологических обследованиях чаще применяют другие основы: переписные листы, списки избирателей, домовые книги, карточки паспортных столов милиции (а также картотеки РЭУ, ДЭЗ и т. п.), нехозяйственные книги сельских советов. Все эти «готовые» основы выборки обладают определенными преимуществами и недостатками. Решая практическую задачу планирования выборочного исследования, социолог обычно оценивает возможные основы по нескольким параметрам.
Полнота. Под полнотой подразумевается то обстоятельство, что все элементы данной генеральной совокупности представлены в основе выборки. Если некоторые единицы наблюдения, которые по предположению должны быть в списке, не зарегистрированы в нем, то список является неполным.
Неполнота основы выборки приводит к ошибкам в том случае, если не включенные в выборочную совокупность единицы наблюдения имеют существенные особенности и их достаточно много.
Отсутствие дублирования. Если некоторые единицы наблюдения генеральной совокупности будут включены в основу выборки более чем один раз, то они могут повториться и в выборко(например, в том случае, когда человек переезжает из одного района в другой и включается в новый список раньше, чем исключается из старого). Социологическая выборка использует, как правило, бесповторный отбор.
Точность. Информация по каждой единице наблюдения должна быть точной. Основа выборки не должна содержать несуществующих единиц наблюдения. Подобные неточности встречаются в избирательных списках, когда в этих списках остаются умершие люди, жильцы снесенных домов и т. п.
Адекватность. Основа выборки, адекватная для решения одних задач, может быть неадекватной для других. Например, полный список работников промышленного предприятия может быть хорошей основой для формирования выборочной совокупности, для исследования проблем удовлетворенности трудом работников данного предприятия, уровня их социальной активности и т. д. Но если изучается удовлетворенность трудом или социальная активность и т. д. не всех работников предприятия, а только молодежи, то этот полный список может послужить лишь для формирования новой основы выборки — списка молодежи.
Если основа охватывает не все социальные объекты генеральной совокупности, то она может использоваться как основа выборки для той части генеральной совокупности, которая представлена полностью, а выбор единиц наблюдения из остальной части можно организовать по другим источникам.
Удобство. Удобство работы с основой выборки — существенное условие повышения качества работы. Удобно, когда единицы наблюдения, входящие в основу выборки, пронумерованы, когда имеющиеся сведения о них дают возможность с полной определенностью опознавать эти единицы. Если основа выборки находится в одном централизованном месте и ее структура соответствует реальной структуре изучаемых социальных объектов, это не только облегчает работу социолога, но и значительно повышает качество исследования.
Сложные схемы выборки (районированные, комбинированные выборки) сложились в силу того, что практически оказалось невозможным обеспечить основой выборки в выше рассмотренном смысле очень большие генеральные совокупности, обладающие сложной структурой.
Качество основы выборки оценивают уже на стадии планирования исследования. Особое внимание уделяют таким потенциальным угрозам валидности, как неполнота выборочной основы, «склеивание» единиц отбора, «пустые» элементы в списке. О неполноте говорят в тех случаях, когда список, используемый для построения выборки, не содержит в себе некоторые единицы, безусловно относящиеся к целевой совокупности. Например, списки жильцов могут не содержать сведений о тех жильцах, которые еще не зарегистрировались по новому месту жительства. В некоторых случаях проблему неполной основы можно решить за счет использования дополнительных основ. В нашем примере со списками жильцов такой дополнительной основой могут стать «листки прибытия-убытия», которые хранятся в паспортных столах отделений милиции (с помощью последних ведется учет прописки граждан). Примером «склеивания» может служить ситуация, когда генеральная совокупность, определяемая объектом исследования, состоит из индивидов, а реальной основой отбора служит список квартир или домовладений, содержащий лишь сведения об ответственных квартиросъемщиках либо о собственниках недвижимости. «Пустые» цементы в основе выборки встречаются в тех случаях, когда исходный список содержит имена или адреса, за которыми не стоят реально существующие (или практически доступные) выборочные единицы. Эта проблема часто возникает при использовании устаревших списков, содержащих информацию о временно уехавших, выбывших, умерших и т. п.1
Описанные выше трудности составления валидной, т.е. соответствующей объекту исследования (целевой совокупности), основы выборки носят и статистический, и «экономический» характер.
К настоящему времени сложились представления об основе, которая бы могла удовлетворить требованиям организации современных социологических исследований, быть действенной для различного типа исследований. Такой основой является социальная карта.
Социальная карта. Подобно тому, как географическая карта является ориентиром в пространственном движении, социальная карта должна стать ориентиром в исследовании социальных объектов. Социальная карта представляет собой пространственное распределение всевозможных социологических показателей для определенных экономико-географических регионов. Такая карта может служить представительной основой всех выборочных исследований в каждом регионе.
В процессе составления социальной карты можно выделить следующие необходимые этапы.
1. Сбор информации о размещении и движении населения в районе, об основных постоянных и сезонных потоках населения, включая въезд и выезд из района, демографические показатели.
2. Сбор социально-экономической информации относительно профессионального состава населения: данные о квалификации, заработной плате, соотношении между работающими и неработающими, распределение уровня семейных доходов и т. д.
3. Сбор социологической информации: условия труда и быта; данные о проведении досуга, о его структуре по различным социальным группам; данные о различных формах социальной активности, образовательном уровне, средствах массовой коммуникации, об активности партийных и общественных организаций и т.д.
Возрастающий интерес социологов к построению социальных карт связан в равной мере как с теоретическими, так и с прикладными задачами выборочного обследования. Если ранее ставился вопрос о том, какова природа общественного мнения и пути его выражения, то теперь чаще ставится вопрос о том, как измерить уровень активности общественного мнения. Для более углубленной разработки социальных проблем необходима и более основательная исходная социальная информация: карта размещения социальных групп, распространенности средств массовых коммуникаций и т. д., т. е. социальная карта.
Объем выборки (n). После определения типа выборки в зависимости от социальной проблемы, целей и задач социального исследования, структуры выборочной совокупности приступают к определению ее объема. Объем выборки — общее число единиц наблюдения, включенных в выборочную совокупность.
Выборочный метод не дает универсального решения относительно необходимого в каждом конкретном случае объема выборки, обязательного соотношения объемов генеральной и выборочной совокупностей.
Если предполагается сформировать вероятностную репрезентативную выборку, то она согласно требованиям математической статистики должна быть достаточно большой. Но само понимание «достаточно большой выборки» конкретно зависит от двух факторов: от степени однородности генеральной совокупности" и от необходимой степени точности выборочных результатов.
Чем однороднее с точки зрения изучаемых признаков генеральная совокупность, тем ниже ее дисперсия и, следовательно, может быть меньше объем выборки.
Цель любой выборки состоит в представлении неизвестной генеральной совокупности с определенной, желаемой точностью. Основным статистическим показателем хорошей выборки является ошибка репрезентативности. При прочих равных условиях большая выборка будет давать меньшую ошибку и, соответственно, меньшая выборка — большую.
Если объекты выборки нужно классифицировать достаточно подробно, то объем выборки должен быть велик настолько, чтобы в каждую выделенную группировку попало достаточное количество элементов.
Объем выборки существенным образом зависит от числа признаков, относительно которых она производится. Выборка, имеющая достаточный объем для одного признака, может быть совершенно недостаточной для другого. Иначе говоря, если планируется изучение распределения многих признаков, то выборки должны надежно репрезентировать каждый из них.
Во многих важных случаях можно руководствоваться сложившейся практикой, т.е. размером выборки, использовавшейся в аналогичных исследованиях.
Размер выборки растет
— при необходимости опубликовать данные для отдельных подгрупп (размеры подвыборок при этом суммируются, и выборка в целом растет пропорционально числу подгрупп);
— при проведении общенациональных обследований, когда велика генеральная совокупность (заданная доля генеральной совокупности/будет определять тем больший объем выборки, чем больше генеральная совокупность);
— если уже имеющаяся информация по ключевым вопросам (например, о намерениях избирателей голосовать за ту или иную партию) явно недостаточна, и степень неопределенности значительна
Размер выборки уменьшается
— при исследовании организаций, институтов и прочих «первичных единиц отбора», если сравнительно невелика величина генеральной совокупности, из которой производится отбор (например, совокупности сотрудников рекламных агентств, школьников, пациентов и т. п.);
— при проведении локальных и региональных исследований;
— если уже существующая информация относительно полна, и все еще остающаяся степень неопределенности незначительна.
«Типичные» размеры выборок для общенациональных опросов варьируют в пределах 1000—2500 респондентов (в зависимости от числа анализируемых подгрупп), для региональных опросов и опросов специальных популяций — от 200 до 500 (при анализе многочисленных подгрупп размер региональной или специальной выборки обычно возрастает как минимум до 1000 человек). Указанные значения, разумеется, могут служить лишь самым общим ориентиром для определения оптимального размера выборки.