- •Оглавление
- •1. Предмет социологии
- •2. Общество и личность.
- •3. Социальные законы функционирования и развития общества
- •4. Формы проявления и механизмы действия социальных законов
- •1. Общая социологическая теория
- •2. Теоретический и эмпирический уровни социологического познания. Теоретическая и прикладная социология
- •3. Специальные социологические теории и эмпирические исследования
- •1. Основные условия и формы жизнедеятельности общества. Способ производства и образ жизни
- •2. Социальная структура и социальные отношения
- •3. Социально-территориальные общности
- •4. Социально-политическая организация общества и социальные институты
- •5. Духовная жизнь общества. Средства массовой информации и пропаганды Социальные проблемы идеологической деятельности
- •5. Социальное планирование. Социальные показатели
- •1. Постановка проблемы. Цели и задачи исследования
- •2. Определение объекта и предмета исследования
- •3. Интерпретация и операционализация понятий
- •4. Выдвижение и проверка гипотез
- •5. Организационно-методический план исследования
- •6. Рабочий план исследования и подготовка исполнителей
- •1. Понятие измерения в социологии. Уровни измерения
- •2. Группировка материала статистических наблюдений
- •3. Графическая интерпретация эмпирических зависимостей
- •4. Средние величины и характеристики рассеяния значений признака
- •5. Нормальное распределение. Статистические гипотезы
- •6. Статистические взаимосвязи и их анализ
- •7. Новые подходы к анализу данных, измеренных по порядковым и номинальным шкалам
- •1. Основные понятия выборочного метода
- •2. Простой случайный отбор
- •3. Систематическая и серийная выборки
- •4. Стратифицированный отбор
- •5. Многоступенчатые и комбинированные способы формирования выборочной совокупности
- •6. Неслучайные методы отбора и другие подходы к построению выборки
- •1. Виды шкал
- •402. Насколько Вы лично удовлетворены следующими сторонами своей жизни?
- •2. Некоторые методы измерения
- •3. Надежность измерения социальных характеристик
- •1. Понятие документа. Классификация документов
- •2. Методы анализа документов
- •3. Выборка документов и проблемы качества документальной информации
- •1. Понятие наблюдения.
- •2. Программа наблюдения
- •3. Виды наблюдения
- •4. Фиксация результатов. Подготовка наблюдатели
- •1. Понятие опроса
- •2. Критерии качества данных опроса
- •3. Основные фазы опроса
- •4. Типы и виды вопросов
- •5. Разновидности опроса
- •6. Эмпирическое обоснование методики опроса
- •1. Социометрический опрос
- •2. Обработка и анализ результатов социометрического опроса
- •3. Социометрические индексы
- •1. Понятие эксперимента
- •2. Экспериментальные переменные
- •3. Виды экспериментов
- •4. Обработка экспериментального материала
- •1. Подготовка данных к анализу на эвм
- •2. Описание и объяснение в социологическом исследовании
- •3. Способы проверки гипотез
2. Простой случайный отбор
Основа выборки. Для организации простых схем отбора (простой случайной, систематической или серийной выборок) необходима информация обо всех элементах генеральной совокупности или хотя бы их перечень.
Основой выборки называют перечень элементов генеральной совокупности, если он удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц наблюдения. Основой могут служить алфавитные списки сотрудников учреждения, номера, пропусков, по которым можно идентифицировать определенные единицы, и т. п.
Полнота. Под полнотой подразумевается представленность всех единиц данной генеральной совокупности в основе выборки. Если некоторые единицы, которые по предположению должны быть в списке, незарегистрированы в нем, то список является неполным.
Неполнота основы выборки приводит к серьезным ошибкам в том случае если не включенные в выборочную совокупность единицы наблюдения имеют существенные особенности и их достаточно много.
Отсутствие дублирования. Если некоторые единицы наблюдения генеральной совокупности будут включены в основу выборки более чем один раз, то они могут повторяться и в выборке (например, в том случае, когда человек переезжает из одного района в другой и включается в новый список раньше, чем исключается из старого).
Точность. Информация о каждой единице отбора должна быть точной. Основа выборки не должна содержать несуществующих единиц. Подобные неточности встречаются в избирательных списках, когда отсутствуют вновь прибывшие в данный населенный пункт, или остаются лица, изменившие свое местожительство, умершие, жильцы снесенных домов и т. п.
Адекватность. Основа выборки, адекватная для решения одних задач, может быть неадекватной для других. Например, полный список работников промышленного предприятия может быть хорошей основой для формирования выборочной совокупности при исследовании проблем удовлетворенности трудом работников данного предприятия, уровня их социальной активности и т. д. Но если изучается удовлетворенность трудом или социальная активность и т. д. не всех работников предприятия, а только молодежи, то- этот -полный список может послужить лишь для формирования новой основы выборки — списка молодежи.
Если основа охватывает не все социальные объекты генеральной совокупности, то она может использоваться как основа выборки для той части генеральной совокупности, которая представлена полностью, а выбор единиц наблюдения из остальной части следует организовать по другим источникам.
Удобство. Удобство работы с основой выборки—существенное условие повышения качества результатов. Удобно, когда единицы составляющие основу выборки, пронумерованы, когда имеющиеся сведения о них дают возможность с полной определенностью опознавать эти единицы. Если основа выборки находится в одном централизованном месте и ее структура соответствует реальной структуре изучаемых социальных объектов, это не только облегчает работу социолога, но и является необходимым требованием к исследованию,. значительно повышающим его качество.
Одной из причин возникновения сложных схем выборки (многоступенчатых, комбинированных и т. п.) является невозможность обеспечить основу выборки для очень больших генеральных совокупностей, обладающих сложной структурой.
К настоящему времени сложились представления об основе, которая могла бы удовлетворить требованиям организации современных социологических исследований, быть действенной для различного типа исследований. Такой основой является социальная карта.
Социальная карта. Подобно тому как географическая карта является ориентиром в пространственном движении, социальная карта должна стать ориентиром в исследовании социальных объектов. Социальная карта представляет собой пространственное распределение всевозможных социальных показателей для определенных экономико-географических регионов. Такая карта может служить основой всех выборочных исследований- в каждом регионе, области,, районе, городе и т. п.
Процесс составления социальной карты складывается из следующих этапов.
1. Сбор информации о размещении и движении населения, обоснованных постоянных и сезонных потоках населения, которые выражаются в демографических показателях.
2. Сбор социально-экономической информации относительно профессионального состава населения: данные о квалификации, заработной плате, соотношения между работающими и неработающими, распределение уровня семейных доходов и т. д.
3. Сбор социологической информации: условия труда и быта; данные о проведении досуга, о его структуре по различным социальным группам; данные о различных формах социальной активности, образовательном уровне, средствах, массовой коммуникации, об активности партийных и общественных организаций и т. д.
Возрастающий интерес социологов к построению социальных парт связан в значительной степени с прикладными задачами выборочного обследования. Для более углубленной разработки социальных проблем необходима и более основательная исходная социальная информация: карта размещения социальных групп, распространенности средств массовых коммуникаций и т. д., т. е. социальная, карта.
Процедура простого случайного отбора. По сформированной основе выборки легко реализовать процедуру простого случайного отбора. Для этого требуется соблюдение равенства шансов попадания единиц отбора в выборочную совокупность. Выделяют: а) простой случайный бесповторный отбор и б) простой случайный повторный отбора.
Осуществляться каждая из разновидностей процедуры может различными способами. Опишем один из них. Пусть основа выборки содержит N единиц. Тогда, чтобы выбрать п единиц наблюдения в выборочную совокупность, напишем все номера от 1 до N на отдельные карточки, тщательно их перемешаем и наугад вынем одну -из них. Номер вытащенной карточки задает соответствующую единицу наблюдения, попавшую в выборочную совокупность. Затем карточка возвращается на место, они снова перемешиваются, наугад вынимается новая карточка, и так далее продолжается п раз. Таи реализуется процедура простого случайного повторного отбора.
Если извлеченную карточку не возвращать назад, а откладывать в сторону, то тот же процесс приведет нас к простой случайно бес повторной выборке размером в п единиц наблюдения или, как еще говорят, объемом в п единиц.
Описанная процедура простого случайного отбора становится чрезвычайно трудоемкой, если число N, задающее объем основы выборки, велико. Главная трудность состоит в том, что обеспечение равной вероятности попадания единицы наблюдения в выборочную совокупность требует очень тщательного перемешивания.
Чтобы устранить трудности, возникающие при исследовании больших генеральных совокупностей (а именно таких большинство в социологии), для реализации простого случайного отбора пользуются так называемыми таблицами случайных чисел. Они содержат те или иные случайные цифры, полученные путем реализации некоторого физического случайного процесса. В литературе приводятся различные последовательности случайных чисел объемом от нескольких десятков до миллиона цифр (табл. 14).
Продемонстрируем, как работать с таблицей случайных чисел, на гипотетическом примере, когда из совокупности заранее пронумерованных 300 единиц необходимо выбрить 7 единиц наблюдения. Поскольку N =300—трехзначное число, а в табл. 14 даны пятизначные числа, будем использовать только три последних цифры каждого числа. Таблица 14. Таблица случайных чисел
Строка |
(1) |
(2) |
(3) |
(4) |
(5) |
1 2 3 4 5 |
10097 37542 08422 99013 12807 |
32533 04805 68953 03529 99970 |
76520 64894 19645 09376 80157 |
13586 74296 09303 70715 36147 |
34673 24805 23209 38311 64032 |
Начиная с первого числа, двигаясь по строке, получим первый номер 97. Числа более 300 пропускаем и, продолжая этот процесс далее, получим ряд чисел:
296, 209, 13, 157, 147, 32.
Это и есть номера единиц наблюдения, попавших в формируемую выборку.
При организации бесповторного отбора приходится пропускать и числа (если они попадаются), которые встречаются второй раз в этом ряду.
Начинать процесс выбора случайных чисел можно с любого места таблицы и вести его в любом направлении (по строкам, столбцам и т. п.) или выбирая только определенные столбцы. Если имеющиеся под рукой таблицы достаточно длинны, то при решении/ очередной задачи выбора рекомендуется начинать с нового места таблицы.
Расчет характеристик простой случайной выборки. Цель любого выборочного исследования состоит в том, чтобы, сформировав выборку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.
Наиболее распространенной в социологических исследованиях задачей является оценка среднего значения признака (или доли в случае качественного признака) в генеральной совокупности.
Проиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. Предположим, что оценивается:
среднее число газет и общественно-политических журналов, выписываемых сотрудниками некоторого производственного коллектива, Рассмотрим по порядку все необходимые операции и их результаты.
Составляется основа выборки, т.е. список всех единиц отбора. В качестве такой основы может быть взят алфавитный список всех сотрудников, пронумерованных последовательно (табл. 15). В целях наглядности вместе с основой выборки приводятся и все истинные значения единиц отбора, еще неизвестные исследователю. В дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.
Таблица 15. Распределение членов коллектива по числу выписываемых газет и журналов
Номер индивида (i) |
Число выписываемых газет и журналов () |
Номер индивида (i) |
Число выписываемых газет и журналов () |
Номер индивида (i) |
Число выписываемых газет и журналов () |
Номер индивида (i) |
Число выписываемых газет и журналов () |
1 2 3 4 5 6 7 8 9 10 11 12 13 |
2 2 0 0 1 2 5 3 5 3 3 4 3 |
14 15 16 17 18 19 20 21 22 23 24 25
|
6 5 0 1 4 3 5 2 4 3 0 1 |
26 27 28 29 30 31 32 33 34 35 36 37 |
6 3 10 2 5 4 8 2 3 2 1 1 |
38 39 40 41 42 43 44 45 46 47 48 49 50 |
3 4 3 1 2 3 5 3 1 2 3 4 2 |
|
N = 50 |
|
Общая сумма выписываемых газет п журналов равна 150. Среднее число выписываемых газет и журналов на каждого сотрудника равно ( = 150/50 = 3.
Среднее квадратическое отклонение для генеральной совокупности равно
Сумма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонения, а именно от единицы отбора 28, было исключено из суммы. Это значение, равное 49, резко увеличивает сумму, будучи нетипичным для генеральной совокупности. Такое исключение экстремального отклонения нередко применяется при обработке первичной социальной информации в том случае, когда предусмотрено возведение в квадрат, а само отклонение в 2 — 3 раза превышает среднее значение параметра.
Однако ни среднее значение параметра, ни среднее квадратическое отклонение перед началом исследования не известны. В противном случае само исследование было бы излишним.
Естественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюдения) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследования потребовалось определить, скажем, объем личных библиотек, положение исследователя осложнилось бы). Исходя из этих соображений, полагаем достаточной выборку, состоящую из пяти респондентов. Проверить правильность определения объема выборки можно только после обработки результатов пилотажного исследования.
Предположим, что случайный выбор из табл. 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют значениям признаков 4, 0, 10, 4, 4.
Среднее арифметическое по выборке х = 22/5 = 4,4, дисперсия
а
Такое значительное отклонение от истинного значения средней объясняется тем, что в выборку попал респондент № 28, исключенный при подсчете дисперсии для генеральной совокупности как нетипичный. Однако при формировании выборки еще неизвестно, что данный респондент нетипичен. Но сам факт, что среднее квадратическое отклонение приближается по величине к средней, должен насторожить исследователей.
Для большей наглядности выразим s в процентах от величины средней: (3,5 : 4,4) 100% = 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины составляет 79 %. В таких случаях целесообразно увеличить объем выборки, например, в 2 раза. В результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значения признака 5, 2, 4, 6, 1, 3, 2, 5, 3. 4.
Среднее арифметическое — 3,6, дисперсия = 2,26, среднее квадратическое отклонение = 1,5. Теперь оно составляет приблизительно 40% от величины средней. При больших дисперсиях объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперсия не перестает уменьшаться. Дальнейшее увеличение объема выборки является нецелесообразным. Обычно исследователь приходит к некоторому компромиссному решению относительно объема выборки в зависимости от требуемой точности, а также средств и времени, которыми он располагает.
Сводка необходимых формул для простой случайной выборки. В рассмотренном гипотетическом примере легко было оценить качество выборочной оценки среднего (перед глазами была информация обо всей генеральной совокупности). Но как провести его оценку
в реальном исследовании, когда имеется только информация, полученная из выборки?
На помощь приходит статистическая теория выборочного метода Она позволяет при условии реализации случайного отбора достичь по крайней мере следующих двух целей:
1. По заданной априори необходимой степени точности выводов (формализуемой с помощью понятия доверительной вероятности) найти, возможные интервалы, изменения характеристик генеральной совокупности (доверительные интервалы). И наоборот, рассчитать доверительную вероятность отклонения характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.
2. Найти объем планируемой выборки, позволяющей достигнуть в пределах требуемой точности расчета выборочных характеристик необходимую доверительную вероятность.
Дадим сводку необходимых для достижения этих целей формул117.
Чтобы уметь применять приведенные формулы при планировании выборки в эмпирическом социологическом исследовании, познакомимся несколько подробнее с основными понятиями выборочного метода — доверительная вероятность и доверительный интервал.
Теоретико-вероятностные теоремы, восходящие к закону больших чисел, позволяют с Определенной вероятностью, обозначаемой (1-), утверждать, что для изучаемого признака отклонения выборочной средней от генеральной не превысят некоторой величины А, называемой предельной ошибкой выборки.
В одной из формулировок это утверждение записывается следующим образом:
(1)
Используя формулу табл. 16 для предельной ошибки , при повторном случайном отборе получим выражение
где описаны в примечании к табл. 16. Смысл приведенного соотношения следующий: с доверительной вероятностью(1-) можно утверждать, что генеральное среднее лежит в интервале , который и называется доверительным интервалом, к определяет как бы степень доверия к данным, получаемым по рассчитанным с его помощью выборочным характеристикам. Отсюда и название — уровень значимости.
Таблица 16. Сводная таблица формул для расчета характеристик простой случайной выборки
Способ отбора |
Отбор по качественному признаку (для доли) | ||
средняя ошибка |
предельная ошибка |
объем выборки | |
Повторный случайный |
|
|
|
Бесповторный случайный |
|
|
|
Способ отбора |
Отбор по количественному признаку (для средней) | ||
средняя ошибка |
предельная ошибка |
объем выборки | |
Повторный случайный |
|
|
|
Бесповторный случайный |
|
|
|
Обозначения: М — средняя ошибка выборки, р — доля единиц с данным значением признака, q = 1 — р — доля единиц, в которых этот признак отсутствует, n — объем выборки, N — объем генеральной совокупности, — предельная ошибка,Z — числа, определяемые по таблице критических точек стандартного нормального распределения (см. табл. А приложения), — уровень значимости, — генеральные среднее и дисперсия.
Примечание. При расчете характеристик бесповторного случайного отбора, с которым практически всегда имеет дело социолог, можно пользоваться более простыми формулами для случая повторного отбора, если объем генеральной совокупности значительно больше объема выборки.
Принятие того или иного уровня значимости, например 5%-ного ( = 0,05), зависит от целей данного социологического исследования, требований к степени гарантии его результатов. Социолог должен четко понимать,, что, выбрав, скажем, уровень значимости, равный 5%, и рассчитав на основе его выборочные характеристики, мы будем утверждать наличие некоторого эффекта, который на самом деле может оказаться несправедливым приблизительно в пяти процентах случаев.
Пример. При обследовании 900 человек — лиц трудоспособного возраста — определен их средний возраст. Для вероятности = 0,90 необходимо найти доверительный интервал, в котором содержится генеральное среднее. Поскольку дисперсия признака неизвестна, оцепим ее приблизительно по значению размаха для генеральной совокупности.
С этой целью воспользуемся соотношением связи среднего квадратичного отклонения о размахом
, (3)
справедливым в предположении нормального характера распределения. Здесь — вариационный размах генеральной совокупности, а V — величина, зависящая от объема выборки, значения которой можно найти в табл. 17.
Так как по всей генеральной совокупности верхняя граница трудоспособности в СССР — 60 лет, а нижняя — 16, то = 60 – 16 = 44, следовательно (для п100 —последний столбец
Таблица 17
Объем выборки n |
5 |
10 |
20 |
30 |
50 |
100 |
V |
2,3 |
3,1 |
3,7 |
4,1 |
4,5 |
5,0 |
табл. 17), получим приближенное значение среднеквадратичного отклонения .
Пользуясь выражением для средней ошибки простого случайного повторного отбора (см. табл. 16) , получим . Предельная ошибка рассчитывается по формуле (см. табл. 16).
Величина Z, находится по табл. А приложения при /2. Таким образом, если (1-) = 0,9, то Z = 1,64.
Подставляя найденные значения М и Z в формулу предельной ошибки, получаем .
Таким образом, округляя значение ошибки до половины года (0,5), можно утверждать, что с вероятностью 0,9 генеральное среднее не выйдет за пределы интервала , т. е. точность выборочной оценки среднего, рассчитанной по нашей выборке (если она организована методом простого случайного повторного отбора), оказывается равной половине года. Утверждать это мы можем с вероятностью 0,9. Интервал, и задает доверительный интервал, рассчитанный по доверительной вероятности, равной 0,9.
Теперь рассмотрим методику нахождения доверительного интервала по заданной доверительной вероятности для качественного признака.
Пример. Выборочное обследование 900 человек, организованное по способу простого случайного повторного отбора, показало, что 18 человек не информированы о крупном событии в стране. Для доверительной вероятности 0,95 нужно найти доверительный интервал.
Пользуясь выражением для формулы средней ошибки (см. табл. 16) , получаем.
Далее по табл. А приложения, как уже описывалось выше, для /2 находим Z = 1,96.
Теперь можно определить величину предельной ошибки (см. табл. 16):
или 0,9%
Таким образом, доверительные границы для доли неинформированных в генеральной совокупности равны 0,02 ± 0,009, или от 1,1 до 2,9%.
Приведем иллюстративный пример определения объема простой повторной случайной выборки. Как видно из формул, чтобы определить объем (см. табл. 16), дл его оценки необходимо знать дисперсии генеральной средней или хотя бы ее оценки.
Для применения соответствующей формулы необходимо оцепить значение дисперсии, что можно сделать (при отсутствии информации о ней и о размахе значений признака в генеральной совокупности) путем проведения одной - двух пилотажных (пробных) выборок.
Допустим, что в результате пилотажа выборочная оценка дисперсии равна 12,24. Определим, каким должен быть объем выборки, чтобы с вероятностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпляра газет. При этих условиях получаем численность планируемой выборки
.
Таким образом, объем выборки должен составлять 24 человека.