Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1111.doc
Скачиваний:
0
Добавлен:
08.11.2019
Размер:
296.96 Кб
Скачать

Огивой.

88,90 100

100,оси

71,00

В

тттш----

43,90 н

50,00

0,00

17,80 в г

Очень Скорее

I I I

Скорее Не опасны Затруднились

опасны опасны не опасны ответить

Рис. 18. Представление петербуржцев об опасности для России конфликта

между чиновниками и рядовыми гражданами (апрель 2008 г.)

252

Для демонстрации изменчивости какого-либо признака во времени

или пространстве используют двустороннюю гистограмму — столбиковый

график, расположенный в двух направлениях. Основная его функция

заключается в демонстрации колебаний по отношению к среднему

значению признака (рис. 19).

-843 С

-793

889 d

-935

943

-959

-930 С

-7

-756

-778

-840 П

05 С

і---

Е93

-750

-220

1991

1990

2005

2004

2003

2002

2001

2000

1999

1998

1997

1996

1995

1994

1993

1992

=1 101 333

-1200 -1000 -800 -600 -400 -200 200 400

Рис. 19. Естественный прирост населения РФ в

1990-х — середине 2000-х годов (тыс. человек)

Источник: Хамраев В. Разрешите поселиться / / Коммерсантъ-Власть. 2006. № 12 (666).

27 марта. С. 19.

Секторная диаграмма представляет собой сегментированный круг

(рис. 20). Площадь круга отождествляется со 100% респондентов.

Сегменты соответствуют группам респондентов, распределенных по

какому-либо признаку.

□ Постоянно □ Часто в Редко ЕЭ Никогда ■ Затруднились ответить

Рис. 20. Частота обсуждений петербуржцами с близкими

и друзьями политических событий (%, апрель 1998 г.)

253

Статистический пакет SPSS позволяет помимо указанных графиков

визуализировать и другие варианты, наиболее интересными из которых

являются коробчатые диаграммы (шутники называют их ≪ящики

с усами≫). Этот вариант графиков очень наглядно демонстрирует

скрытые закономерности для двухмерного распределения признаков

(рис. 21). При интерпретации результатов коробчатой диаграммы обращают

внимание на разброс значений по группам (определяется величиной

прямоугольника, разбросом выступов и линией внутри прямоугольников,

которая показывает модальное значение —наиболее часто

встречающееся в подгруппе).

іаз

§ 1

О

кУ c3 %0 аазз

0 і 5- 0 с;

0 7 оО- 2Q

CD О

S 5 СО О

О СО

азX

-х-7

-*-578

N = 229 40 67 26 375 1

а> с '</> 01 аз

О

L0

2

СО

шцCD СО С[ 0

азЧs

С[

)Sо I—Q . ■3

11

0X

8 44

х о* -А -0 °0из mои 2° t?( —“Г со к 0

SiQ. s Н°и- с: ясо

За кого вы проголосовали? (Фамилии кандидатов не зачитывать.)

Р ис 21. Уровень дохода избирателей-петербуржцев

в период президентских выборов 2008 г.

Коробчатая диаграмма показывает, что выборы проигнорировали

преимущественно среднеобеспеченные люди. Среди тех, кто пришел

на выборы, но испортил при этом бюллетени, доминируют люди слабообеспеченные,

которых при этом нельзя отнести к люмпенизированным

или маргинальным группам. За Зюганова голосовали в основном

малообеспеченные петербуржцы, за Жириновского —наоборот.

Победу Медведеву обеспечили представители всех социальных групп,

однако более активно за него голосовали горожане со средним уровнем

доходов.

254

СО іі х N = 379 422

Мужчина Женщина

Ваш пол?

Р ис 22. Уровень доходов гендерных групп в Санкт-Петербурге (2008 г.)

На рисунке 22 показано, что хотя и богатыми, и бедными являются

представители обеих гендерных групп, уровень доходов мужчин и женщин

в Санкт-Петербурге заметно различается в пользу первых (доходы

их выше, как минимум, на 15-17%).

2. С ре дн иеп ок аз ат ел и в ар иа ци он но гор яд а.

М ер ы в ар иа ци и ир ас се ян ия Средняя арифметическая дает представление об усредненном случае.

Данный показатель позволяет сравнить между собой не только

группы одного ряда распределения, но и сами ряды распределения,

если они строятся по идентичным признакам:

-X =—--,

N

где х. —значения вариаций признака; Ѓ’ —сумма; N —число респондентов.

При обработке данных массовых опросов чаще используется взвешенная

арифметическая'.

N

где х. —числовое значение /-й позиции признака; п. —число респондентов, выделенных

по /-й позиции признака; N —общее число респондентов.

Для номинального уровня измерения (например, поддержки того

или иного политического объединения), где цифры не связаны с порядком

расположения категорий (а потому использование средней

арифметической лишено смысла), для измерения средней тенденции

используют моду. Мода —наиболее часто встречающееся значение

признака в серии зарегистрированных наблюдений. Возможно унимо-

255

дальное, бимодальное или многомодальное распределение признака.

Определение моды в номинальных и порядковых рядах распределения

не вызывает сложностей. В интервальном ряду говорят не о нахождении

моды, а об определении модального интервала. Для этого переходят

от деления на интервалы, основанного на содержательном критерии,

к делению на интервалы по формальным критериям. Значение

моды для интервального ряда (с равными интервалами) определяется

по формуле:

М = х + Ь - п

2пто - п ~ п+'

где хд —нижняя граница модального интервала; 5 —величина интервала; пт — частота модального класса; г г —частота интервала, предшествовавшего модальному;

п+ —частота интервала, следующего за модальным.

Недостатки моды: невозможность использовать ее в дальнейших

вычислениях; вероятность существования нескольких модальных величин

в вариационном ряду; зависимость ее величины от интервала

группировки.

Для измерения среднего значения порядковых и интервальных данных

чаще всего используют медиану. Для номинальных этот показатель

шкал не используется. Медиана —значение среднего признака в упорядоченном

(ранжированном по возрастанию или убыванию признака)

ряду, причем до и после него находится равное число наблюдений.

При нечетном количестве наблюдений медиана приходится ровно

на середину упорядоченного ряда (например, при 1001 наблюдении медианой

будет величина 501-го наблюдения). При наличии четного количества

признаков (наблюдений) в ряду рассчитывают среднее арифметическое

для двух наблюдений, расположенных в центре ряда. При

числе наблюдений, равном 1000, медиана рассчитывается как средняя

арифметическая 500-го и 501-го наблюдений:

.я /2 -я /г

М = х „+ 8-

пт

где хо —нижняя граница медианного интервала; 8 —величина интервала; пте — частота (относительная) медианного интервала; п —сумма частот (относительных

частот) интервалов; nh —частота (относительная), накопленная до медианного

интервала.

В таблице 30 представлены данные доверия ЃбЕдиной РоссииЃв,

выраженного петербуржцами, измеренные с помощью порядковой

шкалы. В данном случае медианное значение этого вариационного

ряда будет равно 4, модальное —4, а взвешенное среднее

арифметическое —2,99.

256

У ро ве ньд ов ер ия«Е ди но й Р ос си и», в ыр аж ен но гоп ет ер бу рж ца ми (апрель 2010 г.)

Т аб ли ца30

В ал ид ны е

з на че ни я

Ч ас то таП ро це нтВ ал ид ны й

п ро це нт К ум ул ят ив ны й

п ро це нт Полностью доверяю 216 19,4 19,4 19,4

Скорее доверяю 213 19,2 19,2 38,6

Скорее не доверяю 121 10,9 10,9 49,5

Совсем не доверяю 483 43,5 43,5 93,0

Затрудняюсь ответить 78 7,0 7,0 100,0

Итого 1111 100,0 100,0

Если для исследования используется динамический ряд (изменение

признака во времени), то в качестве среднего значения может быть

использовано среднее геометрическое (корень п-й степени из произведения

всех значений признака х)\

G = ^ х1х2х3...хп

Например, в регионе N b течение четырех месяцев число забастовок

составило соответственно 34, 56, 21, 39. Среднее геометрическое для

этого ряда:

G = ^/34x56x21x39 = 4/1559376 Ѓб 36.

Помимо названных средних значений ряда можно рассчитывать

среднее квадратическое и среднее гармоническое.

Для вычисления неравномерности распределения признака используют

вариационный размах, среднее абсолютное отклонение, дисперсию,

коэффициент вариации. С их помощью можно определить

степень отклонения от средних значений ряда. Это позволяет ответить

на вопрос, является ли наиболее типичное значение признака репрезентативным

для всей совокупности. Например, нам известно, что

рейтинг доверия местной исполнительной власти в городе N в течение

2010 г. составил 23, 19, 24, 31, 30, 25, 22, 28,- 35, 38, 42, 45%. Разность

между наибольшим и наименьшим значениями ряда —вариационный

размах —определяется по формуле

R = х —х . max min

Для нашего ряда он будет равен 26% (45% —19%).

Среднее абсолютное отклонение —среднее арифметическое абсолютных

величин отклонений отдельных значений признака от их средней

арифметической:

257

- XIх-х\п,

- сумма отклонений значения ряда

N

где N —число значений в ряду; ^ |х ,. —x \n t

от средней арифметической по подсовокупностям (значения суммируются без

учета знака отклонения, по модулю).

Для нашего примера х = 30,167, a d = 6,6945.

Формула дисперсии для порядковых и интервальных рядов:

_ ~ * )2

N - 1

Если число наблюдений больше 30, то в знаменателе из N единица

не вычитается.

Среднеквадратическое отклонение а (сигма) вычисляется как корень

квадратный из дисперсии. С его помощью можно сравнивать

меры рассеяния разных признаков или одного признака для разных

подсовокупностей. Для нашего примера этот показатель равен 8,3.

Для оценки дисперсии (разброса) номинальных данных используют

коэффициент вариации. Он показывает процентную долю всех признаков,

которые не входят в модальную категорию.

Формула коэффициента вариации для номинального ряда:

У у_ / -/ J немодальное

N

гае ^/немодальное ~ количество всех наблюдений, не являющихся модальными;

N —общее число наблюдений 0 < К<+1. При V— 0 модальное значение ряда

является типичным.

Например, был задан вопрос о существовании партии, программу

которой поддерживает респондент. Из 1000 опрошенных 350 человек

дали утвердительный ответ, 400 —отрицательный, 250 человек не смогли

определиться. Тогда коэффициент вариации будет равен отношению

суммы респондентов, ответивших позитивно и затруднившихся с

ответом, к общему числу опрошенных (350 + 250) / 1000 = 0,6.

Дисперсия для ряда с альтернативными признаками определяется

по формуле

o2 = ^ v ^ = «Lx(1_ Ѓб L)

(п,+п2) п2 п2

Для выборки в 1000 человек, из которых 650 собираются голосовать,

а 350 —нет, дисперсия будет (650 х 350) / 10002 = 22,75.

Закон распределения. Нормальное распределение признака в вариационном

ряду можно определить, если: 1) в ряду есть единственная

мода, находящаяся в самом центре распределения; 2) частоты сим-

258

метрично убывают по направлениям к предельным значениям ряда;

3) распределение признака подчиняется Ѓбправилу трех сигмЃв, т.е. 68,3%

всех случаев распределяются в пределах одного стандартного отклонения

от центра ряда, 95,5% случаев —в пределах двух стандартных отклонений,

99,7% —в пределах трех отклонений (рис. 23).

-38 -25 -5 0 8 25 35

Р ис 23. Иллюстрация к Ѓбправилу трех сигмЃв

Собственно говоря, расчет моды, медианы, среднего взвешенного

арифметического выполняет в политологических исследованиях и н струментальную

функцию. Несовпадение этих показателей является

косвенным свидетельством того, что распределение признака не соответствует

нормальному гауссовскому распределению, т.е. что переменная

является перспективной с точки зрения включения ее в сложные

виды статистического анализа.

3. Э ле ме нт ар ны е п ри ем ы р аб от ы

сд ин ам ич ес ки м р яд ом Для анализа периодически повторяющихся политических событий

исследователи обращаются к анализу временных рядов, который используется

как для ретроспективного объяснения событий, так и для

прогнозирования их дальнейшего развития. Классические примеры — прогнозирование итогов избирательных кампаний, развития забастовочного

движения. Некоторые элементарные виды статистического

анализа временных рядов можно выполнять вручную, при создании

сложных моделей удобно пользоваться статистическими пакетами.

Временные ряды —комплекс наблюдений за одной переменной через

определенные интервалы времени. Статистическое прогнозирование

—способ предвидения развития политических событий на основе

эмпирических данных мониторинговых исследований. Период упреждения

—длительность прогноза в эмпирических исследованиях. Он

относительно невелик, а вероятность ошибок увеличивается прямо

пропорционально временному отрезку прогноза. Требования к прогностической

модели традиционны: обоснованность, полнота, валидность,

точность, устойчивость.

259

Многие исследователи до сих пор весьма скептически относятся

к возможностям статистического прогнозирования развития политических

процессов из-за огромного числа факторов, которые нужно

учесть. Аргументы звучат весьма весомо:

■ ни одна из моделей политических процессов не в состоянии

учесть всю палитру и сложность связей между явлениями и взаимодействием

разнородных факторов;

■ модель развития политического процесса, использующая в качестве

исходного материала данные опросов (даже если речь идет

об экспертном опросе, в котором участвуют ключевые информаторы

или политики), в значительной степени зависит от способности

и желания этих людей дать необходимые исследователю

полноценные и достоверные сведения;

■ моделирование политических процессов не может в должной

степени учесть влияние случайных факторов и крайне редко может

учесть ситуацию бифуркации, когда исходные принципы существования

явления радикально меняются.

Тем не менее в течение последних 30 лет прикладное моделирование

в политических исследованиях на основании статистических приемов

обработки данных динамических рядов получило широкое распространение.

Прикладное моделирование выполняется на основании

специальных статистических исследований в ряде научных центров,

хотя наибольший опыт имеют исследователи США (Северо-Западный,

Стэнфордский, Чикагский, Калифорнийский университеты, Массачусетский

технологический институт).

Выделяют три этапа моделирования: логико-интуитивный анализ

(традиционная исследовательская практика, в ходе которой ученый,

опираясь на свои представления, интуицию, логику, знание аналогичных

исследований, создает теоретическую модель изучаемого явления

с выделением ключевых понятий); формализация данных —данная процедура

основывается на трансформации созданной содержательной

статистической модели в динамическую; квантификация данных (создание

Ѓбобраза искусственной реальностиЃв). Подобные модели содержат

указание на объект исследования, структуру его связей с другими

политическими субъектами, интересы, ресурсы влияния, цели действий,

нормативный (типичный) образ действий, противоречия между

субъектами политического действия, соотношение их ресурсов и характер

связей с другими объектами политической реальности.

Самым простым приемом статистического прогнозирования считается

анализ развития ряда распределения количественных параметров

исследуемого социального процесса. Он состоит из взаимосвязанных

компонент:

260

тенденция —направление развития социального процесса (в самом

широком понимании речь идет о прогрессе или регрессе);

если в тенденции обнаруживается функциональная зависимость

ее от времени, то исследователи говорят о наличии тренда;

тренд —описание фактической усредненной для периода упреждения

тенденции изучаемого социального процесса во времени;

интервал циклов —повторяемость показателей, зависящих от

времени.

Достаточно часто событие-причина и событие-следствие отстоят

друг от друга далеко во времени, поэтому при построении прогнозных

моделей также необходимо учитывать временной лаг. В идеальном случае

модель прогноза должна учитывать секулярные тренды (долговременные

тенденции к увеличению или уменьшению), циклические отклонения

(сезонность; классическими примерами являются Ѓбвесеннее

наступление на капиталЃв и снижение показателей неконвенционального

поведения летом), случайные отклонения (известно, например, что в некоторых

случаях на исход голосования оказывали влияние неблагоприятные

погодные условия: дождь, снег, морозы). Случайные отклонения

в электоральном поведении также провоцируются экстраординарными

политическими событиями и Ѓбфеноменом последней неделиЃв (согласно

ему люди с невысоким образованием делают свой выбор именно в последние

дни перед выборами, в то время как высокообразованные избиратели

определяют свои политические симпатии и принимают решение

о походе на избирательный участок намного раньше).

Одной из важнейших и наиболее простых статистических процедур,

предшествующих прогнозированию, является проверка гипотезы о наличии

или отсутствии тренда. Обычно пользуются простейшим методом

определения наличия тренда —методом разности средних уровней. При

использовании этого метода объект исследования разбивают на две под-

выборочные совокупности, идентичные по основным контролируемым

параметрам (например, по социально-демографическим показателям).

Для каждой из совокупностей определяется средняя по показателю, после

чего определяется разность значений средних. Если расхождение существенное,

то тренд имеет место. Незначительное расхождение можно

приписать воздействию случайных факторов, гипотеза о наличии тренда

отвергается. Для определения истинности гипотезы о тренде вычисленное

значение /сравнивается с табличным значением. Если расчетное значение

больше табличного, гипотеза о наличии тренда подтверждается.

При исчислении средних темпов роста в рядах динамики применяется

среднее геометрическое. Например, если есть данные на начало и

конец определенного периода (но число замеров должно быть не меньше

шести), а промежуточные показатели неизвестны, то можно использовать

для определения этих показателей среднее геометрическое,

условно считая, что темп роста одинаков для всех единиц времени.

261

Среднее геометрическое можно использовать и для прогнозирования

изменения показателей на некоторые промежутки времени вперед.

Прирост среднего геометрического, применяемого при исчислении

средних темпов изменения динамического ряда, высчитывается

по одной из формул:

G = ""^Л/ЛхУз/Л-Л/Л-1,

гДеу'//,,//у 2, j j j n \ —отношение последующего значения измеряемой переменной

к предыдущему; п —число периодов (замеров). Или

G = ^ x j x і

где х, —уровень показателя при первом замере; хп —уровень показателя при

последнем замере; п —число периодов (замеров).

Тогда прогноз на следующий замер

Xn+l= X n G = X„- jlx„x l '

Подобная формула может быть использована для прогнозирования

исходов выборов. Но необходимо помнить, что непосредственно перед

ее использованием данные должны быть скорректированы в соответствии

с вводимыми дополнительными условиями. К примеру, необходимо

оценить уровень электоральной активности на выборах. Должно

быть проведено несколько (не менее 6) мониторинговых опросов. Для

корректировки данных можно выбрать одну из трех моделей.

Модель 1. В качестве дополнительного условия вводим гипотезу о

том, что ЃбколеблющиесяЃв (не решившие, будут ли они участвовать в

выборах) будут сомневаться до последнего момента и автоматически

попадут в группу не участвующих в голосовании.

Модель 2. Можно построить прогноз на предположении, что Ѓбколеблющиеся

Ѓв в последний момент распределятся в той же пропорции,

что и определившиеся с выбором.

Модель 3. Для ее реализации необходимо, чтобы респондентам помимо

прямого вопроса о намерении голосовать были заданы и уточняющие

вопросы, позволяющие выяснить количество людей, принявших

окончательное решение, а также вероятный характер принятия решения

об участии в голосовании для ЃбколеблющихсяЃв.

Наиболее точный результат дает 3-я модель прогноза. Тем не менее

и она имеет ограничение, а именно интервал упреждения. Максимальный

интервал упреждения по 1-й модели составляет 4 месяца, по

2-й —2 месяца, по 3-й модели —7 месяцев.

Принципиальное значение для прогнозирования имеет доля людей,

определившихся в своем выборе на момент опроса. Это в свою

очередь зависит от степени актуальности для общественного мнения

262

конкретной избирательной кампании. Известно, что чем ЃбвышеЃв ранг

избирательной кампании, тем выше электоральная активность. Также

необходимо вводить поправочные коэффициенты с учетом социальнодемографических

групп, намеренных принять участие в выборах или,

наоборот, их проигнорировать. Наконец, должны учитываться и статистические

результаты предыдущих голосований.

Метод скользящих средних (метод сглаживания динамического

ряда) —один из наиболее старых и популярных в работе с временными

рядами. Для выполнения этой процедуры должно быть произведено

не менее 12 замеров. Метод скользящих средних основан

на переходе от начальных значений ряда к их средним значениям на

интервале времени, длина которого выбирается заранее. Получаемый

ряд скользящих средних более гладкий за счет усреднения отклонений

среднего ряда. Метод сглаживания динамического ряда помогает

определить тенденцию развития процесса (табл. 31). Также показатели

сглаженного ряда могут служить основой для прогнозирования

ситуации (количества забастовок, численности вступающих в политическое

объединение и т.д.).

Таблица 3 1

К ол ич ес тв о н ес ан кц ио ни ро ва нн ыха кц ийп ро те ст а в2009 г

(условный пример)

М ес яцК ол ич ес тв о а кц ийп ро те ст а С гл аж ен ны е п ок аз ат ел и__

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]