Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зарубин.doc
Скачиваний:
33
Добавлен:
17.11.2018
Размер:
1.37 Mб
Скачать

Тема 11. Формально-математические методы прикладного социологического исследования 233

Ее справедливость легко доказать, используя определение дис­персии. Здесь x2средний квадрат, x2квадрат средней. Для нашего ряда

= 268,5.

x2 =

144⋅2+169⋅9+196⋅6+400⋅5+576⋅23 25

x2= 15,882 = 252,17.

x2 -x2 =16,33.

Расхождение (0,02) с вычисленным по определению значением дисперсии появилось в связи с округлением величин, и это расхо­ждение несущественно.

xi

12 0,08

13

14

20 0,20

24

п

i

0,36

0,24

0,12

Статистический ряд удобно изображать графически: по оси абс­цисс откладывают значения xi, по оси ординат — их относительные частоты ni. Полученные точки соединяют ломаной линией, которая называется полигоном распределения. На рисунке 11.1 изображен по­лигон распределения данного ряда.

mi 4

0,36

11.4.

графическое изображение рядов распределения

Даже на самой начальной стадии работы исследователя не так инте­ресует, сколько раз наблюдается значение xi, как то, насколько часто оно встречается в общем ряду наблюдений.

Эта величина характеризуется относительной частотой значе­ния  xi, или, что то же самое, статистической вероятностью появления этого значения:

ni mi = , n

где ni эмпирическая частота значения, n — объем выборки.

Перечень наблюдаемых на выборке значений и их относительных частот называется статистическим рядом распределения признака. Сумма относительных частот статистического ряда равна 1:

n n n

Статистический ряд распределения, соответствующий дискрет­ному ряду, представленному таблицей на с. 229, выглядит следую­щим образом:

0,30

0,18

0,06

21

24 X;

9 15

Рис. 11.1

При работе со статистическим материалом может получиться очень длинный дискретный ряд распределения, работать с таким рядом неудобно. В таких случаях целесообразно объединить близ­кие по величине значения признака в группы — интервалы. Число значений, попавших в интервал, называется эмпирической частотой данного интервала.

Относительной частотой интервала называется отношение его эмпирической частоты к общему числу наблюдений (к объему вы­борки). Перечень интервалов и их относительных частот называется статистическим интервальным рядом распределения.

При разбиении шкалы на интервалы необходимо заранее ре­шить вопрос о числе интервалов и длине каждого из них. Решение

234

социология. общий курс

Тема 11. Формально-математические методы прикладного социологического исследования 235

того и другого вопроса зависит от специфики исследования, от того, что представляет собой исследуемый признак (возраст, уровень зарплаты, число детей в семье). Каждый раз эти вопросы решают­ся по-разному. Однако есть общие рекомендации, которые следует иметь в виду. Число интервалов рекомендуется выбирать так, что­бы их было не меньше 6 и не больше 20. Если эмпирическая часто­та некоторого интервала слишком мала, то его следует объединить с соседним. Работать удобнее с интервалами одинаковой длины, но это не всегда целесообразно. В таблице распределения фиксируют только границы интервалов. В тех случаях, когда некоторое значение попало на границу двух интервалов, его относят к последующему.

Пусть распределение оценок за тест (по 100-балльной шкале) за­дано следующей таблицей:

Интервалы 0-30 30-50 50-60 60-70 70-80 80-90 90-95 95-100

Эмпириче­ские частоты

50

130

240

250

180

110

30

10

Статист вид:

Интервалы

ический интервальный ряд этого распределения имеет

0-30 30-50 50-60 60-70 70-80 80-90 90-95 95-100

Относи­тельные частоты

0,05

0,13

0,24

0,25

0,18

0,11

0,03

0,01

Интервальный ряд удобно изображать гистограммой. На гори­зонтальной оси откладываются границы интервалов. На каждом полученном отрезке (интервале) строится прямоугольник, площадь которого должна быть равна относительной частоте соответствую­щего интервала. Для этого необходимо, чтобы высота прямоуголь­ника была равна отношению относительной частоты интервала к его длине.

Гистограмма рассмотренного ряда изображена следующим об­разом (в качестве единичного интервала здесь выбран интервал в 10 баллов).

0,30 0,25 0,20 0,15 0,10 0,05

10 20 30 40 50 60 70 80 90 100

Рис. 11.2

Из построения гистограммы следует, что площадь любого ее вы­деленного сектора можно интерпретировать как долю наблюдений, имеющих значения в выделенной части графика.