общая теория статистики
.pdfКоэффициент ранговой корреляции Спирмена:
6× åd 2
ρ = 1− n(n2 −1i) , где
di – разность между i-ми парами рангов; n – число ранжируемых значений переменной или число сопоставляемых пар рангов.
Коэффициент ранговой корреляции Кенделла:
τ = n22×−Sn , где
S = R+ – R-;
R+ – положительное число;R- – отрицательное.
Оба коэффициента могут принимать значения от (– 1) до (+ 1).
Изучение структуры населения
Изучение любого социального процесса невозможно без учета численности и структуры тех групп населения, которые в нем участвуют. В информации об явлениях социальной жизни должны быть сведения о группировках населения по демографическим, социальным, профессиональным, этническим, территориальным признакам.
Характеристики состава населения:
−демографические – пол, возраст, брачное состояние, детность, состав семьи;
−этнические – национальность, родной и разговорный язык;
−социальные – сфера деятельности, источники средств существования, отношения собственности, экономическая нагрузка в семье;
−профессиональные – образование, квалификация, занимаемая должность, профессия, занятие, принадлежность к отрасли экономики;
−политические – партийная принадлежность, в ряде случаев ранг в партийной иерархии;
−территориальные – тип поселения, место жительства.
При описании состава населения часто ограничиваются простейшими показателями: абсолютными величинами, относительными величинами, средними, рядами распределения и рядами динамики.
Показатели структурных различий и сдвигов
Простейшими показателями структурных различий /сдвигов/ являются: 1. Линейный коэффициент структурных различий /сдвигов/.
d = |
å |
|
V1 |
−V2 |
|
, где |
|
|
|||||
|
|
n |
|
|
||
|
|
|
|
|
|
V1 и V2 - сравниваемые признаки; n – количество строк или элементов в структуре.
2. Квадратический коэффициент структурных различий /сдвигов/.
σ = |
(V −V )2 |
. |
||
1 |
2 |
|||
|
|
n
234
Эти показатели находятся в интервале от 0 до 1 или 100 %, в зависимости от единиц измерения исходных данных. Для них используется следующий критерий: если по значению они до 0,03 или 3 %, то структурные различия или сдвиги не наблюдаются; если больше либо равны 0,03, то структурные различия или сдвиги наблюдаются.
3. Интегральный коэффициент (индекс).
|
|
(V -V )2 |
|
||
KV = |
1 |
2 |
. |
||
åV12 + åV22 |
4. Индекс Салаи.
J =
æ |
V1 |
-V2 |
ö2 |
|
|
ç |
÷ |
|
|||
|
|
||||
åçV + V |
÷ |
|
|||
è 1 |
2 |
ø |
. |
||
|
|
|
|||
|
n |
|
|
Два последних показателя могут принимать значения от 0 до 1, здесь могут быть применены общие количественные критерии оценки наличия структурных различий /сдвигов/. Интегральный коэффициент характеризует значимость структурных различий /сдвигов/ по отношению к типу сравниваемых структур. Например, если в структуре преобладают крупные элементы, то значение индексов при прочих равных условиях будет меньше. Индекс Салаи характеризует изменение каких элементов в структуре произошло. Т.е. если изменился /различается/ удельный вес крупных элементов, то значение индекса Салаи при прочих равных условиях будет меньше, по сравнению с изменениями /различиями/ небольших по удельному весу структур.
Примеры решения типовых заданий
Пример 1.
Оцените связь между уровнем успеваемости студентов и отношением к получению второго высшего образования с помощью соответствующих показателей:
Считаете ли Вы необходимым |
Всего |
Уровень успеваемости |
||
получение второго высшего |
опрошено |
«Отличники» |
«Хорошисты» |
«Троечники» |
образования? |
|
|
|
|
Да |
105 |
25 |
50 |
30 |
Затрудняюсь ответить |
70 |
10 |
20 |
40 |
Нет |
75 |
15 |
30 |
30 |
ИТОГО: |
250 |
50 |
100 |
100 |
Решение:
В данном случае принимаются гипотезы Н0 – уровень успеваемости не влияет на отношение студентов к получению второго высшего образования, и Н1 – влияние есть.
Рассчитаем значение непараметрического критерия χ2:
235
χ |
|
æ |
25 |
2 |
|
50 |
2 |
|
30 |
2 |
ö |
= 14,28571. |
||||
2 |
ç |
|
|
|
|
|
÷ |
|||||||||
|
= 250´ ç |
|
|
|
+ |
|
|
|
|
+ ...+ |
|
|
|
-1÷ |
||
|
105´ 50 |
105 |
´100 |
75 |
´100 |
|||||||||||
|
|
è |
|
|
ø |
|
При уровне значимости 0,05 и числе степеней свободы ν= 4 табличное значение составляет 9,488, отсюда вывод – уровень успеваемости студентов влияет на их отношение к необходимости получить второе высшее образование.
Рассчитаем коэффициенты Пирсона и Чупрова:
C1 |
= |
14,28571 |
|
= 0,232 , |
|||||
14,28571+ 250 |
|||||||||
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
||
C1 |
= |
14,28571 |
|
|
|
= 0,169. |
|||
250 |
|
|
|
|
|||||
(3 -1)(3 -1) |
Поскольку оба коэффициента меньше 0,3, значит, гипотеза Н1 не подтверждается. Уровень успеваемости студентов не влияет на отношение к получению второго высшего образования.
Пример 2.
Исследовалась социально-демографическая характеристика занятого населения в зависимости от их семейного положения в Российской Федерации в 2006 г. (млн. чел.).
Занятое население |
Семейное положение |
Всего |
|
по наличию дополнительной |
Состоят в браке |
Не состоят в |
|
работы |
|
браке |
|
Имеют одну работу |
44,2 |
22,6 |
66,8 |
Имеют две и более работ |
1,7 |
0,6 |
2,3 |
Итого |
45,9 |
23,2 |
69,1 |
Решение: |
44,2 |
´ 0,6 |
- 22,6 |
´1,7 |
|
|
|
||||
Коэффициент ассоциации: Ka = |
= -0,183; |
||||||||||
44,2 |
´ 0,6 |
+ 22,6 |
´1,7 |
||||||||
|
|
|
|
||||||||
коэффициент контингенции: Kk = |
44,2 |
× 0,6 − 22,6×1,7 |
|
= -0,029. |
|||||||
|
|
|
|
|
|
|
|
||||
66,8 |
´ 23,2 ´ 45,9´ 2,3 |
||||||||||
|
|
|
|
Можно сделать вывод, что семейное положение занятого населения не влияет на наличие дополнительной работы. Отрицательные значения коэффициентов можно интерпретировать так: семейное положение стимулирует занятых иметь две и более работ.
Пример 3.
С помощью соответствующих коэффициентов определить, имеется ли связь между ответами на вопрос «Кому Вы скорее доверите свои тайны?» молодежи разного пола:
Варианты ответов |
Доля ответов, в % |
|
|
Девушки |
Юноши |
Лучшей подруге (другу) |
20,0 |
24,0 |
236
Родителям |
18,0 |
12,0 |
Уважаемому для Вас человеку |
18,0 |
8,0 |
Братьям, сестрам |
14,0 |
20,0 |
Случайному попутчику |
12,0 |
4,0 |
Любимому человеку |
9,0 |
16,0 |
Никому |
3,0 |
12,0 |
Другие варианты ответа |
6,0 |
4,0 |
Решение:
Принимаем гипотезы Н0 – связи между ответами на вопрос девушек и юношей нет, и Н1 – связь есть Для расчета коэффициентов представим промежуточные результаты в таблице:
Варианты ответов |
Девушк |
Юноши |
|
R1 |
|
R2 |
di |
d i2 |
|
||
|
и |
|
|
|
|
|
|
|
|
|
|
Лучшей подруге (другу) |
20,0 |
|
24,0 |
|
1 |
|
1 |
0 |
0 |
|
|
Родителям |
18,0 |
|
12,0 |
|
2,5 |
|
4,5 |
2 |
4 |
|
|
Уважаемому для Вас |
18,0 |
|
8,0 |
|
2,5 |
|
6 |
3,5 |
12,25 |
|
|
человеку |
|
|
|
|
|
|
|
|
|
|
|
Братьям, сестрам |
14,0 |
|
20,0 |
|
4 |
|
2 |
2 |
4 |
|
|
Случайному попутчику |
12,0 |
|
4,0 |
|
5 |
|
7,5 |
2,5 |
6,25 |
|
|
Любимому человеку |
9,0 |
|
16,0 |
|
6 |
|
3 |
3 |
9 |
|
|
Никому |
3,0 |
|
12,0 |
|
8 |
|
4,5 |
3,5 |
12,25 |
|
|
Другие варианты ответа |
6,0 |
|
4,0 |
|
7 |
|
7,5 |
0,5 |
0,25 |
|
|
|
|
|
|
|
|
|
|
|
Сумма |
48,0 |
|
Коэффициент ранговой корреляции Спирмена: |
|
|
|
||||||||
|
ρ = 1− |
|
6× 48,0 |
= 0,4286 . |
|
|
|
|
|||
|
8 |
× (64 −1) |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|||
Для расчета коэффициента ранговой корреляции Кенделла проводим |
|||||||||||
следующие действия: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Варианты ответов |
R1 |
|
R2 |
|
X |
|
Y |
R- |
R+ |
||
Лучшей подруге (другу) |
1 |
|
|
1 |
|
1 |
|
1 |
0 |
7 |
|
Родителям |
2,5 |
|
4,5 |
|
2,5 |
|
4,5 |
0 |
3 |
|
|
Уважаемому для Вас |
2,5 |
|
|
6 |
|
2,5 |
|
6 |
0 |
2 |
|
человеку |
|
|
|
|
|
|
|
|
|
|
|
Братьям, сестрам |
4 |
|
|
2 |
|
4 |
|
2 |
2 |
4 |
|
Случайному попутчику |
5 |
|
7,5 |
|
5 |
|
7,5 |
0 |
0 |
|
|
Любимому человеку |
6 |
|
|
3 |
|
6 |
|
3 |
3 |
2 |
|
Никому |
8 |
|
4,5 |
|
7 |
|
7,5 |
0 |
0 |
|
|
Другие варианты ответа |
7 |
|
7,5 |
|
8 |
|
4,5 |
4 |
0 |
|
|
|
|
|
|
|
|
|
|
Сумма |
9 |
18 |
|
Столбец Х – переранжируем столбец R1 по возрастанию.
Столбец Y – восстанавливаем значение строк, т.е. проставляем ранги, которые первоначально соответствовали рангам колонки R1 для колонки R2.
237
R- – число рангов, предшествующее i-му рангу в колонке Y и больших его по значению.
R+ – число рангов, последующих i-му рангу в колонке Y и больших его по значению.
S = 18 – 9 = 9.
τ = |
2 × 9 |
= 0,321. |
|
64 − 8 |
|||
|
|
Оба коэффициента подтверждают наличие связи между ответами на поставленный вопрос девушек и юношей, но слабую. Результаты опроса показывают, что в первую очередь молодежь доверяет тайны своим друзьям (подругам), но затем девушки предпочитают доверять родителям и уважаемым ими людям, а юноши – близким родственникам и любимым.
Задания для самостоятельного решения
Задание 1.
На основе опроса студентов одного из вузов проверьте гипотезу о влиянии средней продолжительностью подготовки к каждому экзамену на успешностью сдачи сессии:
|
Среднее время, потраченное на подготовку |
|
||||
Оценки, полученные во |
|
к одному экзамену |
|
Всего |
||
время сессии |
0,1 – 6,0 |
|
6,1 – 12,0 |
|
Более 12 |
опрошено |
|
часов |
|
часов |
|
часов |
|
Все на «отлично» |
10 |
|
20 |
|
30 |
60 |
С одной «четверкой» |
20 |
|
20 |
|
30 |
70 |
Более одной «четверки», но |
30 |
|
60 |
|
10 |
100 |
без «троек» |
|
|
|
|
|
|
С одной «тройкой» |
50 |
|
50 |
|
10 |
110 |
Более одной «тройки» |
60 |
|
40 |
|
10 |
110 |
Итого |
170 |
|
190 |
|
90 |
450 |
Задание 2.
По данным таблицы определите, существует ли взаимосвязь между личным отношением учащихся к преподавателю и итоговой оценкой по предмету.
Итоговая оценка по |
Личное отношение к преподавателю |
Всего |
|||
Любимый |
Нейтрально |
|
|||
дисциплине |
Не люблю |
ответило |
|||
преподаватель |
отношусь |
||||
|
|
|
|||
«Отлично» |
15 |
8 |
2 |
25 |
|
«Хорошо» |
5 |
23 |
12 |
40 |
|
«Удовлетворительно» |
– |
29 |
6 |
35 |
|
Итого: |
20 |
60 |
20 |
100 |
238
Задание 3.
Оцените влияние уровня успеваемости студентов на их отношение к получению второго высшего образования с помощью соответствующих показателей:
Считаете ли Вы необходимым |
Всего |
Уровень успеваемости |
||
получение второго высшего |
опрошено |
«Отличники» |
«Хорошисты» |
«Троечники» |
образования? |
|
|
|
|
Да |
105 |
25 |
50 |
30 |
Затрудняюсь ответить |
70 |
10 |
20 |
40 |
Нет |
75 |
15 |
30 |
30 |
ИТОГО: |
250 |
50 |
100 |
100 |
Задание 4.
По данным выборочного опроса студентов оцените, влияют ли дополнительные занятия спортом на оценку студентами своего здоровья.
Занимаетесь ли Вы дополнительно |
Личная оценка уровня здоровья |
||
спортом? |
Отличное |
Хорошее |
Удовлетворительное |
Занимаюсь спортом на |
10 |
10 |
– |
профессиональной основе |
|
|
|
Дополнительно к занятиям |
10 |
30 |
10 |
физкультурой посещаю различные |
|
|
|
секции |
|
|
|
Посещаю только занятия по |
10 |
5 |
5 |
физкультуре в вузе |
|
|
|
Записан в спецмедгруппу |
– |
5 |
5 |
ИТОГО: |
30 |
50 |
20 |
Задание 5.
С помощью соответствующих коэффициентов определите, имеется ли связь между уровнем безработицы и средней продолжительностью безработицы в городах Красноярского края по данным таблицы за 1998 г.:
Населенный пункт |
Уровень безработицы на |
Средняя продолжительность |
|
01.01.1999 г. (%) |
безработицы за 1998 г. (в мес.) |
||
|
|||
г. Красноярск |
1,27 |
5,2 |
|
г. Ачинск |
1,70 |
5,4 |
|
г. Боготол |
10,66 |
8,9 |
|
г. Бородино |
4,83 |
5,2 |
|
г. Дивногорск |
2,13 |
4,3 |
|
г. Енисейск |
9,25 |
7,8 |
|
г. Заозерный |
2,23 |
4,9 |
|
г. Игарка |
10,19 |
6,1 |
|
г. Лесосибирск |
5,15 |
6,9 |
|
г. Канск |
3,91 |
5,2 |
|
г. Минусинск |
3,35 |
6,3 |
239
Населенный пункт |
Уровень безработицы на |
Средняя продолжительность |
|
01.01.1999 г. (%) |
безработицы за 1998 г. (в мес.) |
||
|
|||
г. Назарово |
3,57 |
7,3 |
|
г. Норильск |
5,68 |
6,2 |
|
г. Сосновоборск |
9,39 |
6,4 |
|
г. Шарыпово |
4,47 |
6,6 |
Задание 6.
Определите, в какой степени одинаковые или разные у молодежи разного пола причины выбора конкретного факультета.
Причины выбора факультета |
Доля ответов, в % |
||
Девушки |
Юноши |
||
|
|||
Под влиянием родителей |
30,0 |
15,0 |
|
Престижность |
25,0 |
15,0 |
|
Нравится специальность |
15,0 |
30,0 |
|
По уговору друга (подруги) |
15,0 |
5,0 |
|
Лишь бы получить классическое образование |
10,0 |
10,0 |
|
Другие причины |
5,0 |
5,0 |
|
Чтобы избежать призыва в армию |
– |
20,0 |
|
Всего ответило |
100,0 |
100,0 |
Задание 7.
В таблице представлено распределение предпочтений в проведении своего свободного времени и уровнем успеваемости студентов. Проверьте гипотезу об наличии зависимости между этими характеристиками респондентов.
Варианты ответов |
|
Доля ответов, в % |
|
||
«Отличники» |
|
«Ударники» |
«Троечники» |
||
|
|
||||
Кружки, секции, курсы |
50,0 |
|
35,0 |
|
35,0 |
Общение в кругу друзей, одногруппников |
30,0 |
|
45,0 |
|
60,0 |
Культурный досуг (театры, музеи) |
35,0 |
|
20,0 |
|
15,0 |
Развлечения (ночные клубы, кафе и др.) |
32,0 |
|
40,0 |
|
50,0 |
Просмотр телевизионных программ, |
40,0 |
|
50,0 |
|
30,0 |
компьютерные игры |
|
|
|
|
|
Занятия спортом |
45,0 |
|
60,0 |
|
50,0 |
Общение в кругу семьи |
30,0 |
|
25,0 |
|
20,0 |
Прогулки на природе |
25,0 |
|
15,0 |
|
10,0 |
Прочие занятия |
15,0 |
|
10,0 |
|
25,0 |
240
Задание 8.
Группе респондентов предлагалось выбрать любимый в году праздник. Определите, есть ли связь между предпочтениями молодежи разного пола.
Варианты ответа |
|
Доля ответов, в % |
|
Девушки |
|
Юноши |
|
|
|
||
Новый год |
60,0 |
|
50,0 |
Рождество |
40,0 |
|
30,0 |
День рождения |
30,0 |
|
60,0 |
День святого Валентина |
25,0 |
|
15,0 |
23 февраля |
20,0 |
|
10,0 |
1 мая |
15,0 |
|
10,0 |
День конституции |
5,0 |
|
5,0 |
8 марта |
5,0 |
|
50,0 |
Другие |
3,0 |
|
5,0 |
Задание 9.
С помощью линейного и квадратического коэффициентов сдвигов оценить различия в условиях проживания студентов с периферии (в динамике),
Условия проживания студентов |
|
Москва |
|
Санкт-Петербург |
||||
1985 |
1990 |
1995 |
1985 |
1990 |
1995 |
|||
|
|
|||||||
1. |
Снимают отдельную |
33,7 |
17,0 |
3,7 |
26,1 |
12,8 |
2,5 |
|
|
квартиру |
|
|
|
|
|
|
|
2. |
Проживают в общежитии: |
|
|
|
|
|
|
|
|
а) в отдельных комнатах |
4,2 |
14,2 |
57,3 |
10,0 |
20,9 |
59,1 |
|
|
б) с подселением |
62,1 |
68,8 |
39,0 |
63,9 |
66,3 |
38,4 |
|
|
|
100,0 |
100,0 |
100,0 |
100,0 |
100,0 |
100,0 |
Задание 10.
Оценить структурные различия с помощью интегрального коэффициента и индекса Салаи в распределении свободного времени студентов (учащихся вечерних отделений вузов по данным выборочного обследования).
Статьи затрат времени за день |
Часы-мин |
|
В % |
|||
мужчины |
женщины |
мужчины |
|
женщины |
||
|
|
|
||||
Свободное время |
4-16 |
2-17 |
100,0 |
|
100,0 |
|
|
В том числе: |
|
|
|
|
|
− |
просмотр телепередач |
2-04 |
1-09 |
48,44 |
|
50,36 |
− |
чтение газет, книг, |
0-41 |
0-18 |
16,02 |
|
13,14 |
|
художественной литературы |
|
|
|
|
|
− |
посещение кинотеатров, |
0-07 |
0-07 |
2,73 |
|
5,11 |
|
театров, спортзалов |
|
|
|
|
|
− прогулки и занятия спортом |
0-13 |
0-11 |
5,08 |
|
8,03 |
|
− |
учеба |
0-10 |
0-11 |
3,91 |
|
8,03 |
− |
домашние дела |
0-23 |
0-17 |
8,98 |
|
12,41 |
241
Статьи затрат времени за день |
Часы-мин |
|
В % |
|||
мужчины |
женщины |
мужчины |
|
женщины |
||
|
|
|
||||
− |
любимые занятия |
0-05 |
0-03 |
1,95 |
|
2,19 |
− |
прием гостей |
0-33 |
0-01 |
12,89 |
|
0,73 |
Задание 11.
Оцените структурные различия в доходах населения за 1995 и 1996 гг. с помощью линейного и интегрального коэффициентов структурных различий:
|
I полугодие 1995 г. |
I полугодие 1996 г. |
Всего |
100.0 |
100.0 |
в том числе: |
|
|
- заработная плата наемных работников, |
41.8 |
43.6 |
включая выплаты социального характера |
|
|
- социальные трансферты |
12.8 |
13.8 |
- доходы от собственности |
4.4 |
6.0 |
- доходы от предпринимательской |
41.0 |
36.6 |
деятельности и др. |
|
|
Задание 12.
Оцените структурные различия в структуре питания семей с различным уровнем денежного дохода с помощью квадратического коэффициента и индекса Салаи по следующим данным:
Расходы на потребление основных продуктов питания
(на члена семьи в месяц, руб.)
Группы продуктов |
Семьи с денежным доходом |
|
|
на уровне прожиточного |
выше прожиточного |
|
минимума |
минимума в 5 раз и более |
Хлеб и хлебные продукты |
91 |
83 |
Картофель |
60 |
67 |
Овощи и бахчевые |
62 |
120 |
Фрукты и фруктовые |
20 |
84 |
консервы |
|
|
Молоко и молочные продукты |
85 |
125 |
Мясо и мясопродукты |
180 |
265 |
242
Задание 13.
Оцените структурные различия в распределении городских и сельских семей по числу детей с помощью линейного и интегрального коэффициентов по следующим данным:
Число детей |
Распределение семей (в % к итогу) |
|
|
городское |
сельское |
Без детей |
20.6 |
21.9 |
Один |
40.7 |
27.8 |
Два |
28.6 |
23.5 |
Три |
6.8 |
12.6 |
Четыре и более |
3.3 |
14.2 |
Итого |
100.0 |
100.0 |
Задание 14.
Оцените структурные различия в доходах населения РФ с помощью квадратического коэффициента и индекса Салаи. Сделайте выводы.
Структура денежных доходов населения РФ (%)
|
1993 г. |
1995 г. |
Всего денежных доходов |
100.0 |
100.0 |
в том числе: |
|
|
- оплата труда |
60.5 |
39.5 |
-социальные трансферты |
15.1 |
16.7 |
- доходы от собственности |
2.3 |
5.2 |
- доходы от предпринимательской |
22.1 |
38.6 |
деятельности |
|
|
243