Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

общая теория статистики

.pdf
Скачиваний:
127
Добавлен:
01.06.2015
Размер:
1.42 Mб
Скачать

Коэффициент ранговой корреляции Спирмена:

åd 2

ρ = 1− n(n2 −1i) , где

di – разность между i-ми парами рангов; n – число ранжируемых значений переменной или число сопоставляемых пар рангов.

Коэффициент ранговой корреляции Кенделла:

τ = n22×Sn , где

S = R+ – R-;

R+ – положительное число;R- – отрицательное.

Оба коэффициента могут принимать значения от (– 1) до (+ 1).

Изучение структуры населения

Изучение любого социального процесса невозможно без учета численности и структуры тех групп населения, которые в нем участвуют. В информации об явлениях социальной жизни должны быть сведения о группировках населения по демографическим, социальным, профессиональным, этническим, территориальным признакам.

Характеристики состава населения:

демографические – пол, возраст, брачное состояние, детность, состав семьи;

этнические – национальность, родной и разговорный язык;

социальные – сфера деятельности, источники средств существования, отношения собственности, экономическая нагрузка в семье;

профессиональные – образование, квалификация, занимаемая должность, профессия, занятие, принадлежность к отрасли экономики;

политические – партийная принадлежность, в ряде случаев ранг в партийной иерархии;

территориальные – тип поселения, место жительства.

При описании состава населения часто ограничиваются простейшими показателями: абсолютными величинами, относительными величинами, средними, рядами распределения и рядами динамики.

Показатели структурных различий и сдвигов

Простейшими показателями структурных различий /сдвигов/ являются: 1. Линейный коэффициент структурных различий /сдвигов/.

d =

å

 

V1

V2

 

, где

 

 

 

 

n

 

 

 

 

 

 

 

 

V1 и V2 - сравниваемые признаки; n – количество строк или элементов в структуре.

2. Квадратический коэффициент структурных различий /сдвигов/.

σ =

(V V )2

.

1

2

 

 

n

234

Эти показатели находятся в интервале от 0 до 1 или 100 %, в зависимости от единиц измерения исходных данных. Для них используется следующий критерий: если по значению они до 0,03 или 3 %, то структурные различия или сдвиги не наблюдаются; если больше либо равны 0,03, то структурные различия или сдвиги наблюдаются.

3. Интегральный коэффициент (индекс).

 

 

(V -V )2

 

KV =

1

2

.

åV12 + åV22

4. Индекс Салаи.

J =

æ

V1

-V2

ö2

 

ç

÷

 

 

 

åçV + V

÷

 

è 1

2

ø

.

 

 

 

 

n

 

 

Два последних показателя могут принимать значения от 0 до 1, здесь могут быть применены общие количественные критерии оценки наличия структурных различий /сдвигов/. Интегральный коэффициент характеризует значимость структурных различий /сдвигов/ по отношению к типу сравниваемых структур. Например, если в структуре преобладают крупные элементы, то значение индексов при прочих равных условиях будет меньше. Индекс Салаи характеризует изменение каких элементов в структуре произошло. Т.е. если изменился /различается/ удельный вес крупных элементов, то значение индекса Салаи при прочих равных условиях будет меньше, по сравнению с изменениями /различиями/ небольших по удельному весу структур.

Примеры решения типовых заданий

Пример 1.

Оцените связь между уровнем успеваемости студентов и отношением к получению второго высшего образования с помощью соответствующих показателей:

Считаете ли Вы необходимым

Всего

Уровень успеваемости

получение второго высшего

опрошено

«Отличники»

«Хорошисты»

«Троечники»

образования?

 

 

 

 

Да

105

25

50

30

Затрудняюсь ответить

70

10

20

40

Нет

75

15

30

30

ИТОГО:

250

50

100

100

Решение:

В данном случае принимаются гипотезы Н0 – уровень успеваемости не влияет на отношение студентов к получению второго высшего образования, и Н1 – влияние есть.

Рассчитаем значение непараметрического критерия χ2:

235

χ

 

æ

25

2

 

50

2

 

30

2

ö

= 14,28571.

2

ç

 

 

 

 

 

÷

 

= 250´ ç

 

 

 

+

 

 

 

 

+ ...+

 

 

 

-1÷

 

105´ 50

105

´100

75

´100

 

 

è

 

 

ø

 

При уровне значимости 0,05 и числе степеней свободы ν= 4 табличное значение составляет 9,488, отсюда вывод – уровень успеваемости студентов влияет на их отношение к необходимости получить второе высшее образование.

Рассчитаем коэффициенты Пирсона и Чупрова:

C1

=

14,28571

 

= 0,232 ,

14,28571+ 250

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C1

=

14,28571

 

 

 

= 0,169.

250

 

 

 

 

(3 -1)(3 -1)

Поскольку оба коэффициента меньше 0,3, значит, гипотеза Н1 не подтверждается. Уровень успеваемости студентов не влияет на отношение к получению второго высшего образования.

Пример 2.

Исследовалась социально-демографическая характеристика занятого населения в зависимости от их семейного положения в Российской Федерации в 2006 г. (млн. чел.).

Занятое население

Семейное положение

Всего

по наличию дополнительной

Состоят в браке

Не состоят в

 

работы

 

браке

 

Имеют одну работу

44,2

22,6

66,8

Имеют две и более работ

1,7

0,6

2,3

Итого

45,9

23,2

69,1

Решение:

44,2

´ 0,6

- 22,6

´1,7

 

 

 

Коэффициент ассоциации: Ka =

= -0,183;

44,2

´ 0,6

+ 22,6

´1,7

 

 

 

 

коэффициент контингенции: Kk =

44,2

× 0,6 − 22,6×1,7

 

= -0,029.

 

 

 

 

 

 

 

 

66,8

´ 23,2 ´ 45,9´ 2,3

 

 

 

 

Можно сделать вывод, что семейное положение занятого населения не влияет на наличие дополнительной работы. Отрицательные значения коэффициентов можно интерпретировать так: семейное положение стимулирует занятых иметь две и более работ.

Пример 3.

С помощью соответствующих коэффициентов определить, имеется ли связь между ответами на вопрос «Кому Вы скорее доверите свои тайны?» молодежи разного пола:

Варианты ответов

Доля ответов, в %

 

Девушки

Юноши

Лучшей подруге (другу)

20,0

24,0

236

Родителям

18,0

12,0

Уважаемому для Вас человеку

18,0

8,0

Братьям, сестрам

14,0

20,0

Случайному попутчику

12,0

4,0

Любимому человеку

9,0

16,0

Никому

3,0

12,0

Другие варианты ответа

6,0

4,0

Решение:

Принимаем гипотезы Н0 – связи между ответами на вопрос девушек и юношей нет, и Н1 – связь есть Для расчета коэффициентов представим промежуточные результаты в таблице:

Варианты ответов

Девушк

Юноши

 

R1

 

R2

di

d i2

 

 

и

 

 

 

 

 

 

 

 

 

 

Лучшей подруге (другу)

20,0

 

24,0

 

1

 

1

0

0

 

Родителям

18,0

 

12,0

 

2,5

 

4,5

2

4

 

Уважаемому для Вас

18,0

 

8,0

 

2,5

 

6

3,5

12,25

 

человеку

 

 

 

 

 

 

 

 

 

 

 

Братьям, сестрам

14,0

 

20,0

 

4

 

2

2

4

 

Случайному попутчику

12,0

 

4,0

 

5

 

7,5

2,5

6,25

 

Любимому человеку

9,0

 

16,0

 

6

 

3

3

9

 

Никому

3,0

 

12,0

 

8

 

4,5

3,5

12,25

 

Другие варианты ответа

6,0

 

4,0

 

7

 

7,5

0,5

0,25

 

 

 

 

 

 

 

 

 

 

Сумма

48,0

 

Коэффициент ранговой корреляции Спирмена:

 

 

 

 

ρ = 1−

 

6× 48,0

= 0,4286 .

 

 

 

 

 

8

× (64 −1)

 

 

 

 

 

 

 

 

 

 

 

 

 

Для расчета коэффициента ранговой корреляции Кенделла проводим

следующие действия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Варианты ответов

R1

 

R2

 

X

 

Y

R-

R+

Лучшей подруге (другу)

1

 

 

1

 

1

 

1

0

7

 

Родителям

2,5

 

4,5

 

2,5

 

4,5

0

3

 

Уважаемому для Вас

2,5

 

 

6

 

2,5

 

6

0

2

 

человеку

 

 

 

 

 

 

 

 

 

 

 

Братьям, сестрам

4

 

 

2

 

4

 

2

2

4

 

Случайному попутчику

5

 

7,5

 

5

 

7,5

0

0

 

Любимому человеку

6

 

 

3

 

6

 

3

3

2

 

Никому

8

 

4,5

 

7

 

7,5

0

0

 

Другие варианты ответа

7

 

7,5

 

8

 

4,5

4

0

 

 

 

 

 

 

 

 

 

Сумма

9

18

 

Столбец Х – переранжируем столбец R1 по возрастанию.

Столбец Y – восстанавливаем значение строк, т.е. проставляем ранги, которые первоначально соответствовали рангам колонки R1 для колонки R2.

237

R- – число рангов, предшествующее i-му рангу в колонке Y и больших его по значению.

R+ – число рангов, последующих i-му рангу в колонке Y и больших его по значению.

S = 18 – 9 = 9.

τ =

2 × 9

= 0,321.

64 − 8

 

 

Оба коэффициента подтверждают наличие связи между ответами на поставленный вопрос девушек и юношей, но слабую. Результаты опроса показывают, что в первую очередь молодежь доверяет тайны своим друзьям (подругам), но затем девушки предпочитают доверять родителям и уважаемым ими людям, а юноши – близким родственникам и любимым.

Задания для самостоятельного решения

Задание 1.

На основе опроса студентов одного из вузов проверьте гипотезу о влиянии средней продолжительностью подготовки к каждому экзамену на успешностью сдачи сессии:

 

Среднее время, потраченное на подготовку

 

Оценки, полученные во

 

к одному экзамену

 

Всего

время сессии

0,1 – 6,0

 

6,1 – 12,0

 

Более 12

опрошено

 

часов

 

часов

 

часов

 

Все на «отлично»

10

 

20

 

30

60

С одной «четверкой»

20

 

20

 

30

70

Более одной «четверки», но

30

 

60

 

10

100

без «троек»

 

 

 

 

 

 

С одной «тройкой»

50

 

50

 

10

110

Более одной «тройки»

60

 

40

 

10

110

Итого

170

 

190

 

90

450

Задание 2.

По данным таблицы определите, существует ли взаимосвязь между личным отношением учащихся к преподавателю и итоговой оценкой по предмету.

Итоговая оценка по

Личное отношение к преподавателю

Всего

Любимый

Нейтрально

 

дисциплине

Не люблю

ответило

преподаватель

отношусь

 

 

 

«Отлично»

15

8

2

25

«Хорошо»

5

23

12

40

«Удовлетворительно»

29

6

35

Итого:

20

60

20

100

238

Задание 3.

Оцените влияние уровня успеваемости студентов на их отношение к получению второго высшего образования с помощью соответствующих показателей:

Считаете ли Вы необходимым

Всего

Уровень успеваемости

получение второго высшего

опрошено

«Отличники»

«Хорошисты»

«Троечники»

образования?

 

 

 

 

Да

105

25

50

30

Затрудняюсь ответить

70

10

20

40

Нет

75

15

30

30

ИТОГО:

250

50

100

100

Задание 4.

По данным выборочного опроса студентов оцените, влияют ли дополнительные занятия спортом на оценку студентами своего здоровья.

Занимаетесь ли Вы дополнительно

Личная оценка уровня здоровья

спортом?

Отличное

Хорошее

Удовлетворительное

Занимаюсь спортом на

10

10

профессиональной основе

 

 

 

Дополнительно к занятиям

10

30

10

физкультурой посещаю различные

 

 

 

секции

 

 

 

Посещаю только занятия по

10

5

5

физкультуре в вузе

 

 

 

Записан в спецмедгруппу

5

5

ИТОГО:

30

50

20

Задание 5.

С помощью соответствующих коэффициентов определите, имеется ли связь между уровнем безработицы и средней продолжительностью безработицы в городах Красноярского края по данным таблицы за 1998 г.:

Населенный пункт

Уровень безработицы на

Средняя продолжительность

01.01.1999 г. (%)

безработицы за 1998 г. (в мес.)

 

г. Красноярск

1,27

5,2

г. Ачинск

1,70

5,4

г. Боготол

10,66

8,9

г. Бородино

4,83

5,2

г. Дивногорск

2,13

4,3

г. Енисейск

9,25

7,8

г. Заозерный

2,23

4,9

г. Игарка

10,19

6,1

г. Лесосибирск

5,15

6,9

г. Канск

3,91

5,2

г. Минусинск

3,35

6,3

239

Населенный пункт

Уровень безработицы на

Средняя продолжительность

01.01.1999 г. (%)

безработицы за 1998 г. (в мес.)

 

г. Назарово

3,57

7,3

г. Норильск

5,68

6,2

г. Сосновоборск

9,39

6,4

г. Шарыпово

4,47

6,6

Задание 6.

Определите, в какой степени одинаковые или разные у молодежи разного пола причины выбора конкретного факультета.

Причины выбора факультета

Доля ответов, в %

Девушки

Юноши

 

Под влиянием родителей

30,0

15,0

Престижность

25,0

15,0

Нравится специальность

15,0

30,0

По уговору друга (подруги)

15,0

5,0

Лишь бы получить классическое образование

10,0

10,0

Другие причины

5,0

5,0

Чтобы избежать призыва в армию

20,0

Всего ответило

100,0

100,0

Задание 7.

В таблице представлено распределение предпочтений в проведении своего свободного времени и уровнем успеваемости студентов. Проверьте гипотезу об наличии зависимости между этими характеристиками респондентов.

Варианты ответов

 

Доля ответов, в %

 

«Отличники»

 

«Ударники»

«Троечники»

 

 

Кружки, секции, курсы

50,0

 

35,0

 

35,0

Общение в кругу друзей, одногруппников

30,0

 

45,0

 

60,0

Культурный досуг (театры, музеи)

35,0

 

20,0

 

15,0

Развлечения (ночные клубы, кафе и др.)

32,0

 

40,0

 

50,0

Просмотр телевизионных программ,

40,0

 

50,0

 

30,0

компьютерные игры

 

 

 

 

 

Занятия спортом

45,0

 

60,0

 

50,0

Общение в кругу семьи

30,0

 

25,0

 

20,0

Прогулки на природе

25,0

 

15,0

 

10,0

Прочие занятия

15,0

 

10,0

 

25,0

240

Задание 8.

Группе респондентов предлагалось выбрать любимый в году праздник. Определите, есть ли связь между предпочтениями молодежи разного пола.

Варианты ответа

 

Доля ответов, в %

Девушки

 

Юноши

 

 

Новый год

60,0

 

50,0

Рождество

40,0

 

30,0

День рождения

30,0

 

60,0

День святого Валентина

25,0

 

15,0

23 февраля

20,0

 

10,0

1 мая

15,0

 

10,0

День конституции

5,0

 

5,0

8 марта

5,0

 

50,0

Другие

3,0

 

5,0

Задание 9.

С помощью линейного и квадратического коэффициентов сдвигов оценить различия в условиях проживания студентов с периферии (в динамике),

Условия проживания студентов

 

Москва

 

Санкт-Петербург

1985

1990

1995

1985

1990

1995

 

 

1.

Снимают отдельную

33,7

17,0

3,7

26,1

12,8

2,5

 

квартиру

 

 

 

 

 

 

2.

Проживают в общежитии:

 

 

 

 

 

 

 

а) в отдельных комнатах

4,2

14,2

57,3

10,0

20,9

59,1

 

б) с подселением

62,1

68,8

39,0

63,9

66,3

38,4

 

 

100,0

100,0

100,0

100,0

100,0

100,0

Задание 10.

Оценить структурные различия с помощью интегрального коэффициента и индекса Салаи в распределении свободного времени студентов (учащихся вечерних отделений вузов по данным выборочного обследования).

Статьи затрат времени за день

Часы-мин

 

В %

мужчины

женщины

мужчины

 

женщины

 

 

 

Свободное время

4-16

2-17

100,0

 

100,0

 

В том числе:

 

 

 

 

 

просмотр телепередач

2-04

1-09

48,44

 

50,36

чтение газет, книг,

0-41

0-18

16,02

 

13,14

 

художественной литературы

 

 

 

 

 

посещение кинотеатров,

0-07

0-07

2,73

 

5,11

 

театров, спортзалов

 

 

 

 

 

− прогулки и занятия спортом

0-13

0-11

5,08

 

8,03

учеба

0-10

0-11

3,91

 

8,03

домашние дела

0-23

0-17

8,98

 

12,41

241

Статьи затрат времени за день

Часы-мин

 

В %

мужчины

женщины

мужчины

 

женщины

 

 

 

любимые занятия

0-05

0-03

1,95

 

2,19

прием гостей

0-33

0-01

12,89

 

0,73

Задание 11.

Оцените структурные различия в доходах населения за 1995 и 1996 гг. с помощью линейного и интегрального коэффициентов структурных различий:

 

I полугодие 1995 г.

I полугодие 1996 г.

Всего

100.0

100.0

в том числе:

 

 

- заработная плата наемных работников,

41.8

43.6

включая выплаты социального характера

 

 

- социальные трансферты

12.8

13.8

- доходы от собственности

4.4

6.0

- доходы от предпринимательской

41.0

36.6

деятельности и др.

 

 

Задание 12.

Оцените структурные различия в структуре питания семей с различным уровнем денежного дохода с помощью квадратического коэффициента и индекса Салаи по следующим данным:

Расходы на потребление основных продуктов питания

(на члена семьи в месяц, руб.)

Группы продуктов

Семьи с денежным доходом

 

на уровне прожиточного

выше прожиточного

 

минимума

минимума в 5 раз и более

Хлеб и хлебные продукты

91

83

Картофель

60

67

Овощи и бахчевые

62

120

Фрукты и фруктовые

20

84

консервы

 

 

Молоко и молочные продукты

85

125

Мясо и мясопродукты

180

265

242

Задание 13.

Оцените структурные различия в распределении городских и сельских семей по числу детей с помощью линейного и интегрального коэффициентов по следующим данным:

Число детей

Распределение семей (в % к итогу)

 

городское

сельское

Без детей

20.6

21.9

Один

40.7

27.8

Два

28.6

23.5

Три

6.8

12.6

Четыре и более

3.3

14.2

Итого

100.0

100.0

Задание 14.

Оцените структурные различия в доходах населения РФ с помощью квадратического коэффициента и индекса Салаи. Сделайте выводы.

Структура денежных доходов населения РФ (%)

 

1993 г.

1995 г.

Всего денежных доходов

100.0

100.0

в том числе:

 

 

- оплата труда

60.5

39.5

-социальные трансферты

15.1

16.7

- доходы от собственности

2.3

5.2

- доходы от предпринимательской

22.1

38.6

деятельности

 

 

243