Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕМА 11 Статистическое изучение взаимосвязи.doc
Скачиваний:
2
Добавлен:
29.08.2019
Размер:
254.98 Кб
Скачать

Вопрос 3.

Статистические методы различных обобщений, указывая на наличие прямой или обратной связи между признаком-фактором и признаком-следствием, не дают ответа на вопрос о мере связей, ее количественном выражении. Этот недостаток восполняется методами корреляционного анализа, которые позволяют выделить из комплекса факторов влияние одного или многих обстоятельств, установить характер взаимосвязи и математически точно измерить ее. Все это имеет важное научное и практическое значение. Последовательное внедрение методов измерения в аналитическую практику правоохранительных органов, судов и других юридических учреждений ставит ее на прочную научную основу.

Для изучения корреляционных связей статистиками разработаны разные методы, каждый из которых решает свои конкретные задачи. Одни коэффициенты связи пригодны для измерения взаимосвязей качественных признаков, другие - для качественных и количественных, третьи - для количественных.

Для измерения связи между качественными признаками в статистике широко используются коэффициенты сопряженности А.А. Чупрова, коэффициент ассоциации К. Пирсона, а также коэффициенты ранговой корреляции Спирмена и Кендалла.

Коэффициент ассоциации К. Пирсона (КП) - относительно простой показатель сопряженности величин. Он применяется к вариации двух качественных признаков, распределенных по двум группам. Его расчет производится на основе таблицы, именуемой таблицей четырех полей.

Таблица 10.5 – Расчет коэффициента ассоциации К.Пирсона

Группы

Признаки

Сумма

1

2

1

а

b

а + b

2

с

d

c + d

Сумма

а + с

b + d

-

Этими полями являются клетки а, b, с, d. Расчет осуществляется на основе сопряжения по строкам а и b, с и d, а также по графам а и с, b u d.

Коэффициент ассоциации Пирсона определяется по формуле:

(10.37).

Ассоциируемые показатели могут быть как абсолютными, так и относительными. Коэффициент ассоциации измеряется от -1 до +1 и интерпретируется так: чем ближе коэффициент к 1, тем теснее связь.

Пример 10.2. Имеются следующие данные о распределении погибших и раненых по вине водителей и пешеходов за 2003 год (таблица 10.6).

Таблица 10.6 – Распределение погибших и раненых

по вине водителей и пешеходов

Причина наезда

Погибло

Ранено

Сумма

Вина водителей

(а)

26807

15,5%

(b)

14665

84,5%

173 492

100,0 %

Вина пешеходов

(с)

6451

13,8%

(d)

40293

86,2 %

46784

100,0 %

Сумма

33258

29,3 %

186 978

170,7 %

-

-

Необходимо рассчитать коэффициент ассоциации Пирсона и установить направление и тесноту связи между ранеными и погибшими в дорожно-транспортных происшествиях по вине водителей и пешеходов.

Ввиду того, что абсолютные показатели громоздки, исчислим коэффициент ассоциации Пирсона на относительных показателях, т.е. процентах:

+0,024

Исходя из этого связь между показателями раненых и погибших по вине водителей и пешеходов прямая (+), но незначительная и случайная, поскольку считается, что если коэффициент ассоциации достигает 0,3, то это свидетельствует о существенной связи между признаками.

Коэффициент взаимной сопряженности А.А. Чупрова (КЧ), в отличие от коэффициента Пирсона, применяется для измерения связи между соотношением двух атрибутивных признаков по трем и более группам. Он рассчитывается по формуле:

, (10.38)

где  2 - показатель взаимного сопряжения;

m1 и m2 - число групп по каждому признаку;

1 - постоянный коэффициент.

Коэффициент A.A. Чупрова варьирует от 0 до 1 и его значение не может быть отрицательным. Связь считается существенной при величине коэффициента равной 0,3. Чем ближе его значение к единице, тем сильнее связь.

Пример 10.3. Имеются следующие данные о распределении некоторых преступлений в регионе по видам и их раскрываемости. По таблице 10.7 необходимо рассчитать коэффициента взаимной сопряженности Чупрова и установить направление и тесноту связи между видами преступлений и их раскрываемостью в регионе.

Таблица 10.7 – Распределение некоторых преступлений в регионе

по видам их раскрываемости

Виды преступлений

Раскрыто

преступлений

Не раскрыто

преступлений

Итого

Разбой

110

40

150

Мошенничество

180

65

245

Умышленное убийство

50

25

75

Поджог

10

20

30

Итого

350

150

500

В нашем примере m1 - число видов деяний, равное 4 (разбой, мошенничество, умышленное убийство и поджог), m2 - число групп по раскрываемости преступлений (раскрытые, нераскрытые преступления), равное 2.

Для расчета показателя взаимного сопряжения (2) построим таблицу 10.8.

Раскроем значение каждого показателя таблицы 10.8 и способы его получения на примере разбоев.

В первой строке каждой клетки (кроме итоговой графы) указаны абсолютные числа раскрытых и нераскрытых преступлений (fi) (разбой, мошенничество и т. д.). Применительно к разбоям (f1): раскрыто 110 деяний, не раскрыто 40.

Во второй строке каждой клетки (кроме итоговой графы) указаны квадраты частот преступлений (fi2). Применительно к разбоям (f12): 110 раскрытых деяний в квадрате составляет 12100, а 40 нераскрытых в квадрате составляет 1600.

В третьей строке каждой клетки (кроме итоговой графы) указаны частные от деления квадратов частот на сумму частот по графам (fi2:f). Применительно к раскрытым разбоям (f12:f): 12100:350=34,5714 и применительно к нераскрытым: 1600:150=10,6667.

Таблица 10.8 – Количество преступлений в регионе по видам их раскрываемости

Виды преступлений

Раскрыто

преступлений

Не раскрыто

преступлений

Итого

1

2

3

4

Разбой

f1

f12

f12: f

( (f12: f )): f1

110

12100

34,5714

-

40

1600

10,6667

-

150

-

45,2381

0,3016

Мошенничество

f2

f22

f22: f

( (f22: f )): f2

180

32 400

92,5714

-

65

4225

28,1667

-

245

-

120,7381

0,4928

Умышленное убийство

f3

f32

f32: f

( (f32: f )): f3

50

2500

7,1429

-

25

625

4,1667

-

75

-

11.3096

0,1508

Поджог

f4

f42

f42: f

( (f42: f )): f4

10

100

0.2857

-

20

400

2,6667

-

30

-

2,9524

0,0984

Итого

f

 ( (fi2: f )): fi

350

-

150

-

500

1,0436

Каждая клетка итоговой графы состоит из четырех строк:

- в первой строке даны суммы частот (110 раскрытых разбоев + 40 нераскрытых = 150);

- во второй строке - прочерк, так как квадраты частот не суммируются;

- в третьей строке даны суммы частных от деления квадратов частот на суммы частот раскрытых и нераскрытых деяний, применительно к разбою: 34,5714 (раскрытые) + 10,6667 (нераскрытые) =45,2381;

- в четвертой строке дается отношение сумм частных (указанных в предыдущей третьей строке) к общему числу частот (указанных в первых строках каждой клетки) (((fi2:f)):fi), применительно к разбою (((f12:f)):f1): 45,2381:150 =0,316.

В итоговой строке итоговой графы приводятся два числа: первое - общее число частот (f) и второе - общая сумма отношений, указанных в четвертой строке предыдущих клеток итоговой графы (((fi2:f)):fi = 0,3016 + 0,4928 + 0,1508 + 0,984 = 1,0436).

Результирующее число 1,0436, вобравшее в себя все статистически значимые отношения, за вычетом единицы, т.е. 1,0436 - 1 = 0,0436, является именно показателем 2, указывающим на взаимную сопряженность атрибутивных признаков нескольких групп.

Тогда коэффициента взаимной сопряженности составит:

.

Коэффициент взаимной сопряженности составил 0,15, что свидетельствует о наличии относительно заметной, но не сильной связи между видами преступлений и их раскрываемостью в регионе.

Особая роль в выявлении связей не только между качественными, но и количественными признаками принадлежит параллельным статистическим рядам. Параллельные статистические ряды представляют собой сопоставление двух и более статистических вариационных или динамических рядов показателей, связанных между собой. Они дают возможность не только увидеть изменения одного явления в рядах распределения, но и установить взаимосвязанное изменение двух или более явлений.

Наряду с относительно точными и сложными корреляционными измерениями имеются и менее точные, но распространенные методы установления взаимосвязей между изучаемыми статистическими рядами.

Коэффициент Фехнера (КФ) рассчитывается на основе сравнения параллельных рядов. С его помощью можно установить направление связи и ее тесноту. Вначале исчисляется средняя арифметическая ряда признака-фактора ( ) и признака-следствия ( ). Затем определяются знаки отклонений от средних. Если реальное значение больше средней, то против него ставится знак (+), меньше - знак (-). Совпадение знаков по отдельным значениям ряда х и у означает согласованную вариацию, несовпадение - нарушение согласованности.

Коэффициент Фехнера будет исчисляться по формуле:

, (10.39)

где С - число совпадений знаков;

Н - число несовпадений знаков.

Коэффициент Фехнера изменяется от +1 до -1. При +1 имеется полная прямая согласованность, при 0 - изменчивость никак не согласуется, при -1 - полная обратная несогласованность.

Часто в статистике для установления связи находят применение коэффициенты ранговой корреляции Спирмена и Кендалла.

Коэффициент Спирмена ( ) рассчитывается по следующей формуле:

, (10.40)

где d2 - квадрат разности рангов;

n - число сопоставляемых пар рангов;

1 и 6 - постоянные коэффициенты.

Методика расчета коэффициента ранговой корреляции Кендалла аналогична методике расчета коэффициента Спирмена, только с иным расчетом суммы рангов.

Коэффициент ранговой корреляции Кендалла () рассчитывается по следующей формуле:

, (10.41)

где S - сумма разности между значениями;

n - число сопоставляемых рангов;

1/2 и 1 - постоянные коэффициенты.

Коэффициенты Кендалла и Спирмена изменяются от +1 до -1.

Пример 9.4. Имеются следующие данные о количестве административных правонарушений и преступлений, совершенных в Калининградской области, за 1998 – 2004гг.

Таблица 10.9 – Распределение административных правонарушений

и преступлений, совершенных в Калининградской

области, за 1998 – 2004гг.

Год

1998

1999

2000

2001

2002

2003

2004

Число административных правонарушений (х)

38

45

59

68

75

79

93

Число преступлений (у)

6

5

4

8

7

10

12

Необходимо рассчитать коэффициент Фехнера и коэффициент Спирмена между административными правонарушениями и преступлениями, совершенными в Калининградской области.

Для решения задачи сначала необходимо исчислить среднюю арифметическую ряда признака-фактора (х) и признака-следствия (у):

= 65,8 правонарушений;

= 7,42 преступлений.

Затем определим знаки отклонений от исчисленных средних (графы 4 и 5 таблицы 10.10). Если реальное значение больше средней, то против него ставится знак (+), меньше - знак (-). Совпадение знаков по отдельным значениям ряда х и у означает согласованную вариацию, несовпадение - нарушение согласованности.

Таблица 10.10 – Расчет коэффициента Фехнера и Спирмена

№ п/п

Правонарушения (x)

Преступления (y)

Расчет коэффициента Фехнера

Расчет коэффициента

Спирмена

Знаки отклонения от средней

Ранги по признакам

Разность

рангов

х

y

х

y

d

d2

1

38

6

-

-

1

3

2

4

2

45

5

-

-

2

2

0

0

3

59

4

-

-

3

1

2

4

4

68

8

+

+

4

5

1

1

5

75

7

+

-

5

4

1

1

6

79

10

+

+

6

6

0

0

7

93

12

+

+

7

7

0

0

= 65,3

= 7,4

d2 = 10

Подсчитаем совпадающие знаки отклонений. Их шесть (три минуса и три плюса). Несовпадающий знак отклонений один. Тогда коэффициент Фехнера будет равен:

.

Коэффициент Фехнера между состоянием административной правонарушаемости и преступными деяниями на предприятии в равен +0,714. Он свидетельствует о существенной прямой согласованности.

Рассчитаем коэффициент ранговой корреляции Спирмена. Для его нахождения сначала ряд х (правонарушения) проранжируем (определим ранги или номера мест) от 1 до 7. Поскольку значения х изначально расположены в порядке возрастания (от меньшего к большему), то значения рангов совпадают со значениями графы номера по порядку (графа 6 таблицы 10.10).

После этого проранжируем ряд у (преступления) от меньшего к большему. Ранг 1 присваивается меньшему значению ряда (4 преступления), ранг 2 - значению 5 преступлений, ранг 3 - значению 6 преступлений, ранг 4 - значению 7 преступлении, paнг 5 - значению 8 преступлений, ранг 6 - значению 10 преступлений, ранг 7 - значению 12 преступлений (все они проставлены в графе 7 таблицы 10.10).

После этого рассчитываем разность рангов (d), а затем полученные числа возводятся в квадрат (d2) и суммируются (d2 =10).

Тогда коэффициент Спирмена на основе полученных данных будет равен:

0,821.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]