Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
206
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

получив три разных таблицы, а далее для каждой из них рассчитать

 

 

m

 

 

межгрупповую дисперсию по формуле:

δ 2 =

å(yi - y)2 × ni

, где δ2 -

i=1

 

 

m

 

 

 

åni

 

i=1

межгрупповая дисперсия, yi - средние по каждой конкретной группе, y - объединенное среднее (среднее по всей совокупности)

m

å yi × ni

вычисляемое по формуле:

y =

i=1

.

m

 

 

åni

 

 

 

i=1

 

Порядок расчета межгрупповой дисперсии для первого способа приведен ниже по ходу решения данной задачи. Для второго, третьего и других способов вычисление межгрупповой дисперсии осуществляется аналогичным образом.

Построим вспомогательные рабочие таблицы:

Х = КП

Частота

Частость,

 

 

 

 

Середина

хi fi

шт.

( fi )

( wi ),%

 

 

 

интервала,

 

 

 

 

 

 

 

 

 

( xi )

 

361-660

3

3,65

 

 

 

 

 

510

1530

661-960

1

1,22

 

 

 

 

 

810

810

961-1260

9

10,98

 

 

 

 

 

1110

9990

1261-1560

13

15,90

 

 

 

 

 

1410

18330

1561-1860

21

25,60

 

 

 

 

 

1710

35910

1861-2160

12

14,63

 

 

 

 

 

2010

24120

2161-2460

13

15,90

 

 

 

 

 

2310

30030

2461-2787

10

12,19

 

 

 

 

 

2624

26240

ИТОГО

82

100

 

 

 

 

 

 

146960

 

 

æ

x

 

f

 

ö

×100

 

Х = КП шт.

Накопленные

qi = ç

 

i

 

i

÷

Накопленные

ç

åxi fi

÷

 

 

частости

è

ø

 

qi (Qi )

 

(Wi ), %

 

 

 

 

 

 

 

 

361-660

3,65

 

1,04

 

 

1,04

661-960

4,87

 

0,55

 

 

1,59

961-1260

15,85

 

6,79

 

 

8,38

1261-1560

31,75

 

12,47

 

 

20,85

1561-1860

57,35

 

24,44

 

 

45,29

1861-2160

71,98

 

16,41

 

 

61,70

2161-2460

87,88

 

20,43

 

 

82,13

167

2461-2787

100

17,86

100

ИТОГО

 

 

 

 

 

Накопленные

Накопленные

WiQi 1

Wi 1Qi

Х = КП шт.

частости

(Qi ) , %

+

+

 

 

 

(Wi ), %

(по КП)

 

 

 

(по

 

 

 

 

субъектам)

 

 

 

361-660

3,65

1,04

5,8

 

661-960

4,87

1,59

40,81

5,06

961-1260

15,85

8,38

330,47

25,2

1261-1560

31,75

20,85

1437,96

266,06

1561-1860

57,35

45,29

3538,5

1195,75

1861-2160

71,98

61,70

5911,7

3259,97

2161-2460

87,88

82,13

8788

5422,2

2461-2787

100

100

 

8213

ИТОГО

 

 

20053

18387

Wi – накопленные частости по субъектам Российской Федерации; Qi – накопленные частости по коэффициентам преступности.

Коэффициент Джини (коэффициент локализации) (Gini index), если он вычисляется по накопленным процентам, как в нашем случае, рассчитывается по формуле:

 

 

n−1

n−1

 

 

 

G =

 

åWiQi+1 -åWi+1Qi

.

 

 

=

=

 

 

 

 

 

i 1

i

1

 

 

 

 

 

100 ×100

 

 

 

 

 

n−1

n−1

 

 

 

 

 

G =

åWiQi+1

-åWi+1Qi

20053 -18387

 

.

 

i 1

i 1

 

=

= 0,16

=

=

 

 

 

100 ×100

 

10000

 

 

 

 

 

 

Если вместо процентов брать доли, то формула для расчета:

n−1

n−1

G = åWiQi+1 åWi+1Qi .

i=1

i=1

В программе Excel построим кривую Лоренца (Lorenz curve), графически отражающую коэффициент локализации (коэффициент Джини).

168

Коэффициент Джини показывает величину площади между функциями Q1и Q2. Следовательно, его можно рассчитать и с помощью интеграла разности между отмеченными функциями:

1

òQ1(W ) -Q2(W )dW .

G = 0

0,5

Для нашего примера имеем:

1

 

G =

òW -(0,49 ×W 2 + 0,514 ×W -0,006)dW

= 0,14 .

0

 

0,5

 

Таблица. Исходные данные для построения графика в программе Excel.

Накопленные

Q2(W)

 

частости

Накопленные

 

(Wi)

частости (Qi)

Q1(W

(по субъектам)

(по КП)

)

 

 

 

 

 

 

 

0

0

0

 

 

 

0,0365

0,0104

0,0365

 

 

 

0,0487

0,0159

0,0487

 

 

 

0,1585

0,0838

0,1585

 

 

 

0,3175

0,2085

0,3175

 

 

 

169

0,5735

0,4529

0,5835

0,7198

0,617

0,7298

0,8788

0,8213

0,8888

1

1

1

Для построения графика выделяем на листе Excel исходные данные, в командной строке выбираем «Вставка», далее выбираем «Точечная» (можно взять линию либо точки), в «Конструкторе» берем удобный вид графика (какую-либо модель).

Чтобы вывести на график формулы для функций Q1 и Q2 нужно встать на соответствующую линию (или любую точку, когда вместо линий вы выбрали точки) курсором, щелкнуть правой клавишей мыши, в появившемся окне выбрать «Добавить линию тренда». Для функции Q1 – выбрать «Линейная» и «Показывать уравнение на диаграмме». Для функции Q2 – выбрать «Полиноминальная» «Степень 2» и «Показывать уравнение на диаграмме».

Используя правило сложения дисперсий, рассчитаем общую, внутригрупповую и межгрупповую дисперсию для данного ряда (поскольку данный ряд мы разобьем на несколько частей).

Вспомогательная таблица.

 

361

1003

1267

1591

1890

2164

2470

 

 

 

 

 

 

 

 

 

373

1020

1275

1595

1928

2172

2487

 

 

 

 

 

 

 

 

 

425

1031

1332

1631

1984

2177

2504

 

 

 

 

 

 

 

 

 

 

1034

1365

1634

2009

2195

2570

 

 

 

 

 

 

 

 

 

 

1042

1399

1658

2012

2198

2583

 

 

 

 

 

 

 

 

 

 

1055

1403

1681

2012

2205

2595

 

 

 

 

 

 

 

 

 

 

1101

1405

1685

2029

2308

2633

 

 

 

 

 

 

 

 

 

 

1215

1426

1695

2072

2330

2719

 

 

 

 

 

 

 

 

 

 

1236

1431

1742

2126

2396

2751

 

 

 

 

 

 

 

 

 

 

 

1440

1745

2138

2402

2787

 

 

 

 

 

 

 

 

 

 

 

1494

1760

2144

2426

 

 

 

 

 

 

 

 

 

 

 

 

1547

1767

2148

2427

 

 

 

 

 

 

 

 

 

 

 

 

1555

1778

 

2454

 

 

 

 

 

 

 

 

 

 

 

 

 

1780

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1788

 

 

 

 

 

 

 

 

 

 

 

170

 

 

 

 

1794

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1795

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1797

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1810

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1817

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1828

 

 

 

 

 

 

 

 

 

 

 

 

386,333

1081,88

1410,69

1731,95

 

2296,46

 

Среднее

3

9

2

2

2041

2

2609,9

 

 

 

 

 

 

 

 

Дисперси

1157,33

 

 

5725,34

7392,90

13050,4

 

я

3

7440,5

6640,97

8

9

4

12459,88

 

 

 

 

 

 

 

 

 

 

86,2583

81,4921

75,6660

85,9820

114,238

 

СКО

34,0196

3

5

3

3

5

111,6238

 

 

 

 

 

 

 

 

Когда совокупность разбита на группы, и для каждой группы рассчитаны среднее и дисперсия, то общая дисперсия вычисляется по формуле: σ 2 = σ 2 + δ 2 , где σ2 - общая дисперсия ряда, σ 2 - средняя из групповых дисперсий, δ2 - межгрупповая дисперсия.

 

 

m

 

 

 

 

 

 

åσ i2 × ni

 

2 ,- средняя из групповых дисперсий; m

σ

2 =

i=1

 

,

где σ

m

 

 

 

å ni

 

 

 

 

 

 

i=1

 

 

 

 

число групп,

ni

- число наблюдений (единиц) в группе. Таким

образом, внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине – внутригрупповой дисперсии.

 

m

 

 

δ 2 =

å(yi - y)2 × ni

, где δ2 - межгрупповая дисперсия, yi - средние

i=1

 

 

m

 

 

å ni

 

i=1

по каждой конкретной группе, y - объединенное среднее (среднее по всей совокупности) вычисляемое по формуле:

 

m

 

 

å yi × ni

y =

i=1

. Межгрупповую дисперсию также называют

m

 

åni

i=1

факторной, поскольку она относится на счет изучаемого фактора.

Частное от деления межгрупповой дисперсии на общую дисперсию дает важный показатель связи называемый

171

коэффициентом детерминации: ηэмп2 = σδ 22 . Коэффициент корреляции

получается путем извлечения корня из коэффициента детерминации:

ηэмп2 = σδ 22 . Более подробно о коэффициенте корреляции речь

идет в главе посвященной изучению закономерностей юридических процессов. Там показано, что данный коэффициент может находиться в пределах от нуля до единицы или минус единицы. Чем ближе значение коэффициента к единице, тем сильнее связь. По общему правилу коэффициент корреляции более 0,7 говорит о сильной связи, от 0,5 до 0,7 – об умеренной связи, от 0,3 до 0,5 – о слабой. Если коэффициент менее 0,3, то связь практически отсутствует.

Для нашего примера по порядку вычисляем:

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

å yi × ni

 

 

 

 

 

 

y =

i=1

 

= 386,3×3 +1081,9

×9 + ...+ 2609,9×10 =1803

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

81

 

 

 

 

 

 

 

åni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

åσ i2 × ni

 

 

 

 

 

 

 

2

=

i=1

 

= 1157,3×3 + 7440,5× 9 + ...+12459,88×10 = 8147,78 .

σ

 

m

 

 

 

 

 

 

åni

 

 

 

81

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3 8,36- 1 8 0)23× 3+

 

 

 

 

 

 

 

m

 

 

 

+ (1 0 8,81- 1 8 0)23× 9+

 

 

 

 

 

 

å (yi - y)2 ×

ni

2

 

 

δ 2 =

 

i=1

 

=

...+ (2 6 0,99- 1 8 0) 3×1 0= 2 8 5 9,57 .

 

 

 

 

 

 

 

 

m

 

 

 

8 1

 

 

 

 

 

 

 

 

å ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

Общая дисперсия: σ2

2 2

=8147 ,78 +285972 ,5 = 294120 ,3 .

Откуда находим коэффициент детерминации:

 

 

 

2

 

 

 

285972 ,5 = 0,97 . Извлекая корень из коэффициента

 

 

 

ηэмп2 = δ 2

=

 

 

 

 

 

σ

 

 

 

294120 ,3

 

 

 

детерминации, получаем значение коэффициента корреляции:

172

ηэмп2 =

δ

2

 

 

 

. Коэффициент корреляции показывает, что

2 =

0,97

= 0,98

 

σ

 

 

 

 

 

уровень преступности тесно связан с региональными особенностями.

Таким образом, межгрупповая и общая дисперсия являются весьма важными, поскольку дают нам, во-первых, коэффициент детерминации, и, во-вторых, эмпирическое корреляционное отношение. Кроме того, межгрупповая дисперсия применяется для сравнения эффективности различных группировок.

Коэффициент Герфиндаля (Herfindahl index) вычисляется по формуле:

 

æ

 

ö2

n

ç

xi fi

÷

H = åç

 

÷ .

n

 

 

ç

åxi

÷

i=1

ç

fi ÷

 

è i=1

ø

Для нашего примера:

Середина

 

 

 

Частота

 

хi fi

 

xi fi

 

 

 

æ

x

 

f

 

ö2

интервала,

 

 

 

 

( fi )

 

 

 

 

 

 

 

ç

 

i

 

i

÷

 

 

 

 

 

 

 

x

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ç

 

 

 

 

÷

( xi )

 

 

 

 

 

 

 

 

 

å i

 

i

è

åxi fi ø

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

510

 

 

 

 

 

3

 

1530

0,0104..

0,000108

810

 

 

 

 

 

1

 

810

0,0055117

0,0000303

1110

 

 

 

 

 

9

 

9990

0,067977

 

0,00462

1410

 

 

 

 

 

13

 

18330

0,12472

0,015557

1710

 

 

 

 

 

21

 

35910

0,24435

 

0,0597

2010

 

 

 

 

 

12

 

24120

0,164

 

 

 

0,0269

2310

 

 

 

 

 

13

 

30030

0,20434

 

0,04175

2624

 

 

 

 

 

10

 

26240

0,17855

 

0,03188

ИТОГО

 

 

 

 

 

82

 

146960

 

 

 

 

 

 

0,1805

 

æ

 

 

ö2

 

 

 

 

 

 

 

 

 

 

 

 

 

n

ç

 

xi fi

÷

= 0,1805 .

 

 

 

 

 

 

 

 

 

 

 

 

H = åç

 

 

÷

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ç

åxi

÷

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

ç

fi ÷

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è i=1

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент Лоренца вычисляется по формуле:

173

L =

1

n

 

 

 

x w

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

å

wi - n

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 i=1

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å i i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

wi

 

 

 

 

 

 

 

xi wi

 

 

 

xi wi

 

w −

xi wi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åxi wi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åxi wi

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,0365

 

 

 

18,615

 

 

0,010379

0,026121

 

 

0,0122

 

 

 

9,882

 

 

0,00551

 

 

 

0,00669

 

 

0,1098

 

 

 

121,878

 

 

0,067954

0,041846

 

 

0,159

 

 

 

224,19

 

 

0,124999

0,034001

 

 

0,256

 

 

 

437,76

 

 

0,244077

0,011923

 

 

0,1463

 

 

 

294,06

 

 

0,163956

0,017656

 

 

0,159

 

 

 

367,29

 

 

0,204786

0,045786

 

 

0,1219

 

 

 

319,86

 

 

0,178341

0,056441

 

 

ИТОГО:

 

1793,535

 

 

 

 

 

0,240464

 

 

 

1

 

 

 

 

x w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L =

n

 

 

 

 

 

=0,5

×0,240464

=0,12 .

 

 

 

 

 

 

 

2

åi=1

wi - n

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åxi wi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решим задачу на нахождение общей дисперсии доли полезную для решения отдельных юридических задач. В нашем распоряжении имеется таблица числа лиц, содержащихся в местах лишения свободы:

Таблица №1. Число лиц, содержащихся в местах лишения свободы в РФ (на конец года, тысяч человек) 11.

Возрастные

группы

2006 2007 2008 2009

18-25

201,5 195,9 199,2 178,1

26-55

478,1 501,3 514,5 324,1

56-60

11,9 13,4 14,4 15,4

<60 5,4 5,7 6,3 6,5

14-17

12,8

10,8

8,6

6

Требуется: 1) найти среднюю общую долю заключенных в возрасте 56-60 лет, содержавшихся в местах лишения свободы в

11 http://www.gks.ru/wps/wcm/connect/rosstat/rosstatsite/main/population/infraction/#

174

России в 2006-2009 годах; 2) найти общую дисперсию доли заключенных в возрасте 56-60 лет, содержавшихся в местах лишения свободы в России в 2006-2009 годах.

Решение:

1) составим вспомогательную таблицу:

Годы

Число

 

Доля

 

 

 

 

 

 

Дисперсия

 

 

 

заключенных,

 

заключенных

 

qi =1− pi

доли

по

 

 

ni

 

в возрасте

 

 

 

 

 

 

группам,

 

 

 

 

 

56-60 лет, pi

 

 

 

 

 

 

σi2 = piqi

 

2006

709,7

 

0,0168

 

 

0,9832

0,0165177

 

2007

727,1

 

0,018

 

 

0,982

0,017676

 

2008

743

 

0,019

 

 

0,981

0,018639

 

2009

530,1

 

0,029

 

 

0,971

0,028159

 

Итого

2709,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

å pi ni

 

 

 

2)

найдем среднюю общую долю:

p =

i=1

.

 

 

 

m

 

 

 

 

 

 

 

 

 

 

åni

 

 

 

0,0168 ×709 ,7 +0,018 ×727 ,1+... +0,029 ×530 ,1

 

 

i=1

 

 

p =

=

54,5

=0,02 .

 

 

 

2709 ,9

 

 

2709 ,9

 

 

Доля заключенных в возрасте 56-60 лет, содержавшихся в местах лишения свободы в России в 2006-2009 годах, составляет 0,02 или 2%.

3) Найдем общую дисперсию доли: σ 2 = p × q = p ×(1- p) .

σ 2 = p ×(1- p) = 0,02 ×(1-0,02) = 0,02 ×0,98 = 0,0196 .

Существует и другой способ вычисления общей дисперсии доли. Приведем его лишь в демонстрационных целях (более трудоемкий).

Сначала находим среднюю из групповых дисперсий:

 

 

 

 

m

 

 

 

 

 

 

2

=

åσi2ni

=

0,0165× 709,7

+ ...+ 0,028×530,1

.

σ i

m

 

 

 

 

 

 

i=1

 

 

 

 

åni 2709,9

i=1

Далее находим межгрупповую дисперсию:

175

 

 

 

m

 

 

 

 

 

 

δ

2

=

å( pi - p)2 × ni

=

(0,0168- 0,02)

2

× 709,7...

.

i=1

 

 

 

 

m

 

 

 

åni 2709,9

i=1

Находим общую дисперсию доли: σ 2 = σ i2 + δ 2 . Результат при этом получается тот же 0,0196.

§4. Однофакторный и двухфакторный дисперсионный анализ (variance analysis) юридических процессов.

Дисперсионный анализ может быть полезен для решения широкого круга юридико-аналитических, исследовательских задач. В частности, уместно сравнить различные населенные пункты по коэффициентам преступности, криминогенной пораженности, виктимности; осуществить подбор факторов для проведения парного или множественного регрессионного анализа с включением сюда каких-либо юридических переменных. «Если ставится задача сравнения двух выборочных дисперсий, то для её решения применяется критерий, названный в честь английского статистика Р. Фишера (1890-1969). Этот критерий представляет собой отношение выборочных дисперсий s12 и s22 , которые рассматриваются как оценки одной и той же генеральной

дисперсии

 

:

 

s2

» .

 

 

 

s22

 

 

σ2

 

F =

1

12

 

 

 

 

 

«Дисперсионный анализ (variance analysis) –

раздел

математической статистики, посвященный методам выявления влияния отдельных факторов на результат эксперимента (физического, производственного, экономического …). Возник как средство обработки результатов агрономических опытов, с помощью которых выявлялись наиболее благоприятные условия для сортов сельскохозяйственных культур. При этом исходят из положения о том, что существенность фактора в определенных условиях характеризуется его вкладом в дисперсию результата. Английский статистик Р. Фишер, разработавший этот метод в 1925

12 Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/Под ред. И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика, 2004. С. 295.

176