Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
206
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

2 =

åσ i2 × ni

, где σ

2 – средняя из

 

 

 

 

 

 

i=1

Средняя из групповых дисперсий: σ

m

 

 

 

 

 

 

 

 

å ni

 

 

 

 

 

 

 

 

 

 

i=1

 

 

групповых дисперсий; m – число групп, ni

- число наблюдений

(единиц) в группе.

 

 

 

 

 

 

 

 

 

 

Общая дисперсия доли:

 

2 = p × q = p ×(1- p) , где

 

 

σ

 

 

m

 

 

 

 

å pi ni

 

 

средняя доля:

p =

i=1

.

 

 

m

 

 

 

 

åni

 

 

i=1

Однофакторный дисперсионный анализ – статистический метод, позволяющий установить статистически значимое различие между математическим ожиданием хотя бы в одной генеральной совокупности от математических ожиданий в других изучаемых генеральных совокупностях.

Коэффициент эластичности коэффициентов преступности по S по коэффициентам преступности по G

(coefficient of the elasticity of coefficients of crime by S by the coefficients of crime by G) – позволяет приблизительно ответить на вопрос, на сколько процентов изменится преступность по S при изменении преступности по G на 1% (один процент):

ЭКПS / КПG = y¢× xy , где у – КПS, х – КПG, у´- первая производная (в

данном случае равна β-коэффициенту риска преступности). Учитывая тот факт, что β-коэффициенты риска преступности мы находим с помощью линейного уравнения вида: у=а+bx+ε, где ε – случайный член, а и b – постоянные коэффициенты (параметры), эластичность коэффициентов преступности по S по коэффициентам преступности по G будет рассчитываться по формуле:

ЭКПS / КПG = ab+×bxx , где b=β.

Оценочное уравнение коэффициентов преступности (ОУКП) (equation of the estimate coefficients of crime) – получаемое по эмпирическим данным уравнение, позволяющее приблизительно оценить по β-коэффициентам крайм-риска неизвестные значения соответствующих коэффициентов преступности.

217

Ковариация (covariance) – ожидаемое значение произведения отклонений двух случайных величин Х и Y от их математических

ожиданий

μХ и μY:

K X ,Y = E(x -μX ) ×( y -μY ) . Для

выборочной

 

 

 

 

N

 

 

статистики

вычисляется

по формуле:

 

å(xi - xi ) ×( y j - y j )

.

 

i 1, j 1

 

 

 

 

K X ,Y =

= =

 

 

 

 

 

 

n

 

Можно делить на (n-1). Коэффициент ковариации показывает не нормированную силу связи между переменными. Если его поделить на произведение стандартных отклонений по переменным, то будет получен нормированный коэффициент ковариации, который получил название коэффициента корреляции:

K

r = σ X X×σ,Y Y , где r – коэффициент корреляции.

Ковариационная матрица (covariance matrix) или вариационно-ковариационная матрица (variance-covariance matrix)

– симметричная матрица (относительно главной диагонали, вдоль которой идут дисперсии), в которой недиагональные элементы являют собой коэффициенты ковариации, а диагональные дисперсии пар элементов выборочной совокупности.

Стандартное отклонение по регионам территории

(standard deviation by the regions of territory):

σгород = é N N wi wjσij

1

ù2 = (w1·w1·AA)+( w1·w2·AB)+

êåå

ú

ëi =1 j =1

û

+(w1·w3·AC)+(w2·w1·AB)+(w2·w2·BB)+(w2·w3·BC)+(w3·w1·AC)+

+(w3·w2·BC)+(w3·w3·CC) – на примере трех регионов,

входящих в данную территорию.

Децильный коэффициент (Kд) (coefficient of deciles) – частное

от деления девятого дециля на первый дециль ранжированного

вариационного

ряда (дециль включает

в себя

10 перцентилей):

 

Д9

 

 

 

 

 

Kд =

 

, где Д1 – первый дециль, Д9 – девятый дециль.

Д1

 

 

 

 

 

 

 

 

Фондовый

коэффициент (Кф):

Kф =

хв

 

 

 

хн ,

где соотносятся

 

 

средние по 10% сверху и снизу ранжированного вариационного ряда.

Коэффициент дифференциации (coefficient of differentiation) вычисляется по формуле:

218

Q

- Q

1- Q1

 

 

 

 

 

 

 

 

 

 

 

Q

, где

Q1 – первый квартиль; Q3

– третий

Kдиф = 3

1

=

 

3

 

Q

Q + Q

 

 

1

 

 

 

 

 

 

 

 

 

3

1

1+ Q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

квартиль.

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент вариации (coefficient of variation):

 

Квар = σ ×100 ,

обычно

в

1,5

раза

больше коэффициента

x

 

 

 

 

 

 

 

 

 

 

 

 

 

дифференциации:

Кдиф »

Kвар

,

а коэффициент

вариации

 

 

 

 

 

 

1,5

 

 

 

 

 

 

 

соответственно: Квар

» Кдиф ×1,5 .

 

 

 

 

 

 

 

Коэффициент

Джини

(коэффициент локализации) (Gini

 

 

 

 

 

 

 

 

 

 

n−1

n−1

 

index) рассчитывается по формуле:

G =

åWiQi+1 -åWi+1Qi

или, если

i=1

i=1

 

 

 

 

 

 

 

 

 

 

 

 

100 ×100

 

 

вместо процентов брать доли, то формула для расчета:

n−1

n−1

G = åWiQi+1 åWi+1Qi . Показывает степень неравенства в

i=1

i=1

распределении какого-либо изучаемого признака. По величине равна площади между линией абсолютного равенства и кривой Лоренца. С помощью интеграла разности между функциями:

1

òQ1(W ) −Q2(W )dW .

G = 0

0,5

Кривая Лоренца (Lorenz curve) – графическое представление коэффициента Джини (коэффициента локализации). Показывает площадь между линией абсолютного равенства (биссектриса) и эмпирической кривой, называемой кривой Лоренца. Кривая Лоренца расположена между линией абсолютного равенства и кривой абсолютного неравенства (идет по оси абсцисс до единицы (100% - если берем в процентах, а не в долях), а далее поднимается вверх до единицы (если в процентах - до 100%) вдоль оси ординат). По оси абсцисс откладываются значения накопленных частостей ( Wi ) по субъектам, а по оси ординат накопленные частости по коэффициентам преступности (Qi ). Если изучаются доходы народонаселения, то по абсциссе обычно идут 20% группы народонаселения, а по ординате доли доходов, приходящихся на

219

эти группы народонаселения. Аналогичным образом можно исследовать любые подходящие переменные.

Коэффициент Герфиндаля (Herfindahl index) вычисляется по формуле:

 

 

æ

 

 

ö2

 

 

 

 

 

n ç

 

xi fi

÷

 

 

 

H = åç

 

 

÷ .

 

 

 

 

n

 

 

 

 

 

 

ç

åxi

÷

 

 

 

 

i=1 ç

fi ÷

 

 

 

 

 

è i=1

ø

 

 

 

Коэффициент Лоренца вычисляется по формуле:

 

1

n

 

 

 

x w

 

 

.

 

 

 

 

 

 

L =

 

å

wi

i i

 

 

n

 

2 i=1

 

 

å i

i

 

 

 

 

 

x w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

Коэффициент

 

 

детерминации (determination coefficient):

ηэмп2 = σδ 22 . Показывает величину объяснительной силы модели.

Коэффициент корреляции (correlation coefficient): ηэмп2 = σδ 22 .

Является показателем силы связи между переменными модели.

Функция выживаемости S(t) (survival curve) – это вероятность прожить более t единиц времени с момента начала

отсчета. Для совокупности имеем: S(t) = mN , где m – число лиц,

переживших какой-то момент времени t, N – объем исследуемой совокупности. Проблема заключается в том, что имеет место выбывание, и в исходную формулу нужно вносить поправку. В итоге получается расчет выживаемости моментным способом,

получившим название метода Каплана-Мейера: S(t)

æ

-

d ö

, где П

ç

n ÷

= Пç1

i ÷

 

è

 

i ø

 

произведение соответствующих сомножителей указанных в скобках, di – абсолютное число умерших в i-ый момент времени, ni

абсолютное число наблюдавшихся в i-ый момент времени. То есть следует перемножить значения по всем i-ым моментам.

ОСНОВНЫЕ ТЕРМИНЫ:

Анализ выживаемости (survival analysis); β-коэффициент риска криминологического процесса (β-coefficient of the risk

220

criminological process), децильный коэффициент (coefficient of

deciles),

дисперсионный анализ (variance analysis), дисперсия

(variance),

коэффициент

эластичности

коэффициентов

преступности по S по коэффициентам преступности по G (coefficient of the elasticity of coefficients of crime by S by the coefficients of crime by G), ковариационная матрица (covariance matrix), ковариация (covariance), коэффициент вариации (coefficient of variation), коэффициент Герфиндаля (Herfindahl index), коэффициент детерминации (determination coefficient), коэффициент Джини (Gini index), коэффициент дифференциации (coefficient of differentiation), коэффициенты концентрации (concentration), коэффициент корреляции (correlation coefficient), кривая выживаемости (survival curve), кривая Лоренца (Lorenz curve), метод Бленда-Алтмана, оценочное уравнение коэффициентов преступности (ОУКП) (equation of the estimate coefficients of crime); стандартное отклонение по регионам территории (standard deviation by the regions of territory).

РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ

Задача №1 Дано: 1) уровень преступности на 100 тысяч населения в

Российской Федерации за 10 лет с 1997 по 2006 год (таблица 1); 2) уровень преступности в Республике Татарстан на 100 тысяч населения с 1997 по 2006 год (таблица 1).

Требуется найти: 1) β-коэффициент риска преступности в Республике Татарстан и дать его подробную интерпретацию; 2) найти эластичность КП в РТ по КП в РФ на 100 тысяч народонаселения равном 4000 преступлений и дать его подробную интерпретацию; 3) построить график эластичности коэффициентов преступности в Республике Татарстан при различных значениях КП по Российской Федерации (от 1100 до 3300).

Решение: 1. Строим таблицу mxn, где m – рабочие строки, n – рабочие столбцы. В данном случае 10х2 (десять рабочих строк и

221

два рабочих столбца). Вспомогательные строки и столбцы используются только в представительских целях, так как для расчетов они не требуются.

Таблица 1

t, годы

Коэффициент

Коэффициент

преступности

преступности в РФ

 

в Республике Татарстан

 

 

 

 

 

1997

1629

1308

 

 

 

1998

1759

1402

 

 

 

1999

2026

1909

 

 

 

2000

2028

1860

 

 

 

2001

2039

1891

 

 

 

2002

1760

1533

 

 

 

2003

1926

1559

 

 

 

2004

2007

1683

 

 

 

2005

2478

2440

 

 

 

2006

2687

2780

 

 

 

2. Получаем регрессионное уравнение вида у=f(x), где y – уровень преступности в Республике Татарстан на 100 тысяч населения, х – уровень преступности на 100 тысяч населения в Российской Федерации, f – конкретная (определенная) функция, то есть правило, по которому связываются левая и правая части уравнения (или параметризация уравнения)37.

Существуют различные методы параметризации функций и статистических закономерностей: 1) метод наименьших квадратов; 2) метод контрольных точек; 3) метод средних; 4) метод сумм; 5) метод кривых Пирсона и др. Наибольшее распространение получил метод наименьших квадратов как наиболее точный, в связи с чем реализован во всех программных статистических и математических пакетах.

37 Параметры в уравнении – постоянные величины, определяющие вид функции и превращающие уравнение общего вида у=f(x) в уравнение конкретного (определенного) вида, например, у=а+bx, где а и b параметры или y=xb, где b – параметр.

222

В нашем примере с помощью компьютерной программы, например, Exсel, Statistica, SPSS, Мathcad, получаем следующее регрессионное уравнение: у=1,4х-1018.

КП РТ, шт.

3000

2500 КП РТ = 1,4035*КП РФ - 1018

R2 = 0,9734

2000

1500

1000

500

0

0

500

1000

1500

2000

2500

3000

КП РФ, шт.

КП РТ Линейный (КП

Рис. 1. Зависимость между КП РФ и КП РТ (1997-2006 г.г.)

Покажем процедуру решения для нашего примера. Система линейных уравнений для оценки параметров а и b методом наименьших квадратов:

 

ï

n

× a+ b

å

x =

å

y

 

 

 

 

ì

 

 

 

 

 

 

í

a

å

x+ b

å

x2

=

å

y× x.

 

 

 

î

 

 

 

 

 

 

 

 

 

ï

 

 

 

 

 

 

 

 

 

 

 

1. Строим расчетную таблицу.

 

 

 

№/№

 

 

х

 

 

 

 

 

у

 

y∙x

x2

1

 

1629

 

 

 

1308

 

2130732

2653641

2

 

1759

 

 

 

1402

 

2466118

3094081

3

 

2026

 

 

 

1909

 

3867634

4104676

4

 

2028

 

 

 

1860

 

3772080

4112784

5

 

2039

 

 

 

1891

 

3855749

4157521

6

 

1760

 

 

 

1533

 

2698080

3097600

7

 

1926

 

 

 

1559

 

3002634

3709476

8

 

2007

 

 

 

1683

 

3377781

4028049

9

 

2478

 

 

 

2440

 

6046320

6140484

10

 

2687

 

 

 

2780

 

7469860

7219969

20339

 

 

18365

38686988

42318281

(Итого

или

 

 

 

 

 

 

 

 

 

 

 

223

№/№

х

у

y∙x

x2

сумма)

 

 

 

 

2. Подставляем значения из расчетной таблицы в систему нормальных уравнений:

ì

1 0× a+ b× 2 0 3=3198 3 6 5

í

a× 2 0 3+3b9× 4 2 3 1 8= 32 8 61 8 6.

î

3. Решаем систему нормальных уравнений через метод определителей или метод последовательного исключения переменных, чтобы найти искомые параметры а и b. В нашем случае применим метод определителей.

Составляем систему двух линейных уравнений с двумя неизвестными:

ì a1 1x1 + a1 2x2 = b1 ,

í

+

 

a2 2x2 = b2

î a2 1x1

 

а далее находим определители:

 

 

 

 

 

 

a1a1

 

=(a1

×a2

)-(a×a)

D=

 

 

a2a2

 

1

122

1221

D

a

=

b1a1

 

=(b×a2

)-

(b

2

×a)

 

 

 

ba

 

1 2

 

 

21

 

 

 

22

 

2

 

 

 

 

224

 

 

 

 

 

 

 

 

 

 

 

 

 

D=

a1b1

=(a×1b)-(a×b)

 

 

 

 

 

 

 

 

 

 

 

 

 

b

a

b

1 2 12

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

1

 

 

 

 

 

 

Очевидно,

что для нашего

примера a11=10; a12=20339;

a21=20339; a22=42318281; b1=18365; b2=38686988.

∆=

 

1

 

0

2

0

3

 

= 10∙42318281-20339∙20339=9507889,

 

 

 

2

0

43

23

39

 

 

 

1

8

3

62

50

3

 

 

 

 

 

 

 

 

 

 

 

 

а=

 

3

8

6

84 62 93 8=18365∙42318281-38686988∙20339=

= -9679418367,

b=

 

1

0

1

8

3

 

=10∙38686988-20339∙18365=13344145,

 

 

 

2

0

33

83

69

а=∆а:∆= -9679418367: 9507889= -1018, b=∆b:∆=13344145: 9507889=1,4.

Первая производная (в регрессионном уравнении – коэффициент регрессии) в данном случае 1,4. Следовательно, β-коэффициент крайм-риска в Республике Татарстан равен 1,4.

225

Ответ: β-коэффициент риска преступности в Республике Татарстан равен 1,4.

Интерпретация β-коэффициента риска преступности в Республике Татарстан:

1)изменчивость преступности (риск преступности) в Республике Татарстан за исследуемый временной период в среднем на 40% выше (или что то же самое – устойчивость ниже на 40%), чем по Российской Федерации в целом, поскольку средний риск по РФ равен единице (1,4-1=0,4 или 40% (0,4∙100=40))38. Свободный член в данном уравнении криминологического смысла не имеет;

2)β-коэффициент риска преступности в Республике Татарстан показывает, что изменение коэффициента преступности по Российской Федерации на единицу измерения (1 преступление на 100 тысяч населения) влечет изменение уровня преступности в Республике Татарстан на 1,4 преступлений, что в свою очередь означает меньшую устойчивость преступности в Республике Татарстан по сравнению с Российской Федерацией в целом, соответственно, и менее надежные прогнозы преступности по данной территории. Например, если коэффициент преступности по Российской Федерации увеличится на 5 преступлений, то в Республике Татарстан он вырастет приблизительно на 7 преступлений. Если же коэффициент преступности по Российской Федерации уменьшится на 5 преступлений, то коэффициент преступности в Республике Татарстан уменьшится примерно на 7 преступлений.

2. Находим эластичность коэффициентов преступности в Республике Татарстан по коэффициентам преступности в

Российской Федерации по формуле для линейного уравнения:

38 При желании можно посчитать, что суммарный уровень преступности по Российской Федерации (20339) за исследуемый период был выше, чем по Республике Татарстан (18365) (20339>18365), но выяснение данного вопроса не имеет отношения к исследованию β-коэффициента риска преступности, поскольку данный коэффициент отвечает лишь на вопрос о величине изменчивости. Таким образом, для нашего примера средний уровень преступности в РФ за исследуемый временной период был выше, чем в Республике Татарстан, но риск (изменчивость) преступности в Республике Татарстан был выше среднего риска преступности по России.

226