Ольков_С_Г_Аналитическая юриспруденция
.pdf
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
2 = |
åσ i2 × ni |
, где σ |
2 – средняя из |
|
|
|
|
|
|
|
i=1 |
|||||
Средняя из групповых дисперсий: σ |
|||||||||||
m |
|||||||||||
|
|
|
|
|
|
|
|
å ni |
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
групповых дисперсий; m – число групп, ni |
- число наблюдений |
||||||||||
(единиц) в группе. |
|
|
|
|
|
|
|
|
|
|
|
Общая дисперсия доли: |
|
2 = p × q = p ×(1- p) , где |
|||||||||
|
|
σ |
|||||||||
|
|
m |
|
|
|||||||
|
|
å pi ni |
|
|
|||||||
средняя доля: |
p = |
i=1 |
. |
|
|
||||||
m |
|
|
|||||||||
|
|
åni |
|
|
i=1
Однофакторный дисперсионный анализ – статистический метод, позволяющий установить статистически значимое различие между математическим ожиданием хотя бы в одной генеральной совокупности от математических ожиданий в других изучаемых генеральных совокупностях.
Коэффициент эластичности коэффициентов преступности по S по коэффициентам преступности по G
(coefficient of the elasticity of coefficients of crime by S by the coefficients of crime by G) – позволяет приблизительно ответить на вопрос, на сколько процентов изменится преступность по S при изменении преступности по G на 1% (один процент):
ЭКПS / КПG = y¢× xy , где у – КПS, х – КПG, у´- первая производная (в
данном случае равна β-коэффициенту риска преступности). Учитывая тот факт, что β-коэффициенты риска преступности мы находим с помощью линейного уравнения вида: у=а+bx+ε, где ε – случайный член, а и b – постоянные коэффициенты (параметры), эластичность коэффициентов преступности по S по коэффициентам преступности по G будет рассчитываться по формуле:
ЭКПS / КПG = ab+×bxx , где b=β.
Оценочное уравнение коэффициентов преступности (ОУКП) (equation of the estimate coefficients of crime) – получаемое по эмпирическим данным уравнение, позволяющее приблизительно оценить по β-коэффициентам крайм-риска неизвестные значения соответствующих коэффициентов преступности.
217
Ковариация (covariance) – ожидаемое значение произведения отклонений двух случайных величин Х и Y от их математических
ожиданий |
μХ и μY: |
K X ,Y = E(x -μX ) ×( y -μY ) . Для |
выборочной |
|||
|
|
|
|
N |
|
|
статистики |
вычисляется |
по формуле: |
|
å(xi - xi ) ×( y j - y j ) |
. |
|
|
i 1, j 1 |
|
||||
|
|
|
K X ,Y = |
= = |
|
|
|
|
|
|
n |
|
Можно делить на (n-1). Коэффициент ковариации показывает не нормированную силу связи между переменными. Если его поделить на произведение стандартных отклонений по переменным, то будет получен нормированный коэффициент ковариации, который получил название коэффициента корреляции:
K
r = σ X X×σ,Y Y , где r – коэффициент корреляции.
Ковариационная матрица (covariance matrix) или вариационно-ковариационная матрица (variance-covariance matrix)
– симметричная матрица (относительно главной диагонали, вдоль которой идут дисперсии), в которой недиагональные элементы являют собой коэффициенты ковариации, а диагональные дисперсии пар элементов выборочной совокупности.
Стандартное отклонение по регионам территории
(standard deviation by the regions of territory):
σгород = é N N wi wjσij |
1 |
ù2 = (w1·w1·AA)+( w1·w2·AB)+ |
|
êåå |
ú |
ëi =1 j =1 |
û |
+(w1·w3·AC)+(w2·w1·AB)+(w2·w2·BB)+(w2·w3·BC)+(w3·w1·AC)+ |
|
+(w3·w2·BC)+(w3·w3·CC) – на примере трех регионов, |
|
входящих в данную территорию. |
|
Децильный коэффициент (Kд) (coefficient of deciles) – частное |
от деления девятого дециля на первый дециль ранжированного
вариационного |
ряда (дециль включает |
в себя |
10 перцентилей): |
||||
|
Д9 |
|
|
|
|
|
|
Kд = |
|
, где Д1 – первый дециль, Д9 – девятый дециль. |
|||||
Д1 |
|||||||
|
|
|
|
|
|
|
|
|
Фондовый |
коэффициент (Кф): |
Kф = |
хв |
|
|
|
|
хн , |
где соотносятся |
|||||
|
|
средние по 10% сверху и снизу ранжированного вариационного ряда.
Коэффициент дифференциации (coefficient of differentiation) вычисляется по формуле:
218
Q |
- Q |
1- Q1 |
|
|
|
|
|
|
|
|
|
||
|
|
Q |
, где |
Q1 – первый квартиль; Q3 |
– третий |
||||||||
Kдиф = 3 |
1 |
= |
|
3 |
|||||||||
|
Q |
||||||||||||
Q + Q |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
3 |
1 |
1+ Q |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
квартиль. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент вариации (coefficient of variation): |
|
||||||||||||
Квар = σ ×100 , |
обычно |
в |
1,5 |
раза |
больше коэффициента |
||||||||
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
дифференциации: |
Кдиф » |
Kвар |
, |
а коэффициент |
вариации |
||||||||
|
|||||||||||||
|
|
|
|
|
1,5 |
|
|
|
|
|
|
|
|
соответственно: Квар |
» Кдиф ×1,5 . |
|
|
|
|
|
|
|
|||||
Коэффициент |
Джини |
(коэффициент локализации) (Gini |
|||||||||||
|
|
|
|
|
|
|
|
|
|
n−1 |
n−1 |
|
|
index) рассчитывается по формуле: |
G = |
åWiQi+1 -åWi+1Qi |
или, если |
||||||||||
i=1 |
i=1 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
100 ×100 |
|
|
вместо процентов брать доли, то формула для расчета:
n−1 |
n−1 |
G = åWiQi+1 −åWi+1Qi . Показывает степень неравенства в |
|
i=1 |
i=1 |
распределении какого-либо изучаемого признака. По величине равна площади между линией абсолютного равенства и кривой Лоренца. С помощью интеграла разности между функциями:
1
òQ1(W ) −Q2(W )dW .
G = 0
0,5
Кривая Лоренца (Lorenz curve) – графическое представление коэффициента Джини (коэффициента локализации). Показывает площадь между линией абсолютного равенства (биссектриса) и эмпирической кривой, называемой кривой Лоренца. Кривая Лоренца расположена между линией абсолютного равенства и кривой абсолютного неравенства (идет по оси абсцисс до единицы (100% - если берем в процентах, а не в долях), а далее поднимается вверх до единицы (если в процентах - до 100%) вдоль оси ординат). По оси абсцисс откладываются значения накопленных частостей ( Wi ) по субъектам, а по оси ординат накопленные частости по коэффициентам преступности (Qi ). Если изучаются доходы народонаселения, то по абсциссе обычно идут 20% группы народонаселения, а по ординате доли доходов, приходящихся на
219
эти группы народонаселения. Аналогичным образом можно исследовать любые подходящие переменные.
Коэффициент Герфиндаля (Herfindahl index) вычисляется по формуле:
|
|
æ |
|
|
ö2 |
|
|
|
|
|
|
n ç |
|
xi fi |
÷ |
|
|
|
|
H = åç |
|
|
÷ . |
|
|
|
|||
|
n |
|
|
|
|
||||
|
|
ç |
åxi |
÷ |
|
|
|
||
|
i=1 ç |
fi ÷ |
|
|
|
||||
|
|
è i=1 |
ø |
|
|
|
|||
Коэффициент Лоренца вычисляется по формуле: |
|||||||||
|
1 |
n |
|
|
|
x w |
|
|
. |
|
|
|
|
|
|
||||
L = |
|
å |
wi − |
i i |
|
||||
|
n |
||||||||
|
2 i=1 |
|
|
å i |
i |
|
|||
|
|
|
|
x w |
|
||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
i=1 |
|
|
|
|
Коэффициент |
|
|
детерминации (determination coefficient): |
ηэмп2 = σδ 22 . Показывает величину объяснительной силы модели.
Коэффициент корреляции (correlation coefficient): ηэмп2 = σδ 22 .
Является показателем силы связи между переменными модели.
Функция выживаемости S(t) (survival curve) – это вероятность прожить более t единиц времени с момента начала
отсчета. Для совокупности имеем: S(t) = mN , где m – число лиц,
переживших какой-то момент времени t, N – объем исследуемой совокупности. Проблема заключается в том, что имеет место выбывание, и в исходную формулу нужно вносить поправку. В итоге получается расчет выживаемости моментным способом,
получившим название метода Каплана-Мейера: S(t)
æ |
- |
d ö |
, где П |
ç |
n ÷ |
||
= Пç1 |
i ÷ |
|
|
è |
|
i ø |
|
–произведение соответствующих сомножителей указанных в скобках, di – абсолютное число умерших в i-ый момент времени, ni
–абсолютное число наблюдавшихся в i-ый момент времени. То есть следует перемножить значения по всем i-ым моментам.
ОСНОВНЫЕ ТЕРМИНЫ:
Анализ выживаемости (survival analysis); β-коэффициент риска криминологического процесса (β-coefficient of the risk
220
criminological process), децильный коэффициент (coefficient of
deciles), |
дисперсионный анализ (variance analysis), дисперсия |
||
(variance), |
коэффициент |
эластичности |
коэффициентов |
преступности по S по коэффициентам преступности по G (coefficient of the elasticity of coefficients of crime by S by the coefficients of crime by G), ковариационная матрица (covariance matrix), ковариация (covariance), коэффициент вариации (coefficient of variation), коэффициент Герфиндаля (Herfindahl index), коэффициент детерминации (determination coefficient), коэффициент Джини (Gini index), коэффициент дифференциации (coefficient of differentiation), коэффициенты концентрации (concentration), коэффициент корреляции (correlation coefficient), кривая выживаемости (survival curve), кривая Лоренца (Lorenz curve), метод Бленда-Алтмана, оценочное уравнение коэффициентов преступности (ОУКП) (equation of the estimate coefficients of crime); стандартное отклонение по регионам территории (standard deviation by the regions of territory).
РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ
Задача №1 Дано: 1) уровень преступности на 100 тысяч населения в
Российской Федерации за 10 лет с 1997 по 2006 год (таблица 1); 2) уровень преступности в Республике Татарстан на 100 тысяч населения с 1997 по 2006 год (таблица 1).
Требуется найти: 1) β-коэффициент риска преступности в Республике Татарстан и дать его подробную интерпретацию; 2) найти эластичность КП в РТ по КП в РФ на 100 тысяч народонаселения равном 4000 преступлений и дать его подробную интерпретацию; 3) построить график эластичности коэффициентов преступности в Республике Татарстан при различных значениях КП по Российской Федерации (от 1100 до 3300).
Решение: 1. Строим таблицу mxn, где m – рабочие строки, n – рабочие столбцы. В данном случае 10х2 (десять рабочих строк и
221
два рабочих столбца). Вспомогательные строки и столбцы используются только в представительских целях, так как для расчетов они не требуются.
Таблица 1
t, годы |
Коэффициент |
Коэффициент |
|
преступности |
|||
преступности в РФ |
|||
|
в Республике Татарстан |
||
|
|
||
|
|
|
|
1997 |
1629 |
1308 |
|
|
|
|
|
1998 |
1759 |
1402 |
|
|
|
|
|
1999 |
2026 |
1909 |
|
|
|
|
|
2000 |
2028 |
1860 |
|
|
|
|
|
2001 |
2039 |
1891 |
|
|
|
|
|
2002 |
1760 |
1533 |
|
|
|
|
|
2003 |
1926 |
1559 |
|
|
|
|
|
2004 |
2007 |
1683 |
|
|
|
|
|
2005 |
2478 |
2440 |
|
|
|
|
|
2006 |
2687 |
2780 |
|
|
|
|
2. Получаем регрессионное уравнение вида у=f(x), где y – уровень преступности в Республике Татарстан на 100 тысяч населения, х – уровень преступности на 100 тысяч населения в Российской Федерации, f – конкретная (определенная) функция, то есть правило, по которому связываются левая и правая части уравнения (или параметризация уравнения)37.
Существуют различные методы параметризации функций и статистических закономерностей: 1) метод наименьших квадратов; 2) метод контрольных точек; 3) метод средних; 4) метод сумм; 5) метод кривых Пирсона и др. Наибольшее распространение получил метод наименьших квадратов как наиболее точный, в связи с чем реализован во всех программных статистических и математических пакетах.
37 Параметры в уравнении – постоянные величины, определяющие вид функции и превращающие уравнение общего вида у=f(x) в уравнение конкретного (определенного) вида, например, у=а+bx, где а и b параметры или y=xb, где b – параметр.
222
В нашем примере с помощью компьютерной программы, например, Exсel, Statistica, SPSS, Мathcad, получаем следующее регрессионное уравнение: у=1,4х-1018.
КП РТ, шт.
3000
2500 КП РТ = 1,4035*КП РФ - 1018
R2 = 0,9734
2000
1500
1000
500
0
0 |
500 |
1000 |
1500 |
2000 |
2500 |
3000 |
КП РФ, шт.
КП РТ Линейный (КП
Рис. 1. Зависимость между КП РФ и КП РТ (1997-2006 г.г.)
Покажем процедуру решения для нашего примера. Система линейных уравнений для оценки параметров а и b методом наименьших квадратов:
|
ï |
n |
× a+ b |
å |
x = |
å |
y |
|
|
|
||
|
ì |
|
|
|
|
|
||||||
|
í |
a |
å |
x+ b |
å |
x2 |
= |
å |
y× x. |
|
|
|
|
î |
|
|
|
|
|
|
|
|
|||
|
ï |
|
|
|
|
|
|
|
|
|
|
|
1. Строим расчетную таблицу. |
|
|
|
|||||||||
№/№ |
|
|
х |
|
|
|
|
|
у |
|
y∙x |
x2 |
1 |
|
1629 |
|
|
|
1308 |
|
2130732 |
2653641 |
|||
2 |
|
1759 |
|
|
|
1402 |
|
2466118 |
3094081 |
|||
3 |
|
2026 |
|
|
|
1909 |
|
3867634 |
4104676 |
|||
4 |
|
2028 |
|
|
|
1860 |
|
3772080 |
4112784 |
|||
5 |
|
2039 |
|
|
|
1891 |
|
3855749 |
4157521 |
|||
6 |
|
1760 |
|
|
|
1533 |
|
2698080 |
3097600 |
|||
7 |
|
1926 |
|
|
|
1559 |
|
3002634 |
3709476 |
|||
8 |
|
2007 |
|
|
|
1683 |
|
3377781 |
4028049 |
|||
9 |
|
2478 |
|
|
|
2440 |
|
6046320 |
6140484 |
|||
10 |
|
2687 |
|
|
|
2780 |
|
7469860 |
7219969 |
|||
∑ |
20339 |
|
|
18365 |
38686988 |
42318281 |
||||||
(Итого |
или |
|
|
|
|
|
|
|
|
|
|
|
223
№/№ |
х |
у |
y∙x |
x2 |
сумма) |
|
|
|
|
2. Подставляем значения из расчетной таблицы в систему нормальных уравнений:
ì |
1 0× a+ b× 2 0 3=3198 3 6 5 |
í |
a× 2 0 3+3b9× 4 2 3 1 8= 32 8 61 8 6. |
î |
3. Решаем систему нормальных уравнений через метод определителей или метод последовательного исключения переменных, чтобы найти искомые параметры а и b. В нашем случае применим метод определителей.
Составляем систему двух линейных уравнений с двумя неизвестными:
ì a1 1x1 + a1 2x2 = b1 , |
|||||
í |
+ |
|
a2 2x2 = b2 |
||
î a2 1x1 |
|
||||
а далее находим определители: |
|
|
|
|
|
|
a1a1 |
|
=(a1 |
×a2 |
)-(a×a) |
D= |
|
||||
|
a2a2 |
|
1 |
122 |
1221 |
D |
a |
= |
b1a1 |
|
=(b×a2 |
)- |
(b |
2 |
×a) |
|
|||||||||
|
|
ba |
|
1 2 |
|
|
21 |
||
|
|
|
22 |
|
2 |
|
|
|
|
224
|
|
|
|
|
|
|
|
|
|
|
|
|
D= |
a1b1 |
=(a×1b)-(a×b) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
b |
a |
b |
1 2 12 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
2 |
1 |
|
|
|
|
|
|
Очевидно, |
что для нашего |
примера a11=10; a12=20339; |
||||||||||
a21=20339; a22=42318281; b1=18365; b2=38686988. |
|||||||||||||||||
∆= |
|
1 |
|
0 |
2 |
0 |
3 |
|
= 10∙42318281-20339∙20339=9507889, |
||||||||
|
|
||||||||||||||||
|
2 |
0 |
43 |
23 |
39 |
|
|||||||||||
|
|
1 |
8 |
3 |
62 |
50 |
3 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
||||||||||||
∆а= |
|
3 |
8 |
6 |
84 62 93 8=18365∙42318281-38686988∙20339= |
= -9679418367,
∆b= |
|
1 |
0 |
1 |
8 |
3 |
|
=10∙38686988-20339∙18365=13344145, |
|
|
|||||||
|
2 |
0 |
33 |
83 |
69 |
а=∆а:∆= -9679418367: 9507889= -1018, b=∆b:∆=13344145: 9507889=1,4.
Первая производная (в регрессионном уравнении – коэффициент регрессии) в данном случае 1,4. Следовательно, β-коэффициент крайм-риска в Республике Татарстан равен 1,4.
225
Ответ: β-коэффициент риска преступности в Республике Татарстан равен 1,4.
Интерпретация β-коэффициента риска преступности в Республике Татарстан:
1)изменчивость преступности (риск преступности) в Республике Татарстан за исследуемый временной период в среднем на 40% выше (или что то же самое – устойчивость ниже на 40%), чем по Российской Федерации в целом, поскольку средний риск по РФ равен единице (1,4-1=0,4 или 40% (0,4∙100=40))38. Свободный член в данном уравнении криминологического смысла не имеет;
2)β-коэффициент риска преступности в Республике Татарстан показывает, что изменение коэффициента преступности по Российской Федерации на единицу измерения (1 преступление на 100 тысяч населения) влечет изменение уровня преступности в Республике Татарстан на 1,4 преступлений, что в свою очередь означает меньшую устойчивость преступности в Республике Татарстан по сравнению с Российской Федерацией в целом, соответственно, и менее надежные прогнозы преступности по данной территории. Например, если коэффициент преступности по Российской Федерации увеличится на 5 преступлений, то в Республике Татарстан он вырастет приблизительно на 7 преступлений. Если же коэффициент преступности по Российской Федерации уменьшится на 5 преступлений, то коэффициент преступности в Республике Татарстан уменьшится примерно на 7 преступлений.
2. Находим эластичность коэффициентов преступности в Республике Татарстан по коэффициентам преступности в
Российской Федерации по формуле для линейного уравнения:
38 При желании можно посчитать, что суммарный уровень преступности по Российской Федерации (20339) за исследуемый период был выше, чем по Республике Татарстан (18365) (20339>18365), но выяснение данного вопроса не имеет отношения к исследованию β-коэффициента риска преступности, поскольку данный коэффициент отвечает лишь на вопрос о величине изменчивости. Таким образом, для нашего примера средний уровень преступности в РФ за исследуемый временной период был выше, чем в Республике Татарстан, но риск (изменчивость) преступности в Республике Татарстан был выше среднего риска преступности по России.
226