Ольков_С_Г_Аналитическая юриспруденция
.pdf(Гамма функция). График функции плотности распределения Стьюдента подобен графику нормального распределения.
Интегральная функция распределения Стьюдента (Госсета)5 вычисляется по формуле:
|
|
æ k +1 |
ö |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Гç |
|
|
÷ |
|
|
t |
æ |
+ t |
2 |
ö |
− |
k+1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
è 2 |
ø |
|
|
|
|
2 |
|
|
|
|
|
|
|
||||||
F(t) = |
|
|
× |
|
ç1 |
|
÷ |
|
|
dt |
. Математическое |
ожидание |
здесь |
||||||||
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
æ k |
ö |
|
òç |
k |
÷ |
|
|
|
||||||||||
|
|
|
|
|
è |
ø |
|
|
|
|
|
|
|
|
|
||||||
|
|
kπГç |
÷ |
|
−∞ |
|
|
|
|
|
|
|
|
|
|
|
|
||||
è 2 |
ø |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
равно нулю (μ=0), |
а |
|
дисперсия |
D(t) = |
k |
, |
k>2. При |
этом |
|||||||||||||
|
k − 2 |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
распределение Стьюдента на зависит от величин математического ожидания и дисперсии, а определяется только объемом выборки.
Функция плотности распределения Стьюдента (t-статистика) подобна z-статистике стандартизованного нормального распределения, и применяется для подобных целей – для построения доверительных интервалов и проверки статистических гипотез применительно к выборкам малого объема. График функции плотности распределения Стьюдента имеет форму подобную форме стандартизованного нормального распределения, но хвосты t-распределения более «тяжелые» - ограничивают большую площадь, чем в стандартизированном нормальном распределении. Данный эффект вызван тем, что в t-распределении не известно стандартное отклонение ГС, а вместо него используется выборочная оценка6. Неопределенность значения стандартного отклонения создает большую изменчивость переменной t по сравнению с переменной z.
В Мастере функций программного пакета Excel имеется функция СТЬЮДРАСП (Х, Степени свободы, Хвосты), а также обратная ей функция СТЬЮДРАСПОБР (Вероятность, Степени свободы).
Использование интегральной функции F(t) («Вероятность») дает возможность по значению t вычислить величину уровня
5 Данное распределение определил в начале ХХ столетия ирландец Уильям С.Госсет, избравший в силу сложившихся обстоятельств, псевдоним Стьюдент.
6 Левин Д.М, Стефан Д., Кребиль Т.С., Беренсон М.Л. Статистика для менеджеров с использованием Microsoft Excel, 4-е изд.: Пер. с англ. – М.: Издательский дом «Вильямс», 2004. С.456.
53
значимости α с односторонней доверительной вероятностью р=1-α с числом степеней свободы k=n-1 или величину 2α в случае с двусторонней доверительной вероятностью: р=1-2α. Что касается термина «Хвост», то он показывает одностороннюю или двухстороннюю доверительную вероятность. Если его значение равно двум, то речь идет о двухсторонней доверительной вероятности. В противном случае он равен единице, что символизирует одностороннюю доверительную вероятность.
- Распределение Вейбулла7 (Weibull distribution) – это распределение вероятностей случайной величины Х, плотность вероятности которой вычисляется по формуле:
f (х) = α |
|
æ |
x öα |
|
|
|
× xα -1 |
-ç |
|
÷ |
, где |
α и β – параметры распределения, α>0, |
|
× e è |
β ø |
|||||
|
|
ç |
÷ |
|
|
βα
β>0, 0≤x≤∞.
Интегральная функция: |
æ x öα |
||
F (х) =1-e è |
β ø . |
||
|
-ç |
|
÷ |
|
ç |
÷ |
Математическое ожидание для распределения Вейбулла
вычисляется по формуле: М [Х ] = μ = β × Гç |
α +1 |
÷ , где Г – гамма- |
æ |
ö |
|
è |
α |
ø |
функция. Дисперсия для распределения Вейбулла вычисляется по
|
|
2 |
ì |
æ |
α + 2 |
ö |
é |
æα +1 |
2 |
ü |
|
|
|
формуле: |
D[X ] = β |
ï |
öù |
ï |
. Если |
α=1, то распределение |
|||||||
|
íГç |
α |
÷ |
- ê |
Гç |
α |
÷ú |
ý |
|||||
|
|
|
ï |
è |
ø |
ë |
è |
øû |
ï |
|
|
||
|
|
|
î |
|
|
|
|
|
|
|
þ |
|
|
Вейбулла совпадает с экспоненциальным распределением, в котором его параметр лямбда равен единице деленной на бету:
λ= β1 .
ВМастере функций программного пакета Excel имеется функция ВЕЙБУЛЛ (Х, Альфа, Бета, Интегральная), позволяющая решать задачи данного класса. В поле «Интегральная» вводится либо нуль (ЛОЖЬ), либо единица (Истина). Соответственно в первом случае вычисляется значение функции плотности f(x), а во втором значение интегральной функции F(x).
На практике распределение Вейбулла применяется при анализе данных выживаемости, поскольку имеет свойство –
7 Названо в честь шведского исследователя Валоди Вейбулла (Waloddi Weibull), применявшего его для описания времен отказов разного типа. Также иногда в литературе называется распределением Вейбулла-Гнеденко.
54
соответствующая функция риска может быть подобрана так, что она возрастает с течением времени, снижается или остается постоянной в зависимости от выбора значений параметра. Кроме того данное распределение нашло широкое применение в теории
надежности, поскольку ему подчиняются пределы упругости различных материалов. Распределение Вейбулла используется для описания времен отказов образцов, поставленных на испытание. Широко применялось для описания времен жизни электронных устройств, ламп, подшипников и т.д. Очевидно, что данное распределение может быть весьма полезным в юриспруденции, вопервых, для анализа политических режимов, где также имеет смысл исследовать пределы «упругости»; во-вторых, при изучении рецидивной преступности (анализ здесь подобен анализу процессов выживаемости), в-третьих, при проверке надежности, устойчивости соответствующих организационно-правовых форм.
Представим график функции плотности распределения Вейбулла f(x) с параметрами α=3, β=5 (=ВЕЙБУЛЛ(A2:A20;3;5;0), где А2:А20 – ячейки со значениями переменной (случайной величины) Х, нуль (ЛОЖЬ) записан в поле «Интегральная».
Из данного графика плотности распределения Вейбулла видно, что вероятность событий максимальна в окрестности точки
55
х=4 области определения функции. В точке х=4 значение плотности распределения достигает своего максимума f(4)=0,23013.
Представим график интегральной функции распределения Вейбулла F(x) с параметрами α=3, β=5 (=ВЕЙБУЛЛ(A2:A20;3;5;1), где А2:А20 – ячейки со значениями переменной (случайной величины) Х, единица (ИСТИНА) записана в поле «Интегральная».
Ниже представлена таблица исходных данных, по которым построены графики.
|
|
|
X |
f(x) |
F(x) |
|
|
|
|
0,02380 |
|
1 |
9 |
0,007968 |
|
|
|
|
0,09004 |
|
2 |
8 |
0,061995 |
|
|
|
|
0,17403 |
|
3 |
9 |
0,194265 |
|
|
|
4 |
0,23013 |
0,400704 |
|
|
|
|
0,22072 |
|
5 |
8 |
0,632121 |
|
|
|
6 |
0,15348 |
0,822361 |
|
|
|
|
0,07563 |
|
7 |
2 |
0,935687 |
|
|
|
|
0,02555 |
|
8 |
8 |
0,983361 |
|
|
|
9 |
0,0057 |
0,997068 |
|
|
|
|
0,00080 |
|
10 |
5 |
0,999665 |
|
|
|
56
11 |
6,9E-05 |
0,999976 |
|
3,43E- |
|
12 |
06 |
0,999999 |
|
9,44E- |
|
13 |
08 |
1 |
С помощью распределение χ2 (chi-square distribution): 1) измеряется уровень значимости α для односторонней доверительной вероятности P=1-α, соответствующей значению y и числу степеней свободы k(df); 2) осуществляется построение доверительных интервалов для дисперсии (соответственно и для среднего квадратического отклонения); 3) производится проверка статистических гипотез.
В программе Excel имеем: ХИ2РАСП (Х, Степени свободы), где х – неотрицательное число, для которого нужно вычислить значение функции распределения. Вообще же распределению χ2 подчиняется случайная величина:
Y = X12 + X 22 +... + X n2 (1.1), где Xi – независимые случайные величины с нулевым математическим ожиданием и дисперсией равной единице.
Функция плотности в данном случае вычисляется по формуле:
æ 1 |
n |
|
|
|
|
|
||||
ö2 |
|
|
|
|
|
|
||||
ç |
2 |
÷ |
|
|
y |
n |
|
, при у≥0, |
n=k=df (число степеней свободы |
|
f ( y) = è |
ø |
|
×e− |
|
× y 2 |
−1 |
||||
|
2 |
|||||||||
|
|
æ n ö |
|
|
|
|
|
|
||
|
Г ç |
2 |
÷ |
|
|
|
|
|
||
|
|
è |
ø |
|
|
|
|
|
равное числу независимых слагаемых в правой части уравнения
(1.1); Г æ n ö – гамма-функция.
ç ÷ è 2 ø
Интегральная |
функция распределения определяется по |
||||||||
|
|
|
|
1 |
|
|
y |
−u u 2n−1 |
|
формуле: |
F( y) = |
|
|
|
|
× |
ò |
e 2 du |
. |
|
n |
æ n ö |
|||||||
2 |
2 |
|
|
||||||
|
|
Гç |
÷ |
|
0 |
|
|
||
|
|
|
|
è |
2 ø |
|
|
|
|
Математическое ожидание здесь равно n, а дисперсия 2n. При этом важно отметить, что распределение не зависит от упомянутых числовых характеристик M[Y] и D[Y], а зависит от объема выборки (n).
57
Покажем практическое применение функции χ2 .
Изучая распределение преступности по субъектам РФ в 2010, я получил эмпирическое значение P(χэмпир2 ) =12 ,85 . Далее нужно проверить соответствует ли эмпирическое распределение теоретическому на соответствующем уровне значимости. Зная число степеней свободы (пять), с помощью встроенной функции ХИ2РАСП (Х, Степени свободы) точно измерим уровень доверительной вероятности: 0,0248. С помощью специальной таблицы значений мы бы лишь выяснили, что на 5% уровне значимости теоретическое и эмпирическое распределения согласуются, а на 1% не согласуются.
Для решения обратной задачи в ППП Excel имеем встроенную функцию: ХИ2ОБР (Вероятность, Степени свободы). Например, по вероятности равной 0,0248 находим эмпирическое значение функции χ2 равное 12,85.
С помощью функции ХИ2ТЕСТ (Фактический интервал, Ожидаемый интервал) осуществляется проверка гипотезы о виде закона распределения с помощью критерия согласия χ2.
Определенный интерес представляет функция распределения Фишера-Снедекора, с помощью которой также осуществляется проверка статистических гипотез. В ППП Excel имеем встроенные функции: FРАСП (Х, Степени свободы 1, Степени свободы 2), FРАСПОБР (Вероятность, Степени свободы 1, Степени свободы 2), ФТЕСТ (Массив 1, Массив 2), ФИШЕР (Х), ФИШЕРОБР (Y)8.
Экспоненциальное распределение (exponential distribution) широко применяется в теории массового обслуживания, теории надежности, при изучении сроков службы различных систем. В
ППП Excel имеем встроенную функцию ЭКСПРАСП (Х, Лямбда, Интегральный)9.
Имеются и другие теоретические виды распределений: Гамма распределение (Gamma distribution), распределение Гомперца
8 Козлов А.Ю., Мхитарян В.С., Шишов В.Ф. Статистические функции МS Excel в экономикостатистических расчетах: Учеб. Пособие для вузов / Под ред. проф. В.С. Мхитаряна. – М.:ЮНИТИ-ДАНА, 2003. С. 142-153.
9 Там же. С. 154.
58
(Gompertz distribution), равномерное распределение (rectangular distribution), треугольное распределение и другие.
Закон сохранения формы распределения10 гласит, что форма распределения для соответствующих данных сохраняется (остается неизменной). Во времени и пространстве, могут меняться только параметры распределения и то не всегда. Например, β- коэффициенты изменчивости преступности по субъектам Российской Федерации и любым другим территориям распределяются по закону Гаусса-Лапласа, и их математическое ожидание равное единице всегда сохраняется, поскольку средний β-коэффициент изменчивости преступности не может отличаться от единицы, ибо тангенс угла наклона в линейном уравнении регрессии здесь получается при переменных икс и игрек равных друг другу (у(х)=х)). В данном случае со временем меняется только стандартное отклонение, и применительно к этому конкретному типу случаев можно говорить о законе сохранения математического ожидания β-коэффициентов преступности11.
§2. Аппроксимация эмпирических распределений известными теоретическими распределениями и проверка эффективности аппроксимации
Довольно часто на практике возникает потребность проверить соответствие эмпирических распределений теоретическим распределениям. Например, ответить на вопрос, какому теоретическому закону распределения подчиняется эмпирическое распределение частот преступлений, регистрируемых в определенном социальном пространстве; по какому закону течет поток заявлений о преступлениях в регистрирующие органы; по какому вероятностному закону распределяются лица, совершившие преступления, в зависимости от их возрастных характеристик и т.д.
10Возможно, честь открытия данного простого закона принадлежит мне, поскольку
влитературе он мне никогда не попадался.
11Честь открытия данного простого закона точно принадлежит мне.
59
Получив соответствующее эмпирическое распределение, мы сравниваем его с теоретическим, и проверяем, насколько сильно они различаются. Если различия невелики, укладываются в пределах соответствующих статистических критериев, то ведут речь о соответствии данного эмпирического распределения теоретическому, и используют его для изучения данного криминологического или иного юридического явления (процесса).
Покажем это на конкретных примерах.
Пример №1. Пусть исследователь решил проверить гипотезу о том, не подчиняется ли нормальному закону распределения эмпирическое распределение коэффициентов преступности по субъектам России в 2010 году.
Решение:
1) Возьмем исходный вариационный (кросс-секционный – за один временной срез) ряд коэффициентов преступности на 100 тысяч народонаселения в 2010 году по субъектам Российской Федерации. Для этого зайдем на официальный сайт Госкомстата России http://www.gks.ru/ и выберем «Население», а в «Населении»
– «Правонарушения», в «Правонарушениях» – «Число
зарегистрированных преступлений в расчете на 100 тыс. чел. населения». Войдем в базу данных, и оттуда берем исходный ряд представленный ниже.
Число зарегистрированных преступлений в расчете на 100 тыс. чел. населения, единица,
значение показателя за год
|
2010 |
Российская Федерация |
1852 |
Центральный федеральный округ |
1620 |
Белгородская область |
1101 |
Брянская область |
1817 |
Владимирская область |
1794 |
Воронежская область |
1215 |
Ивановская область |
1767 |
Калужская область |
1795 |
Костромская область |
1440 |
Курская область |
1595 |
60
Липецкая область |
1405 |
|
Московская область |
1695 |
|
Орловская область |
1681 |
|
Рязанская область |
920 |
|
Смоленская область |
2164 |
|
Тамбовская область |
1267 |
|
Тверская область |
2198 |
|
Тульская область |
1034 |
|
Ярославская область |
1634 |
|
г.Москва |
1760 |
|
Северо-Западный федеральный округ |
1736 |
|
Республика Карелия |
2009 |
|
Республика Коми |
2072 |
|
Архангельская область |
1984 |
|
Ненецкий авт.округ |
2029 |
|
Вологодская область |
2012 |
|
Калининградская область |
1797 |
|
Ленинградская область |
1742 |
|
Мурманская область |
2012 |
|
Новгородская область |
1828 |
|
Псковская область |
1788 |
|
г.Санкт-Петербург |
1399 |
|
Южный федеральный округ (с 2010 |
1495 |
|
года) |
||
|
||
Республика Адыгея |
1055 |
|
Республика Калмыкия |
1431 |
|
Краснодарский край |
1275 |
|
Астраханская область |
2583 |
|
Волгоградская область |
1745 |
|
Ростовская область |
1403 |
|
Северо-Кавказский федеральный округ |
810 |
|
Республика Дагестан |
425 |
|
Республика Ингушетия |
373 |
|
Кабардино-Балкарская Республика |
1042 |
|
Карачаево-Черкесская Республика |
1020 |
|
Республика Северная Осетия - Алания |
1003 |
|
Чеченская Республика |
361 |
|
Ставропольский край |
1332 |
|
Приволжский федеральный округ |
1839 |
61
Республика Башкортостан |
1778 |
Республика Марий Эл |
1780 |
Республика Мордовия |
1031 |
Республика Татарстан |
1555 |
Удмуртская Республика |
2144 |
Чувашская Республика |
1426 |
Пермский край |
2719 |
Кировская область |
1547 |
Нижегородская область |
2427 |
Оренбургская область |
1631 |
Пензенская область |
1236 |
Самарская область |
2138 |
Саратовская область |
1494 |
Ульяновская область |
1365 |
Уральский федеральный округ |
2331 |
Курганская область |
2470 |
Свердловская область |
2195 |
Тюменская область |
2396 |
Ханты-Мансийский авт.округ-Югра |
2487 |
Ямало-Ненецкий авт.округ |
6275 |
Челябинская область |
2402 |
Сибирский федеральный округ |
2340 |
Республика Алтай |
2426 |
Республика Бурятия |
2751 |
Республика Тыва |
1890 |
Республика Хакасия |
2177 |
Алтайский край |
1928 |
Забайкальский край |
2595 |
Красноярский край |
2454 |
Иркутская область |
2633 |
Кемеровская область |
2330 |
Новосибирская область |
2504 |
Омская область |
1658 |
Томская область |
2787 |
Дальневосточный федеральный округ |
2230 |
Республика Саха (Якутия) |
1810 |
Камчатский край |
1591 |
Приморский край |
2570 |
Хабаровский край |
2308 |
62