Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
212
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

(Гамма функция). График функции плотности распределения Стьюдента подобен графику нормального распределения.

Интегральная функция распределения Стьюдента (Госсета)5 вычисляется по формуле:

 

 

æ k +1

ö

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гç

 

 

÷

 

 

t

æ

+ t

2

ö

k+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è 2

ø

 

 

 

 

2

 

 

 

 

 

 

 

F(t) =

 

 

×

 

ç1

 

÷

 

 

dt

. Математическое

ожидание

здесь

 

 

 

 

 

 

 

 

 

 

 

æ k

ö

 

òç

k

÷

 

 

 

 

 

 

 

 

è

ø

 

 

 

 

 

 

 

 

 

 

 

kπГç

÷

 

−∞

 

 

 

 

 

 

 

 

 

 

 

 

è 2

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

равно нулю (μ=0),

а

 

дисперсия

D(t) =

k

,

k>2. При

этом

 

k − 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

распределение Стьюдента на зависит от величин математического ожидания и дисперсии, а определяется только объемом выборки.

Функция плотности распределения Стьюдента (t-статистика) подобна z-статистике стандартизованного нормального распределения, и применяется для подобных целей – для построения доверительных интервалов и проверки статистических гипотез применительно к выборкам малого объема. График функции плотности распределения Стьюдента имеет форму подобную форме стандартизованного нормального распределения, но хвосты t-распределения более «тяжелые» - ограничивают большую площадь, чем в стандартизированном нормальном распределении. Данный эффект вызван тем, что в t-распределении не известно стандартное отклонение ГС, а вместо него используется выборочная оценка6. Неопределенность значения стандартного отклонения создает большую изменчивость переменной t по сравнению с переменной z.

В Мастере функций программного пакета Excel имеется функция СТЬЮДРАСП (Х, Степени свободы, Хвосты), а также обратная ей функция СТЬЮДРАСПОБР (Вероятность, Степени свободы).

Использование интегральной функции F(t) Вероятность») дает возможность по значению t вычислить величину уровня

5 Данное распределение определил в начале ХХ столетия ирландец Уильям С.Госсет, избравший в силу сложившихся обстоятельств, псевдоним Стьюдент.

6 Левин Д.М, Стефан Д., Кребиль Т.С., Беренсон М.Л. Статистика для менеджеров с использованием Microsoft Excel, 4-е изд.: Пер. с англ. – М.: Издательский дом «Вильямс», 2004. С.456.

53

значимости α с односторонней доверительной вероятностью р=1-α с числом степеней свободы k=n-1 или величину 2α в случае с двусторонней доверительной вероятностью: р=1-2α. Что касается термина «Хвост», то он показывает одностороннюю или двухстороннюю доверительную вероятность. Если его значение равно двум, то речь идет о двухсторонней доверительной вероятности. В противном случае он равен единице, что символизирует одностороннюю доверительную вероятность.

- Распределение Вейбулла7 (Weibull distribution) – это распределение вероятностей случайной величины Х, плотность вероятности которой вычисляется по формуле:

f (х) = α

 

æ

x öα

 

 

× xα -1

 

÷

, где

α и β – параметры распределения, α>0,

× e è

β ø

 

 

ç

÷

 

 

βα

β>0, 0≤x≤∞.

Интегральная функция:

æ x öα

F (х) =1-e è

β ø .

 

 

÷

 

ç

÷

Математическое ожидание для распределения Вейбулла

вычисляется по формуле: М [Х ] = μ = β × Гç

α +1

÷ , где Г – гамма-

æ

ö

è

α

ø

функция. Дисперсия для распределения Вейбулла вычисляется по

 

 

2

ì

æ

α + 2

ö

é

æα +1

2

ü

 

 

формуле:

D[X ] = β

ï

öù

ï

. Если

α=1, то распределение

 

íГç

α

÷

- ê

Гç

α

÷ú

ý

 

 

 

ï

è

ø

ë

è

øû

ï

 

 

 

 

 

î

 

 

 

 

 

 

 

þ

 

 

Вейбулла совпадает с экспоненциальным распределением, в котором его параметр лямбда равен единице деленной на бету:

λ= β1 .

ВМастере функций программного пакета Excel имеется функция ВЕЙБУЛЛ (Х, Альфа, Бета, Интегральная), позволяющая решать задачи данного класса. В поле «Интегральная» вводится либо нуль (ЛОЖЬ), либо единица (Истина). Соответственно в первом случае вычисляется значение функции плотности f(x), а во втором значение интегральной функции F(x).

На практике распределение Вейбулла применяется при анализе данных выживаемости, поскольку имеет свойство –

7 Названо в честь шведского исследователя Валоди Вейбулла (Waloddi Weibull), применявшего его для описания времен отказов разного типа. Также иногда в литературе называется распределением Вейбулла-Гнеденко.

54

соответствующая функция риска может быть подобрана так, что она возрастает с течением времени, снижается или остается постоянной в зависимости от выбора значений параметра. Кроме того данное распределение нашло широкое применение в теории

надежности, поскольку ему подчиняются пределы упругости различных материалов. Распределение Вейбулла используется для описания времен отказов образцов, поставленных на испытание. Широко применялось для описания времен жизни электронных устройств, ламп, подшипников и т.д. Очевидно, что данное распределение может быть весьма полезным в юриспруденции, вопервых, для анализа политических режимов, где также имеет смысл исследовать пределы «упругости»; во-вторых, при изучении рецидивной преступности (анализ здесь подобен анализу процессов выживаемости), в-третьих, при проверке надежности, устойчивости соответствующих организационно-правовых форм.

Представим график функции плотности распределения Вейбулла f(x) с параметрами α=3, β=5 (=ВЕЙБУЛЛ(A2:A20;3;5;0), где А2:А20 – ячейки со значениями переменной (случайной величины) Х, нуль (ЛОЖЬ) записан в поле «Интегральная».

Из данного графика плотности распределения Вейбулла видно, что вероятность событий максимальна в окрестности точки

55

х=4 области определения функции. В точке х=4 значение плотности распределения достигает своего максимума f(4)=0,23013.

Представим график интегральной функции распределения Вейбулла F(x) с параметрами α=3, β=5 (=ВЕЙБУЛЛ(A2:A20;3;5;1), где А2:А20 – ячейки со значениями переменной (случайной величины) Х, единица (ИСТИНА) записана в поле «Интегральная».

Ниже представлена таблица исходных данных, по которым построены графики.

 

 

 

X

f(x)

F(x)

 

 

 

 

0,02380

 

1

9

0,007968

 

 

 

 

0,09004

 

2

8

0,061995

 

 

 

 

0,17403

 

3

9

0,194265

 

 

 

4

0,23013

0,400704

 

 

 

 

0,22072

 

5

8

0,632121

 

 

 

6

0,15348

0,822361

 

 

 

 

0,07563

 

7

2

0,935687

 

 

 

 

0,02555

 

8

8

0,983361

 

 

 

9

0,0057

0,997068

 

 

 

 

0,00080

 

10

5

0,999665

 

 

 

56

11

6,9E-05

0,999976

 

3,43E-

 

12

06

0,999999

 

9,44E-

 

13

08

1

С помощью распределение χ2 (chi-square distribution): 1) измеряется уровень значимости α для односторонней доверительной вероятности P=1-α, соответствующей значению y и числу степеней свободы k(df); 2) осуществляется построение доверительных интервалов для дисперсии (соответственно и для среднего квадратического отклонения); 3) производится проверка статистических гипотез.

В программе Excel имеем: ХИ2РАСП (Х, Степени свободы), где х – неотрицательное число, для которого нужно вычислить значение функции распределения. Вообще же распределению χ2 подчиняется случайная величина:

Y = X12 + X 22 +... + X n2 (1.1), где Xi – независимые случайные величины с нулевым математическим ожиданием и дисперсией равной единице.

Функция плотности в данном случае вычисляется по формуле:

æ 1

n

 

 

 

 

 

ö2

 

 

 

 

 

 

ç

2

÷

 

 

y

n

 

, при у≥0,

n=k=df (число степеней свободы

f ( y) = è

ø

 

×e

 

× y 2

1

 

2

 

 

æ n ö

 

 

 

 

 

 

 

Г ç

2

÷

 

 

 

 

 

 

 

è

ø

 

 

 

 

 

равное числу независимых слагаемых в правой части уравнения

(1.1); Г æ n ö – гамма-функция.

ç ÷ è 2 ø

Интегральная

функция распределения определяется по

 

 

 

 

1

 

 

y

u u 2n1

 

формуле:

F( y) =

 

 

 

 

×

ò

e 2 du

.

 

n

æ n ö

2

2

 

 

 

 

Гç

÷

 

0

 

 

 

 

 

 

è

2 ø

 

 

 

 

Математическое ожидание здесь равно n, а дисперсия 2n. При этом важно отметить, что распределение не зависит от упомянутых числовых характеристик M[Y] и D[Y], а зависит от объема выборки (n).

57

Покажем практическое применение функции χ2 .

Изучая распределение преступности по субъектам РФ в 2010, я получил эмпирическое значение Pэмпир2 ) =12 ,85 . Далее нужно проверить соответствует ли эмпирическое распределение теоретическому на соответствующем уровне значимости. Зная число степеней свободы (пять), с помощью встроенной функции ХИ2РАСП (Х, Степени свободы) точно измерим уровень доверительной вероятности: 0,0248. С помощью специальной таблицы значений мы бы лишь выяснили, что на 5% уровне значимости теоретическое и эмпирическое распределения согласуются, а на 1% не согласуются.

Для решения обратной задачи в ППП Excel имеем встроенную функцию: ХИ2ОБР (Вероятность, Степени свободы). Например, по вероятности равной 0,0248 находим эмпирическое значение функции χ2 равное 12,85.

С помощью функции ХИ2ТЕСТ (Фактический интервал, Ожидаемый интервал) осуществляется проверка гипотезы о виде закона распределения с помощью критерия согласия χ2.

Определенный интерес представляет функция распределения Фишера-Снедекора, с помощью которой также осуществляется проверка статистических гипотез. В ППП Excel имеем встроенные функции: FРАСП (Х, Степени свободы 1, Степени свободы 2), FРАСПОБР (Вероятность, Степени свободы 1, Степени свободы 2), ФТЕСТ (Массив 1, Массив 2), ФИШЕР (Х), ФИШЕРОБР (Y)8.

Экспоненциальное распределение (exponential distribution) широко применяется в теории массового обслуживания, теории надежности, при изучении сроков службы различных систем. В

ППП Excel имеем встроенную функцию ЭКСПРАСП (Х, Лямбда, Интегральный)9.

Имеются и другие теоретические виды распределений: Гамма распределение (Gamma distribution), распределение Гомперца

8 Козлов А.Ю., Мхитарян В.С., Шишов В.Ф. Статистические функции МS Excel в экономикостатистических расчетах: Учеб. Пособие для вузов / Под ред. проф. В.С. Мхитаряна. – М.:ЮНИТИ-ДАНА, 2003. С. 142-153.

9 Там же. С. 154.

58

(Gompertz distribution), равномерное распределение (rectangular distribution), треугольное распределение и другие.

Закон сохранения формы распределения10 гласит, что форма распределения для соответствующих данных сохраняется (остается неизменной). Во времени и пространстве, могут меняться только параметры распределения и то не всегда. Например, β- коэффициенты изменчивости преступности по субъектам Российской Федерации и любым другим территориям распределяются по закону Гаусса-Лапласа, и их математическое ожидание равное единице всегда сохраняется, поскольку средний β-коэффициент изменчивости преступности не может отличаться от единицы, ибо тангенс угла наклона в линейном уравнении регрессии здесь получается при переменных икс и игрек равных друг другу (у(х)=х)). В данном случае со временем меняется только стандартное отклонение, и применительно к этому конкретному типу случаев можно говорить о законе сохранения математического ожидания β-коэффициентов преступности11.

§2. Аппроксимация эмпирических распределений известными теоретическими распределениями и проверка эффективности аппроксимации

Довольно часто на практике возникает потребность проверить соответствие эмпирических распределений теоретическим распределениям. Например, ответить на вопрос, какому теоретическому закону распределения подчиняется эмпирическое распределение частот преступлений, регистрируемых в определенном социальном пространстве; по какому закону течет поток заявлений о преступлениях в регистрирующие органы; по какому вероятностному закону распределяются лица, совершившие преступления, в зависимости от их возрастных характеристик и т.д.

10Возможно, честь открытия данного простого закона принадлежит мне, поскольку

влитературе он мне никогда не попадался.

11Честь открытия данного простого закона точно принадлежит мне.

59

Получив соответствующее эмпирическое распределение, мы сравниваем его с теоретическим, и проверяем, насколько сильно они различаются. Если различия невелики, укладываются в пределах соответствующих статистических критериев, то ведут речь о соответствии данного эмпирического распределения теоретическому, и используют его для изучения данного криминологического или иного юридического явления (процесса).

Покажем это на конкретных примерах.

Пример №1. Пусть исследователь решил проверить гипотезу о том, не подчиняется ли нормальному закону распределения эмпирическое распределение коэффициентов преступности по субъектам России в 2010 году.

Решение:

1) Возьмем исходный вариационный (кросс-секционный – за один временной срез) ряд коэффициентов преступности на 100 тысяч народонаселения в 2010 году по субъектам Российской Федерации. Для этого зайдем на официальный сайт Госкомстата России http://www.gks.ru/ и выберем «Население», а в «Населении»

– «Правонарушения», в «Правонарушениях» – «Число

зарегистрированных преступлений в расчете на 100 тыс. чел. населения». Войдем в базу данных, и оттуда берем исходный ряд представленный ниже.

Число зарегистрированных преступлений в расчете на 100 тыс. чел. населения, единица,

значение показателя за год

 

2010

Российская Федерация

1852

Центральный федеральный округ

1620

Белгородская область

1101

Брянская область

1817

Владимирская область

1794

Воронежская область

1215

Ивановская область

1767

Калужская область

1795

Костромская область

1440

Курская область

1595

60

Липецкая область

1405

Московская область

1695

Орловская область

1681

Рязанская область

920

Смоленская область

2164

Тамбовская область

1267

Тверская область

2198

Тульская область

1034

Ярославская область

1634

г.Москва

1760

Северо-Западный федеральный округ

1736

Республика Карелия

2009

Республика Коми

2072

Архангельская область

1984

Ненецкий авт.округ

2029

Вологодская область

2012

Калининградская область

1797

Ленинградская область

1742

Мурманская область

2012

Новгородская область

1828

Псковская область

1788

г.Санкт-Петербург

1399

Южный федеральный округ (с 2010

1495

года)

 

Республика Адыгея

1055

Республика Калмыкия

1431

Краснодарский край

1275

Астраханская область

2583

Волгоградская область

1745

Ростовская область

1403

Северо-Кавказский федеральный округ

810

Республика Дагестан

425

Республика Ингушетия

373

Кабардино-Балкарская Республика

1042

Карачаево-Черкесская Республика

1020

Республика Северная Осетия - Алания

1003

Чеченская Республика

361

Ставропольский край

1332

Приволжский федеральный округ

1839

61

Республика Башкортостан

1778

Республика Марий Эл

1780

Республика Мордовия

1031

Республика Татарстан

1555

Удмуртская Республика

2144

Чувашская Республика

1426

Пермский край

2719

Кировская область

1547

Нижегородская область

2427

Оренбургская область

1631

Пензенская область

1236

Самарская область

2138

Саратовская область

1494

Ульяновская область

1365

Уральский федеральный округ

2331

Курганская область

2470

Свердловская область

2195

Тюменская область

2396

Ханты-Мансийский авт.округ-Югра

2487

Ямало-Ненецкий авт.округ

6275

Челябинская область

2402

Сибирский федеральный округ

2340

Республика Алтай

2426

Республика Бурятия

2751

Республика Тыва

1890

Республика Хакасия

2177

Алтайский край

1928

Забайкальский край

2595

Красноярский край

2454

Иркутская область

2633

Кемеровская область

2330

Новосибирская область

2504

Омская область

1658

Томская область

2787

Дальневосточный федеральный округ

2230

Республика Саха (Якутия)

1810

Камчатский край

1591

Приморский край

2570

Хабаровский край

2308

62