Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
212
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

μ3

=

å(хi - х)3

× fi

= Асим .

å fi

 

 

 

 

 

Для того, чтобы сделать показатель асимметрии безразмерной величиной, не зависящей от масштаба, в котором измерялась переменная величина (варианта), вводится нормированный

коэффициент асимметрии: rA = σμ33 , где rA – нормированный

коэффициент асимметрии, μ3 – асимметрия (центральный момент третьего порядка), σ3 – стандартное отклонение, возведенное в третью степень.

Для нашей задачи о распределении краж по территории Украины за 2009 год имеем:

1) rA = σμ33 = 55981,986481,9133 =1,13181 Е −11. 2) rA = σμ33 = 0,4824250,468593 = −4,1735 .

При симметричном распределении значения случайной величины равноудаленные от среднего значения имеют одинаковую частоту, а, следовательно, асимметрия (μ3) равна нулю. Отсюда и нормированный коэффициент асимметрии равен нулю: rA=0. Если нормированный коэффициент асимметрии rA<0, то в вариационном ряду преобладают значения меньшие, чем среднее (их частота встречаемости выше). В данном случае утверждается, что ряд имеет отрицательную асимметрию (левостороннюю асимметрию). Если нормированный коэффициент асимметрии rA>0, то в вариационном ряду преобладают значения большие, чем среднее (их частота встречаемости выше). В таком случае утверждается, что ряд имеет положительную асимметрию (правостороннюю асимметрию).

В качестве еще одного показателя асимметрии распределения используется коэффициент асимметрии Пирсона, вычисляемый по

 

 

 

 

−Мода

.

 

формуле:

AП =

Х

Когда AП >0, тогда имеет место

 

 

 

 

 

 

 

σ

 

положительная (правосторонняя асимметрия). Когда AП <0, тогда имеет место отрицательная (левосторонняя асимметрия). Когда AП =0, тогда асимметрия отсутствует.

43

μ4

=

å(хi - х)4

× fi

= Эксц

– центральный момент четвертого

å fi

 

 

 

 

 

 

порядка являет собой меру эксцесса.

НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ

Непрерывное распределение (continuous distribution) – это распределение непрерывной случайной величины X, где каждому непрерывному значению из множества X поставлено в соответствие значение плотности вероятности наступления – f(X) – плотность непрерывного распределения вероятностей (continuous probability density function). По сути, в данном случае мы от дискретных сумм переходим к непрерывным интегралам, от столбчатых диаграмм к гладким функциям, не меняя при этом математического смысла происходящего. Например, если математическое ожидание дискретной случайной величины X вычисляется по формуле:

N

X

μX = E(X ) = åxi pi , то для непрерывной случайной величины

i=1

 

это будет примерно то же самое только в интегральной форме (дискретную вероятность мы заменим плотностью вероятности):

μX = E(X ) = òхf (X )dX .

−∞

Среди известных теоретических непрерывных распределений выделяют: нормальное распределение (normal distribution), логнормальное распределение (log-normal distribution), экспоненциальное распределение (exponential distribution), гамма распределение (gamma distribution), распределение χ2 (chi-square distribution), распределение Вейбулла (Weibull distribution),

распределение Гомперца (Gompertz distribution), равномерное распределение (rectangular distribution), треугольное распределение, распределение Стьюдента (Student׳s t-distribution) и другие.

Рассмотрим подробнее некоторые из непрерывных распределений.

44

-Нормальное распределение (normal distribution) или

распределение Гаусса (Gaussian distribution). Иногда его также

называют распределением Гаусса-Лапласа: f (x) =

 

1

 

e-

( х-μ)2

,

где

 

 

2×σ 2

 

 

 

2πσ

 

 

 

 

 

 

 

f(x) – плотность вероятности, σ – стандартное отклонение,

 

μ

математическое ожидание, e – основание натуральных логарифмов

равное

2,718. По существу это дифференциальная функция от

интегральной функции распределения: F (x)

 

 

1

 

x e-

( х-μ)2

dx .

 

 

 

2×σ2

 

 

 

 

 

 

=

 

2πσ

-ò¥

 

 

Закон нормального распределения играет важную роль, вопервых, потому, что является предельным, к которому с ростом числа наблюдений стремятся другие законы распределения. Вовторых, многочисленные физические, химические, биологические, социальные, в том числе и юридические процессы подчиняются именно этому закону распределения. Например, деяния субъектов правовых отношений распределяются именно по нормальному закону. В-третьих, этот закон используется для определения величины доверительных интервалов и доверительных вероятностей, применяется при проверке статистических гипотез. Если мы работаем не с генеральной совокупностью, а с выборками, то математическое ожидание обычно заменяем средним арифметическим, а стандартное отклонение ГС заменяем выборочным стандартным отклонением.

Закон нормального распределения позволяет ответить на вопрос, как часто встречается значение исследуемой случайной величины X. Например, нас может интересовать вопрос, как часто встречаются деяния со значением минус 4 или, насколько часто встречаются регионы с конкретным уровнем преступности и т.д.

Пример.

Известно, что деяния субъектов правовых отношений на плоскости юридической ответственности распределены по нормальному закону с параметрами распределения: σ=3, μ =0. Требуется выяснить, значение функции плотности распределения (дифференциальной функции) и значения интегральной функции распределения для деяния со значением четыре (х=4).

45

Решение:

Воспользуемся программным пакетом Excel, в котором имеется функция НОРМРАСП (Х, Среднее, Стандартное отклонение, Интегральный).

Порядок действий:

-курсором выделяем ячейку для вывода результата вычислений;

-входим в Мастер функций f(x);

-на первом шаге выбираем в категориях функцию «Статистические»;

-среди статистических функций выбираем НОРМРАСП и нажимаем ОК;

-появляется окно «Аргументы функции». Заполняем ячейки этого окна: в поле X вводим число 4, в поле «Среднее» вводим число ноль, в поле «Стандартное отклонение» вводим число 3, а в поле «Интегральная» записываем ноль (для дифференциальной функции) или единицу (для интегральной функции).

Ответ: f(4)=0,05467; F(4)=0,908789.

В программе Excel можно подготовить соответствующие демонстрационные графики:

График построен по таблице:

X

F(X)

f(x)

 

 

 

 

0,00042

 

-10

9

0,000514

 

 

 

-9

0,00135

0,001477

 

 

 

46

-8

0,00383

0,003799

 

 

 

 

0,00981

 

-7

5

0,008741

 

 

 

-6

0,02275

0,017997

 

 

 

-5

0,04779

0,033159

 

 

 

 

0,09121

 

-4

1

0,05467

 

 

 

 

0,15865

 

-3

5

0,080657

 

 

 

 

0,25249

 

-2

3

0,106483

 

 

 

 

0,36944

 

-1

1

0,125794

 

 

 

0

0,5

0,132981

 

 

 

 

0,63055

 

1

9

0,125794

 

 

 

 

0,74750

 

2

7

0,106483

 

 

 

 

0,84134

 

3

5

0,080657

 

 

 

 

0,90878

 

4

9

0,05467

 

 

 

5

0,95221

0,033159

 

 

 

6

0,97725

0,017997

 

 

 

 

0,99018

 

7

5

0,008741

 

 

 

8

0,99617

0,003799

 

 

 

9

0,99865

0,001477

 

 

 

 

0,99957

 

10

1

0,000514

 

 

 

Чтобы получить такую таблицу в поле «Х» («Аргументы функции)) нужно ввести значения для переменной Х, что легко сделать простым выделением столбца, содержащего значения Х. Столбец значений интегральной функции получаем вводом в поле «Интегральная» единицы. Напротив числа минус 10 в графе Х выводим первое значение интегральной функции, а затем протягиваем курсором появившийся крестик, получая соответствующие значения F(X). Для получения значений дифференциальной функции выполняем подобные действия с той лишь разницей, что в поле «Интегральная» вводим значение нуль.

Ниже представлен график распределения β-коэффициентов изменчивости преступности по субъектам Российской Федерации

47

за период с 1990 по 2002 годы (среднее=1; стандартное отклонение 0,4853):

Если перед нами стоит обратная задача – найти неизвестное значение аргумента (х) по известному значению F(X), то делается это следующим образом:

-курсором выделяем ячейку для вывода результата вычислений;

-входим в Мастер функций f(x);

-на первом шаге выбираем в категориях функцию «Статистические»;

-в статистических функциях выбираем НОРМОБР

(Вероятность, Среднее, Стандартное отклонение) и нажимаем клавишу ОК;

-в Аргументах функции НОРМОБР вводим соответствующие значения. Для нашего примера: среднее = 0, стандартное отклонение = 3, вероятность = F(X) = 0,908789.

Ответ: х=4.

Полезно знать, что любой набор нормально распределенных случайных величин можно привести (преобразовать) к так называемому стандартному или стандартизованному виду, где σ=1, μ =0. Здесь интегральная и дифференциальная формулы приобретают вид:

48

f (z) = 21π ez22 , где

z = x σ− μ – формула для замены исходной переменной x.

 

 

 

 

z

z2

 

 

 

1

 

2 dz .

F (z) =

 

 

òe

 

 

 

 

 

 

 

−∞

 

 

 

Стандартизованное нормальное распределение удобно тем, что для него составлена специальная статистическая таблица значений функции F(X). Например, чтобы ответить на вопрос, какое значение функции F(X) соответствует х=4 в распределении с параметрами: σ=3, μ =0, достаточно найти преобразованное значение z, и по нему из таблицы выбрать значение для F(X):

z =

4 −0

=1,333333 ...

В крайнем слева столбце (целые и десятые

 

3

 

 

доли z) таблицы находим число 1,3, а в верхней строке (сотые доли z) берем три. На пересечении строки и столбца находим ответ F(X)=0,9082. Ответ менее точен (точен до тысячных), поскольку мы брали число 1,33, а не 1,333333...

В Мастере функций программного пакета Excel имеется функция НОРМСТРАСП (Z), которая позволяет сразу найти желаемый и более точный ответ без обращения к таблице. В поле функции нужно просто ввести значение для z. Введем число 1,33333 и получим F(X)=0,908789.

Для ответа на обратный вопрос, то есть нахождения по вероятности значения переменной x, имеется функция НОРМСТОБР (Вероятность). Здесь в поле «Вероятность» вводим известную вероятность. Для нашего примера введем F(X)=0,908789, и получим х=1,33333.

Как было отмечено ранее, свойства вероятностного закона нормального распределения широко применяются для различных тестов, проверок соответствия. Например, если имеется выборка объемом n из генеральной совокупности какой-либо нормально распределенной величины N, то по выборочным параметрам мы пытаемся делать суждения о параметрах генеральной совокупности. Скажем, оцениваем математическое ожидание в ГС по среднему выборочному значению. В этой связи возникает

49

вопрос о статистической значимости оценочного значения, в частности выборочного среднего. Для подобных целей и применяется специальный тест, основанный на свойствах закона нормального распределения.

В Мастере функций программного пакета Excel имеется функция ZТЕСТ (Массив, Х, Сигма), которая позволяет проверять статистические гипотезы о соответствии выборочных средних значений математическим ожиданиям в ГС.

Пример. Следователь расследует уголовное дело по факту хищения на предприятии. Подозреваемый, образовавшиеся на складе излишки крупы, списывает на плохую работу оборудования, обеспечивающего расфасовку крупы по пакетам. В техническом паспорте фасовочного оборудования указано, что среднее наполнение пакета составляет 1 кг ±6г.=0,006 кг. (То есть μ=1 кг.; σ=0,006 кг.). Требуется при уровне значимости α=0,05 проверить достоверность утверждения подозреваемого, будто μ ¹ х . На языке статистики это означает, что нужно проверить гипотезу H1 – альтернативная гипотеза о том, что среднее в генеральной совокупности и выборочное среднее неравны. Гипотеза H0 – нулевая гипотеза утверждает обратное. Следователь выносит постановление о назначении экспертизы, и эксперт проводит выборочное исследование, взяв n=100 пакетов с крупой. В итоге по формуле средней арифметической эксперт находит среднее выборочное значение веса одного пакета 0,998 кг.

Расчетное значение оценочного критерия z находим по

формуле: z =

x − μх

=

0,998 −1

= −0,333 . По найденному значению z,

σ х

0,006

 

 

n

 

 

 

100

 

 

воспользовавшись статистической таблицей значений функции распределения стандартного нормального распределения, получим двустороннюю доверительную вероятность F(X)=Р(|z|<0,333)=0,63; 1-Р=1-0,63=0,37. Поскольку полученное значение больше значения α (0,37>0,05), постольку принимается гипотеза H0 о равенстве средних. Полученный результат свидетельствует о том, что

50

оборудование работает исправно в соответствии с критериями указанными в техническом паспорте.

Решим эту же задачу с помощью функции ZТЕСТ (Массив, Х, Сигма), изменив объем выборки, n=20. Ниже приведен столбец выборочных значений:

1,02

0,97

0,95

0,96

1,03

0,96

0,97

0,98

0,99

1,01

0,97

0,98

0,95

0,97

0,97

0,96

0,97

0,98

0,95

0,97

Выборочное среднее в данном случае составит 0,9755. z=-1,826; F(X)=Р(|z|<1,826)=0,966; 1-Р=1-0,966=0,034. В данном

случае подтверждается гипотеза H1.

- Логнормальное распределение (log-normal distribution). Логарифмически нормальное распределение (логнормальное распределение) – это распределение, в котором нормально распределено не само значение переменной (случайной величины) Х, а её логарифм: log X. Нам известно, что операция логарифмирования «стягивает» большие значения и «растягивает» маленькие. Поэтому формула для логнормального распределения та же, что и для простого нормального распределения с той лишь

51

разницей, что вместо переменной (случайной величины) Х берется её логарифм: log X.

Если обозначить log X=Y, то имеем функцию плотности:

 

 

1

-

( y-μy )2

, где

f(y) – плотность вероятности, σy

 

 

2×

2

f ( y) =

 

 

 

e

σ y

 

 

 

 

 

2πσ y

 

 

 

 

 

 

 

 

 

 

стандартное отклонение, μy – математическое ожидание, e – основание натуральных логарифмов равное 2,718281.

Случайная величина Х имеет функцию плотности распределения:

 

 

1

 

 

- (ln x-μ x )2

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

f (x) =

 

 

 

e

 

2×σ x

, где μx = e2

σ y

y ,

 

 

 

 

 

x

 

 

 

 

 

 

 

2πσ x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ x2 = eσ y 2 + 2μ y × (eσ y 2 - 1) .

 

 

 

 

 

 

 

 

 

 

 

 

 

Интегральная

 

функция

для логнормального

распределения

 

 

 

 

 

 

 

 

 

 

1

 

 

 

x

-(ln х-μy )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

определяется формулой: F (x) =

 

 

 

ò 1 e

 

2×σy

 

dx .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2πσ y 0 x

 

 

 

 

 

В Мастере

 

 

функций

программного

пакета

Excel имеется

функция ЛОГНОРМРАСП (Х, Среднее, Стандартное отклонение) для отыскания значения функции распределения F(X), а также обратная функция ЛОГНОРМОБР (Вероятность, Среднее, Стандартное отклонение) для отыскания значения х в случае известного значения функции.

- Распределение Стьюдента

(Student׳s

t-distribution)

 

 

x − μ

sв – выборочное

распределение случайной величины

t =

 

 

 

, где

s /

 

 

n

 

 

в

 

 

 

 

 

стандартное отклонение, x – среднее

арифметическое из

n

наблюдений нормально распределенного набора данных с математическим ожиданием μ.

Функция плотности t-распределения Стьюдента вычисляется

по формуле:

(df): k=n-1;

 

 

æ k +1

ö

 

 

 

 

 

k+1

 

 

Гç

2

 

÷

æ

+ t

2

ö-

 

 

 

 

 

2

 

 

f (t) =

 

è

 

ø

 

×ç1

 

÷

 

 

, где k – число степеней свободы

 

 

 

 

 

 

 

 

 

 

 

 

æ k

ö

ç

k

÷

 

 

 

 

 

è

ø

 

 

 

 

 

kπГç

 

÷

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è 2

ø

 

 

 

 

 

 

 

 

¥

 

 

 

 

 

 

Эйлеров интеграл второго рода

Г (s) = òe-x xs -1dx

 

0

 

 

 

 

 

 

 

 

 

 

 

52