Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
211
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

вероятности наступления (w). По сути, это всё множество значений изучаемой случайной переменной, например, посуточные числа зарегистрированных тяжких преступлений за исследуемый период и поставленные в соответствие этим числам их доли (статистические вероятности). Выше как раз и приведен пример вычисления дискретного статистического распределения.

ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ (discrete distribution)

К известным теоретическим дискретным распределениям относят: биноминальное распределение (binomial distribution), распределение Паскаля (Pascal distribution), распределение Пуассона (Poisson distribution), распределение Бернулли (Bernoulli distribution), гипергеометрическое (hipergeometric distribution), геометрическое (geometric distribution) и некоторые другие виды распределений. Все эти распределения вполне пригодны для исследования подходящих юридических, в том числе, криминологических явлений и процессов.

Рассмотрим подробнее некоторые из вышеперечисленных теоретических распределений, порядок определения их параметров и задачи, решаемые с их помощью.

- Биноминальное распределение (binomial distribution) – это распределение вероятностей появления k-го числа событий в n независимых испытаниях, в каждом из которых вероятность появления события постоянна или равна числу p.

Вероятность числа проявлений события вычисляется по формуле Бернулли: Рn,k = P( X = k) =Cnk × pk ×(1- p)nk , где С – сочетание. Сочетание

– это понятие комбинаторики. Напомним, что сочетаниями, содержащими k элементов, выбранных из n элементов заданного множества, называются различные множества, отличающиеся друг от друга хотя бы одним элементом. Число сочетаний из n элементов по k элементов обозначают:

Сnk или (kn ) . Число сочетаний из n элементов по k элементов

n!

определяется по формуле: Сnk = k!(n k)! .

23

Биноминальное распределение также можно задать в виде дискретного ряда распределения:

 

ì

0,k £

0;

F(x) =

ïï

x

 

í

å P(X = k) 0,< k £ n;.

 

ï

k= 0

 

 

ï

1,k >

n

 

î

Математическое ожидание и дисперсия

биноминального

распределения вычисляются по формулам:

 

М [Х ] =np ;

D[Х ] =np (1− p) .

 

В программном пакете Excel имеется встроенная функция

БИНОМРАСП (Число успехов, Число испытаний, Вероятность успеха, Интегральная).

Биноминальное распределение используется для оценки числа успехов в выборке, состоящей из n наблюдений, такое распределение имеют, например: число бракованных изделий в повторной выборке из n шт.; число попаданий в цель при n выстрелах и т.д.. Так, в судопроизводстве под «успехом», можно понимать ошибку в заполнении процессуальной формы, а все нормальные исходы (заполнения) считать неудачей. Следовательно, биноминальное распределение может быть полезным инструментом при исследовании уголовнопроцессуальных, гражданско-процессуальных и иных правонарушений.

Пример. Руководитель следственного управления установил, что при производстве следственных и иных процессуальных действий следователями допущено 2% брака. Возникают вопросы: 1) какова вероятность того, что среди 30, направленных в суд уголовных дел, будет 0, 1, 2, 3, 4, 5 дел, содержащих такой брак; 2) какова вероятность, что из числа направленных в суд 30 дел будет не более трех, содержащих следственные ошибки.

Решим данную задачу в программном пакете Excel с помощью встроенной функции БИНОМРАСП (Число успехов, Число испытаний, Вероятность успеха, Интегральная).

24

Решение: I.

-встанем курсором на любую свободную ячейку;

-войдем в Мастер функций (f(x));

-в категориях выберем функцию «Статистические»;

-среди статистических функций выберем БИНОМРАСП;

-заполним поля данной функции: в поле «Число успехов» введем число 0 (далее мы будем вместо нуля вводить 1, потом вместо 1 число 2 и т.д.); в поле «Число испытаний» введем число 30; в поле «Вероятность успеха» вводим число 0,02; в поле «Интегральная» вводим число 0 (Ложь);

-нажмем клавишу «ОК». На первый вопрос задачи ответ найден.

Ответ:

P(X=0)=0,545; P(X=1)=0,333; P(X=2)=0,098; P(X=3)=0,018; P(X=4)=0,002; P(X=5)=0,002.

II.

-Войдем в «Аргументы функции» БИНОМРАСП;

-заполним поля данной функции: в поле «Число успехов» введем число 3 (не более трех дел); в поле «Число испытаний» введем число 30; в поле «Вероятность успеха» вводим число 0,02; в поле «Интегральная» вводим число 1 (Истина);

-нажмем клавишу «ОК». На второй вопрос задачи ответ получен.

Ответ:

Вероятность того, что из числа направленных в суд 30 дел будет не более трех, содержащих следственные ошибки, составляет: 0,997. Вероятность довольно велика.

-КРИТБИНОМ (Число испытаний, Вероятность успеха, Альфа). Использование этой функции дает возможность найти минимальное значение распределенной по биноминальному закону случайной величины X, для которой её «интегральная» функция (F(x)) принимает значение не меньше заданного. То есть в данном

25

случае известно значение функции, а нужно найти значение переменной.

Пример. Юристу на предприятии поручено провести проверку качества закупаемой продукции в связи с заключением договора на поставку продукции. Объем партии N=3000 шт. Вероятность выявления некачественного продукта в одном испытании составляет 0,003. Требуется оценить критическое (пороговое) число дефектных единиц товара, при котором партия принимается, если в качестве критерия выбрано значение функции распределения 0,1 (F(x)=Альфа=0,1).

Решение:

-встанем курсором на любую свободную ячейку;

-войдем в Мастер функций (f(x));

-в категориях выберем функцию «Статистические»;

-среди статистических функций выберем КРИТБИНОМ;

-заполним поля данной функции: в поле «Число испытаний» введем число 3000; в поле «Число испытаний» введем число 30; в поле «Вероятность успеха» вводим число 0,003; в поле «Альфа» вводим число 0,1;

-нажмем клавишу «ОК».

Ответ: 5 шт. То есть если будет обнаружено более 5 дефектных единиц товара, то договор не заключается.

- Распределение Паскаля (отрицательное биноминальное распределение) (Pascal distribution). Здесь определяется вероятность числа неудач в последовательности испытаний Бернулли. Случайная величина Х имеет отрицательное биноминальное распределение с параметрами распределения r и p, где r – число успехов, а p – вероятность успеха. Соответственно, вероятность неудач: q=1-p, а число неудач, имевших место до наступления успеха (r), составляет k. Формула для распределения Паскаля:

Р(х = k) = Crk+k −1 × pr ×(1- p)k .

Математическое ожидание и дисперсия в распределении Паскаля определяются по формулам:

26

М [Х ] =

r ×(1- p)

;

p

D[Х ] =

r ×(1- p)

.

p2

Отрицательное биноминальное распределение (распределение Паскаля) широко применяется в исследовании несчастных случаев и заболеваний, и, естественно, весьма полезно в

криминологии, криминалистике, оперативно-розыскной, уголовно-процессуальной и других юридических дисциплинах.

В программном пакете Excel имеется встроенная функция

ОТРБИНОМРАСП (Число неудач, Число успехов, Вероятность успеха), где Число неудач – число, которое мы обозначили как k, Число успехов – число, которое мы обозначили как r, Вероятность успеха– число, которое мы обозначили как p.

Пример. Следователь проводит предварительное следствие по уголовному делу, возбужденному по факту разбойного нападения, совершенному группой лиц из трех человек. По версии следствия преступление могли совершить ранее судимые мужчины из числа жителей поселка «Виноградное». Вероятность того, что в число подозреваемых (в последствии - обвиняемых) попадет конкретное лицо составляет 0,1. Требуется оценить вероятность того, что следователю придется допросить, по меньшей мере, 15 ранее судимых лиц, чтобы выявить трех подозреваемых в совершении преступления лиц.

Решим данную задачу с помощью программного пакета Excel:

-встанем курсором на любую свободную ячейку;

-войдем в Мастер функций (f(x));

-в категориях выберем функцию «Статистические»;

-среди статистических функций выберем ОТРБИНОМРАСП;

-заполним поля данной функции: в поле «Число неудач» введем число 15; в поле «Число успехов» введем число 3 (три); в поле «Вероятность» вводим число 0,1;

-нажмем клавишу «ОК». Задача решена.

Ответ: P(X=k)=0,028. Как видно, вероятность невелика, а, значит, все три подозреваемых могут довольно быстро попасть в сети.

Решение задачи вручную будет выглядеть так:

27

Р(х = k) = Crk+k −1 × pr ×(1- p)k =С315+15 −1 ×0,13 ×(1-0,1)15 .

2) Распределение Пуассона (Poisson distribution) иногда называемое также законом редких событий. Например, заявления об особо тяжких преступлениях (y, шт.), поступающие в дежурные сутки в регистрирующие органы распределяются по закону Пуассона.

По сути, являет собой распределение дискретной случайной величины, когда она принимает одно из возможных значений от

нуля до n с вероятностью:

Р( X ) =

λx

×e−λ , где х=0, 1, 2…n;

 

 

x!

 

λ=μ=D(x)=n∙ p. Лямбда (λ) – это параметр распределения Пуассона, характеризующий скорость появления событий в n испытаниях. Видно, что лямбда, математическое ожидание и дисперсия распределения совпадают. Важно отметить, что распределение Пуассона является предельным случаем биноминального распределения при p→0 и n→∞.

Распределение Пуассона можно задать также в виде функции распределения F(x):

 

ì

0,x£

0;

F(x)=

ïï

n

 

í

å P(x) 0,< x£ n;.

 

ï

х= 0

 

 

ï

1,х >

n

 

î

Воспользуемся программным пакетом Excel, в котором имеется функция ПУАССОН (Х, Среднее, Интегральный). Когда в поле «Интегральный» вводится ноль (ложь), тогда вычисляется

вероятность

Р( X ) =

λx

×e−λ , что событий будет в точности х, а когда

 

 

x!

 

ставится единица (истина), тогда вычисляется вероятность, что число случайных событий будет от нуля до n включительно, то есть значение F(x).

Пример. Пусть в дежурную часть регистрирующего органа в каждые дежурные сутки в течение года поступают заявления о тяжких и особо тяжких преступлениях. Нам известно среднее число

28

заявлений (λ=0,75), и интересует вопрос, какова вероятность поступления в дежурные сутки трех заявлений.

Решение:

-встаем на какую-либо ячейку;

-входим в Мастер функций f(x);

-на первом шаге выбираем в категориях функцию «Статистические»;

-среди статистических функций выбираем ПУАССОН, и нажимаем ОК;

-появляется окно «Аргументы функции». Заполняем ячейки этого окна: в поле X вводим число 3 (количество заявлений), в поле «Среднее» вводим число 0,75, в поле «Интегральная» вводим число ноль (ложь), и в выделенной ячейке получаем ответ: 0,033213. То есть вероятность одновременного поступления в дежурные сутки трех заявлений составляет 0,033213. А вот вероятность того, что в дежурные сутки заявлений о тяжких и особо тяжких преступлений не поступит вовсе равна 0,472.

-Гипергеометрическое распределение (hipergeometric distribution) имеет место в том случае, если вероятность появления

случайной величины X вычисляется по формуле: Р(X = k) = CMk ×CNnkM ,

СNn

где P(X=k) – вероятность наступления события k, k – число интересующих событий в выборке размером n; M – число интересующих событий в ГС объемом N.

Математическое ожидание для гипергеометрического

распределения вычисляется по формуле: М [Х ] = μ = nM , а дисперсия:

 

 

N

D[X ] =

nM ×(N - M ) ×(N - n)

.

N 2 ×(N -1)

В программном пакете Excel имеется встроенная функция

ГИПЕРГЕОМЕТ (Число успехов в выборке, Размер выборки, Число успехов в совокупности, Размер совокупности), где Число успехов в выборке – количество успешных испытаний в выборке,

Размер выборки – размер выборки (n), Число успехов в совокупности – число успешных испытаний в ГС, Размер

29

совокупности – размер генеральной совокупности. Все аргументы данной функции округляются до целых. В противном случае программа выдаст ошибку. То есть в данном случае для решения конкретной задачи нужно заполнить четыре поля встроенной функции. Гипергеометрическое распределение применяется для исследования качества какой-либо продукции, содержащей M

качественных и N-M некачественных изделий. Поскольку проверка всей партии товара (продукции) с точки зрения его качества –

дорогостоящее

мероприятие,

обычно производят

случайную

выборку объемом n из генеральной совокупности объемом N.

Нужно

отметить, что

при определенных

условиях

гипергеометрическое распределение приближенно можно свести к биноминальному с вероятностью успеха p=M/N и числом испытаний n, в частности, когда n/N<0,1.

Пример. Юристу на предприятии поручено провести дисциплинарное расследование по факту выпуска недоброкачественной продукции. При этом лицо, в отношении которого проводится проверка, в своем объяснении настаивает на том, что продукция находится в пределах нормы, и вероятность брака не превышает 0,05.

Объем выпущенной партии составляет 2000 шт. (N=2000). Юрист принимает решение извлечь из данной партии выборку объемом 100 шт. (5% от объема ГС), в которой обнаруживается 12 бракованных изделий (88 – качественные изделия). Требуется проверить утверждение проверяемого лица.

Решим задачу в программном пакете Excel с помощью

встроенной функции ГИПЕРГЕОМЕТ (Число успехов

в

выборке=88,

Размер

выборки=100,

Число

успехов

в

совокупности=1900 (95%),

Размер

совокупности=2000).

Соответственно в первое поле «Аргумента функции» введем число 88, во второе 100, в третье 1900 и в четвертое 2000. В итоге получаем P(X=1900)=0,002264. Интерпретация: вероятность того, что в ГС окажется 1900 качественных изделий составляет 0,002264, что существенно ниже установленного норматива.

30

Элементарные аналитические характеристики дискретных распределений – математическое ожидание, дисперсия, стандартное отклонение, ковариация и корреляция (в случае с двумя и более распределениями) и другие.

Математическим ожиданием (expected value) дискретной случайной величины Х является её среднее взвешенное по вероятности значение (weighted value), вычисляемое по формуле:

N

μX = E(X ) = åxi pi , где pi – вероятность каждого конкретного

i=1

значения случайной величины X, xi – конкретные значения дискретной величины.

Дисперсия дискретной случайной величины X (variance) – это среднее взвешенное по вероятности квадратов разностей между всеми элементами множества X и математическим ожиданием, вычисляемое по формуле:

N

σ X 2 = å(xi - μX )2 × pi . i=1

Среднее квадратическое отклонение (стандартное отклонение) дискретной случайной величины X вычисляется по формуле:

σ X = σ 2 .

Ковариация (covariance) между двумя дискретными случайными величинами X и Y показывает ненормированную силу связи и её направление между ними (если ковариацию поделить на произведение стандартных отклонений по переменным X и Y, то ковариация будет нормированной и называется коэффициентом корреляции – более удобная мера силы связи между переменными12). Ковариация для дискретных переменных вычисляется по формуле:

N

где

p(xi y j )

вероятность

σ XY = å(xi - μX ) ×( y j - μY ) × pi (xi y j ) ,

i=1

 

 

 

наступления i-го значения х и j-го значения у.

Математическое ожидание суммы двух случайных дискретных величин вычисляется по формуле:

1

2 Ковариация является плохой мерой связи потому, что зависит от единиц, в которых измеряются переменные х и y, а коэффициент корреляции величина безразмерная.

31

E( X ,Y ) = E( X ) +E(Y ) .

Дисперсия суммы двух случайных дискретных величин

вычисляется по формуле:

 

 

 

 

D(X ,Y) = σ 2 X +Y

= σ 2 X + σ 2Y + 2σ XY

то

есть

вычисляется

как

произведение дисперсий дискретных величин X и Y умноженное на

ковариацию этих величин.

 

 

 

 

Стандартное

отклонение

суммы

двух

случайных величин

вычисляется по формуле:σ X +Y = σ 2 XY .

Весьма полезными инструментами служат так называемая ожидаемая доходность портфеля ценных бумаг и риск портфеля ценных бумаг, которые можно адаптировать для изучения различных юридических процессов, в частности, рациональной и беловоротничковой преступности. Рациональная преступность зачастую являет собой рисковую деятельность, направленную на извлечение прибыли, а сами рациональные преступления чем-то напоминают ценные бумаги, в которые вкладываются инвестиции.

Ожидаемая доходность портфеля ценных бумаг:

E(P) = w×E(X ) +(1-w)E(Y ) , где E(P) – ожидаемая доходность портфеля, E(X) – ожидаемая доходность пакета акций Х, E(Y) – ожидаемая доходность пакета акций Y, w – доля пакета акций Х в портфеле ценных бумаг, 1-w – доля пакета акций Y в портфеле ценных бумаг.

Риск портфеля ценных бумаг вычисляется по формуле:

σ р = w2 ×σ X 2 + (1- w)2 ×σY 2 + 2× w×(1- w)×σ XY .

Перцентили (persentile) – это ранжированные данные, выраженные в процентах, а не в числах, то есть ранжированные данные, представленные не в абсолютных, а в относительных величинах. Соответственно имеются перцентили от нуля до 100 включительно, и называются - нулевой перцентиль, первый, второй и т.д. Двадцать пятый (25%) и семьдесят пятый (75%) перцентили носят названия квартилей (quartiles), первый называют нижним квартилем, а второй – верхним. Пятидесятый перцентиль (50%) по ранжированному ряду называют медианой (median).

32