Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
206
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

хозяйстве средняя урожайность рассчитывается, как общий валовой сбор (тыс. тонн), деленный на общую посевную площадь (тыс.гектаров).

Покажем применение средней гармонической. Пусть проводится контролируемый эксперимент (метод Монте-Карло) с целью выяснения среднего времени проникновения преступника на охраняемый объект. Отобрано пять специалистов, моделирующих поведение преступников. По итогам составлена таблица:

«Преступник»

 

 

 

1

 

 

2

 

3

 

4

 

5

x=t, мин.

 

 

 

 

10

 

 

14

 

13

 

9

 

11

1/xi

 

 

 

 

 

 

0,1

 

0,0714

 

0,0769

 

0,1111

 

0,09

 

 

 

n

 

 

 

 

5

 

 

 

 

 

 

 

 

 

X гарм =

 

 

 

=

=11,12

, то

есть 11

минут и 12

секунд.

n

1

 

 

0,4494

 

 

 

å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

Простое среднее арифметическое выдает 11,4.

0,2 0,1667 0,1 0,1666 0,2 0,666 = 4 мин Покажем применение средней гармонической взвешенной.

Дано:

Зарегистрирован

% к январю-

о преступлений в

 

марту 2010

январе-марте

 

года (Трц=

2011 года, шт.

 

 

 

уi

×100 )

xi

 

 

 

yi−1

 

 

 

 

 

 

 

 

 

93

103,2

149

97,7

296

115

490

124,2

1028

 

 

 

 

=114,9

X гармВз

 

 

Находим средний процент изменения абсолютного числа, совершенных в области преступлений в январе-марте 2011 года по сравнению с абсолютным числом зарегистрированных преступлений за аналогичный период прошлого 2010 года.

82

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åxi

 

 

 

93 +149 + 296 + 490

 

 

 

 

X гармВз =

 

i=1

 

 

=

 

 

 

 

 

 

x

 

 

93

149 296 490

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åi=1

i

 

 

 

 

+

 

+ 1,15 +

 

 

 

 

 

 

 

 

 

 

 

 

 

1,032

0,977

1,242

 

 

 

 

 

 

 

 

 

Тр(ц

)i

 

 

 

 

 

 

 

 

 

 

 

 

1028

 

 

 

 

 

=1,149 .

 

 

X гармВз

=

 

 

 

 

 

 

 

 

 

 

90 ,12

+152 ,5 +257 ,39 +394 ,5

 

 

 

 

 

 

 

 

 

 

 

 

Или в процентах 114,9%. Несложно заметить, что в качестве x здесь выступает цепной темп роста,

Меры разброса (вариации) демонстрируют силу центробежных процессов, степень удаления элементов от центра. Сюда относятся размах, дисперсия, среднее квадратическое отклонение, коэффициент осцилляции, коэффициент вариации.

Выборочная дисперсия (variance)- среднее взвешенное квадратов отклонений переменной (признака) рассчитывается подобно обычной средней взвешенной по частотам (fi) или частостям (wi). Если значения переменной не повторяются или повторами можно пренебречь (предполагается, что все значения равновероятны), числитель å(хi - X )2 делится на число наблюдений n:

 

n

 

Dв = 1n åi=1

(xi - x)2 . Если значения переменных повторяются (не

равновероятны) то используются формулы:

при расчете с использованием абсолютных частот:

Dв =

1 å(xi - x)2 × fi .

 

n

 

å fi i=1

При расчете с использованием относительных частот:

N

Dв = å(xi - x)2 × wi .

i=1

Считается доказанным, что выборочная дисперсия содержит систематическую ошибку, которая ведет к занижению величины дисперсии. В этой связи выборочную дисперсию корректируют:

Sв =

 

åf

 

× Dв или

 

 

(åf ) -1

× f .

Sв =

 

 

1

 

×å(xi - x)2

 

 

 

 

 

n

 

 

(å f ) -1

 

 

i=1

 

При равновероятных значениях переменной:

Sв = N1 1 ån (xi - x)2 .

- i=1

83

Дисперсия ГС (генеральной совокупности) (population variance) вычисляется точно также как неисправленная выборочная дисперсия с той лишь разницей, что вместо n берется N. Чтобы различать выборочную дисперсию и дисперсию в ГС используют разные обозначения. Дисперсия в ГС обычно обозначается символом σ2.

σ 2 = 1 åN (xi − μ)2 .

N i=1

Стандартное отклонение ГС (population standard) вычисляется путем извлечения квадратного корня из дисперсии генеральной совокупности.

Дисперсия для таблицы данных

 

p

n

 

 

 

 

åå(X ij

 

)2

 

 

 

 

X

 

 

 

 

, где D – дисперсия для таблицы данных, X

 

j 1

i

D =

=

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

средняя для таблицы данных, N – наблюдений.

В программе Excel имеется полезный алгоритм, выдающий группу показателей, именуемых как «Описательная статистика». Для этого нужно выбрать в командной строке «Данные», а в данных команду «Анализ данных». В появившемся окне выбрать «Описательная статистика». Появится диалоговое окно, где нужно указать: 1) координаты вариационного ряда, например, путем его выделения; 2) в «параметрах вывода» поставить флажок на итоговой статистике, а далее щелкнуть ЛКМ (левой клавишей мыши) на ОK. Посмотрим, как работает данный инструмент на примере временного ряда осужденных в Российской империи с 1874 по 1912 годы (таблица №1).

 

 

 

Столбец1

 

 

 

 

 

 

 

 

 

 

 

Среднее

87421

 

 

 

 

Стандартная

 

 

ошибка

4240,102

 

 

 

 

Медиана

92927

 

 

 

 

Мода

#Н/Д

Стандартное отклонение 22032,22

Дисперсия

выборки 4,85E+08

84

Эксцесс

-1,15563

Асимметричность

-0,12649

Интервал

73904

Минимум

52548

Максимум

126452

Сумма

2360367

Счет

27

Стандартная ошибка – стандартное отклонение делится на корень квадратный из объема выборки. Для нашего примера:

СО = 22032 ,22 =4240.

27

Эксцесс (крутость) (kurtosis) – центральный момент четвертого порядка, представляет интерес при изучении частотных вариационных рядов, когда проводится проверка соответствия данного эмпирического распределения теоретическому нормальному распределению (распределению Гаусса). При наличии нормального распределения значение эксцесса равно нулю или близко к нулю. На графике нет вертикального сдвига.

Асимметрия (скос) (skewness) – центральный момент третьего порядка, представляет интерес при изучении частотных вариационных рядов, когда проводится проверка соответствия данного эмпирического распределения теоретическому нормальному распределению (распределению Гаусса). При наличии нормального распределения значение асимметрии равно нулю или близко к нулю. На графике распределения наличие асимметрии будет выражено сдвигом вершины относительно математического ожидания влево или вправо, то есть будет наличие сдвига по горизонтали.

Интервал – размах (range). Счет – число наблюдений.

Для описания особенностей распределения наряду с другими характеристиками используются так называемые моменты распределения, из числа которых нами уже были упомянуты асимметрия и эксцесс.

Кроме того в программе Excel имеются специальные функции для вычисления: 1) выборочной дисперсии: ДИСП; ДИСПА (рассчитывается как и ДИСП, но с учетом текстовых и логических

85

значений); 3) вычисление дисперсии ГС: ДИСПР или ДИСПРА; 4) среднего квадратического отклонения: СТАНДОТКЛОН (по выборке) СТАДОТКЛОНА (то же только с учетом текстовых и

логических значений);

для

ГС

СТАНДОТКЛОНП,

СТАНДОТКЛОНПА.

 

помощью функции СКОС, а

Асимметрия вычисляется с

эксцесс с помощью функции ЭКСЦЕСС.

 

§3. Прогнозирование криминологического процесса по временному ряду с помощью простейшего линейного уравнения, полученного с использованием среднего цепного абсолютного прироста данного процесса

Прогнозированию посвящен специальный раздел. Здесь будет рассмотрен лишь простейший способ прогнозирования по временному ряду с помощью трендового уравнения полученного на основе абсолютного цепного прироста, уже изученного нами.

Дело в том, что довольно часто предсказание будущих значений криминологических процессов делаются на основе их прошлого и настоящего состояния, и предсказание при прочих равных условиях (ceteris paribus)34 будет тем более надежным, чем менее подвижными будут факторы, управляющие исследуемыми криминологическими процессами в будущем.

Простейшее, но в то же время вполне приемлемое оценочное линейное уравнение криминологического процесса, можно получить с помощью среднего цепного абсолютного прироста, вычисляемого

1 N

y = å y

по формуле: ц N i=1 цi , где ∆уц=yi-yi-1, где yi – каждое последующее значение переменной y, yi-1 – каждое предыдущее значение переменной y.

Из школьного курса алгебры мы знаем, что производная функции – это скорость изменения функции в точке:

f ′(x) =lim

y

x→0

x .

34 ceteris paribus (лат. при прочих равных условиях).

86

a = y bt

Точнее выражаясь, производной функции y=f(x) в точке х называется предел отношения приращения функции к приращению аргумента, когда последнее стремится к нулю. Как видно и в числителе и в знаменателе приводятся абсолютные приросты. Поэтому, поделив средние приросты друг на друга, можно приблизительно получить значение производной, а производная – это и есть важнейший параметр линейного оценочного уравнения (параметр b – коэффициент при независимой переменной). В том случае, когда перед нами временной ряд, в котором имеется постоянный интервал, например, 1 год, 1 месяц и т.п., цепной абсолютный прирост независимой переменной t всегда равен единице, равно как и средний абсолютный прирост также равен единице: Dt =1, что легко проверить (2-1=1; 3-2=1; 4-3=1 и т.д., а среднее для нашего примера (1+1+1)/3=1). Тогда, чтобы найти параметр b нужно найти только средний абсолютный цепной прирост по зависимой переменной. В статистике и эконометрике этот параметр также называют коэффициентом регрессии, а по сути, это приближенное значение производной функции. Для временного ряда это функция вида: y=f(t). В случае с линейной функцией нужно найти два параметра: 1) коэффициент регрессии (b) и 2) свободный член уравнения (a). Параметр b ответит на вопрос, на сколько в абсолютном выражении изменится зависимая переменная при изменении независимой переменной на единицу измерения. Параметр a покажет значение оценочной функции при нулевом уровне независимой переменной. Свободный член оценочного уравнения находим по формуле:

.

Не следует путать средний абсолютный цепной прирост со средним арифметическим независимой переменной: Dt ¹t . Для нашего простейшего примера среднее значение времени будет (1+2+3+4)/4=2,5.

Как мы выяснили параметр b ответит на вопрос, на сколько в абсолютном выражении изменится зависимая переменная при изменении независимой переменной на единицу измерения, но можно получить и более тонкий ответ, показывающий процентные

87

соотношения зависимой и независимой переменной, для чего нужно найти эластичность зависимой переменной по независимой. Эластичность покажет, насколько процентов изменится зависимая переменная при изменении независимой на 1%. Для линейной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Э

 

= b ×

t

 

функции эластичность находим по формуле:

y / t

y или среднюю

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Э

 

= b ×

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эластичность

y / t

y .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Качество полученного уравнения в данном случае можно

проверить

с

 

помощью

 

средней

 

 

ошибки

аппроксимации,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= n1 × å

 

 

yi

- yi

 

 

×100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

вычисляемой по формуле:

 

y

. То есть каждая частная

 

i=1

 

 

i

 

 

 

 

 

 

 

 

 

 

ошибка аппроксимации (Ai) находится, как модуль разности эмпирического и оценочного значений деленные на эмпирическое значение, а полученный результат переводится в проценты умножением на 100. Средняя ошибка аппроксимации говорит о том, насколько процентов в среднем отличаются расчетные (оцененные по уравнению) значения от эмпирических (фактических). Чем меньше средняя ошибка аппроксимации, тем точнее расчетные значения описывают фактические. Считается, что уравнение пригодно для прогнозирования, если средняя ошибка аппроксимации не превышает 8-10%.

Решим конкретную задачу. Возьмем на сайте UNODC (United Nations Office on Drug and Crime)35 сведения о разбойных нападениях в Украине с 2003 по 2008 годы и на сайте МВД Украины36 данные о разбоях за 2009 год). В статистической отчетности UNODC разбойные нападения проходят как assault at the national level, number of police-recorded offences (разбои на национальном уровне, число преступлений зарегистрированных полицией).

Таблица. Сведения о разбойных нападениях, зарегистрированных в Украине с 2003 по 2009 годы, с прогнозом до 2012 года.

35http://www.unodc.org/

36http://mvs.gov.ua

88

Годы

t, годы

Разбои (разбiй, assault), шт.

2003

1

5703

2004

2

5538

2005

3

6707

2006

4

6464

2007

5

5716

2008

6

4984

2009

7

5103

2010

8

5345

2011

9

5245

2012

10

5145

Требуется: 1) сделать прогноз числа разбойных нападений в Украине на 2010, 2011, 2012 годы с помощью трендового уравнения; 2) рассчитать среднюю эластичность разбойных нападений в Украине по времени; 3) Проверить качество полученного уравнения с помощью средней ошибки аппроксимации.

Решение:

1) Находим цепной абсолютный прирост разбойных нападений:

Разбои (разбiй, assault), шт.

∆уц=yi-yi-1

5703

 

-

5538

 

-165

6707

 

1169

6464

 

-243

5716

 

-748

4984

 

-732

5103

yц =

119

 

1 å yцi = −100

 

 

N

 

 

N

 

 

i=1

2) Находим средний цепной абсолютный прирост (-100) и записываем его в таблицу. Поскольку средний цепной прирост в данном случае представляет собой параметр b оценочного уравнения, то он найден, и отвечает на вопрос, что за исследуемый

89

период времени в Украине число разбоев ежегодно в среднем снижалось на 100 преступлений.

3)Находим средние значения зависимой и независимой переменных: t =4; y =5745.

4)Находим свободный член уравнения по формуле:

a = y bt =5745-(-100)∙4=6145.

5)Получаем оценочное уравнение: y =6145 −100 t .

6)Находим прогнозные значения для 8-10 периодов, то есть для 2010, 2011, 2012 годов:

y8 = 6145 -100t = 6145 -100 ×8 = 5345 ; y9 = 6145 -100t = 6145 -100 ×9 = 5245 ;

 

 

 

y10 =

6145 -100t = 6145 -100 ×10 = 5145

.

 

 

 

 

 

 

 

 

 

 

 

7) Рассчитаем среднюю эластичность разбойных нападений в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

Э

 

= b ×

t

 

= -100 ×

 

Украине по времени:

y / t

 

 

5745 =-0,069.

 

 

y

 

 

 

 

8) Проверим качество полученного уравнения с помощью

средней ошибки аппроксимации, вычислив её по формуле:

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 1n

× å

 

 

yi

- yi

 

 

×100

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

y

.

 

 

 

 

 

 

 

 

 

 

 

 

 

i =1

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для этого сначала нужно найти 7 оценочных значений для 1-7 периодов:

y1 = 6145 -100t = 6145 -100 ×1 = 6045 ; y2 = 6145 -100t = 6145 -100 × 2 = 5945 ; y3 = 6145 -100t = 6145 -100 ×3 = 5845 ; y4 = 6145 -100t = 6145 -100 × 4 = 5745 ; y5 = 6145 -100t = 6145 -100 ×5 = 5645 ; y6 = 6145 -100t = 6145 -100 × 6 = 5545 ; y7 = 6145 -100t = 6145 -100 × 7 = 5445 .

Разбои (укр.

 

 

разбiй, англ.

yi , шт.

Ai , %

assault), шт.

 

 

yi

 

 

5703

6045

5,9

5538

5945

7,34

90

6707

5845

12,85

6464

5745

11,12

5716

5645

1,2

4984

5545

11,25

5103

5445

6,7

Средняя ошибка аппроксимации

8,05%

Судя по средней ошибке аппроксимации (8%), полученное оценочное уравнение пригодно для прогнозирования.

Посмотрим улучшит ли качество прогноза оценочное уравнение полученное по более сложной методике принятой на вооружение в эконометрике и теории статистики – метод наименьших квадратов (МНК) (ordinary least squares (OLS)).

Коэффициент регрессии здесь находится по формуле:

b =

Кt, y

 

 

 

 

 

 

 

 

 

 

σt ×σ y

. В

данной формуле

нам

пока

неизвестен

только

коэффициент

ковариации, стоящий

 

 

в

числителе

дроби.

 

 

 

 

Кt, y =

1 å(ti - t ) × ( yi - y)

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

Вычисляется он по формуле:

 

N

 

 

 

 

.

 

Свободный член вычисляется ранее указанным способом. В результате вычислений получим нижеследующее уравнение:

y =6302 −139 ,2t при коэффициенте аппроксимации R2 равном 0,219 (чем ближе значение коэффициента аппроксимации к единице, тем точнее оценочное уравнение). Видно, что коэффициент аппроксимации низок и уравнение не пригодно для прогнозирования.

Для сравнения рассчитаем среднюю ошибку аппроксимации и для данного уравнения полученного методом наименьших квадратов в программе Excel.

Разбои (разбiй,

 

 

assault), шт.

yi , шт.

Ai , %

yi

 

 

5703

6162,8

8,06

5538

6023,6

8,76

6707

5884,4

12,26

6464

5745,2

11,12

5716

5606

1,92

91