Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
212
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

 

ПОКАЗАТЕЛЬ

Значение или формула для

 

 

 

 

нахождения значения

 

 

 

1)

Минимальное

Нулевой перцентиль

 

значение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)

Нижний

 

квартиль

Формула

для

нахождения

 

(25%)

-

четверть

нижнего квартиля:

 

 

 

расстояния

от

1+int [(1+n) / 2] ,

где

int -

 

минимального

 

2

 

 

 

 

означает

целое

число

(дробная

 

значения

 

 

 

 

 

часть

 

 

игнорируется

 

 

 

 

 

 

 

 

 

 

(отбрасывается)

 

 

 

3)

Медиана

 

(50%) –

Формула для нахождения:

 

середина

 

 

 

 

1+n

 

 

ранжированного ряда

 

 

2

 

 

 

 

 

 

 

 

 

 

 

4)

Верхний квартиль (75-

Формула для нахождения:

 

й перцентиль)

é1+int[(1+ n) / 2]ù

 

 

 

 

 

 

(n +1) - ê

2

ú

 

 

 

 

 

 

ë

û

 

 

5)

Максимальное

100-й перцентиль

 

 

значение

 

(100-й

 

 

 

 

 

 

перцентиль)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Блочная диаграмма – используется для наглядного представления пяти вышеприведенных показателей в одномерном наборе данных.

33

Пять базовых показателей (five-number summary) позволяющих диагностировать оценку вида распределения, включают:

1)минимальное значение переменной по ранжированному ряду;

2)максимальное значение переменной по ранжированному ряду;

3)значение первого квартиля – значение 25%-го числа от начала ранжированного ряда;

4)значение третьего квартиля – значение 75%-го числа от начала ранжированного ряда;

5)Медиана.

Распределение является симметричным, если:

1)расстояние от минимального значения ранжированного вариационного ряда исследуемой переменной величины до медианного значения переменной равно расстоянию от медианного значения до максимального значения переменной величины.

2)Расстояние от минимального значения до первого квартиля, равно расстоянию от третьего квартиля до максимального значения переменной.

3)Расстояние от первого квартиля до медианы, равно расстоянию от медианы до третьего квартиля.

Распределение является асимметричным, если:

1)имеет место положительная асимметрия, когда расстояние от минимального значения переменной по ранжированному вариационному ряду до медианы меньше расстояния от медианы до максимального значения переменной.

2)При положительной асимметрии расстояние от минимального значения переменной до первого квартиля меньше, чем расстояние от третьего квартиля до максимального значения исследуемой переменной.

3)Имеет место отрицательная асимметрия, когда расстояние от минимального значения переменной до медианы больше, чем расстояние от медианы до переменной с максимальным значением.

34

4) При отрицательной асимметрии расстояние от минимального значения переменной до первого квартиля больше, чем расстояние от третьего квартиля до максимального значения исследуемой переменной.

Удобным статистическим инструментом, позволяющим в геометрической форме представить пять базовых показателей, и диагностировать форму распределения, оценить симметрично оно или асимметрично, является блочная диаграмма (box-and-whisker diagram). Часто такие диаграммы представляются группами.

Примеры.

Дано: число зарегистрированных преступлений в Украине за 2008 и 2009 годы.

Таблица. Число зарегистрированных преступлений в Украине в 2008-2009 годах.

 

 

Всего

 

 

зарегистрированно

Наименование

преступлений (усього

регионов

зареєстровано злочинів)

 

 

 

 

 

 

2008

2009

 

дина-

 

 

міка, %

 

 

 

 

 

 

 

 

 

АР Крым

 

 

 

 

(АР Крим)

19729

22817

 

15.7

 

 

 

 

 

Винницкая

 

 

 

 

(Вінницька)

10291

10630

 

3.3

 

 

 

 

 

Волынская

 

 

 

 

(Волинська)

7288

7746

 

6.3

 

 

 

 

 

Днепропетровская

 

 

 

 

(Дніпропетровська)

32593

40499

 

24.3

 

 

 

 

 

Донецкая

 

 

 

 

(Донецька)

46357

52867

 

14.0

 

 

 

 

 

Житомирская

 

 

 

 

(Житомирська)

7769

8749

 

12.6

 

 

 

 

 

Закарпатская

 

 

 

 

(Закарпатська)

5024

5618

 

11.8

 

 

 

 

 

Запорожская

 

 

 

 

(Запорізька)

24213

24816

 

2.5

 

 

 

 

 

Ивано-

5247

5469

 

4.2

Франковская

 

 

 

 

 

 

 

 

 

35

(Івано-

 

 

 

Франківська)

 

 

 

 

 

 

 

Киевская

 

 

 

(Київська)

11639

13727

17.9

 

 

 

 

город Киев

 

 

 

(місто Київ)

25586

34944

36.6

 

 

 

 

Кировоградская

 

 

 

(Кіровоградська)

7237

9671

33.6

 

 

 

 

Луганская

 

 

 

(Луганська)

26166

29204

11.6

 

 

 

 

Львовская

 

 

 

(Львівська)

13480

13765

2.1

 

 

 

 

Николаевская

 

 

 

(Миколаївська)

11008

11573

5.1

 

 

 

 

Одесская

 

 

 

(Одеська)

19777

21028

6.3

 

 

 

 

Полтавская

 

 

 

(Полтавська)

12742

13601

6.7

 

 

 

 

Ровненская

 

 

 

(Рівненська)

5789

6963

20.3

 

 

 

 

город Севастополь

 

 

 

(місто

 

 

 

Севастополь)

4711

5157

9.5

 

 

 

 

Сумская

 

 

 

(Сумська)

8213

9674

17.8

 

 

 

 

Тернопольская

 

 

 

(Тернопільська)

4626

5156

11.5

 

 

 

 

Харьковская

 

 

 

(Харківська)

24197

25557

5.6

 

 

 

 

Херсонская

 

 

 

(Херсонська)

9838

10644

8.2

 

 

 

 

Хмельницкая

 

 

 

(Хмельницька)

8094

9127

12.8

 

 

 

 

Черкасская

 

 

 

(Черкаська)

7690

9131

18.7

 

 

 

 

Черниговская

 

 

 

(Чернігівська)

7026

8780

25.0

 

 

 

 

Черновицкая

 

 

 

(Чернівецька)

5016

5818

16.0

 

 

 

 

Требуется: 1) рассчитать значение медианы, первого и третьего квартилей, минимального и максимального значения

36

преступности в Украине за 2008-2009 гг.; 2) построить блочные диаграммы для преступности в Украине за 2008-2009 годы; 3) оценить форму распределения преступности в Украине за 20082009 годы; 4) сравнить формы распределения преступности в Украине в 2008 и 2009 годах.

Ответ:

Таблица с расчетными данными.

 

Набл.

Медиан

Мин.

Макс.

Q1

Q3

2008 г.

 

а

 

 

 

 

27

9838,00

4626,000

46357,00

7026,000

19777,00

2009 г.

27

10630,00

5156,000

52867,00

7746,000

22817,00

Q1 – первый квартиль (25%); Q2 – третий квартиль (75%).

B o x & W h is k e r P lo t Б л о ч н а я д и а г р а м м а

6 0 0 0 0

5 0 0 0 0

4 0 0 0 0

3 0 0 0 0

2 0 0 0 0

1 0 0 0 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

e d ia n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 5 % - 7 5

%

 

 

 

 

 

 

 

 

 

 

 

 

 

V a r 1

 

 

 

V a

r 2

 

 

 

 

 

 

 

 

 

M

in - M a x

 

 

 

 

 

2

0

0

8

2

0

0

9

 

 

 

 

 

 

 

Из блочной диаграммы видно, что распределение преступности по территории Украины не является симметричным. Судя по диаграмме, в Украине, как в 2008, так и в 2009 году имела

37

место положительная асимметрия, поскольку расстояние от минимального значения до первого квартиля было меньше, чем расстояние от третьего квартиля до максимального значения. Соответственно и расстояние от минимального значения до медианного меньше, чем от медианы до максимального значения.

Кроме того, по блочной диаграмме можно сказать: 1) устойчивость вариационного ряда преступности в Украине в 2009 году снизилась, то есть временной ряд 2009 года более изменчив, чем вариационный ряд 2008 года; 2) уровень преступности по территории Украины стал выше в 2009 году по сравнению с 2008 годом. Об этом свидетельствует сдвиг вверх минимального и максимального значений преступности, первого и третьего квартиля и медианного значения.

Во многих случаях форма распределения может быть асимметричной (скошенной), что вызвано содержанием набора исследуемых данных. Иногда удается избежать проблемы асимметрии, осуществив преобразование исходных данных.

Преобразование (transformation) – замена исходных данных для упрощения вычислений, например, сдвиг запятой или логарифмирование. Логарифмирование – замена исходных данных (только положительных чисел) их логарифмами, что позволяет: 1) увеличить (растянуть) малые значения; 2) уменьшить (сжать) большие значения; 3) преобразовать скошенные распределения в симметричные, поскольку горизонтальная ось (ось абсцисс) равномерно растягивается около нуля. Например, логарифм числа 0,0004=-3,3979; log(15000)=4,176. Отсюда и частоты, откладываемые по ординате, располагаются более кучно и равномерно. В случае, если вычисляется натуральный логарифм (основание число e=2,71…), то его перевод в десятичный осуществляется путем деления полученного числа на 2,302585, например, ln(15000)=9,6158. Разделив 9,6158 на 2,302585, получим 4,176. Соответственно и наоборот, если умножить 4,176 на 2,302585, то получим 9,615.

Рассмотрим практический пример.

38

Дано: таблица исходных первичных данных (primary data) о числе зарегистрированных в 2009 году краж по различным административно-территориальным единицам Украины

 

Кража

Log числа

АТЕ Украины

(Крадіжка)

краж

 

 

 

 

 

 

АР Крим

10134

4,005781

 

 

 

Вінницька

3391

3,530328

 

 

 

Волинська

2999

3,476976

 

 

 

Дніпропетровська

17824

4,251005

 

 

 

Донецька

24521

4,389538

 

 

 

Житомирська

2692

3,430075

 

 

 

Закарпатська

1657

3,219323

 

 

 

Запорізька

11166

4,047898

 

 

 

Івано-

 

 

Франківська

1675

3,224015

 

 

 

Київська

5687

3,754883

 

 

 

місто Київ

17706

4,24812

 

 

 

Кіровоградська

4677

3,669967

 

 

 

Луганська

9495

3,977495

 

 

 

Львівська

4331

3,636588

 

 

 

Миколаївська

3842

3,584557

 

 

 

Одеська

6798

3,832381

 

 

 

Полтавська

5896

3,770557

 

 

 

Рівненська

3142

3,497206

 

 

 

місто

 

 

Севастополь

2280

3,357935

 

 

 

Сумська

3951

3,596707

 

 

 

Тернопільська

1651

3,217747

 

 

 

Харківська

9493

3,977403

 

 

 

Херсонська

3794

3,579097

 

 

 

Хмельницька

3452

3,538071

 

 

 

Черкаська

3053

3,484727

 

 

 

Чернігівська

4213

3,624591

 

 

 

Чернівецька

2316

3,364739

 

 

 

Донецька

 

 

залізниця

821

2,914343

 

 

 

Львівська

 

 

залізниця

222

2,346353

 

 

 

39

Одеська

 

 

залізниця

428

2,631444

 

 

 

Придніпр.

 

 

залізниця

1289

3,110253

 

 

 

Півд.-Зах.

 

 

залізниця

564

2,751279

 

 

 

Південна

 

 

залізниця

422

2,625312

Требуется: 1) построить гистограмму распределения краж по территории Украины; 2) построить гистограмму по логарифмированному числу краж по территории Украины.

Решение:

I. Чтобы построить гистограмму вручную:

1.Ранжируем столбец первичных данных (краж) от минимума до максимума.

2.Находим длину интервала: l= Rh , где l – длина интервала, R

размах, h – число групп.

3.Число групп (h) можно задать по формуле Стерджесса:

h=1+3,322×logN,

где N – число исследуемых объектов (в нашем случае число субъектов РФ).

4.Составляем таблицу распределения уровней краж по субъектам Украины.

5.Строим гистограмму распределения.

II. Чтобы построить гистограмму в программе Excel нужно:

1.Выбрать в командной строке «Данные» (в ранних версиях программы – «Сервис»).

2.Выбрать «Анализ данных»3.

3.Выбрать «Гистограмма» и заполнить поля диалогового окна (достаточно заполнить входной интервал, выделив курсором исходные данные, и поставить флажок на выводе графика), после чего нажать «OK».

3 Если на панели «Анализ данных» отсутствует, то его туда нужно добавить, выбрав в меню «Надстройки».

40

4. Чтобы столбцы сливались друг с другом нужно встать курсором на какой-либо столбец гистограммы, щелкнуть правой клавишей мыши, в появившемся окне выбрать «формат ряда данных», и в «параметрах ряда» свести зазор к нулю.

Ниже приводятся гистограммы, дающие решение задачи. На гистограмме №1 показано распределение субъектов Украины по числу зарегистрированных краж, а на гистограмме №2 – распределение субъектов Украины по логарифму зарегистрированных краж с основанием 10.

41

III. В более продвинутых, чем Excel математических пакетах можно сразу получить аппроксимирующую эмпирическое распределение теоретическую кривую, что показано на нижеследующем рисунке, выполненном с помощью ППП

«Statistica».

Хотя в случае с нашей задачей ликвидировать асимметрию полностью не удалось, но она заметно уменьшилась после проведения процедуры логарифмирования. Так, для распределения числа зарегистрированных краж по территории Украины коэффициент асимметрии составил 1,986481 (положительное или правостороннее смещение), а для распределения логарифма числа зарегистрированных краж по территории Украины: А=-0,46859 (отрицательное или левостороннее смещение)4.

1

0

 

 

 

 

Г И С Т О Г Р А М М А № 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ЧАСТОТА

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

2 ,0

2 , 2

2 ,4

2 ,6

2 ,8

3 ,0

3 , 2

3 ,4

3 ,6

3 ,8

4 ,0

4 , 2

4 ,4

4 ,6

 

 

 

 

 

 

 

Л о г а р и ф м ч и с л а к р а ж

 

 

 

 

 

Как было выяснено ранее, центральный момент третьего порядка

показывает величину асимметрии, и вычисляется по формуле:

4 «Левосторонняя» и «правосторонняя» асимметрия – неудачные термины, поскольку способны вводить в заблуждение. Если смотреть на гистограмму, то левостороннее смещение оказывается справа от нас, а правостороннее слева.

42