Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
206
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

дисперсий: (4,67+8,16+34,67)/3=15,833. Поделив средний квадрат отклонений (MSм) между группами на средний квадрат отклонений внутри групп (MSост): 29,1/15,883, получим искомое значение эмпирического F=1,83.

Пример (условный!)20 двухфакторного дисперсионного анализа.

Дано: таблица первичных статистических данных о результатах контролируемых экспериментов (по методу МонтеКарло) с отбором 96 охранников для работы в сети гипермаркетов. На объектах, куда помещались испытуемые, подставные лица совершали кражи, а не уведомленные об этом охранники должны были эти кражи заметить. Охранников отбирали по двум критериям: 1) физический возраст; 2) стаж работы по специальности. То есть в ячейках таблицы представлено число, выявленных охранниками краж (для каждого охранника число краж, совершенных на объекте, было одинаковым).

Таблица. Данные к задаче (на рабочем листе ППП Excel).

 

A

B

C

D

E

1

Стаж

 

Возраст

 

 

2

 

от 20 до 30

от 30 до 40

от 40 до 50

от 50 до 60

3

от 1 до 3

3

2

3

2

4

 

2

3

1

1

5

 

1

2

2

1

6

 

2

3

2

2

7

 

1

4

3

1

8

 

3

3

2

2

9

от 3 до 6

4

3

3

2

10

 

5

4

2

3

11

 

5

6

4

2

12

 

4

3

3

2

13

 

3

4

2

2

14

 

4

2

3

3

20 Данные вымышлены. Однако подобные эксперименты представляют реальный интерес. Можно проверять качество работы охранников, частных детективов, сотрудников криминальной полиции, БЭП, следователей, кинологов, тестировать собак, используемых в криминалистических целях, проверять качество работы адвокатов, судей, юристов в народном хозяйстве.

187

15

от 6 до 8

5

4

5

3

16

 

6

7

3

4

17

 

7

6

4

3

18

 

6

5

3

2

19

 

4

5

6

5

20

 

5

3

4

3

21

Более 8

7

6

5

4

22

 

6

5

4

3

23

 

8

6

7

2

24

 

6

8

6

4

25

 

6

9

6

3

26

 

7

10

7

4

Требуется: 1) с помощью метода двухфакторного дисперсионного анализа оценить значимость влияния возраста и трудового стажа охранников на качество выполняемых ими охранных функций; 2) Построить графики числа выявленных краж в зависимости от возраста и стажа охранников.

Решение:

1). В командной строке ППП Excel выбираем «Данные», «Анализ данных», «Двухфакторный дисперсионный анализ с повторениями.

2). В поле «Входной интервал» вводим (можно протяжкой) исходную таблицу А2:Е26. В поле «Число строк для выборки» вводим число 6 (стаж-возрастные группы взяты по 6 шт.). В поле «Альфа» введем 0,05. Укажем выходной интервал, например, «Новый рабочий лист». Нажмем клавишу ОК.

3). Получим ответ:

ИТОГИ

от 20 до 30

от 30 до 40

от 40 до 50

от 50 до 60

Итого

от 1 до 3

 

 

 

 

 

Счет

6

6

6

6

24

Сумма

12

17

13

9

51

Среднее

2

2,833333

2,166667

1,5

2,125

Дисперсия

0,8

0,566667

0,566667

0,3

0,722826

от 3 до 6

 

 

 

 

 

188

Счет

 

6

 

 

6

 

6

6

24

Сумма

 

25

 

22

17

14

78

Среднее

4,166667

3,666667

2,833333

2,333333

3,25

Дисперсия

0,566667

1,866667

0,566667

0,266667

1,23913

от 6 до 8

 

 

 

 

 

 

 

 

 

Счет

 

6

 

 

6

 

6

6

24

Сумма

 

33

 

30

25

20

108

Среднее

5,5

 

 

5

4,166667

3,333333

4,5

Дисперсия

1,1

 

 

2

1,366667

1,066667

1,913043

Более 8

 

 

 

 

 

 

 

 

 

Счет

 

6

 

 

6

 

6

6

24

Сумма

 

40

 

44

35

20

139

Среднее

6,666667

7,333333

5,833333

3,333333

5,791667

Дисперсия

0,666667

3,866667

1,366667

0,666667

3,824275

Итого

 

 

 

 

 

 

 

 

 

Счет

 

24

 

24

24

24

 

Сумма

110

 

113

90

63

 

Среднее

4,583333

4,708333

3,75

2,625

 

Дисперсия

3,818841

4,824275

2,891304

1,11413

 

Дисперсионный анализ

 

 

 

 

 

P-

F

 

 

 

 

 

 

 

 

Источник

 

 

 

 

 

 

 

Значени

критическо

вариации

SS

df

MS

F

 

е

е

 

 

 

 

60,0833

54,6212

 

 

Выборка

180,25

3

 

3

 

1

2,58E-19

2,718785

 

66,4166

 

22,1388

20,1262

 

 

Столбцы

 

7

3

 

9

 

6

8,18E-10

2,718785

 

22,6666

 

2,51851

2,28956

 

 

Взаимодействие

 

7

9

 

9

 

2

0,02425

1,999115

 

 

 

8

 

 

 

 

 

 

Внутри

 

88

0

 

1,1

 

 

 

 

 

357,333

9

 

 

 

 

 

 

Итого

 

3

5

ОТВЕТ:

 

 

 

 

 

 

 

 

 

 

Поскольку

FXфакт

=54 ,6 >Fтаб

=2,72

при

выбранном

значении

α=0,05, то нулевая

гипотеза

о

равенстве

средних отклоняется

189

FXZфакт
=1,99
FZфакт
=20 ,1 >Fтаб
=2,71

(принимается альтернативная гипотеза), влияние фактора X (стаж работы по специальности) считается статистически значимым.

Поскольку при выбранном значении α=0,05, то нулевая гипотеза о равенстве средних отклоняется (принимается альтернативная гипотеза), влияние фактора Z (физический возраст) считается статистически значимым.

Поскольку =2,29 >Fтаб при выбранном значении α=0,05, то нулевая гипотеза о равенстве средних отклоняется (принимается альтернативная гипотеза), влияние взаимодействия факторов X (стаж работы) и Z (возраст) считается статистически значимым.

Таким образом, по итогам исследования можно утверждать, что раскрываемость краж (Y) зависит от стажа и возраста

охранников, а также от совместного влияния возраста и стажа охранников.

Построим графики числа выявленных краж от возраста и стажа охранников.

Далее, в развитие данной задачи двухфакторного дисперсионного анализа, можно построить уравнение множественной регрессии с введением фиктивных переменных – стаж и возраст.

190

§5. Метод Блэнда-Алтмана: сравнение двух способов измерения или согласуются ли результаты повторных измерений полученных одним и тем же способом.

Метод Блэнда-Алтмана21 является довольно простым, но в то же время результативным в двух случаях: 1) когда требуется проверить согласуются ли результаты измерений одних и тех же объектов, проведенные с помощью разных методов; 2) когда требуется сравнить насколько согласованны результаты повторных измерений, проведенных одним и тем же способом. Метод БлэндаАлтмана широко применяется в медико-биологических исследованиях22, но вполне приемлем и для любых других отраслей научного знания.

Стенон Гланц отмечает: «Итак, с помощью двух методов получены две серии измерений. Казалось бы, ничто не мешает применить регрессионный анализ или рассчитать коэффициент корреляции. Увы, эти, на первый взгляд, очевидные действия могут привести к ложным выводам. Регрессионный анализ неприменим уже потому, что его результаты зависят от того, какую переменную считать независимой, а какую зависимой. Тут следует подчеркнуть отличие задачи сравнения двух методов измерения от задачи колибровки, в которой приближенные измерения сравниваются с некоторым эталоном»23. Теперь о корреляции: «Что может дать коэффициент корреляции? Положим, он статистически значимо отличается от нуля. Но ценен ли этот факт? Нет, ведь проверялась корреляция измерений одной и той же величины»24.

Суть метода: 1) для каждой пары измерений, полученных разными методами или одним методом в разное время, вычисляется их среднее (складываем значения и делим на два) и разность (из первого значения вычитаем второе); 2) находится средняя разность, характеризующая систематическое расхождение и

среднее квадратическое отклонение, показывающее степень

21Назван так в честь его изобретателей Д. Блэнда и Дж. Алтмана.

22Гланц С. Медико-биологическая статистика/С.Гланц. – Пер с англ. – М.: Практика, 1998. С.

23Там же. С. 270.

24Там же. С.270.

191

разброса результатов; 3) строится график, на котором по оси абсцисс располагаются средние значения результатов попарных сравнений, а по оси ординат значения разностей с диапазоном равным 2 средним квадратическим отклонениям разности; 4) на основе полученных результатов делается вывод о степени согласованности измерений. При этом никаких дополнительных критериев не применяется. Оценка делается «на глазок». Именно поэтому метод Блэнда-Алтмана называют описательным.

Задача. Проведен подсчет голосов избирателей, полученных по двум разным методикам, и в итоге имеются нижеследующие результаты по числу отбракованных «голосов» по первой и второй

методике (доля):

 

 

 

 

№ участка

1-я методика

2-я методика

1

 

0,001

0,03

 

2

 

0,007

0,04

 

3

 

0,005

0,02

 

3

 

0,002

0,05

 

3

 

0,004

0,06

 

6

 

0,003

0,08

 

7

 

0,008

0,01

 

 

 

Решение:

 

 

1-я

2-я

Средне

Разность

участка

методика методика

е

 

1

0,001

0,03

0,0155

-0,029

2

0,007

0,04

0,0235

-0,033

3

0,005

0,02

0,0125

-0,015

3

0,002

0,05

0,026

-0,048

3

0,004

0,06

0,032

-0,056

6

0,003

0,08

0,0415

-0,077

7

0,008

0,01

0,009

-0,002

 

 

 

Средне

 

 

 

 

е

-0,03714

 

 

 

СКО

0,0254

192

Среднее квадратическое отклонение (стандартное отклонение) можно найти в ручную или с помощью ППП Excel, задав функцию =СТАНДОТКЛОН, выделив для этого значения разности по всем позициям.

1-я

2-я

Среднее

Разность

участ

методик

мето

 

 

ка

а

дика

 

 

 

 

 

 

 

 

 

 

 

 

1

0,001

0,03

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

2

0,007

0,04

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

3

0,005

0,02

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

3

0,002

0,05

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

3

0,004

0,06

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

6

0,003

0,08

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

7

0,008

0,01

=(RC[-2]+RC[-1])/2

=RC[-3]-RC[-2]

 

 

 

 

 

 

 

 

 

 

 

Среднее

=СРЗНАЧ(R[-7]C:R[-1]C)

 

 

 

 

 

 

 

 

СКО (СТО)

=СТАНДОТКЛОН(R[-8]C:R[-2]C)

 

 

 

 

 

193

Таблица к графикам.

Среднее

Разность

Средняя

Средняя

Средняя

 

 

разность

разность

разность

 

 

-2СТО

+2СТО

 

 

 

 

 

 

 

 

 

 

 

0,0155

-0,029

-0,06254

-0,01174

-0,03717

 

 

 

 

 

0,0235

-0,033

-0,06254

-0,01174

-0,03717

 

 

 

 

 

0,0125

-0,015

-0,06254

-0,01174

-0,03717

 

 

 

 

 

0,026

-0,048

-0,06254

-0,01174

-0,03717

 

 

 

 

 

0,032

-0,056

-0,06254

-0,01174

-0,03717

 

 

 

 

 

0,0415

-0,077

-0,06254

-0,01174

-0,03717

 

 

 

 

 

0,009

-0,002

-0,06254

-0,01174

-0,03717

 

 

 

 

 

Ответ: между двумя методиками существуют существенные различия. Такой вывод мы делаем, поскольку 2 точки из 7 вышли за границы 2-х стандартных отклонений, и 2 точки близки к этим границам. Кроме того, наблюдается стабильное нарастание разности. Относительно значений наблюдений велика средняя разность (-0,037), характеризующая систематическое расхождение и среднее квадратическое отклонение (0,025), показывающее степень разброса результатов.

194

§6. Анализ выживаемости (survival analysis) в юриспруденции. Анализ выживаемости – это статистический метод, нацеленный на: 1) выявление различий в тех случаях, когда мы имеем дело с неполными (цензурированными) данными25, «проблемой выбывания» объектов исследования; 2) получение

полезных функций – выживаемости, смертности.

25 В анализе выживаемости используются полные (complete) и неполные, или цензурированные, наблюдения (censored).

195

Данный метод широко применяется в медицине для изучения выживаемости пациентов26 при применении к ним различных препаратов и методов лечения: «наиболее типичный пример исследования такого рода – это изучение выживаемости, когда больных наблюдают от начала болезни до смерти. Обычно больных включают в исследование на всем его протяжении, поэтому оно всегда заканчивается до смерти последнего больного. Истинная продолжительность болезни выживших к концу исследования остается неизвестной. Кроме того, исследователь может потерять больного из виду до завершения исследования, если тот, к примеру, переехал в другой город. Наконец больной может умереть по причине, не связанной с изучаемым заболеванием, например, погибнуть в автокатастрофе. Во всех этих случаях длительность заболевания остается неизвестной, мы знаем только, что она превышает некоторый срок»27. Очевидно, что здесь неприемлемы обычные способы оценки различий, в частности, сравнение долей и средних величин, поскольку следует учесть выбывание. Так же вполне очевидно, что «анализ выживаемости» пригоден не только для медико-биологических исследований, но имеет широкий спектр действия, в частности, и в юриспруденции. В качестве объекта исследования здесь могут выступать рецидивисты, особо опасные рецидивисты, лица, совершающие различные виды преступлений и правонарушений – административных, дисциплинарных, гражданско-правовых, уголовно-процессуальных и т.д. В качестве объектов здесь могут выступать различные категории сотрудников правоохранительных и судебных органов – судьи, прокуроры, следователи, дознаватели, сотрудники оперативных подразделений, пенитенциарной системы и т.п.

Например, изучая особо опасных рецидивистов, мы можем исследовать влияние на них различных режимов содержания, методов воспитательно-исправительного воздействия. При этом «моментом смерти» здесь можно считать совершение нового

26Так же широко применяется в страховом деле и промышленности, например, при изучении долговечности службы различных приборов.

27Гланц С. Медико-биологическая статистика/С.Гланц. – Пер с англ. – М.: Практика, 1998. С.

196