Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ольков_С_Г_Аналитическая юриспруденция

.pdf
Скачиваний:
213
Добавлен:
13.05.2015
Размер:
8.92 Mб
Скачать

вычислим и эту матрицу, а также покажем, как такие матрицы вычисляются вручную.

По общему правилу коэффициент ковариации вычисляется

 

1

N

 

по формуле: Kx, y =

å(yi - y) × (xi - x) . Обратим внимание, что

x в

 

 

N

 

 

 

i =1

 

формуле ковариации для нашего примера взят условно (это не независимая переменная, а также оценка, то есть, по сути, y - только по другому столбцу). При этом стоит отметить, что для нашего случая будет устанавливаться связь между столбцами, то есть оценками, которые давали судьи. Так коэффициент ковариации для первого и второго столбцов исходной таблицы покажет в ненормированном виде связь между оценками судей Иванова и Петрова, следующий за ним по первой строке коэффициент ковариации покажет связь между оценками Иванова и Сидорова и так далее. Первый же в первой строке коэффициент

ковариации – это дисперсия: Dy, y = N1 åN ( yi - y)2 - связь столбца

i=1

оценок Иванова с самим собой.

Получим ковариационную матрицу в ППП Excel: 1) Введем на рабочий лист исходную таблицу:

Иванов

Петров

Сидоров

Николаев

Васильев

Онищенко

-1

0

0

1

0

-2

0

-1

-3

0

-3

-4

-2

-3

-4

-2

-4

-5

-3

-4

-6

-3

-4

-7

-4

-6

-7

-3

-5

-9

-5

-7

-9

-4

-5

-10

-8

-9

-10

-7

-10

-10

183

2) В командной строке выберем ярлык «Данные», а в «Данных» - «Анализ данных». В «Анализе данных» выберем пункт «ковариация» и заполним диалоговое окно. В итоге получим нижеприведенную ковариационную матрицу, содержащую все коэффициенты ковариации для нашей исходной таблицы:

Ковариационная матрица оценок системы судей.

 

 

 

 

Николае

Василье

 

 

Иванов

Петров

Сидоров

в

в

Онищенко

 

 

 

 

 

 

 

 

6,20408

 

 

 

 

 

Иванов

2

 

 

 

 

 

 

 

 

 

 

 

 

 

7,20408

9,06122

 

 

 

 

Петров

2

4

 

 

 

 

 

 

 

 

 

 

 

 

7,26530

 

10,5306

 

 

 

Сидоров

6

9,55102

1

 

 

 

 

 

 

 

 

 

 

 

5,83673

7,12244

7,53061

 

 

 

Николаев

5

9

2

5,959184

 

 

 

 

 

 

 

 

 

 

6,16326

7,59183

8,04081

 

 

 

Васильев

5

7

6

6,469388

7,673469

 

 

 

 

 

 

 

 

 

6,36734

8,51020

9,30612

 

 

 

Онищенко

7

4

2

6,44898

6,693878

8,489796

 

 

 

 

 

 

 

Как видно коэффициенты ковариации трудно интерпретировать сточки зрения измерения силы связи между переменными модели. Именно поэтому ковариацию обычно используют как вспомогательную операцию.

Теперь, если поделить каждый коэффициент ковариации на произведение соответствующих стандартных отклонений, получим нормированные коэффициенты ковариации, которые

называются

коэффициентами

корреляции:

 

σx ×σy .

 

 

 

rx, y =

Kx, y

 

 

 

 

Коэффициенты

корреляции для

нашего примера

покажут

степень согласованности принимаемых судьями решений.

184

Прежде чем искать коэффициенты корреляции, найдем среднюю дисперсию, поскольку частные дисперсии нам уже известны, ибо расположены на главной диагонали ковариационной матрицы. Стандартное же отклонение (среднее квадратическое отклонение) – это корень квадратный из дисперсии или возведение дисперсии в степень 0,5. Сведем дисперсии и стандартные отклонения в таблицу:

D(x,y)

6,2

9,06

10,5

5,96

7,67

8,49

 

 

 

 

 

 

 

σx, y

2,49

3,01

3,24

2,44

2,77

2,91

Dx, y =7,97 ;σx, y =2,81 .

Среднее стандартное отклонение и частные стандартные отклонения являются мерой разброса данных вокруг среднего. Обычно, чем больше разброс, тем менее устойчивы данные, тем труднее по ним сделать более или менее точный прогноз.

Теперь найдем коэффициенты корреляции, которые покажут нам степень согласованности между принимаемыми судьями решениями (выносимыми приговорами) по сходным (а в нашем примере тождественным) уголовным делам. Ниже представлена корреляционная матрица. Она получена по тому же алгоритму, что и ковариационная с той лишь разницей, что вместо ковариации в диалоговом окне выбирается пункт «корреляция».

Корреляционная матрица системы оценок судей.

 

Иванов

Петров

Сидоров

Николаев

Васильев

Онищенко

 

 

 

 

 

 

 

Иванов

1

0,96

0,90

0,96

0,89

0,88

 

 

 

 

 

 

 

Петров

0,96

1

0,98

0,97

0,91

0,97

 

 

 

 

 

 

 

Сидоров

0,90

0,98

1

0,95

0,89

0,98

 

 

 

 

 

 

 

Николаев

0,96

0,97

0,95

1

0,96

0,91

 

 

 

 

 

 

 

Васильев

0,89

0,91

0,89

0,96

1

0,83

 

 

 

 

 

 

 

Онищенко

0,88

0,97

0,98

0,91

0,83

1

 

 

 

 

 

 

 

185

По главной диагонали корреляционной матрицы размером 6 на 6 коэффициент корреляции, естественно, везде равен единице, что соответствует реальности. Это означает полную согласованность собственных решений. Например, решения судьи Иванова согласуются с решениями судьи Иванова (с самим собой), решения судьи Петрова в полной мере согласуются с решениями судьи Петрова и т.д. Математический смысл такого согласования заключается в том, что коэффициент ковариации делится сам на себя (произведение одноименных стандартных отклонений дает нам исходную ковариацию).

Другие коэффициенты корреляции, не лежащие на главной диагонали, показывают степень согласованности, принимаемых решений разными парами судей. Отметим, что в целом решения судей положительно коррелированны, что говорит о неких общих принципах, лежащих в основе их мировоззрения, соблюдения ими законности и т.д. При наличии отрицательных корреляций об этом нельзя было бы говорить.

Наименее согласованными являются решения судей Онищенко и Васильева (r=0,83); Онищенко и Иванова (r=0,88); Иванова и Васильева (0,89); Васильева и Сидорова (0,89).

Определим степень согласованности решений судьи Иванова со всеми другими его коллегами, вычислив средний коэффициент корреляции (найдем среднее по первому столбцу, исключив из расчета согласие с самим собой (коэффициент корреляции

равный единице):

r

Иванов

=

0,96 + 0,90 + 0,96 + 0,89 + 0,88

= 0,92 .

 

 

 

 

5

 

186

Аналогичным образом вычислим согласованность решений каждого судьи и представим данные в таблице:

Таблица согласованности оценок в системе судей.

 

Степень

Судья

согласованности

 

 

Иванов

0,918

 

 

Петров

0,958

 

 

Сидоров

0,94

 

 

Николаев

0,95

 

 

Васильев

0,896

 

 

Онищенко

0,914

 

 

Среднее

0,929

 

 

Наиболее согласованными являются решения судьи Петрова (идеальный судья – судья, не допустивший ни одной ошибки). Его решения не согласуются с решениями других судей лишь на 4, 2%, и это несогласование в его пользу, поскольку именно его решениям должны были соответствовать решения других судей. В наихудшем положении оказываются Васильев (не согласуется 10,4% его решений), Онищенко (не согласуется 8,6% его решений) и Иванов (не согласуется 8,2% его решений).

Измерим среднюю согласованность решений судей, как среднюю арифметическую коэффициентов корреляции:

r

системы

=

0,918 + 0,958 + 0,94 + 0,95 + 0,896 + 0,914

= 0,929 .

 

 

 

6

 

Можно утверждать, что решения судей по типовым делам различаются в среднем на 8%.

Сведем в таблицу данные о несогласованности решений судей:

Таблица несогласованности решений в системе судей.

Судья

Несогласованность,

 

%

 

 

Иванов

8,2

 

 

Петров

4,2

 

 

Сидоров

6

 

 

Николаев

5

 

 

Васильев

10,4

 

 

Онищенко

8,6

 

 

187

Среднее 7

Зная среднюю степень согласованности решений судей можно было сразу измерить среднюю степень несогласованности, вычитая из единицы среднюю согласованность: 1-0,929=0,07 или 7%.

Ответим на последний вопрос задачи, найдем нормированную корреляционную функцию системы судей. Для этого усредним значения ковариационной матрицы по диагоналям (вдоль диагоналей). Очевидно, что среднее по главной диагонали равно единице ((1+1+1+1+1+1)/6=1).

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

0,96

 

 

 

 

 

 

 

 

 

 

 

 

1

0,98

0,9

 

 

 

 

 

 

 

 

 

 

 

1

0,95

0,97

0,96

 

 

 

 

 

 

 

 

 

 

1

0,96

0,89

0,91

0,89

 

 

 

 

 

 

 

 

 

1

0,83

0,91

0,98

0,97

0,88

 

 

 

 

 

 

 

Средне

 

 

0,917

 

 

 

е

1

0,936

5

0,95

0,93

0,88

 

 

 

 

 

 

 

По данным последней строки построим график нормированной корреляционной функции.

Нормированная

корреляционная

функция

наглядно

показывает степень

несогласованности

решений

судей в

 

 

 

188

зависимости от того, какой судья и по какому делу принимал решения.

Построим Гауссову кривую, приняв М[Y(X)]=-4,476; σ=2,81 в соответствии с условием задачи (то есть параметры Гауссова распределения взяты из системы оценок судей). Для этого в ППП

Excel на рабочий лист в первый столбец введем значения оценок от 0 до -10, например с шагом 0,2. Напротив нуля в соседнем столбце в ячейке поставим знак = и напишем русские буквы «НО», появится список функций, из которых выберем «НОРМРАСП(». В открывшейся скобке введем по порядку: 1) значения переменной оценок из первого столбца, встав курсором на первую ячейку данного столбца, и выделив курсором данный столбец до конца; 2) поставим точку с запятой, и введем значение математического ожидания (-4,476); 3) поставим точку с запятой, и введем значение стандартного отклонения (2,81); 4) в поле интегральная поставим значение нуль (0); 5) закроем скобку и нажмем клавишу «Enter» на клавиатуре. В ячейке появится первое значение плотности вероятности равное в нашем случае 0,039925; 6) встанем на это число курсором. В правом нижнем углу виден квадрат. Встанем на него курсором, и увидим, как появится крестик. Удерживая ЛКМ, протянем курсор вниз по всей длине соседнего ряда переменной Y. Столбец f(y) будет полностью заполнен; 7) выделим столбцы Y и f(y), в командной строке выберем «Вставка», а во вставке «точечная». В «точечной» возьмем любую удобную диаграмму», а также из конструктора диаграмм выберем удобный тип представления диаграммы.

189

Задача решена • Важно отметить, что степень согласованности в оценках

может измеряться не только с помощью линейного коэффициента корреляции, как это делали мы. Здесь можно использовать и другие коэффициенты корреляции. В частности, весьма удобным здесь будет коэффициент конкордации, поскольку позволяет сразу получить степень согласованности по всей системе судей.

Задача №2.

Дано: оценки в системе судей представленные в таблице размером 7 строк (оценки) на 6 столбцов (судьи):

Таблица №1. Исходные данные к задаче.

Иванов

Петров

Сидоров

Николаев

Васильев

Онищенко

-1

0

0

1

0

-2

0

-1

-3

0

-3

-4

-2

-3

-4

-2

-4

-5

-3

-4

-6

-3

-4

-7

-4

-6

-7

-3

-5

-9

-5

-7

-9

-4

-5

-10

-8

-9

-10

-7

-10

-10

190

Требуется: измерить степень согласованности в оценках судей с помощью коэффициента конкордации (МКРК – множественной корреляции ранговый коэффициент).

Решение:

Немного теории:

множественный коэффициент ранговой корреляции (МКРК) или коэффициент конкордации, обычно обозначаемый английской буквой W, применяется для измерения силы связи между произвольным числом переменных модели. Вычисляется МКРК в случае несвязанных (неповторяющихся) рангов по формуле:

W = 12G

m2 ×(N 3 - N ) , где m – число переменных модели, N – число

наблюдений (строк), G – отклонение суммы квадратов рангов от

средней квадрата рангов:

 

 

 

 

N

 

 

 

N

(åRxi + Ryi

+ Rzi

)2

 

G = å(Rxi + Ryi + Rzi )2

i=1

 

 

,

N

 

 

i=1

 

 

 

 

 

 

 

где Rxi – ранжированные значения по переменной икс; аналогично и

по переменным Y, Z и т.д., в зависимости от числа переменных

включенных в модель.

Статистическая значимость коэффициента конкордации проверяется с помощью критерия Пирсона χ2, для чего сначала нужно вычислить эмпирическое значение данного критерия, а потом сравнить его с табличным. Эмпирическое значение критерия Пирсона χ2 для коэффициента конкордации в случае несвязанных рангов вычисляется по формуле:

2

 

12G

χфакт

=

 

.

m × N ×(N -1)

191

В случае, если ранги связаны (повторяются), то применяется

W =

 

12G

 

m

 

скорректированная формула:

m2 × (N3

- N) - m × å(t3 - t) , где t – число

 

 

1

 

одинаковых рангов по каждому признаку (по каждой переменной).

Эмпирическое значение критерия Пирсона χ2

для

коэффициента конкордации

 

в случае

 

связанных

рангов

вычисляется по формуле:

χфакт

2

=

12G

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

m × N × (N -1) -

å(t3 - t)

.

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

N -1

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим задачу, связанную с применением МКРК.

Решение:

1). Наша таблица первичных статистических данных содержит сведения о шести переменных (m=6): оценки Иванова, Петрова, Сидорова, Николаева, Васильева, Онищенко. Обозначим переменные первыми буквами фамилий судей: И, П, С, Н, В, О.

Зададим исходные данные в ППП Excel:

 

A

 

B

 

 

C

 

 

 

D

 

 

E

 

 

F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

Иванов

Петров

 

Сидоров

 

 

Николаев

Васильев

Онищенко

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

-1

 

0

 

0

 

 

 

 

1

 

 

0

-2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

0

 

-1

 

-3

 

 

 

 

0

 

 

-3

-4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

-2

 

-3

 

-4

 

 

 

 

-2

 

 

-4

-5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

-3

 

-4

 

-6

 

 

 

 

-3

 

 

-4

-7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

-4

 

-6

 

-7

 

 

 

 

-3

 

 

-5

-9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

-5

 

-7

 

-9

 

 

 

 

-4

 

 

-5

-10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

-8

 

-9

 

-10

 

 

 

 

-7

 

 

-10

-10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

 

H

 

I

 

 

 

J

 

 

K

 

L

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Rп

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

1

 

1

 

1

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

2

 

2

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

3

 

3

 

3

 

 

3•

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

192