Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций за 3й семестр.doc
Скачиваний:
44
Добавлен:
20.09.2019
Размер:
1.71 Mб
Скачать

Вспомогательная таблица для расчета рангового коэффициента корреляции Спирмена

п/п

x

y

px

(ранг x)

py

(ранг y)

di= pxi- pyi

(разность рангов)

di2

Σ

-

Значения рангового коэффициента корреляции также расположены между «–1» и 1, как и линейного коэффициента корреляции, но обычно ранговый коэффициент измеряет тесноту связи более «грубо» (приближенно), чем линейный.

Сам по себе ранговый коэффициент Спирмена называют еще коэффициентом корреляции рангов, потому что формулу для его расчета можно вывести из обычной формулы для линейного коэффициента корреляции. Предположим, что мы проранжировали признаки X и Y, а потом рассчитали коэффициент корреляции между их рангами по формуле:

где pxi - ранг i-той единицы совокупности по переменной x;

pyi - ранг i-той единицы совокупности по переменной y;

- средний ранг по переменной x; - средний ранг по переменной y.

Известно, что сумма квадратов отклонений чисел натурального ряда от их средней величины равна (n3-n)/12. Так как ранги представляют собой ряд натуральных чисел, то = (n3-n)/12 и =(n3-n)/12 т.е. в знаменателе формулы стоит величина (n3-n)/12.

Преобразуя формулу рангового коэффициента корреляции, получаем:

= = + - 2 = 2×((n3-n)/12)- 2 =(n3-n)/6−2

Отсюда получаем, что = ((n3-n)/6− ): 2

И, следовательно,

Помимо коэффициента Спирмена в статистике используют также коэффициент корреляции рангов Кендэлла (τ), который рассчитывается по формуле:

Где n – число наблюдений, а S – сумма разностей между числом последовательностей и числом инверсий по второму признаку. Чтобы рассчитать этот коэффициент, выполняют несколько последовательных этапов:

  1. Значения X ранжируются в порядке возрастания или убывания;

  2. Значения Y располагаются в порядке, соответствующем значениям X;

  3. Для каждого ранга Y определяется число следующих за ним значений рангов, превышающих его величину. Сумма всех этих чисел (обозначается через P) определяется как мера соответствия последовательностей рангов по X и Y и учитывается со знаком (+);

  4. Для каждого ранга Y определяется число следующих за ним значений рангов, меньших его величины. Сумма этих чисел обозначается через Q и учитывается со знаком (-);

  5. Находится сумма баллов по всем членам ряда S = P-Q;

  6. Полученная сумма соотносится с максимально возможной, которая равна n(n-1)/2 в случае если в обоих рядах ранги следуют строго последовательно от 1 до n.

4.Способы оценки тесноты взаимосвязей между качественными признаками

Для оценки тесноты связи между двумя качественными признаками, которые нельзя даже проранжировать, используют другие методы. Пусть имеется два качественных признака x и y, которые нельзя измерить количественно, но можно определить, обладает ли данная статистическая единица данным признаком или нет. Условно можно считать, что каждый признак принимает только два возможных значения: 0 – если статистическая единица не обладает данным признаком; 1 – если статистическая единица обладает данным признаком.

Для измерения связи между такими признаками вначале строится так называемая таблица сопряженности, которая имеет форму, приведенную ниже:

Таблица 8.4

Таблица сопряженности между двумя альтернативными признаками

y

x

0

1

Σ

0

S(0,0)

S(0,1)

S(0,0)+ S(0,1)

1

S(1,0)

S(1,1)

S(1,0)+ S(1,1)

Σ

S(0,0)+ S(1,0)

S(0,1)+ S(1,1)

S

S = S(0,0) + S(0,1) + S(1,0) + S(1,1).

В этой таблице S – это общее число статистических единиц;

S(0,0) – это число статистических единиц, для которых х=0; у=0;

S(0,1) – это число статистических единиц, для которых х=0; у=1;

S(1,0) – это число статистических единиц, для которых х=1; у=0;

S(1,1) – это число статистических единиц, для которых х=1; у = 1.

Обозначим S(0,0) = a; S(0,1) = b; S(1,0); S(1,1).

На основе этой таблицы далее рассчитываются различные показатели.

Среди показателей, используемых для оценки тесноты связей качественных признаков, наиболее известны:

Коэффициент ассоциации:

Коэффициент контингенции:

Кроме того, в статистике разработаны и другие непараметрические методы оценки тесноты статистических взаимосвязей.

Коэффициент конкордации, например, используется не только для оценки связи между двумя факторами, но и между большим числом факторов, принимающих несколько различных значений..

Формула для расчета этого коэффициента имеет вид:

где m – количество факторов, n – число наблюдений (то есть известных значений каждого фактора), а S – сумма квадратов отклонений суммы рангов по m факторам от их средней арифметической.