Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций за 3й семестр.doc
Скачиваний:
44
Добавлен:
20.09.2019
Размер:
1.71 Mб
Скачать

3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками

В статистике разработано много различных показателей, выражающих тесноту связей между явлениями и процессами, но каждый из них обладает своими преимуществами и недостатками. Наиболее распространенным из них является линейный коэффициент корреляции, но он показывает наличие тесноты связи только в случае, если зависимость между значениями показателей носит линейный характер. Если это не так, лучше пользоваться другими показателями. Показатель так называемого «корреляционного отношения» можно использовать в довольно широкой области, но предварительно необходимо построить уравнение регрессии, описывающее статистическую взаимосвязь между признаками X и Y, т.е. расчет этого показателя довольно сложен10.

Ранговый коэффициент корреляции может использоваться даже в том случае, если признаки нельзя выразить количественно, но можно проранжировать, то есть расположить по порядку. Существуют также особые способы измерения взаимосвязей между количественно не измеримыми признаками, которые мы рассмотрим ниже.

Линейный коэффициент корреляции рассчитывается по формуле:

В этой формуле и – средние значения признаков x и y, а и – соответственно средние квадратические отклонения. Из этой формулы легко выводятся другие формулы для расчета линейного коэффициента корреляции, например:

Или

Все эти формулы тождественны и дают один и тот же результат, но в разных случаях бывает удобнее пользоваться той или иной формулой. Первая и вторая формула наиболее удобны для запоминания, но расчет по последней формуле более прост.

Для расчета линейного коэффициента корреляции по последней из приведенных формул обычно строится вспомогательная таблица следующего вида (табл. 8.2).

Таблица 8.2

Вспомогательная таблица для расчета линейного коэффициента корреляции

x

y

Σ

В последней строке таблицы 8.2. рассчитываются суммы по столбцам.

Линейный коэффициент корреляции равен отношению суммы в последнем столбце таблицы к корню из произведения сумм в двух предшествующих столбцах.

Подчеркнем, что линейный коэффициент корреляции обладает следующим свойством: он всегда находится между –1 и 1, т.е. всегда –1 r 1.

Если при вычислениях вдруг обнаруживается, что коэффициент корреляции находится за пределами этих границ, значит, это просто ошибка в расчетах!

Чем ближе коэффициент корреляции к 1, тем более тесной является связь! При этом если r > 0, то связь прямая, а если < 0, то связь обратная.

Если | | ≥ 0,7, то связь считается более тесной, если | r | < 0,3, то связь отсутствует. Если 0,3 ≤ | r | ≤ 0,7, то наличие связи целесообразно проверить дополнительными методами.

Линейный коэффициент корреляции может не всегда показать наличие связи. В случае, если значения признаков нельзя измерить количественно, удобнее использовать ранговый коэффициент корреляции или специальные коэффициенты, используемые для оценки тесноты связи между качественными признаками. Если связь не является линейной, то в качестве критерия оценки тесноты связи удобнее всего использовать так называемое корреляционное отношение. Но для его расчета вначале необходимо построить так называемое уравнение регрессии11 (т.е. связи между признаками).

Линейный коэффициент корреляции и корреляционное отношение не являются универсальными показателями оценки тесноты связи. Их можно применять только в том случае, если изучаемые признаки можно измерить количественно.

При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий). Поэтому методы, основанные на их использовании, получили название параметрических методов оценки тесноты статистической связи.

Между тем в статистической практике приходится сталкиваться с задачами измерения взаимосвязей между качественными признаками, к которым параметрические методы анализа в их обычном виде не применимы. Статистической наукой разработаны методы, которые позволяют оценить тесноту взаимосвязи между явлениями, не используя при этом количественные значения признака, а значит, не рассчитывая и параметры распределения. Такие методы получили название непараметрических.

Одним из таких методов является расчет так называемого рангового коэффициента корреляции. Он может использоваться как в тех случаях, когда признаки измеримы количественно, так и в тех случаях, когда их нельзя измерить количественно, но можно проранжировать, то есть расположить их значения в порядке возрастания. Например, предположим, что при оценке тесноты связи между ростом и весом некоторой группы людей мы по каким-то причинам не смогли достать измерительные приборы (весы, ростомер и т.п.). Но мы можем выстроить этих людей по росту, определив, кто из них выше, а кто ниже, и одновременно определить, кто из них больше весит, усадив их на качели. Таким образом, мы можем проранжировать их рост и вес. Ранг – это порядковый номер значений признака, расположенных по их возрастанию. Если нам известны количественные значения соответствующих признаков, то в расчетах рангового коэффициента корреляции они все равно не понадобятся – нужно только определить ранг соответствующего значения.

Предположим, что мы расположили значения признаков x и y порядку и перенумеровали их, то есть присвоили каждому соответствующий порядковый номер или ранг. (Необходимо отметить, что одинаковым значениям присваивается одинаковый ранг!)

Обозначим ранг значения признака как px а ранг значения признака y как py

Формула для расчета рангового коэффициента корреляции имеет вид:

В этой формуле di – это разность рангов значений признаков x и y, то есть di= pxi- pyi

Для расчета рангового коэффициента корреляции удобно построить вспомогательную таблицу (табл. 8.3).

Таблица 8.3