Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по теории статистики.doc
Скачиваний:
76
Добавлен:
12.03.2016
Размер:
1.24 Mб
Скачать

3. Показатели тесноты связи.

Теснота корреляционной связи может быть измерена эмпирическим корреляционным отношением э, когда2(межгрупповая дисперсия) характеризует отклонение групповых средних результативного признака от общей средней:.

Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения – теоретическое.

Теоретическое корреляционное отношение представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака, т. е. рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативного признака:

 = ,

где 2=;=Тогда=.

Изменение значения объясняется влиянием факторного признака.

В основе расчета корреляционного отношения лежит правило сложения дисперсий , где- отражает вариациюyза счет всех остальных факторов, кромеx, т. е. является остаточной дисперсией:

.

Тогда формула теоретического корреляционного отношения примет вид:

или.

Подкоренное выражение корреляционного отношения представляет собой коэффициент детерминации.

Корреляционное отношение может находиться в пределах от 0 до 1, т. е.

(0 1) Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.

Теоретическое корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.

Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи – линейный коэффициент корреляции:

гдеn– число наблюдений.

Для практических вычислений при малом числе наблюдений (n20-30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:

Он принимает значение в интервале : -1 r1. Отрицательные значения указывают на обратную связь, положительные - на прямую. Приr= 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, приr=1 связь – функциональная.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативными и несколькими факторными признаками, а также между каждой парой факторных признаков.

Множественный коэффициент корреляции вычисляется по формуле:

, где- дисперсия теоретических значений результативного признака, рассчитанная по уравнению множественной регрессии;- общая дисперсия результативного признака.

В случае оценки тесноты связи между результативным и двумя факторными признаками множественный коэффициент корреляции можно определить по формуле:

,

где r – парные коэффициенты корреляции между признаками., которые могут быть рассчитаны по следующим формулам:

;

;

.

4. Непараметрические методы оценки связи.

Методы корреляционного и регрессионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. Между тем в статистике приходиться сталкиваться с задачами измерения связи между качественными признаками. Такие методы измерения связи называются непараметрические.

Для исследования степени тесноты связи между качественными признаками, каждый из которых представлен в виде альтернативных признаков, может быть использован коэффициент ассоциации Д. Юла или коэффициент контингенции К. Пирсона. Расчетная таблица в этом случае состоит из четырех ячеек (таблица «четырех полей») и имеет следующий вид:

Признаки

А (да)

(нет)

Итого

B (да)

a

b

а + b

(нет)

c

d

c+d

Итого

a + c

b + d

n

Коэффициент ассоциации вычисляется по формуле:

.

Коэффициент контингенции:

.

Если по каждому из взаимосвязанных признаков выделяется число групп более двух то для подобного таблиц теснота связи между качественными признаками может быть измерена с помощью коэффициентов взаимной сопряженности К. Пирсона и А. А. Чупрова.

Коэффициент взаимной сопряженности Пирсона вычисляется по формуле:

, где2– показатель средней квадратической сопряженности, который вычисляется по формуле:

, где,.

Коэффициент Чупрова:

, где К1, К2– число групп по каждому из признаков.

Для определения тесноты связи как между количественными, так и между качественными признаками, при условии, что значение этих признаков могут быть проранжированы по степени убывания или возрастания, используется коэффициент корреляции рангов Спирмена:

,

где d – разность рангов признаковxиy;

n- число наблюдаемых единиц.

В случае отсутствия связи = 0. При прямой связи коэффициент- положительная правильная дробь, при обратной – отрицательная.

Если объём исходной информации небольшой, то необходимо выполнить проверку существенности рангового коэффициента, т. е. сверить с таблицей предельных значений. Расчетное значение должно быть больше предельного.

Для определения тесноты связи между произвольным числом ранжированных признаков применяется коэффициент конкордации:

,

где m– количество факторов;

n- число наблюдений;

S- отклонение суммы квадратов рангов от средней квадратов рангов.

Рассмотрим пример:

В результате обследования студентов факультета получены следующие данные:

Успеваемость

Количество студентов

Всего

Посещающих спортивные секции

Не посещающих спортивные секции

Удовлетворительная

220

60

280

Неудовлетворительная

10

30

40

Итого

230

90

320

Определите коэффициент ассоциации и контингенции между успеваемостью и посещаемостью спортивных секций.

Коэффициент ассоциации:

Коэффициент контингенции:

.

Полученные коэффициенты подтверждают наличие существенной связи между исследуемыми признаками. Однако коэффициент контингенции всегда меньше коэффициента ассоциации и дает более корректную оценку тесноту связи.