Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
консп.-лек1-9TB.doc
Скачиваний:
75
Добавлен:
16.09.2019
Размер:
3.6 Mб
Скачать

7.2. Коэффициент корреляции и корреляционное отношение.

При изучении корреляционных связей возникают три основных вопроса: наличие связи, форма связи и сила связи. Ответы на эти вопросы могут быть получены с помощью коэффициента корреляции xy = M{[ x – M(x )][y – M(y)]}/ x y и корреляционного отношения y = M(y/x) / y, которые обладают следующими важными свойствами:

1. Если коэффициент корреляции xy равен плюс или минус единице, xy = 1, то между X и Y существует функциональная линейная связь вида y = ax + b.

2. Если xy = 0, между X и Y не может существовать прямолинейной корреляционной связи, но криволинейная связь возможна.

3. Чем ближе xy к 1, тем точнее и теснее корреляционная прямолинейная связь между X и Y . Она ослабевает с приближением xy к нулю.

4. Если корреляционное отношение y =0, то между X и Y нет корреляционной связи.

5. Если y = 1, то Y функционально зависит от Х, т.е. всякому допустимому значению Х соответствует одно определенное значение Y.

6. Чем ближе y к единице, тем теснее связь между переменными X и Y.

7. Если y = xy , то между переменными существует только линейная связь.

Коэффициент корреляции xy и корреляционное отношение y являются теоретическими параметрами. Их эмпирическими аналогами или оценками служат выборочный коэффициент корреляции rxy и выборочное корреляционное отношение y. Вычисление и анализ rxy и y составляют основу первого этапа анализа взаимосвязи между случайными величинами. Этот этап носит название корреляционного анализа. Затем проводится регрессионный анализ, основная цель которого- определение аналитического выражения взаимосвязи между исследуемыми переменными, т.е. уравнения регрессии.

7.3. Корреляционный анализ

Для вычисления коэффициента корреляции и корреляционного отношения предварительно составляются корреляционные таблицы. По характеру таблицы можно ориентировочно судить о наличии или отсутствии корреляционной связи между переменными. Например, по двум приведенным ниже таблицам можно сказать, что в первом случае такая связь может быть обнаружена, а во втором ее нет.

X

Y

1

2

3

4

X

Y

1

2

3

4

1

2

3

4

5

1

2

1

-

-

-

1

2

1

-

-

-

1

2

1

-

-

-

1

2

1

2

3

4

5

1

1

1

1

1

3

3

3

3

3

3

3

3

3

3

1

1

1

1

1

Имея корреляционную таблицу, в каждой клетке которой указана частота некоторой пары значений Х и Y вычисляют величину Сxy:

Cxy = nxy( x - )( y - )/n.

Величина Cxy носит название ковариации X и Y . Частное от деления величины Cxy на произведение средних квадратических отклонений величин Sx и Sy представляет собой выборочный коэффициент корреляции:

rxy = Cxy / Sx Sy.

Для упрощения вычислений ковариации Cxy, а также Sx и Sy можно пользоваться следующими формулами:

Cxy = ( x nxy y)/ n - ;

Sx = ;

Sy = ;

где nx и my - частоты соответствующих значений x и y. Корреляционное отношение y вычисляется по формуле:

y = S / Sy ;

где Sy - среднее квадратическое отклонение значений y от средней ,

S - среднее квадратическое отклонение значений частной средней x от общей средней , т.е.

S = .

Если на основании анализа коэффициента корреляции и корреляционного отношения установлено наличие прямолинейной корреляционной связи между Y и X, то эту связь можно выразить в виде следующего уравнения:

x - = ( rxy Sy / Sx )( x - ) = b ( x - ); (7.1)

где b = rxy Sy / Sx называется коэффициентом регрессии Y на X.

Уравнение (7.1) часто представляют в виде x = a + bx.

Если в результате расчета получено небольшое значение rxy, то может возникнуть вопрос, не случайно ли значение rxy отличается от нуля и не равен ли действительный коэффициент корреляции нулю. Этот вопрос разрешается сравнением численного значения rxy с Sr. Приближенно можно считать, что среднее квадратическое отклонение Sr коэффициента корреляции rxy численно равно

Sr = (1 - r ) / .

Когда действительное значение коэффициента корреляции rxy равно нулю, то

Sr= 1 / .

Поэтому, если

| rxy | / Sr = | rxy | 3 ,

то можно считать rxy значащим, а связь реальной, если же

| rxy | < 3 ,

то можно предполагать, что линейная связь между переменными отсутствует, но возможна криволинейная.