- •Элементы корреляционного анализа
- •Введение
- •Двумерная корреляционная модель
- •Проверка значимости истинного коэффициента корреляции
- •Интервальное оценивание коэффициента корреляции
- •Индивидуальные задания
- •Обозначения и наименования признаков:
- •Образец выполнения индивидуального задания
- •Библиографический список.
- •Приложение 1. Таблица Фишера-Йейтса (фрагмент).
- •Приложение 2. Таблица z-преобразований Фишера
- •Приложение 3. Таблица значений функции ф(t).
- •Элементы корреляционного анализа
- •1997., Протокол , и одобрены
- •654080, Новокузнецк, ул. Кирова,42.
Проверка значимости истинного коэффициента корреляции
Для проверки значимости истинного (генерального) коэффициента корреляции проверяется нулевая гипотеза H0: r = 0 против альтернативной H1: r ¹ 0. Если на выбранном уровне значимости a гипотеза H0 отвергается, то коэффициент корреляции r считается значимым и рассчитанное по выборке значение r может быть использовано в качестве его точечной оценки. Если коэффициент корреляции оказывается незначимым, т. е. гипотеза H0 не отвергается, то с вероятностью l = 1 - a признаки X и Y в генеральной совокупности считаются линейно независимыми (некоррелированными).
Доказано, что если верна гипотеза H0: r = 0, то статистика
( 3 )
имеет распределение Стьюдента с n = n - 2 степенями свободы. По таблице распределения Стьюдента были определены значения статистики tтабл. (a,n = n - 2) для a = 0.01 и a = 0.05 и рассчитаны соответствующие границы для r (таблицы Фишера - Йейтса, см. приложение 1).
Таким образом, для проверки гипотезы H0: r = 0 находят rтабл. (a, n = n - 2) и сравнивают его с rнабл., рассчитанным по выборочным данным (например, по формулам (2)). Еслиôrнабл.ô £ rтабл., то гипотеза H0 не отвергается на уровне значимости a; если ôrнабл.ô > rтабл., то гипотеза H0 не отвергается и, следовательно, коэффициент корреляции r значим.
Интервальное оценивание коэффициента корреляции
Если для двумерной корреляционной модели коэффициент корреляции r значим, то имеет смысл найти для него интервальную оценку (построить доверительный интервал). Плотность вероятности выборочного коэффициента корреляции имеет сложный вид, поэтому используют специально подобранные функции от выборочного коэффициента корреляции r, которые подчиняются хорошо изученным законам распределения, например нормальному закону. Чаще всего используют z - преобразование Фишера:
( 4 )
Таблицы преобразований Фишера приведены в приложении 2. Величина z при n > 10 распределена приблизительно нормально, причем
По таблице z - преобразования Фишера выборочного коэффициента корреляции r находят ему соответствующее zr и строят интервальную оценку для MZ:
( 5 )
где tl находят по таблице интегральной функции Лапласа (Приложение 3) из условия F (tl) = l / 2 для данного l = 1 - a. Таким образом получают доверительный интервал
zmin £ MZ £ zmax , ( 6 )
исходя из которого, с помощью таблиц z - преобразования Фишера получают интервальную оценку для r (по значениям z находят значения r):
rmin £ r £ rmax . ( 7 )
При выборе rmin и rmax следует учитывать, что z - функция нечетная.
Индивидуальные задания
По данным X и Y таблицы 3, соответствующим номеру вашего варианта, необходимо выполнить следующее:
Вычислить выборочный коэффициент корреляции r между X и Y.
Проверить значимость истинного коэффициента корреляции r с помощью таблицы Фишера - Йейтса ( приложение 1 ).
В случае, если r значим, найти для него интервальную оценку с помощью z - преобразования Фишера ( приложение 2 ).
Варианты задач для самостоятельной работы даны в таблице 2.
Таблица 2
Номер |
Признаки |
Номер |
Признаки |
Номер |
Признаки |
варианта |
|
варианта |
|
варианта |
|
1 |
Y1X1 |
10 |
Y2X1 |
19 |
Y3X1 |
2 |
Y1X2 |
11 |
Y2X2 |
20 |
Y3X2 |
3 |
Y1X3 |
12 |
Y2X3 |
21 |
Y3X3 |
4 |
Y1X4 |
13 |
Y2X4 |
22 |
Y3X4 |
5 |
Y1X5 |
14 |
Y2X5 |
23 |
Y3X5 |
6 |
Y1X6 |
15 |
Y2X6 |
24 |
Y3X6 |
7 |
Y1X7 |
16 |
Y2X7 |
25 |
Y3X7 |
8 |
Y1X8 |
17 |
Y2X8 |
26 |
Y3X8 |
9 |
Y1X9 |
18 |
Y2X9 |
27 |
Y3X9 |