- •Элементы корреляционного анализа
- •Введение
- •Двумерная корреляционная модель
- •Проверка значимости истинного коэффициента корреляции
- •Интервальное оценивание коэффициента корреляции
- •Индивидуальные задания
- •Обозначения и наименования признаков:
- •Образец выполнения индивидуального задания
- •Библиографический список.
- •Приложение 1. Таблица Фишера-Йейтса (фрагмент).
- •Приложение 2. Таблица z-преобразований Фишера
- •Приложение 3. Таблица значений функции ф(t).
- •Элементы корреляционного анализа
- •1997., Протокол , и одобрены
- •654080, Новокузнецк, ул. Кирова,42.
Образец выполнения индивидуального задания
Методику вычисления выборочного коэффициента корреляции r, проверки значимости истинного (генерального) коэффициента корреляции r, построения доверительного интервала для r в случае его значимости рассмотрим на следующем примере.
Пример: На основании представленных в табл. 4 данных о выработке валовой продукции на одного работающего (X) и материалоемкости в стоимостном выражении (Y), полученных с n=15 однотипных предприятий, проверить при a=0,05 значимость коэффициента корреляции r; с надежностью g=0,95 найти интервальную оценку для r. Предполагается, что совместное распределение признаков (X,Y) подчиняется нормальному закону распределения.
Таблица 4
млн руб. |
6.0 |
4.9 |
7.0 |
6.7 |
5.8 |
6.1 |
5.0 |
6.9 |
6.8 |
5.9 |
5.0 |
5.6 |
6.0 |
5.7 |
5.1 |
% |
25 |
30 |
20 |
21 |
28 |
26 |
30 |
22 |
20 |
29 |
27 |
25 |
24 |
25 |
30 |
Для получения по формулам (2) точечных оценок генеральных средних, дисперсий, средних квадратических отклонений и коэффициентов корреляции результаты промежуточных вычислений удобно поместить в расчетную таблицу (таблица 5) .С целью контроля вычислений данные разбиты на пятерки, для каждой из которых в итоговой (выделенной) строке приводятся суммы элементов соответствующих строк. Сумма пяти элементов контрольного столбца должна совпадать с суммой элементов итоговой строки.
Так, например,
6.0+4.9+7.0+6.7+5.8=30.4
6.0+25+36.00+625+150.0=842
Контроль: 30.4+124+187.54+3150+740.1=842.00+1105.91+616.00+654.29+1013.84=4232.04
Таблица 5
X |
Y |
X2 |
Y2 |
X Y |
контроль |
1 |
2 |
3 |
4 |
5 |
6 |
6.0 4.9 7.0 6.7 5.8 |
25 30 20 21 28 |
36.00 24.01 49.00 44.89 33.64 |
625 900 400 441 784 |
150.0 147.0 140.0 140.7 162.4 |
842.00 1105.91 616.00 654.29 1013.84 |
30.4 |
124 |
187.54 |
3150 |
740.1 |
4232.04 |
6.1 5.0 6.9 6.8 5.9 |
26 30 22 20 29 |
37.21 25.00 47.61 46.21 34.81 |
676 900 484 400 841 |
158.6 150.0 151.8 136.0 171.1 |
903.91 1110.00 712.31 609.01 1081.81 |
30.7 |
127 |
190.84 |
3301 |
767.5 |
4417.04 |
5.0 5.6 6.0 5.7 5.1 |
27 25 24 25 30 |
25.00 31.36 36.00 32.49 26.01 |
729 625 576 625 900 |
135.0 140.0 144.0 142.5 153.0 |
921.00 826.96 786.00 830.69 1114.11 |
27.4 |
131 |
150.86 |
3455 |
714.5 |
4478.76 |
Далее составим таблицу итоговых строк (таблица 6).
Таблица 6
1 |
2 |
3 |
4 |
5 |
6 |
30.4 30.7 27.4 |
124 127 131 |
187.54 190.84 150.86 |
3150 3301 3455 |
740.1 767.5 714.5 |
4232.04 4417.04 4478.76 |
88.5 |
382 |
529.24 |
9906 |
2222.1 |
13127.84 |
Из последней строки итоговой таблицы получаем:
å x = 88,5 ; å y = 382 ;
å x2= 529,24 ; å y2= 9906 ; å xy = 2222,1 .
Следовательно, по формулам (2) :
Теперь можно найти точечную оценку парного коэффициента корреляции:
Для проверки значимости истинного (генерального) коэффициента корреляции r сформулируем статистическую гипотезу H0: r = 0. По условию уровень значимости a = 0, 05. По таблице Фишера-Йейтса (приложение 1) находим rтабл. (a = 0.05; n = n - 2 = 13) = 0.514.
Сравнение ½rнабл.½ = 0,90 и rтабл. = 0,514 свидетельствует о том, что гипотеза H0 : r = 0 отвергается (0,90 > 0.514 ) и, следовательно, коэффициент корреляции r значим.
Построим теперь с надежностью g =1 - a = 0,95 интервальную оценку для r с помощью z - преобразования Фишера (4). По таблице из положения 2 по найденному значению r = - 0,90 находим zr = -1,4722 , учитывая, что функция нечетная, т.е. z-r =-zr. По таблице значений интегральной функции Лапласа (приложение 3 ) из условия Ф(tg) = g / 2 = 0,95 / 2 = 0,475 находим tg=1,96 и по формуле (5) получаем интервальную оценку для MZ:
,
или, окончательно,
2,0380 £ MZ £ -0,9064.
Воспользовавшись таблицей z-преобразований Фишера, перейдем от z к r:
zmax = -0,906 , следовательно, rmax =-0,72;
zmin = -2,0380 , следовательно, rmin =-0,97.
По формуле (7) получаем искомый доверительный интервал для r:
0,97< r < -0,72
Таким образом, доказана тесная отрицательная взаимосвязь между выработкой валовой продукции на одного работающего и материалоемкостью в стоимостном выражении.