Задание 4
Пусть в опыте наблюдается одновременно значения двух случайных величин Х, Y (двух признаков). В результате получена двухмерная выборка объема n=30 приведенная в таблице 4.
4.1. Вычислим выборочные средние Хср, Yср выборочные дисперсии Dx, Dy и среднеквадратические отклонения sxв, syв по каждому из признаков (признак X рассчитан в Задании 1 )
Xср=19 sx=9,856; Yср=667; sy=145,634
Выборочный коэффициент корреляции между наблюдаемыми случайными величинами вычислим по формуле:
, где
получим выборочное среднее произведение (XY)ср =13695,467 и коэффициент корреляции rВ= 0,712.
Таблица 4.
-
i
X
Y
i
X
Y
i
X
Y
1
23
512
11
25
746
21
12
699
2
17
659
12
18
673
22
34
972
3
36
815
13
20
678
23
31
820
4
10
594
14
38
874
24
14
630
5
19
678
15
22
713
25
10
590
6
22
714
16
25
743
26
12
610
7
6
426
17
21
700
27
9
450
8
14
503
18
14
763
28
23
720
9
2
487
19
5
743
29
12
512
10
34
543
20
35
1012
30
7
431
Построим прямую линейной среднеквадратической регрессии
Вычислим коэффициенты этой прямой и получим ее уравнение. Оно представляет собой линейное приближение уравнения регрессии и построено методом наименьших квадратов, т.е. сумма квадратов отклонения наблюдаемых в выборке точек (xi, yi) от соответствующих точек прямой (xi, (xi)) является минимальной среди всех возможных прямых. Построенная прямая приведена на рис. 4, на нем же приведены и точки выборки.
Рис.4.
4.2. Выборочный коэффициент корреляции rВ является случайной величиной, поэтому полученное на нашей выборке значение rВ = 0,712 может не отражать истинного значения коэффициента корреляции r(X,Y).
Проверим гипотезу о значимости выборочного коэффициента корреляции, это позволит судить о наличии корреляционной связи между признаками Х и Y. В качестве основной гипотезы возьмем предположение об отсутствии корреляции Н0={r=0}, допустим так же что двухмерная случайная величина (X,Y) имеет нормальное распределение. Примем за критерий случайную величину
Т=,
которая, при справедливости основной гипотезы, имеет распределение Стьюдента с n-2 степенями свободы. Тогда, задаваясь уровнем значимости ошибки II-рода (отвергнуть верную гипотезу) a4=0,01 и альтернативной гипотезой Н0={r0}, находим критические точки двухсторонней критической области из решения уравнения
P(t >tкр) =a4
Эти решения представляются обратным распределением Стьюдента и находятся из таблиц tкр=Ткр(a/2; n-2), например в [1,2 приложение 6]. Тогда критерий проверки основной гипотезы Н0 об отсутствии корреляции между X и Y состоит в следующем:
если tнабл £ tкр гипотеза принимается ( найденный коэффициент корреляции не значителен, случайно отличен от нуля),
если tнабл > tкр гипотеза отвергается (корреляция значительна )
В нашем примере tнабл =5,365, а tкр=Ткр(0,005,28)=2,76 и тогда согласно критерию гипотеза об отсутствии корреляции наблюдаемых случайных величин Х и Y отвергается, т.е. найденный выборочный коэффициент корреляции значим.