Задача 11
По выборке двухмерной случайной величины:
- вычислить точечную оценку коэффициента корреляции;
- вычислить интервальную оценку коэффициента корреляции (γ = 0,95);
- проверить гипотезу об отсутствии корреляционной зависимости;
- вычислить оценки параметров a0 и a1 линии регрессии;
- построить диаграмму рассеивания и линию регрессии.
Необходимая для выполнения задачи выборка, объемом 25 пар значений двумерной величины, содержится в индивидуальном задании студента.
Двумерная выборка:
( 0.43; -0.68) ( -0.83; -1.38) ( -2.22; -2.30) ( -0.94; -1.33) ( -2.06; -2.30)
( -1.74; -1.42) ( -1.01; -0.76) ( -0.25; -0.34) ( -0.18; -0.42) ( -2.69; -2.47)
( -1.44; 1.04) ( 0.49; -0.91) ( -1.78; -0.49) ( -1.91; -1.55) ( -1.40; -2.35)
( -0.60; -1.40) ( -0.52; 0.14) ( -1.76; -1.49) ( -0.28; -1.56) ( -1.38; 0.04)
( -1.05; -1.24) ( -2.73; -0.53) ( 1.76; 0.62) ( 1.40; -1.28) ( -3.33; -0.44)
Решение:
Для решения задачи удобно воспользоваться приведенной ниже таблицей. Значения в 3-ем, 4-ом и 5-ом столбцах вычисляются по формулам, приведенными в первой строке таблицы. В последней строке таблицы приведены средние арифметические значений каждого из столбцов. Таким образом получены:
-
оценки математических ожиданий по каждой переменной:
3,0876 (см. столбец 2),
2,516 (см. столбец 3);
-
оценки начальных моментов второго порядка по каждой переменной:
17,29498 (см. столбец 4),
12,85406 (см. столбец 5);
-
оценка смешанного начального момента второго порядка:
4,72216 (см. столбец 6).
Таблица 11.1
№ п/п |
x |
y |
x^2 |
y^2 |
х*у |
1 |
7,37 |
1,01 |
54,3169 |
1,0201 |
7,4437 |
2 |
3,78 |
1,49 |
14,2884 |
2,2201 |
5,6322 |
3 |
-0,81 |
5,07 |
0,6561 |
25,7049 |
-4,1067 |
4 |
0,55 |
3,42 |
0,3025 |
11,6964 |
1,881 |
5 |
3,32 |
0,68 |
11,0224 |
0,4624 |
2,2576 |
6 |
4,95 |
4,28 |
24,5025 |
18,3184 |
21,186 |
7 |
4,02 |
-3,23 |
16,1604 |
10,4329 |
-12,9846 |
8 |
2,22 |
-0,16 |
4,9284 |
0,0256 |
-0,3552 |
9 |
2,86 |
3,42 |
8,1796 |
11,6964 |
9,7812 |
10 |
5,43 |
-0,28 |
29,4849 |
0,0784 |
-1,5204 |
11 |
1,47 |
6,84 |
2,1609 |
46,7856 |
10,0548 |
12 |
5,24 |
0,45 |
27,4576 |
0,2025 |
2,358 |
13 |
5,59 |
1,59 |
31,2481 |
2,5281 |
8,8881 |
14 |
9,78 |
-0,46 |
95,6484 |
0,2116 |
-4,4988 |
15 |
-2,63 |
1,54 |
6,9169 |
2,3716 |
-4,0502 |
16 |
2,27 |
7,69 |
5,1529 |
59,1361 |
17,4563 |
17 |
6,13 |
5,42 |
37,5769 |
29,3764 |
33,2246 |
18 |
4,04 |
0,93 |
16,3216 |
0,8649 |
3,7572 |
19 |
4,24 |
3,19 |
17,9776 |
10,1761 |
13,5256 |
20 |
-0,59 |
6,88 |
0,3481 |
47,3344 |
-4,0592 |
21 |
-1,59 |
4,43 |
2,5281 |
19,6249 |
-7,0437 |
22 |
3,42 |
0,92 |
11,6964 |
0,8464 |
3,1464 |
23 |
2,83 |
2,77 |
8,0089 |
7,6729 |
7,8391 |
24 |
1,8 |
2,42 |
3,24 |
5,8564 |
4,356 |
25 |
1,5 |
2,59 |
2,25 |
6,7081 |
3,885 |
Среднее |
3,0876 |
2,516 |
17,29498 |
12,85406 |
4,72216 |
На основе этих данных легко вычислить оценки дисперсий:
8,0851;
6,7956
и оценку корреляционного момента
-2,9764
Вычислим точечную оценку коэффициент корреляции по формуле:
-0,4015.
Вычислим интервальную оценку коэффициента корреляции с надежностью γ = 0,95. Для этого в таблице функции Лапласа найдем значение, равное и определим значение аргумента, ему соответствующее: . Вычислим вспомогательные значения a, b:
Таким образом, доверительный интервал для коэффициента корреляции имеет вид
Проверим гипотезу об отсутствии корреляционной зависимости:
Так как объем выборки невелик (n < 50 ), то определим значение критерия t:
Из таблицы Стьюдента выбирается критическое значение
Так как , то гипотеза H0 принимается, т.е. величины X и Y некоррелированны.
Вычислим оценки параметров и линии регрессии:
Уравнение линии регрессии имеет вид:
Построим диаграмму рассеивания, изобразив значения исходной двумерной выборки в виде точек с координатами на плоскости в декартовой системе координат, и линию регрессии (рис. 11.1).
Рис. 11.1 Диаграмма рассеивания и линия регрессии