- •ЛЕКЦИЯ
- •Понятия корреляции и регрессии впервые появились в работах К. Пирсона и Ф. Гальтона.
- •Определение. Если изменение одной величины влечет за собой изменение распределения другой величины, то
- •Определение. Если статистическая зависимость такова, что изменение одной величины влечет за собой изменение
- •Определение. Условным средним yx называют среднее арифметическое наблюдавшихся значений Y , соответствующих
- •Определение. Условным средним xy называют среднее
- •Определение. Уравнение yx y yx x x
- •Определение. Уравнение xy x xy y y
- •Замечание. Выборочный коэффициент корреляции rB − это оценка степени тесноты
- •Свойства выборочного коэффициента корреляции:
- •После нахождения выборочных уравнений линий регрессии следует проверить нулевую гипотезу об отсутствии линейной
- ••Пример. Дана корреляционная таблица. Найти выборочный коэффициент корреляции, выборочные уравнения регрессии на и
- •Решение. Сначала вычислим компоненты выборочных
- •Откуда получаем следующие значения:
- •Следовательно:
- •Наблюдаемое
- •САМОСТОЯТЕЛЬНО. По корреляционной таблице, приведенной ниже, найти выборочный коэффициент корреляции.
- •КОНЕЦ
После нахождения выборочных уравнений линий регрессии следует проверить нулевую гипотезу об отсутствии линейной корреляционной связи между переменными. Для этого выполняют следующие шаги:
1. Вычисляют наблюдаемое значение критерия
tнабл rB n 2 , который имеет распределение
1 rB2
Стьюдента с k n 2 степенями свободы.
2. |
Вычисляют |
по |
|
таблице |
(приложение 4) |
||
критическое |
значение критерия tкрит t 1 ;k , |
||||||
где − уровень значимости. |
|
||||||
3. |
Решение принимают после сравнения найденных |
||||||
значений. Если |
|
tнабл |
|
tкрит , то |
нулевая гипотеза |
||
|
|
отвергается, а это значит, что выборочный коэффициент корреляции значимо отличается от нуля и выявленная линейная корреляционная зависимость не является следствием случайного отбора переменных в выборку.
•Пример. Дана корреляционная таблица. Найти выборочный коэффициент корреляции, выборочные уравнения регрессии на и на . Проверить гипотезу об отсутствии линейной корреляционной связи между переменными.
yi |
20 |
23 |
26 |
29 |
32 |
|
xi |
||||||
|
|
|
|
|
||
|
|
|
|
|
|
|
47 |
11 |
5 |
|
|
|
|
|
|
|
|
|
|
|
57 |
2 |
13 |
7 |
|
|
|
|
|
|
|
|
|
|
67 |
|
1 |
6 |
3 |
|
|
|
|
|
|
|
|
|
77 |
|
|
6 |
6 |
6 |
|
|
|
|
|
|
|
|
87 |
|
|
|
4 |
6 |
|
|
|
|
|
|
|
Решение. Сначала вычислим компоненты выборочных
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
коэффициентов |
регрессии, |
|
а именно: |
|
|
|
|
|
|
xi ni |
, |
|||||||||||||||||||||||
|
|
|
x |
|
i 1 |
|
||||||||||||||||||||||||||||
|
|
|
n |
|||||||||||||||||||||||||||||||
|
|
|
|
|
l |
|
|
|
|
|
|
k l |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
y j nj |
|
|
|
|
|
|
xi y j nij |
|
|
|
|
|
|
|
|
xi2 ni |
|
|||||||||||||
|
y |
|
j 1 |
, |
|
|
xy |
|
i 1 j 1 |
|
|
|
|
|
|
|
|
|
, |
|
|
x2 |
|
i 1 |
|
, |
||||||||
|
|
n |
|
|
|
|
n |
|
n |
|||||||||||||||||||||||||
|
|
|
|
|
l |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y2j nj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
xy x y |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
y2 |
|
j 1 |
|
, |
r |
|
|
|
|
|
. Для |
этого |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
n |
|
|
B |
|
|
|
2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
x2 |
|
|
y2 |
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
x |
y |
|
|
|
|
|
|
|
расширим исходную таблицу следующим образом:
yi |
20 |
23 |
26 |
29 |
32 |
ni |
|
xi |
|||||||
|
|
|
|
|
|
||
47 |
11 |
5 |
|
|
|
16 |
|
57 |
2 |
13 |
7 |
|
|
22 |
|
67 |
|
1 |
6 |
3 |
|
10 |
|
77 |
|
|
6 |
6 |
6 |
18 |
|
87 |
|
|
|
4 |
6 |
10 |
|
nj |
13 |
19 |
19 |
13 |
12 |
n=76 |
Откуда получаем следующие значения:
x 47 16 57 22 67 10 77 18 87 10 64,89, 76
y 20 13 23 19 26 19 29 13 32 12 25,68, 76
xy 47 20 11 47 23 5 57 20 2 57 23 13 ... 87 29 4 87 32 6 1713,87, 76
x2 472 16 572 22 672 10 772 18 872 10 4396,37, 76
y2 202 13 232 19 262 19 292 13 322 12 675, 21, 76
x* |
|
4396,37 |
64,89 |
2 13,626 и |
*y |
|
675,21 |
25,68 2 |
3,968, |
r |
1713,87 64,89 25,68 0,8784, |
|||
B |
|
13,626 3,968 |
|
|
|
|
|
xy 0,8784 13,6263,968 3,02 и
yx 0,8784 13,6263,968 0,26.
Следовательно:
1) |
|
y |
|
|
|
|
|
|
|
|
|
− уравнение выборочной регрессии |
||
x |
|
|
64,89 |
3,02 |
y 25,68 |
|
||||||||
X на Y ; |
|
|
|
|
|
|
|
|
||||||
2) |
|
|
|
|
x |
|
|
|
|
|
|
− уравнение выборочной |
||
|
|
|
y |
|
25,68 |
0, 26 |
x 64,89 |
|
регрессии Y на X .
Выборочный коэффициент корреляции получился близким к единице, проверим, случайно это или нет.
Наблюдаемое |
значение |
критерия |
tнабл 0,8784 76 2 15,81. |
||||||
|
|
|
|
|
|
|
|
1 0,8784 2 |
|
Критическое |
значение |
tкрит t 1 0,05;74 1,99. |
Так как |
||||||
|
15,81 |
|
1,99, |
то |
гипотезу |
о |
случайности |
линейной |
|
|
|
корреляционной связи между переменными следует отбросить, т.е. коэффициент корреляции значимо отличается от нуля.