- •Часть 3
- •Лабораторная работа №3 Установление линейной корреляционной связи между двумя случайными величинами
- •§ 1.1. Краткие теоретические сведения
- •§ 1.2 План выполнения работы и алгоритм расчетов
- •§ 1.3 Образец выполнения лабораторной работы. «Установление линейной корреляционной связи между двумя случайными величинами».
- •§1.4 Контрольные вопросы
- •§ 1.5 Варианты заданий к лабораторной работе № 3
- •Рекомендуемая литература
- •Содержание
§ 1.3 Образец выполнения лабораторной работы. «Установление линейной корреляционной связи между двумя случайными величинами».
X |
Y |
Производительность труда на одного рабочего (%)
|
Годовая продукция на одного рабочего
(млн. руб) |
Таблица 1.
X |
Y |
X |
Y |
X |
Y |
X |
Y |
X |
Y |
5 |
4 |
15 |
12 |
25 |
12 |
15 |
16 |
55 |
16 |
15 |
8 |
5 |
12 |
25 |
8 |
35 |
16 |
45 |
20 |
15 |
12 |
25 |
12 |
65 |
24 |
45 |
20 |
55 |
16 |
15 |
16 |
25 |
4 |
35 |
12 |
35 |
12 |
45 |
20 |
35 |
12 |
25 |
8 |
35 |
12 |
45 |
16 |
55 |
16 |
15 |
12 |
25 |
8 |
35 |
12 |
35 |
12 |
55 |
20 |
35 |
12 |
25 |
4 |
45 |
16 |
45 |
20 |
55 |
20 |
15 |
12 |
25 |
12 |
35 |
12 |
55 |
16 |
55 |
20 |
35 |
16 |
25 |
16 |
45 |
16 |
55 |
16 |
55 |
24 |
5 |
4 |
25 |
8 |
35 |
12 |
45 |
20 |
55 |
20 |
1.Исходные данные сгруппируем в виде корреляционной таблицы 2.
Таблица 2.
Y |
X |
|
||||||
5 |
15 |
25 |
35 |
45 |
55 |
65 |
||
4 |
2 |
|
2 |
|
|
|
|
4 |
8 |
|
1 |
4 |
|
|
|
|
5 |
12 |
1 |
4 |
3 |
9 |
|
|
|
17 |
16 |
|
2 |
|
2 |
3 |
5 |
|
12 |
20 |
|
|
1 |
|
5 |
4 |
|
10 |
24 |
|
|
|
|
|
1 |
1 |
2 |
|
3 |
7 |
10 |
11 |
8 |
10 |
1 |
50 |
2. Для предварительной оценки формы связи построим точки с координатами: (5;4), (5;12), (15;8),(15;12), (15;16), (25;4), (25;8),(25;12),(25;20),(35;12),(35;16),(45;16),(45;20),(55;16),(55;20),(55;24),(65;24).
Отметить в прямоугольной системе координат XОY точки с данными координатами, не соединяя их
Точки группируются около некоторой прямой, поэтому связь между X и Y можно предположительно считать линейной.
3. Произведем промежуточные вычисления, т.е. найдем , , , .
Для упрощения расчетов перейдем к условным вариантам и найдем соответствующие характеристики: , , , .
В корреляционной таблице 1 найдем наибольшую частоту: .
Тогда =35, =12, =15-5=10, =8-4=4.
;
Запишем корреляционную таблицy 2 в условных вариантах, дополнив ее новыми строками и столбцами
Таблица 3.
V |
U |
|
|
|
|
||||||
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
|||||
-2 |
6 2 |
|
2 2 |
|
|
|
|
4 |
-8 |
16 |
16 |
-1 |
|
2 1 |
1 4 |
|
|
|
|
5 |
-5 |
5 |
6 |
0 |
0 1 |
0 4 |
0 3 |
0 9 |
|
|
|
17 |
0 |
0 |
0 |
1 |
|
-2 2 |
|
0 2 |
1 3 |
2 5 |
|
12 |
12 |
12 |
9 |
2 |
|
|
-2 1 |
|
2 5 |
4 4 |
|
10 |
20 |
40 |
24 |
3 |
|
|
|
|
|
6 1 |
9 1 |
2 |
6 |
18 |
15 |
|
3 |
7 |
10 |
11 |
8 |
10 |
1 |
N=50 |
∑=25 |
∑=91 |
∑=70 |
|
-9 |
-14 |
-10 |
0 |
8 |
20 |
3 |
∑=-2 |
|
|
↑ Контроль |
|
27 |
28 |
10 |
0 |
8 |
40 |
9 |
∑=122 |
|
|
|
|
12 |
-2 |
6 |
0 |
13 |
32 |
9 |
∑=70 |
←Контроль |
|
|
Заполнение таблицы 2.
Она заполняется в соответствии с символьными выражениями в заглавиях строк(столбцов).
Например =-8 получается умножением =4 на V=-2.
Значение =16 получается умножением =-8 на V=-2.
Аналогично по столбцам значение =-9 получается умножением =3 на U=-3.
Символы ∑ означают сумму найденных значений. Например ∑=25 получается суммированием значений : -8+(-5)+12+20+6=25;
∑=-2 получается суммированием значений : -9+(-14)+(-10)+0+8+20+3 =-2
Для вычисления удобно сначала вычислить произведения , которые записываются в верхний угол каждой клетки таблицы, которая содержит частоту . Например 6 = и т.д.
Полученные таким образом произведения , умножают на соответствующие частоты и результаты складывают отдельно по строкам и столбцам.
Например для столбца значение 16 = . И так далее.
Аналогично для строки например значение 6= . И так далее.
Полученные числа суммируют и по строкам и по столбцам, результаты должны совпадать.
Действительно:
12+(-2) + 6 + 0+ 13 + 32 + 9=16 + 6 + 0 + 9 + 24+15 = 70 Итак, промежуточные вычисления в условных вариантах:
4.Подсчитаем выборочный коэффициент линейной корреляции rв по формуле:
Значение rв =0,95, следовательно корреляционная связь между случайными величинами Х и Y сильная. Знак rв положительный, следовательно связь прямая.
5. Подсчитаем возможную ошибку
Найдем по таблице Стьюдента значение критерия ,
Число степеней свободы находится по формуле k = n-2 =200 – 2 = 198, a уровень значимости α примем равным 0,05. Значение = 1,64.
Тогда доверительный интервал для линейного коэффициента генеральной совокупности будет иметь вид:
0,92 < <0,98 или (0,92; 0,98).
Найденный интервал указывает на то, что при повторении опытов в 95 случаях их 100 истинное значение коэффициента линейной корреляции генеральной совокупности будет заключено в интервале (0,92; 0,98).
Установим значимость
Вычислим tнабл =
Сравним tнабл и tкрит
Так как 47,5 > 2,01 то вычисленное значение гв отличается от нуля значимо и, следовательно, с вероятностью 0,95 можно утверждать, что изучаемые случайные величины линейно коррелированны.
Найдем коэффициенты линейной регрессии.
Для этого перейдем от условных вариантов к исходным:
σx = 1,56*10=15,6 σy= 1,25*4=5.
Запишем уравнения линейной регрессии:
или после преобразований
- уравнение линейной регрессии Y на X
уравнение линейной регрессии X на Y.
Построим график эмпирической и теоретической линий регрессии. Наглядно убедимся в отсутствии грубой ошибки при определении существующей в генеральной совокупности связи между X и Y как линейной корреляционной связи.
Для этого соединим отрезками прямых точки с координатами: (5; 6,7), (15; 12,6), (25; 9,6), (35; 12,7), (45; 18,5), (55; 18,4), (65; 24). Получим ломаную линию (эмпирическую линию регрессии)
и по уравнению построим прямую(теоретическую линию регрессии), в одной и той же системе координат.
Построить график с двумя линиями. Ввиду простоты выполнения данного задания график не представлен.
Теоретическая линия регрессии хорошо согласуется с эмпирической линией регрессии.
11. Произведем содержательную интерпретацию результатов
корреляционного анализа.
Между производительностью труда и средней годовой продукцией на рассматриваемом этапе развития производства существует тесная прямая линейная корреляционная связь (rв=0,71). Это можно утверждать с вероятностью 0,95.
Доверительный интервал имеет вид (0,51 ; 0,91). Это означает, что в исследуемых условиях производства влияние производительности труда на годовую продукцию составляет от 51% до 91%. Это будет наблюдаться в 95 случаях из 100.
12. Произведем содержательную интерпретацию результатов
регрессионного анализа.
Уравнение характеризует как в среднем годовая продукция зависит от производительности труда. Коэффициент линейной регрессии ( ) говорит о том, что, если производительность труда увеличить в среднем на 1 тонну, то годовая продукция возрастет в среднем на 0,23 млн. рублей.
Уравнение характеризует то, как в среднем производительность труда зависит о величины годовой продукции. Если годовую продукцию в среднем необходимо увеличить на 1 млн. рублей, то производительность труда необходимо увеличить в среднем на 2,22( ).