Кореляційний аналіз
Якщо елімінування застосовують для оцінки взаємозв’язків функціонально-залежних величин, то для характеристики взаємозв’язків випадкових величин використовують кореляційно-регре-сійний аналіз.
Кореляційно-регресійний аналіз дозволяє кількісно оцінити тісноту зв’язку між випадковими величинами і ступінь впливу факторів на узагальнений показник (кінцевий результат ). Кореляція між двома величинами називається парною, а між багатьма – множинною.
Тісноту зв’язку між двома факторами характеризує коефіцієнт парної кореляції, який визначається за такою формулою:
r = , (3.7)
де - середнє значення добутку випадкових величин;
- середні значення величин х і у;
- середньоквадратичні відхилення випадкових величин.
Коефіцієнт кореляції змінюється від –1 до 1. Якщо коефіцієнт кореляції дорівнює 1, то між величинами існує пряма функціональна залежність, при коефіцієнті –1 - обернена функціональна залежність, при коефіцієнті рівному 0 залежність відсутня.
Зв’язок між багатьма факторами визначається коефіцієнтом множинної кореляції:
, (3.8)
де r –коефіцієнти парної кореляції, обчислені за формулою (3.7).
Взаємозв’язок між випадковими величинами характеризує рів-няння регресії. Якщо між величинами передбачається прямоліній-на залежність, то її відображають рівнянням лінійної регресії (рів-нянням прямої):
Таблиця 3.3. Допоміжна таблиця
для розрахунку коефіцієнтів рівняння регресії
х1 |
х2 |
х1х2 |
х12 |
х22 |
у |
ух1 |
ух2 |
30 |
29 |
870 |
900 |
841 |
28 |
840 |
812 |
36 |
38 |
1368 |
1296 |
1444 |
48 |
1728 |
1824 |
42 |
39 |
1638 |
1764 |
1521 |
64 |
2688 |
2496 |
47 |
42 |
1974 |
2209 |
1764 |
80 |
3760 |
3360 |
56 |
46 |
2576 |
3136 |
2116 |
100 |
5600 |
4600 |
60 |
52 |
3120 |
3600 |
2704 |
116 |
6960 |
6032 |
66 |
55 |
3630 |
4356 |
3025 |
144 |
9504 |
7920 |
∑=337 |
301 |
15176 |
17261 |
13415 |
580 |
31080 |
27044 |
Звідки с = 0,929.
Підставимо значення с в перше рівняння другої системи і вирішивши його одержимо b = 2,431.
Підставимо значення b i c в перше рівняння першої системи знаходимо а = -74,101
Таким чином, вихід валової продукції рослинництва В від площі посівів F і наявності основних засобів виробництва S можна підрахувати за таким рівнянням:
B = 2,431F + 0,929S – 74,101
Задача 3
Витрати на ремонт і технічне обслуговування тракторів
Т-150К по рокам експлуатації в середньому склали 711,00; 1058,50; 1461,91; 1853,84; 1913,79; 1989,40; 2379,16; 2499,26 грн. Обчислити прогноз витрат на ремонт і технічне обслуговування трактора Т-150К на 10 рік служби.
Навіть без побудови графіка видно, що між витратами на ремонт і технічне обслуговування і строком служби існує нелінійна
Задача 2
В таблиці 3.2 наведені дані групування фермерських господарств за виходом валової продукції рослинництва. Скласти рівняння регресії залежності виходу валової продукції рослинництва від площі посівів і забезпеченості основними засобами виробництва.
Таблиця 3.2. Групування фермерських
господарств за виходом валової продукції рослинництва
Кількість господарств |
Площа посівів, га |
Основні засоби виробництва, тис. грн. |
Вихід продукції рослинництва, тис. грн. |
10 |
30 |
29 |
28 |
13 |
36 |
38 |
48 |
25 |
42 |
39 |
64 |
18 |
47 |
42 |
80 |
23 |
56 |
46 |
100 |
10 |
60 |
52 |
116 |
9 |
66 |
55 |
144 |
Складемо допоміжну таблицю для обчислення коефіцієнтів рівняння регресії і розв’яжемо систему рівнянь (3.13).
580 = 7а + 337b + 301c
31080 = 337a + 17261b + 15176c
27044 = 301a + 15176b + 13415c
Поділивши на коефіцієнти при а і віднявши від другого і третього рівняння перше одержимо систему з двох рівнянь.
9,369 = 3,077b + 2,033c
6,99 = 2,276b + 1,568c
Поділивши на коефіцієнти при b і віднявши від другого рівняння перше одержимо 0,026 = 0,028с.
y = а + bx, (3.9)
де а,b – коефіцієнти рівняння регресії.
Значення коефіцієнтів а,b знаходять методом найменших квадратів. Цей метод передбачає, що сума квадратів відхилень фактичних значень функціональної ознаки від значень, одержаних за рівнянням регресії, повинна бути мінімальною:
∑( уі - )2 → min (3.10)
Для лінійної залежності (3.9) параметри а,b визначають вирі-шуючи систему рівнянь:
∑у = nа + b∑x;
∑yx = a∑x + b∑x2, (3.11)
де n – число членів в кожному рядку.
Якщо вивчають вплив декількох факторів і передбачається лінійна кореляція, то рівняння регресії буде такого типу:
yх1,х2 = а + bx1 + cx2 (3.12)
і параметри а,b,c підраховуються теж методом найменших квадратів вирішенням наведеної нижче системи рівнянь (3.13). Потім обчислюється коефіцієнт множинної кореляції за формулою (3.8):
∑у = na + b∑x1 + c∑x2
∑ух1 = а∑х1 + b∑x12 + c∑x1x2 (3.13)
∑yx2 = a∑x2 + b∑x1x2 + c∑x22
Якщо передбачається нелінійна кореляційна залежність, тоді рівняння регресії буде поліномом вищого ступеня:
ух = a + bx + cx2 (3.14)
і система рівнянь для визначення коефіцієнтів a,b,c буде такою:
∑у = nа + b∑x + c∑x2
∑yx = a∑x + b∑x2 + c∑x3 (3.15)
∑yx2 = a∑x2 + b∑x3 + c∑x4
Для вирішення системи рівнянь необхідно складати допоміжні таблиці з величинами у, ух, х, х2, х3, х4 і т.д.
Розглянемо приклади застосування кореляційного аналізу.