Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
17
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

298

Розділ 6

Умови мінімізації суми квадратів відхилень приводять до наступних виразів:

З цих виразів можна отримати систему

рівнянь з

не-

відомими, розв’язання якої надає значення , ,

, .

 

Розглянемо знаходження числових значень коефіцієнтів для випадку квадратичної залежності між змінними величинами, яка описується тричленним поліномом

. (6.12)

Візьмемо частинні похідні функції найменших квадратів F і прирівняємо їх до нуля:

(6.13)

В результаті отримаємо систему нормальних рівнянь, які після нескладних перетворень приймуть вигляд:

(6.14)

Апроксимація зв’язків однофакторними регресійними моделями

299

Розв’язуючи отриману систему лінійних рівнянь будь-яким відомим методом, знаходимо параметри полінома , та .

Запис і опрацювання вихідних даних зручно виконувати в табличній формі такого вигляду

Номер

спостереження

1

2

Підсумок

Гіперболічна залежність має вигляд

. (6.15)

Систему нормальних рівнянь для визначення коефіцієнтів методом найменших квадратів можна записати у вигляді:

(6.16)

Степенева залежність має вигляд

. (6.17)

Для визначення параметрів цієї залежності попередньо проводять лініювання (спрямлення) кривої. Для цього необхідно взяти логарифм від правої та лівої частин залежності, в результаті чого отримаємо такий вираз

. (6.18)

300

Розділ 6

 

 

 

 

Шукані невідомі коефіцієнти рівняння регресії можна визначити за

формулами:

 

 

 

 

 

 

 

;

,

 

 

(6.19)

де

 

 

 

;

 

 

 

 

;

 

 

 

 

 

.

 

 

 

 

 

В результаті обчислень коефіцієнт

отримуємо одразу, а для зна-

ходження коефіцієнта

необхідно потенціювати вираз

.

 

Логарифмічна залежність має вигляд

 

 

 

 

 

 

.

 

 

(6.20)

Графічна інтерпретація логарифмічної функції в залежності від

значення основи логарифму має вигляд, показаний на рис. 6.3.

 

 

Для отримання невідомих параметрів логарифмічної регресійної за-

лежності необхідно прологарифмувати результати спостережень по х і,

розглядаючи їх як незалежні змінні, визначити параметри регресійної

 

 

залежності

 

та

методом

 

 

найменших квадратів.

 

 

 

 

Розрахункові

формули

для

 

 

визначення параметрів

та

 

 

мають вигляд:

 

 

 

 

 

 

;

 

,

 

 

 

де складові

обчислюються

за

 

 

формулами:

 

 

 

 

Рис. 6.3. Графіки логарифмічних

 

 

 

 

 

функцій

 

 

 

 

 

 

Апроксимація зв’язків однофакторними регресійними моделями

301

;

.

6.2.3. Оцінка точності апроксимації. Для лінійної регресійної за-

лежності точність апроксимації оцінюється за допомогою коефіцієнта кореляції . Оцінка точності апроксимації нелінійними залеж-

ностями здійснюється за допомогою теоретичного кореляційного відношення

,

(6.21)

де – середнє вибіркове значення залежної змінної.

Якщо , то нелінійна залежність точніше апроксимує зв’язок між показниками процесу; для лінійної моделі регресії .

Додатковою оцінкою точності апроксимації для нелінійних залеж-

ностей є середня відносна похибка апроксимації

. (6.22)

6.2.4. Аналіз рівняння регресії.

Оцінка значимості коефіцієнтів регресії. При апроксимації кореляційної залежності отримують лінію регресії, яка відповідає тільки частковій вибірці, тобто тим даним, що були використані при статистичному опрацюванні. Для розповсюдження цієї залежності на генеральну сукупність необхідно оцінити значення коефіцієнтів регресії, бо може статися, що за умови дійсний коефіцієнт, який відо-

бражає генеральну сукупність . У цьому випадку виконувати прогнози за отриманою регресійною залежністю не можна.

Перевірка значимості коефіцієнтів лінійної регресії здійснюється за допомогою критерію Стьюдента за таким алгоритмом.

302

Розділ 6

1. Визначають розрахункове значення t-критерію Стьюдента за формулою

. (6.23)

2.Знаходять кількість ступенів вільності .

3.Задаються рівнем значимості (зазвичай приймають ).

4.Із таблиці критичних точок розподілу Стьюдента (додаток Д6) за

значеннями

і знаходять критичне значення

.

5. Якщо

, то коефіцієнт

слід вважати значимим.

Оцінка значимості (адекватності) рівняння регресії. Зна-

чимість рівняння регресії визначається можливістю надійно прогно-

зувати середні значення залежної змінної у за заданими значеннями незалежної змінної х.

Оцінку значимості рівняння регресії виконують в такій послідовності. 1. Обчислюють дисперсію фактичних значень залежної змінної

. (6.24)

2. Обчислюють залишкову дисперсію, що характеризує ступінь розсіяння фактичних значень у відносно розрахункових за отриманим регресійним рівнянням

,

(6.25)

де – кількість параметрів в рівнянні регресії (для однофактор - ної моделі ).

3. Розраховують значення F-критерію Фішера за формулою

Апроксимація зв’язків однофакторними регресійними моделями

303

.

(6.26)

4. Визначають кількості ступенів вільності за формулами

;

.

5.Задаються рівнем значимості .

6.За таблицею критичних точок розподілу Фішера (додаток Д8) для значень , та знаходять табличне значення F-критерію .

7.Якщо , то рівняння регресії вважається значимим,

тобто краще описує процес, ніж середнє значення досліджуваного показника, і може бути застосоване для математичного опису і аналізу досліджуваного транспортно-технологічного процесу.

Приклад 1. Встановити залежність для характеристики зв’язку між вантажообігом (у тонно-кілометрах) у розрахунку на один автомобіль автотранспортного підприємства (АТП) і загальним річним обсягом перевезень (тис. т). У табл. 6.1 наведені статистичні дані результатів обстеження n = 30 автотранспортних підприємств.

 

 

 

 

 

 

 

 

Таблиця 6.1

 

Облікові дані про річний обсяг перевезень та вантажообіг,

 

виконаний автомобілями на автотранспортних підприємствах

 

 

 

 

 

 

 

 

 

 

 

Річний

 

Вантажо-

 

Річний

 

Вантажо-

Номер

обсяг

 

Номер

обсяг

 

 

обіг

,

 

обіг ,

АТП

перевезень

АТП

перевезень

т-км/авт.

т-км/авт.

 

, тис.

т

 

, тис.

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1,3

 

7,4

 

16

6,2

 

10,6

 

2

3,9

 

10,3

 

17

5,3

 

13,6

 

3

2,2

 

11,6

 

18

4,6

 

13,5

 

4

4,4

 

12,7

 

19

1,5

 

8,6

 

5

2,3

 

8,7

 

20

2,8

 

10,6

 

6

3,3

 

10,4

 

21

6,2

 

11,6

 

7

3,7

 

12,5

 

22

6,0

 

12,5

 

8

5,8

 

13,7

 

23

4,2

 

12,3

 

9

2,6

 

10,7

 

24

4,2

 

11,6

 

10

3,8

 

10,3

 

25

2,4

 

7,4

 

11

3,1

 

10,5

 

26

2,4

 

9,7

 

12

4,0

 

12,8,

 

27

4,7

 

12,0

 

13

4,7

 

12,3

 

28

4,5

 

12,4

 

14

6,0

 

13,6

 

29

3,0

 

8,5

 

15

8,0

 

13,1

 

30

7,5

 

14,7

 

304

Розділ 6

Розв’язок.

1. Встановлення наявності кореляційного зв’язку. Наявність кореляції вста-

новлюємо візуально на основі поля кореляції. Для побудови поля кореляції увесь діапазон зміни функції у і аргументу х розбиваємо на т = 8 інтервалів і визначаємо їх ширину:

;

.

Для подальших розрахунків приймаємо , .

Будуємо координатну сітку (рис. 6.4) і на неї наносимо точки у відповідності з таблицею вихідних даних. За зовнішнім виглядом отриманого кореляційного поля робимо висновок, що між досліджуваними величинами існує кореляційний зв’язок.

14

 

 

 

 

 

 

 

13

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

11

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

7

0

1

2

3

4

5

6

7

Рис. 6.4. Поле кореляції, емпірична та теоретична лінії регресії

2. Визначення форми зв`язку. Попередню форму зв’язку визначаємо на основі графіка ескізної функції, який представляє собою емпіричну лінію регресії у по х. Для її побудови вихідні дані представляємо у формі кореляційної таблиці (табл. 6.2).

 

 

Апроксимація зв’язків однофакторними регресійними моделями

305

 

 

 

 

 

 

 

 

 

 

 

Таблиця 6.2

 

 

 

 

 

Кореляційна таблиця

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Середина

 

 

 

 

 

 

 

 

 

 

 

 

 

інтервалу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1–2

 

2–3

3–4

4–5

5–6

6–7

7–8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

– 15

14,5

 

 

 

 

 

 

 

1

1

 

13

– 14

13,5

 

 

 

 

1

3

 

1

5

 

12

– 13

12,5

 

 

 

2

4

1

 

 

7

 

11

– 12

11,5

 

 

1

 

2

 

1

 

5

 

10

– 11

10,5

 

 

2

4

 

 

1

 

7

 

 

9 – 10

9,5

 

 

1

 

 

 

 

 

1

 

8

– 9

8,5

1

 

1

1

 

 

 

 

3

 

7

– 8

7,5

1

 

1

 

 

 

 

 

2

 

 

 

 

 

2

 

6

7

7

4

2

2

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Використовуючи кореляційну таблицю, за формулою (6.3) розраховуємо ординати для кожного інтервалу ознаки х :

;

;

; ;

; ;

.

Із середини інтервалів факторіальної ознаки уявно відкладаємо значення розра-

хованих середньозважених ординат

і в центрі відповідної клітини ставимо точки

(позначені прозорими точками). Позначки послідовно з’єднуємо відрізками прямих ліній і отримуємо ламану лінію емпіричної регресії у по х . Вона показує, як зміщуються ряди розподілу функції при зміні аргументу, або як у середньому змінюється у при зміні х. Отримана лінія емпіричної регресії не дає змогу однозначно визначити форму регресійної залежності.

3. Визначення щільності зв’язку. Оскільки вид зв’язку між змінними у та х невідомий, то необхідно обчислити за даними заданої вибірки значення коефіцієнта вибіркової кореляції та вибіркового кореляційного відношення. Коефіцієнт парної кореляції обчислюємо за формулою (5.12), розрахунок окремих складових поданий в табл. 6.3.

306

Розділ 6

Таблиця 6.3 Розрахунок складових коефіцієнта кореляції

Номер АТП

1

1,3

7,4

1,69

54,76

9,62

2

3,9

10,3

15,21

106,09

40,17

3

2,2

11,6

4,84

134,56

25,52

4

4,4

12,7

19,36

161,29

55,88

5

2,3

8,7

5,29

75,69

20,01

6

3,3

10,4

16,89

108,16

34,32

7

3,7

12,5

13,69

156,25

46,25

28

4,5

12,4

20,25

153,76

55,80

29

3,0

8,5

9,00

72,25

25,5

30

7,5

14,7

56,25

216,09

110,25

Сума

124,6

340,5

600,12

3964,32

1484,92

 

 

;

 

 

.

Визначаємо коефіцієнт кореляції

.

Для розрахунку вибіркового кореляційного відношення за формулою (5.18) обчислюємо загальне стандартне відхилення і відхилення емпіричної лінії регресії від загальної середньої. Результати обчислень представлені у таблицях 6.4–6.5, сформованих на підставі табл. 6.2 і розрахункових значень (с. 305). Згідно з розрахунковими даними маємо:

;

.

.

Так як , то маємо підставу вважати зв’язок більш схиль-

ним до нелінійного.

 

 

Апроксимація зв’язків однофакторними регресійними моделями

307

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 6.4

 

 

Розрахунок стандартного відхилення результуючого фактора

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Інтервали

 

Середини

 

Частота

 

 

 

 

 

 

 

 

 

 

 

інтервалів

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(табл. 6.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

– 8

 

7,5

 

 

2

 

 

–3,85

 

14,82

 

29,65

 

 

8

– 9

 

8,5

 

 

3

 

 

–2,88

 

8,12

 

24,37

 

 

 

9 – 10

 

9,5

 

 

1

 

 

–1,85

 

3,42

 

3,42

 

 

10

– 11

 

10,5

 

 

7

 

 

–0,85

 

0,72

 

5,06

 

 

11

– 12

 

11,5

 

 

4

 

 

0,15

 

0,02

 

0,09

 

 

12

– 13

 

12,5

 

 

7

 

 

1,15

 

1,32

 

9,24

 

 

13

– 14

 

13,5

 

 

5

 

 

2,15

 

4,62

 

23,11

 

 

 

14

– 15

 

14,5

 

 

1

 

 

3,15

 

9,92

 

9,92

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 6.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Розрахунок середнього квадратичного відхилення лінії регресії

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ордината лінії регресії

 

Частота

 

 

 

 

 

 

 

 

 

 

 

 

за ознакою

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(табл. 6.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8,00

 

 

2

 

–3,35

 

11,22

 

22,45

 

 

 

 

9,67

 

 

6

 

–1,68

 

2,82

 

16,93

 

 

 

 

10,17

 

 

7

 

–1,18

 

1,39

 

9,75

 

 

 

 

12,36

 

 

7

 

1,01

 

1,02

 

7,14

 

 

 

 

13,25

 

 

4

 

1,9

 

3,61

 

14,44

 

 

 

 

11,00

 

 

2

 

–0,35

 

0,12

 

0,24

 

 

 

 

14,00

 

 

2

 

2,65

 

7,02

 

14,05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У подальшому перевіримо можливість представлення емпіричної залежності між досліджуваними ознаками у формі лінійної моделі.

Для обґрунтування правомірності гіпотези щодо прямолінійної форми кореляційного зв’язку розраховуємо за формулою (5.22) коефіцієнт

.

Так як , то виникає необхідність у визначенні ступеню відхилення від лінійної форми зв’язку. Вимірювання відхилення виконаємо двома способами.

Перший спосіб. Розраховуємо похибку різниць між та за формулою (5.24)

.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]