Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Rozd_5.doc
Скачиваний:
4
Добавлен:
15.11.2019
Размер:
424.45 Кб
Скачать

5.4. Забезпечення адекватності регресійної моделі

Адекватність регресійної моделі означає здатність її правильно описати реальну структуру взаємозв’язків між ознаками хі та у. Методологічною основою вирішення проблеми адекватності є теоретичний, змістовний аналіз матеріальної природи процесу (явища) та обґрунтування типу й структури моделі, яка описує механізм його формування. Практично з метою забезпечення адекватності моделі змістовний аналіз поєднується з формальними процедурами перевірки гіпотез щодо дотримання логіко-статистичних умов використання МНК.

Мірою адекватності моделі, як уже зазначалося в 5.3, слугують відхилення фактичних значень від теоретичних ej = yj – Yj. На величину цих відхилень впливає весь комплекс умов, зокрема:

  • обсяг та однорідність сукупності;

  • незалежність спостережень;

  • інформативність включених у модель факторів;

  • стабільність не включених у модель факторів;

  • тип моделі.

Репрезентативність оцінок регресійного аналізу прямо пропорційна обсягу та однорідності сукупності. Саме недостатній обсяг сукупності та її неоднорідність вважаються найвагомішими чинниками неадекватності моделей. Тому при формуванні ознакової множини моделі слід враховувати співвідношення між обсягом вибірки і кількістю включених у модель факторів (воно має бути приблизно 8 : 1).

Оцінювання однорідності сукупності здійснюється на етапі розвідувального аналізу даних (див. 3.1). Так, наявність аномальних значень, які не узгоджуються з розподілом основної маси даних, може бути наслідком помилок спостереження або результатом незвичайної комбінації причин і умов, у яких функціонує одиниця сукупності. Ідентифікація таких спостережень дає можливість усунути помилки, а якщо це неможливо, то вилучити аномальний об’єкт з подальшого аналізу. Якщо сукупність розшарована на групи (кластери), то в моделі можна врахувати таку неоднорідність (див. 6.2).

Інформативність включених у модель факторних ознак залежить як від соціально-економічного змісту, так і від шкали вимірювання ознаки. Якщо ознака за змістом не інформативна, то ніякий спосіб моделювання не забезпечить належних результатів. Так само результати аналізу будуть суттєво різнитися залежно від того, якою шкалою представлено одну й ту саму ознаку (метричною, ранговою чи номінальною).

Ті властивості, що безпосередньо не вимірюються або не мають єдиного вимірника, включаються в модель у вигляді інтегральних оцінок. Наприклад, погодні умови характеризуються середньодобовою температурою повітря, кількістю опадів, трива­лістю сонячного світла, хмарністю і т. ін. Усі ці характеристики агрегуються в індексі погодних умов.

Важливою умовою регресійного аналізу є відсутність мультиколінеарності, яка веде до зсунення оцінок параметрів моделі та унеможливлює коректну інтерпретацію результатів. Два фактори вважаються колінеарними, якщо коефіцієнт кореляції між ними перевищує сукупний коефіцієнт кореляції, тoбто rik > R. Найпростіший спосіб усунення мультиколінеарності — виключити одну із корельованих ознак із моделі або замінити її іншою. Часом колінеарні фактори агрегуються в одну узагальнюючу оцінку (див. 9.1).

Стабільність не включених у модель факторів означає, що вплив їх на варіацію у незначний і врівноважується, він однаковий в усіх частинах сукупності (умова гомоскедастичності). Математичною основою дотримання цих передумов МНК слугує ймовірнісний розподіл залишків еj. Передбачається, що:

  • для кожного спостереження залишок еj — випадкова величина, яка має нормальний розподіл. Умова нормальності необхідна для визначення довірчих меж коефіцієнтів регресії і для перевірки гіпотез щодо їх істотності;

  • математичне сподівання залишків М(е) = 0;

  • дисперсія залишків однакова в усіх частинах сукупності: = const. Ця умова пов’язана з однорідністю сукупності;

  • залишки незалежні, тобто відсутня серійна кореляція чи автокореляція даних.

У модулі Multiple Regression процедури аналізу залишків Residual analysis передбачають як візуальні методи, так і статистичні. На рис. 5.2 наведено один з типів графіків залишків (Normal probability plot of residuals) для моделі виходу цукру з 1 т сировини. Пряма відповідає нормальному закону розподілу. По тому, як коливаються залишки навколо прямої, можна зробити висновок щодо дотримання умови нормальності їх розподілу, гомоскедастичності і незалежності. Тобто вплив не врахованих в моделі факторів незначний, спільна їх дія є однаковою в усіх частинах сукупності, варіація виходу цукру з 1 т сировини не залежить від рівня не врахованих факторів. Все це свідчить про адекватність моделі реальному процесу.

Рис. 5.2. Графік залишків регресійної моделі

У великих за обсягом сукупностях візуальні методи аналізу залишків необхідно поєднувати із статистичними оцінками, які представлені групою опцій Statistics.

На основі адекватної регресійної моделі можна здійснити прогноз показника-функції у, задаючи певні значення факторів хі. Такий прогноз уможливлює опція Predіct dependent var. — Прогноз залежної ознаки. Значення хі задаються у вікні Specify values for indep.vars. Так, визначивши, що х1 = 15,6, х2 = 0,9 i х3 = 2,0, маємо прогнозне значення виходу цукру з 1 т сировини Y = 12,14 кг.

Використовуючи параметри моделі, можна також оцінити потенційно можливі рівні показника-функції для кожної одиниці сукупності, визначити резерви збільшення (зменшення) показника у за рахунок факторів, які піддаються регулюванню (суб’єк­тивних факторів). У нашому прикладі — це збільшення виходу цукру з 1 т сировини за рахунок зменшення втрат при зберіганні цукрового буряка і в процесі його переробки. Така оцінка, природно, орієнтована на кращі досягнення в галузі. Ефект регулювання і-го фактора на j-му об’єкті визначається за формулою

Δxі = bi (xijxi0),

де xi0 — база порівняння,

bi — коефіцієнт регресії і-го фактора.

Застосовуючи цю методику, визначимо резерв збільшення виходу цукру з 1 т сировини для j-го заводу (табл. 5.7).

Таблиця 5.7

Фактор

Рівень втрат, %

Відхилення

Коефіцієнт регресії

Ефект регулювання фактора

фактичний

мінімальний

x2

1,06

0,90

0,16

–10,084

–1,613

x3

2,68

2,0

0,68

–1,729

–1,175

Разом

Х

Х

Х

Х

–2,788

Якщо мінімальні втрати цукрового буряка при переробці — 2,0%, а на j-му заводі — 2,68%, то ефект доведення втрат до мінімального рівня становить (2,68 – 2,0)(–1,729) = –1,175. Зменшення втрат при зберіганні цукрового буряка дає ефект (1,06 – – 0,90)(–10,084) = –1,613. Отже, сумарний ефект за рахунок обох факторів –2,788, а потенційно можливий вихід цукру з 1 т сировини за незмінності цукристості буряка, яка є зовнішнім, об’єктив­ним фактором, становить 11,91 кг. Відношення фактичного рівня до потенційно можливого характеризує ступінь використання об’єктивних можливостей. У розглянутому прикладі це відношення становить 9,13 : 11,91 = 0,777, тобто ефективність використання сировини на заводі нижча за потенційно можливу на 23,3%. При визначенні резервів збільшення (зменшення) показника-функ­ції за рахунок регулювання суб’єктивних факторів базою порівняння може бути середня величина, норматив, стандарт тощо.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]