Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Rozd_6.doc
Скачиваний:
2
Добавлен:
15.11.2019
Размер:
244.74 Кб
Скачать

6.3. Регресія на групуваннях

Модель із структурними змінними і змінними взаємодії можна застосувати до комбінаційних групувань. Традиційно для аналізу взаємозв’язків за даними комбінаційних групувань використовується модель дисперсійного аналізу Аnova/Manova. Основне завдання дисперсійного аналізу — виявити джерела варіації; дисперсійні комплекси орієнтовані переважно на обробку даних запланованих експериментів з однаковими частотами груп і підгруп. У соціально-економічних дослідженнях будь-яке комбінаційне групування є результатом статистичного спостереження, тобто «незапланованого» експерименту, а отже, забезпечити однакові частоти груп і підгруп практично неможливо. У такому разі перевага віддається моделям множинної лінійної регресії. Особливості застосування регресії до задач дисперсійного аналізу розглянемо на прикладі двофакторної класифікації (фактори А і В).

У регресійній моделі, як і в дисперсійному аналізі, значення i-ї ознаки у h-ї одиниці сукупності, яка належить до j-ї групи, представляється сумою загальної середньої μ, ефекту кожного фактора (аi + bj) та ефектів їх взаємодії (ab)ij:

Yijh = μ + аi + bj + (ab)ij + eijh,

де eijh — залишок;

і — рівень фактора А;

j — рівень фактора В.

Щоб забезпечити однозначність МНК-оцінок параметрів моделі, формулюються додаткові обмеження:

На основі введених обмежень можна представити одні ефекти моделі як лінійну комбінацію інших і записати модель з мінімальною кількістю ефектів.

Наприклад, за фактором А виділено три групи, за фактором В — дві. Тоді в моделі, окрім ефектів факторів (а1, а2, а3, b1, b2), необхідно врахувати шість ефектів взаємодії: (ab)11, (ab)12, (ab)21, (ab)22, (ab)31, (ab)32. Сформулюємо додаткові обмеження для зазначених ефектів моделі:

  • а1 + а2 + а3 = 0; b1 + b2 = 0;

  • (ab)11+ (ab)21+ (ab)31= (ab)12+ (ab)22+ (ab)32 = (ab)11 + (ab)12 = = (ab)21+(ab)22 = (ab)31+(ab)32 = 0.

Звідси маємо:

а3 = –а1 а2; b2 = –b1; (ab)12 = (ab)11; (ab)22 = – (ab)21;

(ab)31 = – (ab)11 (ab)21; (ab)32 = –(ab)31 = (ab)11+ (ab)21.

Визначальними виявляються параметри: μ, а1, а2, b1, (ab)11 та (ab)21. Це мінімальна їх кількість, і модель з цими параметрами записується так:

Y = μ + а1 х1 + а2 х2 + b1 х3 + (ab)11 х4 + (ab)21 х5.

Порядок формування файла первинних даних розглянемо на прикладі моделі тривалості перерви в роботі безробітних (n = 12). Фактор А — вікова група безробітних: А1 — до 30 років; А2 — від 30 до 50; А3 — 50 років і старші. Фактор В — стать безробітного: В1 — чоловіки; В2 жінки. В табл. 6.6 належність безробітного до відповідної підгрупи за цими факторами вказується подвійним індексом ij, де i = 1, 2, 3; j =1, 2; y — тривалість перерви в роботі (міс.).

Ознакова множина моделі Х являє собою матрицю коефіцієнтів при відповідних ефектах впливу факторів та ефектах їх взаємодії. Так, х1 відповідає ефекту а1, тому х1 = 1 для першої вікової групи, х1 =0 для другої вікової групи, а оскільки а1 + а2 + а3 = 0, то для третьої вікової групи х1 = –1. Аналогічно визначається вектор х2, який відповідає ефекту а2. Вектор х3 відноситься до ефекта b1. Прийнявши х3 = 1 для чоловіків, маємо х3 = –1 для жінок. Вектори х4 та х5 відносяться до ефектів взаємодії: х4 = х1 х3; х5 = х2 х3.

Таблиця 6.6

ij

у

х1

х2

х3

х4

х5

11

4

1

0

1

1

0

11

3

1

0

1

1

0

21

5

0

1

1

0

1

31

7

–1

–1

1

–1

–1

31

6

–1

–1

1

–1

–1

31

5

–1

–1

1

–1

–1

12

2

1

0

–1

–1

0

12

4

1

0

–1

–1

0

12

3

1

0

–1

–1

0

22

7

0

1

–1

0

–1

22

6

0

1

–1

0

–1

32

11

–1

–1

–1

1

1

До сформованого таким чином файла первинних даних застосуємо процедури модуля Multiple Regression. Параметри моделі наведено в табл. 6.7.

Таблиця 6.7

Regression Summary for Dependent Variable: у

R= ,96 RІ= ,922 Adjusted RІ= ,857 F(5,6)=14,22 p<,0028 Std.Error of estimate: ,913

N = 12

BETA

St. Err. of BETA

B

St. Err. of B

t(6)

p-level

Intercpt, μ

5,833

0,291

20,02

1,01E-06

х1

– 0,962

0,141

– 2,583

0,378

– 6,84

0,000

х2

– 0,027

0,143

– 0,083

0,435

– 0,19

0,854

х3

– 0,432

0,126

– 1

0,291

– 3,43

0,014

х4

0,448

0,135

1,25

0,378

3,31

0,016

х5

0,078

0,136

0,25

0,435

0,57

0,586

Істотними виявилися ефекти впливу першої групи фактора А (вік до 30 років) і першої градації фактора В (чоловіки), а також ефект взаємодії цих факторів (ab)11. Якщо середня тривалість перерви в роботі по сукупності в цілому становить 5,8 міс., то у віковій групі до 30 років цей показник на 2,6 міс. менший; на 1 міс. менша за середню тривалість перерви в роботі у чоловіків.

При збільшенні кількості факторів оцінювання ефектів впливу кожного з них й усіх можливих взаємодій за розглянутою методикою значно ускладнюється. У такому разі ефективною виявляється модель з адитивними ефектами. Адитивність означає незалежність впливу одного фактора від рівня іншого. Забезпечити її можна шляхом стандартизації комбінаційного групування, себто заміною частот емпіричного розподілу частотами певного стандартного розподілу. Зважені по частотах стандартного розподілу середні j-ї групи за і-им фактором Yij називаються стандартизованими, а відхилення цих середніх від загальної середньої — стандартизованими (центрованими) ефектами аij = Yij – . Незсунені та з мінімальною дисперсією оцінки ефектів аij дає стандартизація групувань методом найменших квадратів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]