черняк
.pdf
|
|
1972/ |
|
4,5766 |
3,9005 |
6,415 |
3,7483 |
8,035 |
|
Q2 |
|
|
67 |
37 |
854 |
33 |
829 |
|
|
1972/ |
|
4,9333 |
3,7182 |
6,427 |
4,2413 |
8,047 |
|
Q3 |
|
|
33 |
55 |
247 |
33 |
446 |
|
|
1972/ |
|
5,3333 |
6,3320 |
6,435 |
4,8513 |
8,063 |
|
Q4 |
|
|
33 |
50 |
745 |
33 |
220 |
|
|
1973/ |
|
6,2833 |
5,1878 |
6,442 |
5,6396 |
8,087 |
|
Q1 |
|
|
33 |
37 |
297 |
67 |
425 |
|
|
1973/ |
|
7,4666 |
7,3710 |
6,435 |
6,6083 |
8,091 |
|
Q2 |
|
|
67 |
48 |
847 |
33 |
811 |
|
|
1973/ |
|
9,8733 |
7,5045 |
6,428 |
8,3883 |
8,090 |
|
Q3 |
|
|
33 |
09 |
663 |
33 |
801 |
|
|
1973/ |
|
8,98 |
9,3811 |
6,417 |
7,4616 |
8,098 |
|
Q4 |
|
|
|
40 |
550 |
67 |
369 |
|
|
1974/ |
|
8,3033 |
6,3878 |
6,418 |
7,6003 |
8,089 |
|
Q1 |
|
|
33 |
51 |
051 |
33 |
298 |
|
|
1974/ |
|
10,456 |
8,2983 |
6,406 |
8,268 |
8,091 |
|
Q2 |
|
|
667 |
40 |
561 |
|
811 |
|
|
1974/ |
|
11,533 |
11,891 |
6,385 |
8,2863 |
8,083 |
|
Q3 |
|
|
333 |
42 |
880 |
33 |
051 |
|
|
1974/ |
|
9,05 |
9,6535 |
6,373 |
7,336 |
8,079 |
|
Q4 |
|
|
|
87 |
887 |
|
122 |
|
|
1975/ |
|
6,5633 |
11,410 |
6,351 |
5,8733 |
8,056 |
|
Q1 |
|
|
33 |
56 |
073 |
33 |
427 |
|
|
1975/ |
|
5,92 |
5,4572 |
6,352 |
5,4006 |
8,067 |
|
Q2 |
|
|
|
48 |
346 |
67 |
902 |
|
|
1975/ |
|
6,6666 |
8,3506 |
6,350 |
6,3366 |
8,086 |
|
Q3 |
|
|
67 |
37 |
277 |
67 |
380 |
|
|
1975/ |
|
6,12 |
6,7269 |
6,341 |
5,6843 |
8,099 |
|
Q4 |
|
|
|
13 |
396 |
33 |
402 |
|
|
1976/ |
|
5,29 |
5,1718 |
6,341 |
4,9533 |
8,118 |
|
Q1 |
|
|
|
51 |
862 |
33 |
714 |
|
|
1976/ |
|
5,57 |
5,1180 |
6,345 |
5,1686 |
8,122 |
|
Q2 |
|
|
|
58 |
223 |
67 |
431 |
|
|
1976/ |
|
5,53 |
6,2017 |
6,340 |
5,1686 |
8,125 |
|
Q3 |
|
|
|
84 |
273 |
67 |
927 |
|
|
1976/ |
|
4,99 |
6,8614 |
6,342 |
4,6983 |
8,136 |
|
Q4 |
|
|
|
44 |
037 |
33 |
313 |
|
|
1977/ |
|
4,81 |
5,4079 |
6,351 |
4,624 |
8,150 |
|
Q1 |
|
|
|
05 |
912 |
|
872 |
|
|
1977/ |
|
5,2366 |
8,1503 |
6,349 |
4,8286 |
8,167 |
|
Q2 |
|
|
67 |
92 |
046 |
67 |
636 |
|
|
1977/ |
|
5,8066 |
6,9745 |
6,348 |
5,472 |
8,181 |
|
Q3 |
|
|
67 |
92 |
404 |
|
553 |
|
|
1977/ |
|
6,5933 |
7,0500 |
6,351 |
6,137 |
8,179 |
|
Q4 |
|
|
33 |
53 |
865 |
|
536 |
|
|
1978/ |
|
6,7966 |
5,6438 |
6,357 |
6,408 |
8,186 |
|
Q1 |
|
|
67 |
65 |
512 |
|
409 |
|
|
1978/ |
|
7,2 |
10,370 |
6,353 |
6,481 |
8,217 |
|
Q2 |
|
|
|
58 |
586 |
|
978 |
|
|
1978/ |
|
8,0833 |
7,7627 |
6,353 |
7,3153 |
8,225 |
|
Q3 |
|
|
33 |
94 |
993 |
33 |
664 |
|
|
1978/ |
|
9,8966 |
8,6832 |
6,349 |
8,6803 |
8,237 |
|
Q4 |
|
|
67 |
48 |
470 |
33 |
373 |
|
|
1979/ |
|
10,096 |
7,8207 |
6,342 |
9,3576 |
8,237 |
|
Q1 |
|
|
667 |
50 |
107 |
67 |
691 |
|
|
1979/ |
|
9,8533 |
8,5493 |
6,345 |
9,3723 |
8,238 |
|
Q2 |
|
|
33 |
63 |
397 |
34 |
616 |
|
|
1979/ |
|
10,603 |
8,8086 |
6,347 |
9,6313 |
8,244 |
|
Q3 |
|
|
333 |
54 |
885 |
33 |
728 |
257
|
|
1979/ |
|
13,096 |
7,9574 |
6,336 |
11,803 |
8,246 |
|
Q4 |
|
|
667 |
41 |
670 |
667 |
591 |
|
|
1980/ |
|
14,253 |
9,2141 |
6,330 |
13,458 |
8,250 |
|
Q1 |
|
|
333 |
41 |
169 |
667 |
829 |
|
|
1980/ |
|
10,75 |
9,4505 |
6,298 |
10,049 |
8,224 |
|
Q2 |
|
|
|
37 |
007 |
333 |
860 |
|
|
1980/ |
|
9,6466 |
9,0866 |
6,312 |
9,2353 |
8,225 |
|
Q3 |
|
|
67 |
49 |
097 |
33 |
101 |
|
|
1980/ |
|
14,513 |
10,479 |
6,312 |
13,709 |
8,244 |
|
Q4 |
|
|
333 |
53 |
904 |
667 |
991 |
|
|
1981/ |
|
14,52 |
11,251 |
6,296 |
14,369 |
8,258 |
|
Q1 |
|
|
|
48 |
084 |
|
552 |
|
|
1981/ |
|
15,35 |
6,9857 |
6,302 |
14,829 |
8,254 |
|
Q2 |
|
|
|
94 |
509 |
|
373 |
|
|
1981/ |
|
16,213 |
9,3234 |
6,284 |
15,087 |
8,259 |
|
Q3 |
|
|
333 |
90 |
129 |
333 |
588 |
|
|
1981/ |
|
12,94 |
8,5695 |
6,275 |
12,022 |
8,243 |
|
Q4 |
|
|
|
66 |
268 |
667 |
572 |
|
|
1982/ |
|
13,696 |
4,5346 |
6,286 |
12,895 |
8,231 |
|
Q1 |
|
|
667 |
60 |
486 |
|
136 |
|
|
1982/ |
|
13,483 |
5,2402 |
6,282 |
12,359 |
8,235 |
|
Q2 |
|
|
333 |
65 |
984 |
|
122 |
|
|
1982/ |
|
11,553 |
4,0572 |
6,285 |
9,7053 |
8,230 |
|
Q3 |
|
|
333 |
54 |
005 |
33 |
684 |
|
|
1982/ |
|
8,81 |
3,3336 |
6,316 |
7,935 |
8,232 |
|
Q4 |
|
|
|
18 |
703 |
|
068 |
|
|
1983/ |
|
8,34 |
4,8824 |
6,332 |
8,0813 |
8,238 |
|
Q1 |
|
|
|
91 |
228 |
33 |
405 |
|
|
1983/ |
|
8,6066 |
2,8123 |
6,355 |
8,419 |
8,265 |
|
Q2 |
|
|
67 |
14 |
529 |
|
264 |
|
|
1983/ |
|
9,44 |
3,9181 |
6,368 |
9,1866 |
8,280 |
|
Q3 |
|
|
|
54 |
987 |
67 |
052 |
|
|
1983/ |
|
9,19 |
4,2134 |
6,375 |
8,7933 |
8,297 |
|
Q4 |
|
|
|
96 |
867 |
33 |
070 |
|
|
1984/ |
|
9,45 |
5,6207 |
6,377 |
9,1333 |
8,316 |
|
Q1 |
|
|
|
80 |
857 |
33 |
178 |
|
|
1984/ |
|
10,773 |
4,1585 |
6,384 |
9,8433 |
8,329 |
|
Q2 |
|
|
333 |
38 |
305 |
33 |
417 |
|
|
1984/ |
|
11,146 |
4,5626 |
6,382 |
10,343 |
8,334 |
|
Q3 |
|
|
667 |
02 |
478 |
333 |
808 |
|
|
1984/ |
|
9,2566 |
2,6370 |
6,386 |
8,9733 |
8,341 |
|
Q4 |
|
|
67 |
20 |
530 |
33 |
458 |
|
|
1985/ |
|
8,69 |
4,6399 |
6,400 |
8,1833 |
8,348 |
|
Q1 |
|
|
|
37 |
523 |
33 |
017 |
|
|
1985/ |
|
7,91 |
2,6809 |
6,418 |
7,5233 |
8,355 |
|
Q2 |
|
|
|
05 |
486 |
33 |
803 |
|
|
1985/ |
|
7,7233 |
2,8038 |
6,446 |
7,1033 |
8,368 |
|
Q3 |
|
|
33 |
51 |
560 |
33 |
461 |
|
|
1985/ |
|
7,7 |
3,9239 |
6,464 |
7,1466 |
8,374 |
|
Q4 |
|
|
|
95 |
576 |
67 |
131 |
|
|
1986/ |
|
7,4133 |
1,9726 |
6,480 |
6,8866 |
8,387 |
|
Q1 |
|
|
33 |
05 |
989 |
67 |
198 |
|
|
1986/ |
|
6,5433 |
1,7987 |
6,515 |
6,13 |
8,386 |
|
Q2 |
|
|
33 |
95 |
254 |
|
560 |
|
|
1986/ |
|
5,8933 |
3,1998 |
6,549 |
5,5333 |
8,392 |
|
Q3 |
|
|
33 |
98 |
046 |
33 |
219 |
|
|
1986/ |
|
5,7266 |
2,9906 |
6,584 |
5,34 |
8,395 |
|
Q4 |
|
|
67 |
49 |
086 |
|
500 |
|
|
1987/ |
|
5,95 |
3,5977 |
6,606 |
5,5333 |
8,402 |
|
Q1 |
|
|
|
89 |
894 |
33 |
904 |
258
|
|
1987/ |
|
6,8466 |
2,8525 |
6,617 |
5,7333 |
8,415 |
|
Q2 |
|
|
67 |
72 |
196 |
33 |
227 |
|
|
1987/ |
|
7,0266 |
3,0551 |
6,611 |
6,0333 |
8,424 |
|
Q3 |
|
|
67 |
53 |
214 |
33 |
924 |
|
|
1987/ |
|
7,54 |
3,6979 |
6,612 |
6,0033 |
8,439 |
|
Q4 |
|
|
|
14 |
419 |
33 |
340 |
|
|
1988/ |
|
6,7133 |
3,3155 |
6,611 |
5,76 |
8,445 |
|
Q1 |
|
|
33 |
76 |
622 |
|
762 |
|
|
1988/ |
|
7,2533 |
4,4941 |
6,618 |
6,23 |
8,456 |
|
Q2 |
|
|
33 |
91 |
918 |
|
339 |
|
|
1988/ |
|
8,1633 |
4,8347 |
6,619 |
6,9933 |
8,462 |
|
Q3 |
|
|
33 |
89 |
848 |
33 |
631 |
|
|
1988/ |
|
8,5866 |
3,9898 |
6,612 |
7,7033 |
8,472 |
|
Q4 |
|
|
67 |
93 |
931 |
33 |
133 |
|
|
1989/ |
|
9,4466 |
5,1121 |
6,598 |
8,5333 |
8,480 |
|
Q1 |
|
|
67 |
02 |
751 |
33 |
031 |
|
|
1989/ |
|
9,29 |
4,3546 |
6,577 |
8,44 |
8,484 |
|
Q2 |
|
|
|
99 |
275 |
|
463 |
|
|
1989/ |
|
8,39 |
3,7608 |
6,572 |
7,85 |
8,484 |
|
Q3 |
|
|
|
29 |
754 |
|
463 |
|
|
1989/ |
|
8,0566 |
3,5021 |
6,576 |
7,6333 |
8,488 |
|
Q4 |
|
|
67 |
10 |
606 |
33 |
114 |
|
|
1990/ |
|
8,0766 |
5,2574 |
6,574 |
7,7566 |
8,496 |
|
Q1 |
|
|
67 |
31 |
452 |
67 |
643 |
|
|
1990/ |
|
8,1933 |
4,2118 |
6,574 |
7,7666 |
8,500 |
|
Q2 |
|
|
33 |
03 |
546 |
67 |
474 |
|
|
1990/ |
|
7,8333 |
3,9482 |
6,575 |
7,4933 |
8,498 |
|
Q3 |
|
|
33 |
70 |
841 |
33 |
316 |
|
|
1990/ |
|
7,68 |
4,2256 |
6,573 |
7,0233 |
8,490 |
|
Q4 |
|
|
|
05 |
205 |
33 |
274 |
|
|
1991/ |
|
6,5966 |
4,8463 |
6,574 |
6,0533 |
8,485 |
|
Q1 |
|
|
67 |
86 |
205 |
33 |
083 |
|
|
1991/ |
|
6,0566 |
2,7397 |
6,587 |
5,5933 |
8,490 |
|
Q2 |
|
|
67 |
70 |
026 |
33 |
418 |
|
|
1991/ |
|
5,83 |
2,7829 |
6,599 |
5,4066 |
8,492 |
|
Q3 |
|
|
|
16 |
436 |
67 |
880 |
|
|
1991/ |
|
4,9166 |
2,4668 |
6,617 |
4,5833 |
8,493 |
|
Q4 |
|
|
67 |
05 |
347 |
33 |
064 |
|
|
1992/ |
|
4,19 |
3,7775 |
6,648 |
3,91 |
8,500 |
|
Q1 |
|
|
|
31 |
784 |
|
759 |
|
|
1992/ |
|
4,03 |
2,6704 |
6,668 |
3,7233 |
8,506 |
|
Q2 |
|
|
|
14 |
766 |
33 |
638 |
|
|
1992/ |
|
3,41 |
1,3525 |
6,692 |
3,13 |
8,515 |
|
Q3 |
|
|
|
98 |
511 |
|
291 |
|
|
1992/ |
|
3,5666 |
2,6467 |
6,724 |
3,0766 |
8,529 |
|
Q4 |
|
|
67 |
24 |
760 |
67 |
260 |
|
|
1993/ |
|
3,2866 |
3,1426 |
6,737 |
2,9933 |
8,532 |
|
Q1 |
|
|
67 |
85 |
378 |
33 |
141 |
|
|
1993/ |
|
3,2566 |
1,7190 |
6,759 |
2,9833 |
8,538 |
|
Q2 |
|
|
67 |
71 |
368 |
33 |
054 |
|
|
1993/ |
|
3,31 |
1,0925 |
6,786 |
3,02 |
8,544 |
|
Q3 |
|
|
|
14 |
213 |
|
692 |
|
|
1993/ |
|
3,3666 |
1,3387 |
6,806 |
3,08 |
8,559 |
|
Q4 |
|
|
67 |
31 |
020 |
|
869 |
|
|
1994/ |
|
3,6666 |
2,6302 |
6,814 |
3,25 |
8,568 |
|
Q1 |
|
|
67 |
99 |
227 |
|
095 |
|
|
1994/ |
|
4,7266 |
2,9385 |
6,811 |
4,0366 |
8,578 |
|
Q2 |
|
|
67 |
77 |
526 |
67 |
119 |
|
|
1994/ |
|
5,2133 |
2,0787 |
6,813 |
4,51 |
8,588 |
|
Q3 |
|
|
33 |
70 |
823 |
|
024 |
259
|
|
1994/ |
|
6,11 |
1,2178 |
6,807 |
5,2833 |
8,600 |
|
Q4 |
|
|
|
57 |
213 |
33 |
394 |
260
Розділ 11. Моделі з обмеженими залежними змінними і моделі з панельними даними
11.1.Моделі з обмеженими залежними змінними
11.1.1.Моделі бінарного вибору
Припустимо, що нас цікавить, чому певна сім'я має або, навпаки, не має автомобіль. Нехай єдиною пояснювальною змінною є дохід. Ми зібрали дані про n сімей i 1,n . Позначимо через xi дохід і-ї сім'ї. Визначимо залежну змінну y таким чином:
yi 1, якщо i -та сім'я має автомобіль;
yi 0 , якщо i -та сім'я не має автомобіля.
ы
Проаналізуємо модель лінійної регресії
yi 0 1xi i , i 1,n.
З одного боку,
M yi |xi 0 xi ,
оскільки за стандартним припущенням регресії M i |xi 0.
З іншого боку,
M yi |xi 1 P {yi 1|xi } 0 P {yi 0|xi } P {yi 1|xi }.
Отже,
P {yi 1|xi } 0 xi .
Це співвідношення показує, що модель лінійної регресії буде нереалістичною, оскільки вираз 0 xi не обов'язково обмежено нулем та одиницею. Крім того, виникають
проблеми з властивостями збурень. Для розв'язання цієї проблеми було запропоновано
підхід так званих латентних змінних. Припустимо, що справжня модель |
має вигляд |
|||||
y* |
0 |
x |
, але значення |
змінної y * ми не спостерігаємо. Тому |
змінна |
y * |
i |
1 i |
i |
|
|
|
|
називається латентною, або прихованою. Значення спостережень yi |
пов'язані |
зі |
||||
значеннями латентної змінної y* |
таким чином: |
|
|
|||
|
|
|
i |
|
|
|
yi 1, якщо yi 0 ;
yi 0 , якщо yi 0.
Латентну змінну можна інтерпретувати як "здібність" , "здатність" або "схильність". Тобто якщо здатність або схильність придбати автомобіль (або, скажімо, в іншій моделі – повернути кредит) є додатною, то сім'я купує автомобіль (повертає кредит тощо). Інша можлива інтерпретація – це різниця функції корисності для двох рішень. Параметри моделі оцінюють методом максимальної правдоподібності. Позначимо через F функцію розподілу збурень і припустимо, що розподіл збурень є симетричним. Тоді
P {yi 1} P {yi 0} P { 0 1xi i 0}
P { i 0 1xi } P { i 0 1xi } F 0 1xi ,
і
P {yi 0} P {yi 0} 1 P {yi 0} 1 F 0 1xi .
Таким чином, функція правдоподібності має вигляд
L |
|
F x |
|
|
1 F x |
. |
|
|
i:yi 1 |
0 1 i |
|
i;yi 0 |
|
0 1 i |
|
Поки що ми визначили латентну змінну з точністю до довільної константи. Справді, визначимо y * * y*, де 0 .
Тоді:
261
якщо yi 0, то yi 1;
якщо yi 0, то yi 0.
Дисперсії збурень для двох варіантів латентної змінної відрізнятимуться в 2 разів,
тому ми можемо однозначно визначити латентну змінну, зафіксувавши її дисперсію. Найчастіше припускають, що збурення мають стандартний нормальний розподіл. Модель, одержувана в такому випадку, отримала назву моделі пробіт. Логарифм функції правдоподібності має вигляд
lnL , |
2 |
n |
|
|
ln 0 |
i xi |
e |
x2 |
|
|
e |
x2 |
2 |
|
|
2 dx |
ln |
2 dx. |
|||||||
0 1 |
|
|
|
i:yi 1 |
|
|
|
|
i:yi 0 |
|
|
|
|
|
|
|
|
|
|
|
x |
i |
|
||
|
|
|
|
|
|
|
|
|
|
0 1 |
|
Модель логіт одержують у припущенні, що збурення мають логістичний розподіл з функцією розподілу
|
|
|
|
|
|
|
F x |
|
|
ex |
. |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
1 |
ex |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Логарифм функції правдоподібності має вигляд |
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
L , |
ln |
e 0 1xi |
|
|
ln |
1 |
. |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
0 |
1 |
i;yi 1 |
1 e 0 1xi |
i:yi 1 |
1 e 0 1xi |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
Для |
обох моделей |
|
зручно |
інтерпретувати не регресійну |
функцію |
ˆ |
ˆ |
, а |
|||||||||||
|
0 |
1xi |
|||||||||||||||||
ˆ |
ˆ |
, де F |
– відповідна функція розподілу. З виведення функції правдоподібності |
||||||||||||||||
F 0 1xi |
|||||||||||||||||||
видно, що вираз |
ˆ |
|
ˆ |
є оцінкою ймовірності P {yi |
1}, тобто оцінкою ймовірності |
||||||||||||||
F 0 |
1xi |
того, чи сім'я матиме автомобіль, чи буде повернуто кредит тощо. Унаслідок того, що функції розподілу монотонно зростають, знаки коефіцієнтів інтерпретують майже звичним способом. Для характеристики згоди моделі використовують кілька варіантів
псевдо R2 :
1)Псевдо R2 за Т. Амемійя
R2 |
1 |
|
|
|
|
1 |
|
|
. |
1 |
2 lnL |
lnL |
0 |
/n |
|||||
|
|
|
|
|
1 |
|
|
2)Псевдо R2 за Д. Мак-Фейденом
R2 1 lnL1 /lnL0,
де lnL1 - значення логарифмічної функції правдоподібності, обчислене при значеннях аргументів, що дорівнюють ММП-оцінкам;
lnL |
0 |
n |
ln n |
/n n n |
ln |
1 |
n1 |
|
; |
n y . |
|
|
1 |
1 |
1 |
|
|
n |
|
|
1 |
i |
|
|
|
|
|
|
|
|
|
|
|
|
3) Псевдо R2 , що ґрунтується на коректних прогнозах. Визначимо прогнози таким чином:
|
yˆi 1 |
, якщо |
|
ˆ |
|
ˆ |
1 |
; |
|
|
|
|
|
||||||||
F 0 |
|
1xi |
2 |
|
|
|
|
|
|||||||||||||
|
yˆi 0 |
, якщо |
|
ˆ |
|
ˆ |
|
1 |
. |
|
|
|
|
|
|||||||
F 0 1xi |
|
2 |
|
|
|
|
|
||||||||||||||
Частка |
некоректних прогнозів дорівнює |
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
wv |
1 |
n |
y |
yˆ |
2 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
n i 1 |
i |
i |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Позначимо через |
ˆ |
n1 |
|
– частку одиниць у вибірці. Визначимо: |
|||||||||||||||||
n |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
wv0 1 |
ˆ |
, якщо |
ˆ 0,5; |
|
|
|
|
|
|
||||||||||
|
|
wv0 ˆ |
, якщо |
ˆ 0,5 |
. |
|
|
|
|
|
|
|
|
Псевдо R2 визначаємо таким чином:
262
R2 1 wv1 . wv0
11.1.2. Моделі з упорядкованим відгуком
Розглянемо вибір між M можливостей, які ми занумеруємо від 1 до M . Якщо ці можливості можна впорядкувати логічно (наприклад, автомобіля немає, один автомобіль, більш ніж один автомобіль), то в такій ситуації застосовують так звані моделі з упорядкованим відгуком. В основу також покладено ідею латентних змінних. Для випадку єдиної пояснювальної змінної можна записати:
yi * 0 1xi i ,
yi j , якщо j 1 yi * j ,
де 0 , 1 0, m , а решта j невідомі.
У припущенні, що збурення незалежні і мають стандартний нормальний розподіл,
одержуємо модель пробіт з упорядкованим відгуком, а якщо збурення мають логістичний розподіл, одержуємо модель логіт з упорядкованим відгуком. При M 2
маємо звичайні моделі. Розглянемо приклад. Припустимо, що заміжні жінки відповідають на запитання: "Скільки часу ви бажаєте працювати?", причому анкета опитування містить три варіанти відповіді: "ні", "неповний робочий тиждень", "повний робочий тиждень". Згідно з неокласичною теорією відповідь залежить від індивідуальних переваг і бюджетного обмеження. Такими чинниками можуть бути вік, склад сім'ї, дохід чоловіка, рівень освіти тощо. Для простоти розглянемо модель з однією незалежною змінною. Будемо вважати, що залежна змінна набуває значень таким чином:
yi 1, якщо відповідь "ні";
yi 2 , якщо відповідь "неповний робочий тиждень";
yi 3 , якщо відповідь "повний робочий тиждень".
Модель записуємо в такому вигляді:
yi * 0 1xi i ;
yi 1, якщо yi * 0 ;
|
yi 2, якщо 0 yi * ; |
|
yi 3, якщо yi * ; |
i незалежні і мають стандартний нормальний розподіл.
Латентну змінну можна проінтерпретувати як бажання працювати або як кількість робочих годин. Таким чином,
P {yi 1|xi } P {yi 0|xi } F 0 1xi ,
P {yi 3|xi } P {yi |xi } 1 F 0 1xi
і
P {yi 2|xi } P 0 1xi P 0 1xi ,
де F – функція розподілу для стандартного нормального розподілу. Невідомий параметр оцінюють методом максимальної правдоподібності разом з 0 і 1 . У результаті
підстановок y попередні формули x замість xi і оцінок замість параметрів одержимо
оцінки ймовірностей кожної можливості, якщо значення пояснювальної змінної дорівнює x .
11.1.3.Моделі Тобіт
Удеяких ситуаціях залежна змінна буде неперервною, але діапазон її значень обмежений. Досить часто значення залежної змінної дорівнює нулю для значної частини популяції і є додатним для решти популяції. Як приклади можна назвати витрати на
263
товари тривалого користування, робочі години, обсяги прямих іноземних інвестицій, що їх зробила фірма.
Уперше модель запропонував Джеймс Тобін у 1958 р., а свою назву – Тобіт – вона одержала в 1964 р. завдяки Артуру Голдбергу, який підкреслив її подібність до моделей пробіт. Згодом було запропоновано різноманітні узагальнення цієї моделі. Ми розглянемо стандартну модель Тобіт, або, як її іноді називають, модель цензурованої регресії:
yi * 0 1xi i , i 1,n;
yi yi * , якщоyi * 0;
yi 0 , якщо yi * 0;
i незалежні і мають розподіл N 0, 2 .
Латентну змінну y * зазвичай інтерпретують як "бажану" кількість. Логарифм функції правдоподібності має вигляд
lnL 0, 1, 2 |
|
|
|
|
|
x |
|
|
|
|||
|
ln 1 |
F |
0 |
1 i |
|
|
|
|||||
|
|
|
||||||||||
|
|
|
|
i:yi 0 |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
1 yi 0 |
|
2 |
|
|
||
|
|
|
|
|
1xi |
|
||||||
ln |
|
exp |
2 |
|
|
2 |
|
|
, |
|||
2 2 |
|
|
||||||||||
|
i:yi 1 |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
де F-функція розподілу стандартного нормального розподілу. Звернімо увагу на особливість інтерпретації регресійних коефіцієнтів і вибіркової регресійної функції. Очікувані значення залежної змінної знаходять таким чином:
M y|x ˆ0 ˆ1x F ˆ0 ˆˆ1x ˆ ˆ0 ˆˆ1x ,
де F – функція розподілу, а – щільність стандартного нормального розподілу. Граничний ефект незалежної змінної не дорівнює регресійному коефіцієнту. За умови цензурування
My |
|
|
ˆ |
ˆ |
|
|
0 |
1x |
. |
||
x |
|
ˆ |
|||
1 |
|
|
|
Оскільки оцінки параметрів знаходять методом максимальної правдоподібності, то коваріаційну матрицю визначають і перевірку гіпотез здійснюють у межах звичайної для ММП схеми.
11.2. Моделі з панельними даними
11.2.1.Переваги панельних даних
Панельні дані, або панель утворюється таким чином. Припустимо, що ми маємо N одиниць спостереження i 1,N , причому для кожної одиниці (особи, домогосподарства,
фірми, галузі промисловості, |
країни тощо) ми спостерігаємо набір показників за |
||||
T t |
|
періодів часу. Через |
yit будемо позначати значення залежної змінної для i -ї |
||
1,T |
|||||
одиниці спостереження в момент часу |
t . Набір значень k незалежних змінних, не |
||||
враховуючи константу, позначимо через |
xitT |
. Лінійну модель можна записати у такому |
|||
вигляді: |
|
|
|
yit i xitT it ,
де – вектор параметрів, які характеризують граничний ефект незалежних змінних на
залежну. Це означає, що ефекти від зміни x однакові для всіх одиниць у всіх спостереженнях, але середні значення змінних можуть відрізнятись від одиниці до одиниці спостереження. Отже, i відображає дію факторів, специфічних для конкретної
264
одиниці спостереження, але не змінюються з часом. У стандартному випадку
припускають, що it |
незалежні й однаково розподілені з нульовим середнім і дисперсією |
||||
2 |
. Якщо трактують як фіксовані невідомі параметри, то модель називають моделлю з |
||||
|
i |
|
|
|
|
фіксованими ефектами, а випадок, коли i |
утворюють вибірку з розподілу із середнім |
||||
і дисперсією 2 |
одержав назву |
моделі з |
випадковими ефектами. Тут важливим є |
||
припущення, що |
i |
не залежить |
від xit . |
Моделі з панельними даними дозволяють |
аналізувати зміни на індивідуальному рівні. Розглянемо ситуацію, коли середній рівень споживання зростає на 2 % щорічно. Це може бути викликано тим, що споживання кожного зростає на 2 %, або, скажімо, тим, що приблизно половина збільшила споживання на 4 %, а в решти рівень споживання не змінився. Дослідження показали, що оцінювання за панельними даними найчастіше буде більш ефективним порівняно з ситуацією, коли доступний такий самий обсяг даних, але дані утворюються в результаті вибору різних одиниць у кожний період часу. Моделі з панельними даними є більш стійкими щодо пропущених змінних, похибок вимірювання та наявності ендогенних змінних серед регресорів.
11.2.2. Модель із фіксованими ефектами
Модель із фіксованими ефектами є моделлю з лінійної регресії, у якій константи змінюються від одиниці до одиниці спостереження:
|
y |
|
xT |
|
|
|
it |
i |
it |
it |
. |
|
ii |
~ i.i.d. 0, 2 |
|
||
Припустимо також, що всі |
xit |
незалежні від усіх it . Цю модель можна записати в |
межах стандартної моделі регресії з використанням фіктивної змінної для кожної одиниці спостереження і :
y |
N |
d |
xT , |
|
|
||||
it |
j 1 |
j ij |
it |
it |
|
|
|
|
де dij 1 для i j і dij 0 у решті випадків.
Отже, модель можна оцінити звичайним методом найменших квадратів, однак, у цьому разі вона міститиме велику кількість невідомих параметрів. Проте можна зробити простіше: показати, що ті самі оцінки можна знайти з регресії з використанням даних
у формі відхилень від середніх за одиницями. Спочатку зауважимо, що
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xT , |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
де |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
i |
аналогічно. Далі запишемо |
|
|
|||||||||||
|
|
(1/T ) tyit , а решта середніх утворюються |
|
|
||||||||||||||||||||||||||||||||||
yi |
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
y |
|
x |
|
x |
|
T . |
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
y |
it |
i |
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
it |
|
i |
|
|
|
|
|
|
|
|
it |
|
i |
|
|
|
|
|
|
|
|
|
|||||
МНК-оцінка |
|
, знайдена |
|
за |
цією |
моделлю |
з |
перетвореними |
даними, |
називається |
||||||||||||||||||||||||||||
оцінкою з фіксованими ефектами. |
|
Позначимо її через |
ˆ |
. Оцінки |
i |
знаходимо |
||||||||||||||||||||||||||||||||
|
FE |
|||||||||||||||||||||||||||||||||||||
таким чином: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ˆi yi |
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
xi |
FE ,i 1,...,N |
|
|
|
|
|
|
s і t . |
|
|
|||||||||||||||
Оцінки є незміщеними в припущенні, що M x |
it is |
0 для всіх |
Коваріаційна |
|||||||||||||||||||||||||||||||||||
матриця |
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
FE |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
ˆ |
|
|
|
2 |
|
N |
|
T |
|
xit xi xit xi |
T |
1 |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
D βFE |
|
|
|
|
|
|
, |
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1t 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
2 |
-оцінка дисперсії збурень |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
де |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
2 |
|
|
|
1 |
|
|
N |
T |
|
|
|
|
|
T ˆ |
|
2 |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yit ˆi xit βFF |
|
. |
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
T 1 i 1t 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
265
При досить необмежених припущеннях одержані оцінки є асимптотично нормальними. Отже, для перевірки гіпотез можна застосувати стандарті статистики (t- статистику, статистику Вальда тощо).
11.2.3.Модель з випадковими ефектами
Урегресійному аналізі зазвичай припускають, що всі фактори, які діють на залежну змінну, але які не входять до рівняння явно, можна моделювати за допомогою збурень. У
нашому випадку це приводить до припущення, що i є випадковими факторами,
незалежними й однаково розділеними стосовно одиниць спостережень. Таким чином, модель можна записати у вигляді
yit xitTβ i it ,
it ~ i.i.d. 0, 2 ; i ~ i.i.d. 0, 2 ,
причому i it слід інтерпретувати як похибку, яка складається з двох компонентів:
1). компонента, специфічного для кожної одиниці спостережень, який не змінюється в часі;
2). залишкового компонента, припускаючи, що він некорельований у часі.
Таким чином, кореляція збурень у часі виникає завдяки ефектам i , пов'язаним з
одиницями спостережень. Отже, залишилось записати структуру цієї кореляції й застосувати узагальнений метод найменших квадратів. Найбільш простою процедурою обчислення є така. Слід знайти оцінки звичайного методу найменших квадратів у моделі за перетвореними даними:
|
|
|
y y |
1 (x |
it |
x |
)T u , |
|
|
|
|
|
it |
i |
i |
it |
|
||
1/2 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
де 1 |
, а |
|
|
. |
|
|
|
|
|
2 |
T 2 |
|
|
|
|
|
|||
На практиці 2 і 2 |
невідомі, тому їх треба оцінювати. |
Оцінку 2 знаходять із моделі з фіксованими ефектами. Оцінку 2 можна знайти за формулою
|
2 |
1 |
N |
2 |
|
1 |
|
2 |
|
ˆ |
|
|
ei |
|
T |
ˆ |
|
, |
|
|
|||||||||
|
|
N i 1 |
|
|
|
|
|
де ei – залишки звичайного методу найменших квадратів у моделі
yi xTi β i i ,i 1,N .
Оцінки, одержані за допомогою описаного варіанту узагальненого методу найменших
квадратів, називаються оцінками з випадковими ефектами; |
|
ˆ |
(англ. |
|||||
їх позначаємо βRE |
||||||||
random effects estimator). Коваріаційну матрицю знаходимо за формулою |
|
|||||||
ˆ ˆ |
2 |
N T |
T |
N |
|
T |
1 |
|
xit xi xit xi |
T |
xi x xi x |
. |
|
||||
DβRE ˆ |
|
|
|
|
||||
|
|
i 1 j 1 |
|
i 1 |
|
|
|
|
Ця коваріаційна матриця збігається зі стандартною коваріаційною матрицею, яку розраховують під час оцінювання моделі за перетвореними даними звичайним методом найменших квадратів.
11.2.4. Фіксовані ефекти чи випадкові ефекти
Загалом моделі з фіксованими ефектами слід надавати перевагу в тому разі, коли обрані одиниці спостережень становлять усю або значну частину невеликої популяції (країни, великої компанії, галузі). У таких випадках наголос часто роблять на відмінностях між одиницями спостережень. Якщо сукупність одиниць спостережень утворюють як вибірку з великої популяції, роблячи наголос на граничних ефектах пояснювальних змінних, то перевагу слід віддати моделі з випадковими ефектами. Однак
266