СтатистикаЛевина 2012
.pdf5.5. Метод дисперсионного анализа.
Для статистической совокупности, сгруппированной по изучаемому признаку, возможно вычисление трех видов дисперсий:
-общей ( 2 ); -межгрупповой ( 2 ) и
-средней из внутригрупповых дисперсий ( k2 ).
Между указанными видами дисперсий существует соотношение, которое называется правилом сложения дисперсий:
2 2 к2
На основе данного правила строится метод дисперсионного анализа.
Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности:
|
|
|
|
|
|
|
|
2 |
|
(xi хо)2 f |
о |
, где |
|||
|
f |
|
|
||||
|
|
|
|
|
|||
|
|
о |
|
|
xi – индивидуальное значение признака;
f о – частота, то есть число повторений данного значения признака;
хо – общая средняя для всей изучаемой совокупности.
Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием факторного признака, положенного в основу группировки:
2 |
|
( |
хк |
|
хо |
)2 f |
k |
|
|
|
|
|
|
|
|
|
, где |
||
|
|
f |
|
|
|
||||
|
|
|
|
|
|
||||
|
|
|
k |
|
|
хk – средняя по отдельным группам;
xo – средняя общая;
f k – численность отдельных групп.
Средняя внутригрупповых дисперсий характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает
160
под влиянием других, не учитываемых факторов и не зависит от факторного признака, положенного в основу группировки.
Зная, что внутригрупповая дисперсия равна:
k |
2 |
|
(xk |
xk |
)2 f |
k |
|
|
|
f |
|
|
, то |
||||
|
|
|
|
|
|
|||
|
|
|
k |
|
|
средняя внутригрупповых дисперсий определяется как:
k 2
k 2
n
Если основанием группировки является факторный признак, то с помощью правила сложения дисперсий можно измерить силу его влияния на результативный признак, вычислив коэффициент детерминации и эмпирическое корреляционное отношение.
Коэффициент детерминации:
2 2
2
показывает долю общей вариации результативного признака, обусловленную вариацией группировочного признака.
Эмпирическое корреляционное отношение:
|
|
2 |
|
2 |
|||
|
|
По абсолютной величине он может изменяться в интервале
[0,1].
Если = 0, следовательно, группировочный признак не оказывает влияния на результативный.
Если = 1, следовательно, изменение результативного признака полностью обусловлено группировочным признаком, то есть между ними существует функциональная связь. Таким образом, чем ближе к 1, тем теснее связь и наоборот.
Поэтому порядок установления взаимосвязи методом дисперсионного анализа сводится к следующему:
1)рассчитывают общую среднюю и общую дисперсию по всей совокупности;
2)всю совокупность разбивают на группы по изучаемому признаку;
161
3)по каждой группе рассчитывают среднее значение признака и дисперсию;
4)рассчитывают среднюю дисперсию из внутригрупповых;
5)рассчитывают межгрупповую дисперсию;
6)рассчитывают индекс корреляции.
Пример: Рассмотрим этот метод по данным распределения торговых предприятий по объему товарооборота и формам собственности.
1)Расчет общей дисперсии, складывающейся под влиянием всех факторов.
Группы п/п |
|
Численность пред- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
по количе- |
|
приятий по формам |
|
|
|
|
Расчетные показатели |
|
|
|
|
|||||||||||||||
ству това- |
|
собственности |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
рооборота, |
|
гос. |
|
|
част. |
всего |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
млн. руб. |
|
|
|
x |
/ |
x |
/ |
f o |
(x |
/ |
|
о |
(x |
/ |
|
о |
2 |
(x / xо)2 f |
|
|||||||
|
fг |
|
|
fч |
fо |
|
|
|
||||||||||||||||||
x1 |
|
|
|
|
|
|
x ) |
|
x ) |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
60 – 80 (+) |
|
- |
|
21 |
21 |
70 |
1.470 |
-35 |
|
|
1.225 |
|
25.725 |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
80 – 100 |
|
- |
|
27 |
27 |
90 |
2.430 |
-15 |
|
|
|
|
225 |
|
|
6.075 |
|
|||||||||
100 –120 |
|
10 |
|
14 |
24 |
110 |
2.640 |
|
+5 |
|
|
|
|
25 |
|
|
600 |
|
|
|||||||
120 – 140 |
|
11 |
|
5 |
16 |
130 |
2.080 |
|
25 |
|
|
|
|
625 |
|
|
10.000 |
|
||||||||
140 – 160 |
|
6 |
|
2 |
8 |
150 |
1.200 |
|
45 |
|
|
2.025 |
|
16.200 |
|
|||||||||||
160 – 180 |
|
4 |
|
- |
4 |
170 |
680 |
|
65 |
|
|
4.225 |
|
16.900 |
|
|||||||||||
Итого: |
|
31 |
|
69 |
100 |
|
|
10.500 |
|
|
|
|
|
8.350 |
|
75.500 |
|
|||||||||
Средний объем товарооборота на одно предприятие соста- |
||||||||||||||||||||||||||
вит: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xo |
x / |
f o |
, следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
f o |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xo 10500100 105млн.руб
Общая дисперсия товарооборота по исследуемым предприятиям будет равна:
|
|
|
|
|
|
o |
2 |
|
(x / xo)2 f o |
||
|
|
f |
, следовательно, |
||
|
|
|
|
o |
162
o 2 75500100 755 ,
что обусловлено и мощностью предприятий и формой собственности.
3)Дальше рассмотрим, как складываются показатели товарооборота и его вариации по группам в зависимости от форм собственности.
Расчет дисперсии по государственным предприятиям.
x / г |
f г |
|
/ |
|
|
(x |
|
|
|
|
)2 |
(x |
|
|
|
|
)2 |
|
|
||
x |
г |
xг / xг |
г |
/ x |
г |
г |
/ x |
г |
f |
г |
|||||||||||
|
|
f |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
3 |
|
4 |
|
|
|
|
5 |
|
|
|
|
|
6 |
|
|
|
|
|
110 |
10 |
1.100 |
-23 |
|
|
|
|
529 |
|
|
|
|
5.290 |
|
|
||||||
130 |
11 |
1.430 |
-3 |
|
|
|
|
9 |
|
|
|
|
|
99 |
|
|
|
||||
150 |
6 |
900 |
|
17 |
|
|
|
|
289 |
|
|
|
|
1.734 |
|
|
|||||
170 |
4 |
680 |
|
37 |
|
|
|
1.369 |
|
|
|
5.476 |
|
|
|||||||
Итого |
31 |
4.110 |
|
|
|
|
|
|
|
|
|
|
|
12.599 |
|
|
Средний объем товарооборота по государственным предприятиям составил:
xг |
|
xг / |
f г |
, следовательно, |
||||||
|
|
f |
г |
|||||||
|
|
|
|
|
|
|
|
|||
xг |
|
|
4110 |
|
133млн. руб |
|||||
|
31 |
|
||||||||
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(хг хг ) |
2 |
f г |
||||
2 |
|
|
|
|||||||
|
|
|
f г |
|
|
|
||||
г |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
2 12599 406
г
31
Расчет дисперсии по частным предприятиям.
x / ч |
f ч |
|
|
|
|
|
|
|
|
|
|
|
(xч / |
|
)2 f ч |
x |
/ f ч |
|
xч / xч |
(xч |
/ x |
ч |
)2 |
xч |
|||||||
|
|
|
ч |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
3 |
|
4 |
|
|
|
5 |
|
|
|
6 |
|
|
70 |
21 |
1.470 |
|
-23 |
|
|
529 |
|
|
11.109 |
|||||
90 |
27 |
2.430 |
|
-3 |
|
|
|
9 |
|
|
|
243 |
|||
110 |
14 |
1.540 |
|
17 |
|
|
|
289 |
|
|
4.046 |
||||
130 |
5 |
|
650 |
|
37 |
|
|
1.369 |
|
6.845 |
|||||
150 |
2 |
|
300 |
|
57 |
|
|
3.249 |
|
6.498 |
|||||
Итого: |
69 |
6.390 |
|
|
|
|
|
|
|
|
|
28.741 |
|||
|
|
|
|
163 |
|
|
|
|
|
|
|
|
|
|
Средний объем товарооборота на одно частное предприятие составил:
xч xч / f ч , следовательно,
f ч
|
xг |
6930 |
93млн.руб |
|
|
|
|
|
||||||||||||||||||||
69 |
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(хч |
|
хч ) |
2 |
fч |
|
|
|
|
|
|
|
|
|
|||||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
fч |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
ч |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ч2 |
|
|
|
|
|
28741 |
417 |
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
69 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
4)Средняя из групповых дисперсий дает обобщающую ха- |
||||||||||||||||||||||||||||
рактеристику |
|
вариации, возникающую под влиянием неучтен- |
||||||||||||||||||||||||||
ных факторов. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
406 417 |
|
|
|
823 |
|
|
|
|
|
|||||||||||||||
2 |
|
|
|
412 |
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|||
5)Расчет межгрупповой дисперсии |
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
Группы п/п по |
|
|
|
Средний объем |
|
|
|
|
|
|||||||||||||||||||
|
|
|
товарооборота |
|
Число п/п, |
xk х0 |
|
|
||||||||||||||||||||
формам собст- |
|
|
|
|
|
(хk хо )2 |
(xk xo )2 f k |
|||||||||||||||||||||
|
|
одного п/п, млн. |
|
f k |
||||||||||||||||||||||||
венности |
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
руб., xk |
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
3 |
4 |
5 |
6 |
||
государственные |
|
|
|
|
|
|
133 |
|
|
|
|
|
31 |
28 |
784 |
24.304 |
||||||||||||
частные |
|
|
|
|
|
|
93 |
|
|
|
|
|
|
69 |
-12 |
144 |
9.936 |
|||||||||||
Итого: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
100 |
|
|
34.240 |
|||
Мерой колеблемости частных средних вокруг общей сред- |
||||||||||||||||||||||||||||
ней является межгрупповая дисперсия: |
|
|
|
|||||||||||||||||||||||||
2 |
|
|
|
(x |
k |
|
x |
o |
)2 |
f |
k |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
f k |
|
|
|
|
|
, следовательно, |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2 |
|
|
34240 |
|
324 |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Общая дисперсия равна:
164
2 2 k2 , следовательно,
2 342 411 754
6) Определим коэффициент детерминации
2 2 , следовательно,
2
2 342755 0,453 или 45,3 %
Таким образом, 45,3 % различий в объеме товарооборота предприятий определено формой собственности предприятий, а 54,7 % – влиянием других факторов.
Следовательно, индекс корреляции (эмпирическое корреляционное отношение):
2
2 , то есть
342755 0,673
Данное значение индекса корреляции свидетельствует о существенном влиянии на объем товарооборота формы собственности предприятия.
5.6. Корреляционно-регрессионный метод установления связей.
Это наиболее точный метод установления взаимосвязей, рассматривающий влияние вариации факторного признака «х» на результативный «у».
В основу выявления и установления аналитической формы связи положено применение в анализе исходной информации математических функций. При изучении связи показателей приме-
165
няются разного рода уравнения прямолинейной и криволинейной зависимости.
Если результативный признак с увеличением факторного признака равномерно возрастает или убывает, то такая зависимость является линейной и выражается уравнением прямой:
, |
(7.1) |
где
х – индивидуальные значения факторного признака;
a, b – параметры уравнения прямой (уравнения регрессии); ух – теоретическое значение результативного признака.
Параметры уравнения прямой a и b определяются путем решения системы нормальных уравнений, полученных методом наименьших квадратов или по формулам:
(7.2)
или
(7.3)
(7.4)
Параметр можно также найти по формуле:
(7.5)
Если данные сгруппированы и представлены в виде корреляционной таблицы, то параметры уравнения регрессии при прямолинейной зависимости могут быть определены или с помощью решения системы нормальных уравнений:
(7.6)
166
или по формулам:
(7.7)
,
(7.8)
где – групповые средние.
Параметр а можно также определить по формуле (7.5), т. е.:
В уравнении прямой параметр a не имеет экономического смысла. Параметр b является коэффициентом регрессии и показывает изменение результативного признака при изменении факторного признака на единицу. Часто исследуемые признаки имеют разные единицы измерения, поэтому для оценки влияния факторного признака на результативный применяется коэффициент эластичности. Он рассчитывается для каждой точки и в среднем по всей совокупности.
Коэффициент эластичности рассчитывается как:
(7.9)
где – первая производная уравнения регрессии.
Средний коэффициент эластичности для уравнения прямой определяют по следующей формуле:
(7.10)
Значение данного коэффициента показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1%.
Дальнейшим шагом является установление тесноты взаимосвязи. Для чего рассчитываются: линейный коэффициент корреляции, теоретическое корреляционное отношение, индекс корреляции.
167
Линейный коэффициент корреляции используется для измерения тесноты связи только при линейной зависимости:
(7.11)
(7.12)
В зависимости от степени приближения значения данного коэф-
фициента k 1 |
|
|
различают связь: |
|
|
1. |
слабая |
до 0,3 (+) |
2. |
умеренная |
0,3 – 0,5 |
3. |
заметная |
0,5 – 0,7 |
4. |
высокая |
0,7 – 0,9 |
5. |
весьма высокая |
более 0,9 |
Теоретическое корреляционное отношение и индекс корреляции применяются для измерения тесноты корреляционной связи между признаками как при линейной, так и не линейной зависимости.
Теоретически корреляционное отношение рассчитывается:
|
(7.13) |
; |
(7.14) |
− факторная дисперсия, которая характеризует вариацию результативного признака под влиянием признака-фактора, включенного в модель:
(7.15)
168
− общая дисперсия, которая характеризует вариацию результативного признака под влиянием всех факторов, вызывающих эту вариацию.
Теоретическое корреляционное отношение изменяется от 0 до 1, чем ближе корреляционное отношение к 1, тем теснее связь между признаками.
Индекс корреляции может быть определен с помощью следующих формул:
(7.16)
(7.17)
(7.18)
где
− остаточная дисперсия, которая характеризует вариацию результативного признака под влиянием прочих неучтенных факторов.
Дальнейшим шагом является оценка адекватности регрессионной модели и значимости показателей тесноты корреляционной связи.
Адекватность регрессионной модели при малой выборке (n<30) оценивается с помощью критерия Фишера:
(7.19)
где
m – число параметров модели ; n – число единиц наблюдения.
Затем эмпирическое значение критерия Fэ сравнивается с табличным Fт, с уровнем значимости 0,01 или 0,05 и числом степеней свободы (m - 1), (n - m) . Если Fэ > Fт , то уравнение регрессии признается значимым.
169