Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СтатистикаЛевина 2012

.pdf
Скачиваний:
147
Добавлен:
10.05.2015
Размер:
4.83 Mб
Скачать

5.5. Метод дисперсионного анализа.

Для статистической совокупности, сгруппированной по изучаемому признаку, возможно вычисление трех видов дисперсий:

-общей ( 2 ); -межгрупповой ( 2 ) и

-средней из внутригрупповых дисперсий ( k2 ).

Между указанными видами дисперсий существует соотношение, которое называется правилом сложения дисперсий:

2 2 к2

На основе данного правила строится метод дисперсионного анализа.

Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности:

 

 

 

 

 

 

 

2

 

(xi хо)2 f

о

, где

 

f

 

 

 

 

 

 

 

 

 

о

 

 

xi – индивидуальное значение признака;

f о – частота, то есть число повторений данного значения признака;

хо – общая средняя для всей изучаемой совокупности.

Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием факторного признака, положенного в основу группировки:

2

 

(

хк

 

хо

)2 f

k

 

 

 

 

 

 

 

 

, где

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

хk – средняя по отдельным группам;

xo – средняя общая;

f k – численность отдельных групп.

Средняя внутригрупповых дисперсий характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает

160

под влиянием других, не учитываемых факторов и не зависит от факторного признака, положенного в основу группировки.

Зная, что внутригрупповая дисперсия равна:

k

2

 

(xk

xk

)2 f

k

 

 

f

 

 

, то

 

 

 

 

 

 

 

 

 

k

 

 

средняя внутригрупповых дисперсий определяется как:

k 2

k 2

n

Если основанием группировки является факторный признак, то с помощью правила сложения дисперсий можно измерить силу его влияния на результативный признак, вычислив коэффициент детерминации и эмпирическое корреляционное отношение.

Коэффициент детерминации:

2 2

2

показывает долю общей вариации результативного признака, обусловленную вариацией группировочного признака.

Эмпирическое корреляционное отношение:

 

 

2

2

 

 

По абсолютной величине он может изменяться в интервале

[0,1].

Если = 0, следовательно, группировочный признак не оказывает влияния на результативный.

Если = 1, следовательно, изменение результативного признака полностью обусловлено группировочным признаком, то есть между ними существует функциональная связь. Таким образом, чем ближе к 1, тем теснее связь и наоборот.

Поэтому порядок установления взаимосвязи методом дисперсионного анализа сводится к следующему:

1)рассчитывают общую среднюю и общую дисперсию по всей совокупности;

2)всю совокупность разбивают на группы по изучаемому признаку;

161

3)по каждой группе рассчитывают среднее значение признака и дисперсию;

4)рассчитывают среднюю дисперсию из внутригрупповых;

5)рассчитывают межгрупповую дисперсию;

6)рассчитывают индекс корреляции.

Пример: Рассмотрим этот метод по данным распределения торговых предприятий по объему товарооборота и формам собственности.

1)Расчет общей дисперсии, складывающейся под влиянием всех факторов.

Группы п/п

 

Численность пред-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

по количе-

 

приятий по формам

 

 

 

 

Расчетные показатели

 

 

 

 

ству това-

 

собственности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рооборота,

 

гос.

 

 

част.

всего

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

млн. руб.

 

 

 

x

/

x

/

f o

(x

/

 

о

(x

/

 

о

2

(x / xо)2 f

 

 

fг

 

 

fч

fо

 

 

 

x1

 

 

 

 

 

 

x )

 

x )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

60 – 80 (+)

 

-

 

21

21

70

1.470

-35

 

 

1.225

 

25.725

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

80 – 100

 

-

 

27

27

90

2.430

-15

 

 

 

 

225

 

 

6.075

 

100 –120

 

10

 

14

24

110

2.640

 

+5

 

 

 

 

25

 

 

600

 

 

120 – 140

 

11

 

5

16

130

2.080

 

25

 

 

 

 

625

 

 

10.000

 

140 – 160

 

6

 

2

8

150

1.200

 

45

 

 

2.025

 

16.200

 

160 – 180

 

4

 

-

4

170

680

 

65

 

 

4.225

 

16.900

 

Итого:

 

31

 

69

100

 

 

10.500

 

 

 

 

 

8.350

 

75.500

 

Средний объем товарооборота на одно предприятие соста-

вит:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xo

x /

f o

, следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xo 10500100 105млн.руб

Общая дисперсия товарооборота по исследуемым предприятиям будет равна:

 

 

 

 

 

 

o

2

 

(x / xo)2 f o

 

 

f

, следовательно,

 

 

 

 

o

162

o 2 75500100 755 ,

что обусловлено и мощностью предприятий и формой собственности.

3)Дальше рассмотрим, как складываются показатели товарооборота и его вариации по группам в зависимости от форм собственности.

Расчет дисперсии по государственным предприятиям.

x / г

f г

 

/

 

 

(x

 

 

 

 

)2

(x

 

 

 

 

)2

 

 

x

г

xг / xг

г

/ x

г

г

/ x

г

f

г

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

3

 

4

 

 

 

 

5

 

 

 

 

 

6

 

 

 

 

110

10

1.100

-23

 

 

 

 

529

 

 

 

 

5.290

 

 

130

11

1.430

-3

 

 

 

 

9

 

 

 

 

 

99

 

 

 

150

6

900

 

17

 

 

 

 

289

 

 

 

 

1.734

 

 

170

4

680

 

37

 

 

 

1.369

 

 

 

5.476

 

 

Итого

31

4.110

 

 

 

 

 

 

 

 

 

 

 

12.599

 

 

Средний объем товарооборота по государственным предприятиям составил:

xг

 

xг /

f г

, следовательно,

 

 

f

г

 

 

 

 

 

 

 

 

xг

 

 

4110

 

133млн. руб

 

31

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(хг хг )

2

f г

2

 

 

 

 

 

 

f г

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 12599 406

г

31

Расчет дисперсии по частным предприятиям.

x / ч

f ч

 

 

 

 

 

 

 

 

 

 

 

(xч /

 

)2 f ч

x

/ f ч

 

xч / xч

(xч

/ x

ч

)2

xч

 

 

 

ч

 

 

 

 

 

 

 

 

 

 

 

1

2

 

3

 

4

 

 

 

5

 

 

 

6

 

70

21

1.470

 

-23

 

 

529

 

 

11.109

90

27

2.430

 

-3

 

 

 

9

 

 

 

243

110

14

1.540

 

17

 

 

 

289

 

 

4.046

130

5

 

650

 

37

 

 

1.369

 

6.845

150

2

 

300

 

57

 

 

3.249

 

6.498

Итого:

69

6.390

 

 

 

 

 

 

 

 

 

28.741

 

 

 

 

163

 

 

 

 

 

 

 

 

 

 

Средний объем товарооборота на одно частное предприятие составил:

xч xч / f ч , следовательно,

f ч

 

xг

6930

93млн.руб

 

 

 

 

 

69

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(хч

 

хч )

2

fч

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fч

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ч

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ч2

 

 

 

 

 

28741

417

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

69

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4)Средняя из групповых дисперсий дает обобщающую ха-

рактеристику

 

вариации, возникающую под влиянием неучтен-

ных факторов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

406 417

 

 

 

823

 

 

 

 

 

2

 

 

 

412

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

5)Расчет межгрупповой дисперсии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Группы п/п по

 

 

 

Средний объем

 

 

 

 

 

 

 

 

товарооборота

 

Число п/п,

xk х0

 

 

формам собст-

 

 

 

 

 

(хk хо )2

(xk xo )2 f k

 

 

одного п/п, млн.

 

f k

венности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

руб., xk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

3

4

5

6

государственные

 

 

 

 

 

 

133

 

 

 

 

 

31

28

784

24.304

частные

 

 

 

 

 

 

93

 

 

 

 

 

 

69

-12

144

9.936

Итого:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

34.240

Мерой колеблемости частных средних вокруг общей сред-

ней является межгрупповая дисперсия:

 

 

 

2

 

 

 

(x

k

 

x

o

)2

f

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f k

 

 

 

 

 

, следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

34240

 

324

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая дисперсия равна:

164

2 2 k2 , следовательно,

2 342 411 754

6) Определим коэффициент детерминации

2 2 , следовательно,

2

2 342755 0,453 или 45,3 %

Таким образом, 45,3 % различий в объеме товарооборота предприятий определено формой собственности предприятий, а 54,7 % – влиянием других факторов.

Следовательно, индекс корреляции (эмпирическое корреляционное отношение):

2

2 , то есть

342755 0,673

Данное значение индекса корреляции свидетельствует о существенном влиянии на объем товарооборота формы собственности предприятия.

5.6. Корреляционно-регрессионный метод установления связей.

Это наиболее точный метод установления взаимосвязей, рассматривающий влияние вариации факторного признака «х» на результативный «у».

В основу выявления и установления аналитической формы связи положено применение в анализе исходной информации математических функций. При изучении связи показателей приме-

165

няются разного рода уравнения прямолинейной и криволинейной зависимости.

Если результативный признак с увеличением факторного признака равномерно возрастает или убывает, то такая зависимость является линейной и выражается уравнением прямой:

,

(7.1)

где

х – индивидуальные значения факторного признака;

a, b – параметры уравнения прямой (уравнения регрессии); ух – теоретическое значение результативного признака.

Параметры уравнения прямой a и b определяются путем решения системы нормальных уравнений, полученных методом наименьших квадратов или по формулам:

(7.2)

или

(7.3)

(7.4)

Параметр можно также найти по формуле:

(7.5)

Если данные сгруппированы и представлены в виде корреляционной таблицы, то параметры уравнения регрессии при прямолинейной зависимости могут быть определены или с помощью решения системы нормальных уравнений:

(7.6)

166

или по формулам:

(7.7)

,

(7.8)

где – групповые средние.

Параметр а можно также определить по формуле (7.5), т. е.:

В уравнении прямой параметр a не имеет экономического смысла. Параметр b является коэффициентом регрессии и показывает изменение результативного признака при изменении факторного признака на единицу. Часто исследуемые признаки имеют разные единицы измерения, поэтому для оценки влияния факторного признака на результативный применяется коэффициент эластичности. Он рассчитывается для каждой точки и в среднем по всей совокупности.

Коэффициент эластичности рассчитывается как:

(7.9)

где – первая производная уравнения регрессии.

Средний коэффициент эластичности для уравнения прямой определяют по следующей формуле:

(7.10)

Значение данного коэффициента показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1%.

Дальнейшим шагом является установление тесноты взаимосвязи. Для чего рассчитываются: линейный коэффициент корреляции, теоретическое корреляционное отношение, индекс корреляции.

167

Линейный коэффициент корреляции используется для измерения тесноты связи только при линейной зависимости:

(7.11)

(7.12)

В зависимости от степени приближения значения данного коэф-

фициента k 1

 

различают связь:

 

1.

слабая

до 0,3 (+)

2.

умеренная

0,3 – 0,5

3.

заметная

0,5 – 0,7

4.

высокая

0,7 – 0,9

5.

весьма высокая

более 0,9

Теоретическое корреляционное отношение и индекс корреляции применяются для измерения тесноты корреляционной связи между признаками как при линейной, так и не линейной зависимости.

Теоретически корреляционное отношение рассчитывается:

 

(7.13)

;

(7.14)

− факторная дисперсия, которая характеризует вариацию результативного признака под влиянием признака-фактора, включенного в модель:

(7.15)

168

− общая дисперсия, которая характеризует вариацию результативного признака под влиянием всех факторов, вызывающих эту вариацию.

Теоретическое корреляционное отношение изменяется от 0 до 1, чем ближе корреляционное отношение к 1, тем теснее связь между признаками.

Индекс корреляции может быть определен с помощью следующих формул:

(7.16)

(7.17)

(7.18)

где

− остаточная дисперсия, которая характеризует вариацию результативного признака под влиянием прочих неучтенных факторов.

Дальнейшим шагом является оценка адекватности регрессионной модели и значимости показателей тесноты корреляционной связи.

Адекватность регрессионной модели при малой выборке (n<30) оценивается с помощью критерия Фишера:

(7.19)

где

m – число параметров модели ; n – число единиц наблюдения.

Затем эмпирическое значение критерия Fэ сравнивается с табличным Fт, с уровнем значимости 0,01 или 0,05 и числом степеней свободы (m - 1), (n - m) . Если Fэ > Fт , то уравнение регрессии признается значимым.

169