Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции (Статистика).doc
Скачиваний:
31
Добавлен:
07.05.2019
Размер:
1.66 Mб
Скачать

9.2.1.2. Метод группировок

При большом числе наблюдений для выявления корреляционной связи между двумя количественными показателями X и Y удобно пользоваться методом группировок.

Чтобы выявить наличие корреляционной связи между двумя признаками, проводится группировка единиц совокупности и для каждой выделенной группы рассчитывается среднее значение результативного признака . Если результативный признак зависит от факторного признака, то в изменении среднего значения результативного признака будет прослеживаться определенная закономерность.

Таблица 9.2

Зависимость между суточной выработкой продукции (Y) и величиной основных производственных фондов (X) для совокупности 50 однотипных предприятий

Величина

ОПФ, млн. руб. (X)

Середины

интервалов

Суточная выработка продукции, т (Y)

Групповая

средняя, т,

7 – 11

11 – 15

15 – 19

19 – 23

23 – 27

9

13

17

21

25

20 – 25

22,5

2

1

3

10,3

25 – 30

27,5

3

6

4

13

13,3

30 – 35

32,5

3

11

7

21

17,8

35 – 40

37,5

1

2

6

2

11

20,3

40 – 45

42,5

1

1

2

23,0

5

11

17

14

3

50

Групповая средняя, млн. руб.,

25,5

29,3

31,9

35,4

39,2

Рис. 1. График корреляционного поля и эмпирической линии регрессии

Корреляционное поле отражает не только общую зависимость между X и Y, но и концентрацию индивидуальных точек вокруг линии регрессии показателя .

9.2.1.3. Выборочный линейный коэффициент корреляции к. Пирсона

На основе аналитических группировок и корреляционных таблиц можно не только выявить наличие зависимости между двумя коррелируемыми показателями, но и измерить тесноту этой связи, в частности, с помощью линейного коэффициента корреляции r.

При расчете этого показателя учитываются не только знаки отклонений индивидуальных значений признака от средней, но и сами величины таких отклонений, т.е. и . Однако непосредственно сопоставить между собой полученные абсолютные величины нельзя, т.к. сами признаки могут быть выражены в разных единицах, а при наличии одних и тех же единиц измерения средние могут быть различны по величине. В этой связи сравнению могут подлежать отклонения, выраженные в относительных величинах, к примеру, в долях среднего квадратического отклонения (их называют нормированными отклонениями).

Так для факторного признака будем иметь совокупность величин , а для результативного .

Для получения обобщающей характеристики степени тесноты связи между признаками рассчитывают среднее произведение нормированных отклонений, полученная величина и является линейным коэффициентом корреляции:

. (9.2)

Величину, расположенную в числителе, называют ковариацией или корреляционным моментом:

. (9.3)

Вычисление коэффициента корреляции по формуле (9.2) является трудоемкой операцией, поэтому на практике используют следующую формулу:

. (9.4)

Если исходная информация сгруппирована и подсчитаны частоты повторений пар исследуемых признаков, то для расчета линейного коэффициента корреляции используют взвешенную формулу:

. (9.5)

На основе аналитических группировок и корреляционных таблиц можно не только выявить наличие зависимости между двумя коррелируемыми показателями, но и измерить тесноту этой связи, в частности, с помощью эмпирического корреляционного отношения:

,

и эмпирического коэффициента детерминации:

,

где и соответственно межгрупповая и общая дисперсии результативного признака.

Для нашего примера данные показатели будут равны:

.

.

Эмпирический коэффициент детерминации характеризует, что вариация зависимого результативного признака (суточной выработки продукции) только на 57% объясняется вариацией независимого признака (основных производственных фондов предприятий). Остальные 43% – действие прочих неучтенных факторов.

.

Значение эмпирического корреляционного отношения (учитывая, что связь между X и Y – прямая, значение взято со знаком «+») характеризует тесноту связи выше средней, поэтому можно сделать вывод о наличии существенной прямой связи между суточной выработкой продукции и стоимостью основных производственных фондов.