Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпаргалки для студентов.doc
Скачиваний:
4
Добавлен:
21.08.2019
Размер:
1.27 Mб
Скачать

Вопрос 36 Количественная оценка тесноты связи по эмпирическим данным: эмпирический коэффициент детерминации, эмпирическое корреляционное отношение. Ответ

Количественная оценка тесноты связи по эмпирическим данным состоит в расчете показателей тесноты связи:

  • Эмпирический коэффициент детерминации (эмпирическое дисперсионное отношение) - 2.

Данный показатель рассчитывается по данным аналитической группировки (табл.), как отношение межгрупповой дисперсии признака-результата Y (y2) к общей дисперсии Y (y2):

.

Согласно теореме о разложении дисперсии межгрупповая дисперсия связана с общей дисперсией: y2=y2+y2. Тогда эмпирический коэффициент детерминации может быть рассчитан через остаточную дисперсию по формуле:

где j2 – дисперсия признака-результата Y внутри j-ой группы.

Эмпирический коэффициент детерминации характеризует силу влияния группировочного признака (Х) на образование общей вариации результативного признака Y и показывает процент (долю) вариации признака-результата, обусловленную признаком-фактором, положенным в основу группировки.

Расчет 2 удобно вести в таблице:

Таблица

Признак- фактор

Хj

Nj

Среднее значение признака-результата

j2Nj

X1

N1

12N1

X2

N2

22N2

....

...

Xm

Nm

m2Nm

Итого

N

Х

j2

Тогда .

Рассмотрим пример. Пусть дана совокупность из 20 рабочих, характеризующихся признаками: Y - выработка рабочего (шт./смену) и Х- квалификация (разряд). Исходные данные представлены в таблице:

X

4

5

3

6

5

3

4

6

3

5

7

5

8

7

6

6

8

7

8

8

Y

11

13

10

17

12

12

14

18

13

15

18

16

27

20

15

17

24

22

25

23

Требуется оценить тесноту связи между признаками с помощью эмпирического коэффициента детерминации (2).

Для расчета 2 произведем аналитическую группировку совокупности. В качестве признака-фактора возьмем Х (разряд рабочего), в качестве признака-результата – Y выработку рабочего). Аналитическая группировка производится по признаку Х. В данном случае она будет дискретная (т.к. значения признака Х довольно часто повторяются). Количество групп равно числу значений признака Х в совокупности, т.е. 6. Результаты группировки и расчета 2 сведем в таблицу:

Признак-фактор Х

Признак-результат Y

Количество единиц в группе, Nj

Среднее значение признака-результата в группе,

( - )2·Nj

Дисперсия признака-результата в группе, 2j

2j·Nj

3

10

3

(10+12+13)/3=11,7

(11,7-17,1)23=88,56

21=((10-11,7)2+(12-11,7)2+(13-11,7)2)/3=1,56

4,7

12

13

4

11

2

(11+14)/2=12,5

(12,5-17,1)22=42,3

22=((11-12,5)2+(14-12,5)2)/2=2,25

4,5

14

5

12

4

(12+13+15+16)/4= 14

(14-17,1)24=38,4

23=((12-14)2+(13-14)2+(15-14)2+(16-14)2)/4=2,5

10

13

15

16

6

15

4

(15+17+17+18)/4= 16,75

(16,75-17,1)24=0,49

24=((15-16,75)2+(17-16,75)2++(17-16,75)2+(18-16,75)2)/4=1,9

4,75

17

17

18

7

18

3

(18+20+22)/3=20

(20-17,1)23=25,23

25=((18-20)2+(20-20)2+(22-20)2)/3=2,7

8

20

22

8

23

4

(23+24+27+25)/4= 24,75

(24,75-17,1)24=234,1

26=((23-24,75)2+(24-24,75)2+(27-24,75)2+(25-24,75)2)/4=2,19

8,75

24

27

25

=17,1

20

429,1

40,7

Эмпирический коэффициент детерминации равен отношению межгрупповой дисперсии признака-результата (y2) к общей дисперсии признака-результата (y2): 2 = y2/y2 = y2/(y2+y2).

Межгрупповая дисперсия Y будет равна: y2= ( - )2·Nj / N = 429,1/20=21,45.

Остаточная дисперсия Y будет равна: y2= 2j·Nj/ N= 40,7/20= 2,035.

Тогда: 2=21,45/(21,45+2,035)= 429,1/(429,1+40,7)=0,913.

Вывод: 91,3% вариации выработки рабочих обусловлена влиянием фактора разряд.

  • Эмпирическое корреляционное отношение - .

Данный показатель представляет собой корень из эмпирического коэффициента детерминации. Оно показывает тесноту связи (не только линейной!) между группировочным и результативным признаками. Область допустимых значений эмпирического корреляционного отношения от 0 до +1.

Максимально тесная связь – это связь функциональная, когда каждое значение признака-результата Y однозначно определяется значением признака-фактора Х (т.е. результатом группировки). В этом случае дисперсия групповых средних (y2) равна общей дисперсии (y2), т.е. внутригрупповой вариации не будет. При этом остаточная дисперсия (y2) равна 0, а эмпирический коэффициент детерминации равен 1.

Если связь между признаками отсутствует, то все групповые средние равны между собой, межгрупповой вариации не будет (y2=0), а эмпирический коэффициент детерминации равен 0.

Рассчитаем эмпирическое корреляционное отношение для нашего примера: = 0,9555. Вывод: признаки «выработка рабочего» и «разряд» связаны довольно тесной связью.

Показатели  и 2 определяются не только наличием связи признаков Х и Y, но и фактом группировки первичных данных. С ростом числа групп m межгрупповая дисперсия 2 растет и приближается к общей дисперсии. Если число групп меньше количества единиц совокупности N, то значения  и 2 никогда не будут равны 1, даже при строгой функциональной связи.

Заметим, что сама по себе величина показателя тесноты связи не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменениях признаков. Установлению причинно-следственной зависимости должен обязательно предшествовать анализ качественной природы явлений.