Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика общая (лекции для ЗИЭФ контрольн. ра...doc
Скачиваний:
12
Добавлен:
16.11.2019
Размер:
3.36 Mб
Скачать

Расчетные значения, необходимые для исчисления дост, дx

у-

(у- )2

-

( - )2

y-

-3,3

10,89

-2,7

7,29

-0,6

0,36

-2,3

5,29

-2,1

4,41

-0,2

0,04

-1,3

1,69

-1,5

2,25

0,2

0,04

-0,3

0,09

-0,9

0,81

0,6

0,36

-0,3

0,09

-0,3

0,09

0,0

0,0

0,7

0,49

0,3

0,09

0,4

0,16

0,7

0,49

0,9

0,81

-0,2

0,04

1,7

2,89

1,5

2,25

0,2

0,04

2,7

7,29

2,1

4,41

0,6

0,36

1,7

2,89

2,7

7,29

-1,0

1,0

Итого

32,10

29,70

2,40

Средние квадратические отклонения (см. табл. 9.1):

=2,87.

Расчетные значения t- критерия Стьюдента:

По таблице распределения Стьюдента для ν= 8 находим критическое значение t-критерия: (tтабл= 3,307 при α = 0,05).

Поскольку расчетное значение tрасч>tтабл, оба параметра a0, a1 признаются значимыми (отклоняется гипотеза о том, что каждый из этих параметров в действительности равен нулю, и лишь в силу случайных обстоятельств оказался равным прове­ряемой величине).

Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением ηэ, когда (межгрупповая дисперсия) харак­теризует отклонения групповых средних результативного признака от общей средней: ηэ = .

Говоря о корреляционном отношении как о показателе из­мерения тесноты зависимости, следует отличать от эмпириче­ского корреляционного отношения — теоретическое.

Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выровненных значений ре­зультативного признака δ, т. е. рассчитанных по уравнению регрес­сии, со средним квадратическим отклонением эмпирических (факти­ческих) значений результативного признака σ:

ηэ = .

Где ;

Тогда η= (9.6)

Изменение значения η объясняется влиянием факторного признака.

В основе расчета корреляционного отношения лежит правило

сложения дисперсий (см. главу 5), т. е. , где - отра­жает вариацию у за счет всех остальных факторов, кроме х, т. е. является остаточной дисперсией:

Тогда формула теоретического корреляционного отношения примет вид:

(9.7)

или (9.8)

Подкоренное выражение корреляционного отношения пред­ставляет собой коэффициент детерминации (меры определенно­сти, причинности). Коэффициент детерминации показывает до­лю вариации результативного признака под влиянием вариации признака-фактора.

Теоретическое корреляционное отношение применяется для измерения тесноты связи при линейной и криволинейной зависи­мостях между результативным и факторным признаком. При кри­волинейных связях теоретическое корреляционное отношение, ис­числяемое по формулам (9.7), (9.8), часто называют индексом кор­реляции R. При значительной корреляции расчет по формулам (9.7) и (9.8) значительно проще, так как отклонение (у- ), как прави­ло, по значению меньше, чем отклонение ( - ).

Как видно из формул (9.7) и (9.8), корреляционное отноше­ние может находиться в пределах от 0 до 1, т. е. (0 ≤ η ≤ 1). Чем ближе корреляционное отношение к 1, тем связь между призна­ками теснее.

Проиллюстрируем расчет теоретического корреляционного от­ношения как меры тесноты связи на примере, рассмотренном в табл.9.1, для которого по уравнению прямой регрессии = 4 + 0,6x найдены значения дневной выработки каждого рабочего.

Теоретическое корреляционное отношение рассчитываем дву­мя способами (см. данные табл.9.2):

По формуле (9.6) = ;

По формуле (9.8) =

Полученное значение теоретического корреляционного отно­шения свидетельствует о возможном наличии весьма тесной пря­мой зависимости между рассматриваемыми признаками.

Коэффициент детерминации равен 0,925. Отсюда заключаем, что 92,5% общей вариации выработки в изучаемой бригаде обуслов­лено вариацией фактора — стажа работы рабочих (и только 7,5% общей вариации нельзя объяснить изменением стажа работы).

Кроме того, при линейной форме уравнения применяет­ся другой показатель тесноты связи - линейный коэффици­ент корреляции:

(9.9)

где n— число наблюдений.

Для практических вычислений при малом числе наблюде­ний, n ≤ (20 ÷30), линейный коэффициент корреляции удобнее исчислять по следующей формуле:

. (9.10)

Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1 ≤ r ≤ +1.

Отрицательные значения указывают на обратную связь, по­ложительные — на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной вели­чине к единице, тем теснее связь между признаками. И, наконец, при r= ±1 связь — функциональная.

Используем данные табл. 9.1 и рассчитаем линейный коэффициент корреляции по формуле (9.10):

Квадрат линейного коэффициента корреляции называется линейным коэффициентом детерминации. Из определения коэффици­ента детерминации очевидно, что его числовое значение всегда за­ключено в пределах от 0 до 1, т. е. 0 < < 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отно­шению, которое является более универсальным показателем тесно­ты связи по сравнению с линейным коэффициентом корреляции.

Факт совпадений и несовпадений значений теоретического корреляционного отношения з и линейного коэффициента кор­реляции r используется для оценки формы связи.

Выше отмечалось, что посредством теоретического корреля­ционного отношения измеряется теснота связи любой формы, а с помощью линейного коэффициента корреляции - только прямолинейной. Следовательно, значения η и r совпадают толь­ко при наличии прямолинейной связи. Несовпадение этих зна­чений свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов и не превышает 0,1, то гипотезу о пря­молинейной форме связи можно считать подтвержденной. В приведенном ранее примере совпадение значений η и r (η = r = 0,962) дает основание считать связь между выработкой рабочих и их стажем прямолинейной.

Показатели тесноты связи, исчисленные по данным сравни­тельно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость про­верки их существенности, дающей возможность распространять выводы по результатам выборки на генеральную совокупность.

Для оценки значимости коэффициента корреляции r исполь­зуют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального.

При линейной однофакторной связи t-критерий можно рас­считать по формуле:

(9.11)

где (n -2) — число степеней свободы при заданном уровне значимости б и объеме выборки п.

Полученное значение tрасч сравнивают с табличным значе­нием t-критерия (для α = 0,05 и 0,01). Если рассчитанное зна­чение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (т. е. отклоняется гипотеза о его случайности).

Так, для коэффициента корреляции между выработкой и ста­жем работы получим:

Это значительно больше критического значения t для n — 2 = 8 степеней свободы и α = 0,01 (tтабл = 3,356), что свидетельствует о значимости коэффициента корреляции и существенности связи между выработкой и стажем работы.

Таким образом, построенная регрессионная модель = 4 + 0,6x в целом адекватна, и выводы, полученные по результатам малой выбор­ки, можно с достаточной вероятностью распространить на всю гипоте­тическую генеральную совокупность.