Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособиеМС(1окон).doc
Скачиваний:
151
Добавлен:
31.05.2015
Размер:
1.76 Mб
Скачать

2.3.4. Проверка значимости параметров связи

В двумерной модели параметрами связи являются коэффициент корреляции (или квадрат, называемый коэффициентом детерминации) и коэффициенты регрессии yx и xy.

Заметим, что в двумерной модели достаточно проверить значимость только коэффициента корреляции. Если коэффициент корреляции незначим, то признаки х и у считаются независимыми в генеральной совокупности.

Статистика r, вычисляемая для выборки из двумерной нормально распределенной совокупности с = 0, связана со статистикой t, имеющей распределения Стьюдента с v=n-2 степенями свободы, формулой

(123)

Зная границы для t, соответствующие обычным уровням значимости (=10%, 5%, 2%, 1%), можно получить границы для r, воспользовавшись этой формулой. Границы для r табулированы. Таким образом, для проверки гипотезы H0: =0 по данным и v =п-2 находим rтабл . Если |rнабл | > rтабл , то гипотеза Но отвергается с вероятностью ошибки , если же |rнабл | < rтабл, то гипотеза не отвергается. При v> 100 для проверки H0: =0 следует пользоваться нормированным нормальным законом распределения статистики

Если наблюдаемая величина (t или ) расположена в доверительном интервале[-t1-, t1-], то гипотеза Н0 не отвергается; в противном случае H0 отвергается с уровнем значимости .

2.3.5. Интервальные оценки параметров связи

Для значимых параметров связи имеет смысл найти интервальные оценки.

При нахождении доверительного интервала для коэффициента корреляции  используют статистику, введенную Фишером:

,

которая при n>10 распределена приблизительно нормально с

генеральным средним и дис

персией .

Тогда доверительный интервал, оценивающий MZr с надежностью =1-, имеет вид

(124)

где t — находится по таблицам интеграла Лапласа для данного (или =1-).

Для перехода от Z к имеется таблица, составленная Фишером и Иейтсом, после использования которой получаем интервальную оценку с надежностью вида

где rmin и rmax выбираются с учетом того, что Zr — функция нечетная. При этом поправочным членом уMZr пренебрегают.

Если коэффициент корреляции значим, то коэффициенты регрессии также значимо отличаются от нуля (с тем же уровнем ). Интервальные оценки для них получаются по формулам:

где t имеет распределение Стьюдента с v =n-2 степенями свободы.

Переход от неравенства |к интервальным оценкам для коэффициента регрессии осуществляется с помощью тождественных алгебраических преобразований.

Для значимого коэффициента корреляции некоторые авторы рекомендуют более предпочтительную оценку, чем r:

Предпочтительной оценкой 2 является выражение

Этими точечными оценками следует пользоваться при небольших объемах n выборки.

Кроме нахождения интервальной оценки для , с помощью преобразования

можно решить следующие задачи.

1. Проверить, согласуется ли выборочный коэффициент корреляции r с предполагаемым значением генерального коэффициента корреляции 0. Для этого, взяв уровень значимости , проверяем, попадает ли абсолютная величина разности |Zr -Z | в интервал [0,t1- /]. Если попадает, то гипотеза Н0: =0 не отвергается. В противном случае отвергается с уровнем .

1. Проверить гипотезу об однородности коэффициентов корреляции. Пусть r1, r2, ..., rk. — коэффициенты корреляции, полученные из k нормально распределенных совокупностей по выборкам с объемами n1, n2, ..., nk. Проверяется гипотеза

Статистика

имеет тогда распределение 2 с k степенями свободы. Если заменить z на среднее арифметическое

то получим, что

распределена по закону 2 с v=k-1 степенями свободы. Если теперь для заданных а и v=k-1

то гипотеза однородности отвергается с уровнем . В противном случае гипотеза Н0 не отвергается.

В случае принятия гипотезы однородности предпочтительной точечной оценкой является значение r, полученное обратным преобразованием из zr.