Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Главы 4-5 KeatYoung с рисунками.doc
Скачиваний:
5
Добавлен:
10.11.2019
Размер:
17.2 Mб
Скачать

1,708 При уровне значимости 0,05 и использовании одностороннего критерия.

При использовании двустороннего критерия t-значение равняется 2,060. Если

t-значенме, рассчитанное для определенного коэффициента, превышает 1.798,

МЫ можем сказать, что этот коэффициент значим на уровне 0,05 при исполь-

зовании одностороннего коэффициента.5 Если оно больше 2,060, то это верно

при использовании двустороннею критерия. Простой и полезный способ опре-

деления критического уровня заключается в использовании правила двух. Это

означает, что если абсолютное значение t превышает 2, то мы можем сделать

вывод, что коэффициент значим на уровне 0,05,

Из предшествующего уравнения регрессии видно, что X, (цена пиццы) и А':1

(цена лимонада) статистически значимы, потому что абсолютные значения их

^статистики равны 4,89 и 3,80 соответственно. Две остальные переменные,

X (плата за обучение) и Хл (расположение студенческого городка), не являют-

ся статистически значимыми, потому что абсолютные значения их г-статисти-

ки меньше 2.

Если полученный коэффициент переменной проходит t-тест, мы можем быть

уверенными, что переменная действительно оказывает влияние на спрос. Если

он не проходит t-тест, то при любых условиях переменная не оказывает реаль-

ного влияния на весь массив студентов. Другими словами, коэффициенты ре-

грессии не равняются нулю только из-за случайности, возникшей в выборке из

общего массива студентов.

В статистическом анализе максимум, на что мы можем рассчитывать, — это уверенность в том, что наша выборка действительно отражает массив, ко-

торый она представляет. Однако мы никогда не можем быть абсолютно уве-

ренными. Поэтому статистики устанавливают степень неопределенности. Как

будет объясняться в этой главе далее, использование правила двух представ-

ляет собой 5%-ный уровень значимости. Другими словами, когда мы утверж-

даем, что коэффициент проходит правило двух (модификацию t-теста) и счи-

тается статистически значимым, мы оставляем себе 5%-ную вероятность

ошибки.

Другим важным статистическим показателем, который используется для

оценки результатов регрессии, является коэффициент смешанной корреляции,

или R2. Этот показатель демонстрирует, какая часть изменения зависимой пе-

ременной вызвана изменением всех объясняющих переменных в уравнении

регрессии. Значение этого показателя варьирует от 0 (изменение зависимой

переменной не вызвано изменением объясняющих переменных) до 1,0 (все из-

менение зависимой переменной вызвано изменениями объясняющих перемен-

ных). Для статистиков чем ближе R2 к 1,0, тем выше объясняющая сила регрес-

сионного уравнения.

В нашем уравнении регрессии для пиццы R2 равняется 0,717. Это значит,

что примерно 72% изменения спроса на пиццу среди студентов колледжей вы-

звано изменениями цены на пиццу, стоимости обучения, стоимости прохлади-

тельных напитков и расположением колледжа. Как будет объясняться в этой

главе далее, R2 увеличивается по мере того, как в уравнении регрессии добав-

ляются независимые переменные. Поэтому большинство аналитиков предпо-

читают использовать критерий, позволяющий скорректировать количество

независимых переменных, используемых в уравнении, чтобы уравнения с раз-

личным количеством переменных можно было удобнее сравнивать между со-

бой. Этот альтернативный показатель называется скорректированный R1. Скор-

ректированный R2 для нашего уравнения равняется 0.67.

Другой тест, который называется F-тест, часто используется вместе с R2.

Этот тест скорее измеряет статистическую значимость всего уравнения регрес-

сии, а не его отдельных коэффициентов (в отличие от г-теста). Фактически

f-тест измеряет статистическую значимость R2. Процедура проведения /'-теста

схожа с проведением f-тсста. Вначале устанавливается критическое значение /

О

в зависимости от статистической значимости, которую хочет получить иссле

дователь (обычно она устанавливается на уровне 0,05 или 0,01). Существуют

два значения степеней свободы, которые должны учитываться при выборе

критического F-значения. Эти значения зависят от размера выборки и числа

независимых переменных в уравнении, а также размера выборки минус коли

чество независимых переменных плюс диапазон уравнения. Следовательно так

как в примере с пиццей размер выборки равняется 30, а количество независи-

мых переменных равняется 4, степени свободы равняются 4 и 25 (30 - 4 - 1)

На уровне 0,05 критическое F-значение при таких степенях свободы равняется