Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Главы 4-5 KeatYoung с рисунками.doc
Скачиваний:
5
Добавлен:
10.11.2019
Размер:
17.2 Mб
Скачать

2,76. На уровне 0,01 критическое значение равняется 4,18. Так как результаты

регрессии для спроса на пиццу демонстрируют F-значение, равное 15.8, мы мо-

жем сделать вывод, что все наше уравнение статистически значимо на уров-

не 0,01.

ОБЗОР ОСНОВНЫХ ЭТАПОВ АНАЛИЗА РЕЗУЛЬТАТОВ

РЕГРЕССИИ

Теперь мы рассмотрим основные этапы регрессионного анализа уравнения спро-

са с использованием следующего уравнения:

(3) (2) (30).

(Стандартные ошибки коэффициентов приведены в круглых скобках.)

п = 56;

Д2=0,47,

где Q —величина спроса на товар; Р —цена товара (центы); Рх —цена связан-

ного товара (центы); I —доход на душу населения (S тыс.); п —объем выборки;

R2 —скорректированный коэффициент смешанной корреляции.

Этап 1: проверка знаков и значений

Отрицательный знак переменной Р указывает на обратную зависимость меж-

ду ценой и величиной спроса на товар. Единичное увеличение цены (т. е. уве-

личение на 1 цент) приведет к снижению величины спроса на 10 единиц. Еди-

ничное снижение цены приведет к увеличению цены спроса на 10 единиц. Итак.

например, если цена снизилась на $1, величина спроса увеличится на 1 тыс.

единиц.

Положительный знак переменной Рх говорит о прямой связи между ценой

связанного товара и величиной спроса. Это значит, что связанный товар явля-

ется заменителем рассматриваемого нами товара. Например, если цена на свя-

занный товар изменится на 1 единицу (т. е. на 1 цент), величина спроса на рас-

сматриваемый нами товар изменится на 4 единицы в том же направлении.

Положительный знак переменной I говорит о том, что товар является нор-

мальным или, возможно, лучшим. Это зависит от значения коэффициента эла-

стичности дДЭмжеелетлн яеане нанпрнпаи ысре2ча енев: та у лап рер$ онок1а ви однстиэоыич.фхс оефн.д)теиу пз .ца ркиЕвиоиедвнэсиеитднфомеивтыфч кнхэи ол ипеацзс емииртеиезенммченнеенннтоиесноюнтывии хв е еэн Рлэал,илм чаРа иснстнетиыоичб нсчхпоонрсдотоиисмса отп н оиуа с д5то0ах неододивуни (титьц. еов.п триоезм-- х равны: и I. Предположим, что ОНИ

25

Е,=50Х —= 1,56.

' 800

Этап 3: определение статистической значимости

Используя правило двух как аппроксимацию уровня значимости, равного 0,05,

мы можем сказать, что Р\\ Рхстатистически значимы, потому что их (-значения

превышают 2 (например, 3,3 и 2 соответственно). / не является статистически

значимым на уровне 0,05, потому что его (-значение равняется 1,67. В качестве

дополнения отметим, что R2, равный 0,47, говорит о том, что 47%-ные измене-

ния количества могут объясняться изменением трех независимых переменных:

Р, Рх и /, Хотя это не является показателем статистической значимости, но го-

ворит об объясняющей силе уравнения регрессии. Для перекрестных данных

такой уровень R2 можно считать достаточно высоким.

ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА

ДЛЯ ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ

Исходя из нашего опыта в мире бизнеса практический результат любого стати-

стического анализа, включая анализ регрессии, определяется тем, насколько

его результаты могут помочь менеджеру принять хорошее решение. В случае

с пиццей результаты говорят о том, что цена на пиццу и цена на дополняющий

товар, прохладительный напиток, являются ключевыми факторами, влияющи-

ми на спрос на пиццу. Оба их коэффициента эластичности меньше 1, а коэф-

фициенты обеих переменных проходят (-тест. Что это значит для тех, кто зани-

мается этим бизнесом? Во-первых, это значит, что они могут рассчитывать на

Т|х что снижение цены приведет к снижению дохода, если прочие факторы

остаются неизменными. Поэтому люди, продающие пиццу, вряд ли захотят сни-

зить цену, пытаясь увеличить продажи. Однако они могут попытаться снизить

пену на прохладительные напитки, рассчитывая, что более низкая цена на ли-

монад заставит людей покупать больше пиццы.

В статистическом анализе часто выявление факторов, не прошедших t-тест,

"редстапляег такую же значимость, как и выявление факторов, прошедших (-тест.

В нашем примере мы выяснили, что плата за обучение, а также расположение

студенческого городка не оказывают статистически значимого влияния на сппп

на пиццу. Более того, значения их коэффициентов были относительно маль

Для менеджеров сетей кафр. такт; как Pino H?/r i/ Domino's, это говорит о 1ОМ

что им не стоит сильно заботиться о типе колледжа (государственного или ча-

стного), а также его расположении (в черте города или в пригороде), принимая

решение об открытии пиццерии. Мы надеемся, что это резюме будет полезно

инструкторам и читателям, которые просто хотят понять общую идею того как

можно использовать регрессионный анализ в бизнес-анализе и принятии ре-

шений. В оставшейся части главы мы обсудим это более подробно.

ПРОБЛЕМЫ ИСПОЛЬЗОВАНИЯ

РЕГРЕССИОННОГО АНАЛИЗА

Иногда даже самые лучшие данные и мощные компьютерные программы не

могут компенсировать определенных статистических проблем, которые возни-

кают при попытках вычислить количественную связь между величиной спроса

и факторами, определяющими спрос. Мы кратко рассмотрим три наиболее важ-

ные проблемы.

ПРОБЛЕМА ИДЕНТИФИКАЦИИ

Проблема идентификации является, наверное, самой большой проблемой для

тех, кто использует регрессионный анализ для оценки спроса на определенные

товары и услуги. Для того чтобы объяснить, в чем ее суть, давайте вернемся

к нашему примеру с пиццей. Предположим, у нас есть данные за двадцатилет-

ний период времени, описывающие потребление пиццы надушу населения и пе-

ны на пиццу. График рассеяния, построенный на основе этой информации, по-

казан на рис. 5.1, а. Заметьте, что рассеяние имеет тенденцию подниматься

наверх, и оценка регрессии методом наименьших квадратов продемонстрирует

такой характер связи. Означает ли это, что потребители пиццы ведут себя ир-

рационально и спрос на пиццу увеличивается при более высоких ценах? Этот

вывод противоречит здравому смыслу, но тогда как объяснить положительный

коэффициент ценовой переменной в уравнении спроса? Внимательный чита-

тель скажет, что то, что мы определили как з'равнение спроса, скорее всего, яв-

ляется уравнением предложения или, возможно, результатом смещения кри-

вых спроса и предложения на пиццу за последние 20 лет. Как видно на рис. 5.1,

б, если предложение остается неизменным за последние 20 лет, в то время как

спрос смещается вправовверх (вследствие изменения таких факторов, как до-

ход, число покупателей, вкусы и предпочтения), уравнение регрессии будет

реально отражать кривую предложения 5,. Если предложение увеличилось, но

спрос увеличился еще больше, то регрессия будет реальным отражением пере-

сечения различных крииых спроса и предложения на рис. 5.1, в. На рис. 5.1,2

показана другая возможность. В этом случае предложение смещается больше,

чем спрос. Тогда линия регрессии направлена вниз и больше похожа на кри-

вую спроса. Тем не менее эта кривая спроса более пологая, чем настоящие кри-

вые спроса, которые сместились вправо за последние годы. Таким образом, рег-

рессия связи между ценой и величиной спроса будет необъективной, потому

что она будет указывать на завышенную ценовую эластичность среди массива

потребителей пиццы.

Существуют продвинутые методы оценки, такие как двухстадийный

наименьших квадратов и непрямой метод наименьших квадратов, помогающие

исследователям в работе с выборками, и которых имеет место одновременное

Р И С У Н О К 5Д

Проблема идентификации

смещение спроса и предложения. Эти методы

включают в себя одновременное рассмотрение

уравнений спроса и предложения в одном

уравнении регрессии. В этой книге мы не бу-

дем рассматривать эти методы. Однако стоит запомнить, что, если проблема

определения не будет выявлена и решена исследователем, обычный метод наи-

меньших квадратов приведет к необъективным оценкам коэффициентов рег-

рессии.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Одно из основных предположений, которое допускается при построении мно-

жественного регрессионного уравнения, заключается в том, что независимые

переменные не связаны между собой. Если это предположение неверно, то каж-

дый полученный коэффициент может дать искаженное представление о влия-

нии изменения каждой независимой переменной. Предположим, что регресси-

онная модель говорит о том, что спрос на зарубежные автомобили класса люкс

зависит от цены, дохода и образования. Последняя переменная включена, по-

тому что образование заменяет фактор спроса и предпочтения; предполагает-

ся, что люди с более высоким уровнем образования больше предпочитают за-

рубежные автомобили класса люкс. Однако, как вы можете предположить,

u

О

оn

образование и доход тесно связаны. Если их значения склонны изменяться

вместе, метод средних квадратов может произвольно придавать большее зна

чение коэффициенту одной переменной и меньшее значение коэффициенту

другой. В результате, если две переменные тесно связаны между собой, стало

вится сложно разделять влияния, которые каждая переменная оказывает на

зависимую переменную. Наличие такого условия в регрессионном анализе на

зывается мулътжолдшеарностъю.

Если результаты регрессии проходят F-тест (показатель общей статисти-

ческой значимости уравнения регрессии), но не проходят £-тест для каждого

коэффициента регрессии, как правило, ато означает, что данные выборки со-

держат мультиколлинеарность. Также мультиколлинеарность можно обнару-

жить, проверяя коэффициенты корреляции между двумя переменными, которые

могут быть тесно связаны между собой.6 На практике коэффициент корреля-

ции, равный 0,7 и более, дает исследователям основания подозревать наличие

мультиколлинеарности.

Если мультиколлинеарность является серьезной проблемой в регрессион-

ном анализе, она будет стремиться завышать стандартные ошибки коэффици-

ентов. Это будет снижать Означения (которые, как вы помните, вычисляются

при помощи стандартных ошибок коэффициентов). Это усложняет отклоне-

ние нулевой гипотезы и, конечно же, выявление статистически значимых неза-

висимых переменных в регрессионной модели.

Однако следует отметить, что, если исследователь просто хочет использо-

вать полученные коэффициенты регрессии как основу для прогнозирования

будущих значений зависимых переменных, мультиколлинеарность не будет

представлять серьезной проблемы. Эту статистическую проблему следует ре-

шать, когда исследователь хочет понять основополагающую структуру функ-

ции спроса (т. е. ключевые факторы спроса). Большинство пакетов программ

автоматически рассчитывают матрицу коэффициентов корреляции для всего

набора независимых переменных, которые присутствуют в уравнении регрес-

сии. Стандартное средство избавления от мультиколлинеарности заключается

в удалении одной из переменных, тесно связанных с другой переменной в урав-

нении регрессии.

АВТОКОРРЕЛЯЦИЯ

Автокорреляция —это проблема, которая часто возникает при использовании

временных данных. В этом случае ее называют корреляцией внутри ряда. Да-

вайте в качестве примера возьмем простую регрессию, включающую только

зависимую перемешгую У и одну независимую переменную X. Автокорреля-

ция происходит, когда переменная У связана с переменной X определенным

образом. Например, на рис. 5.2, а график рассеяния показывает, что при увели-

чении X (предположительно со временем) У отклоняется от линии регрессии

систематическим образом. Другими словами, остаточный момент, или разни-

ца между наблюдаемым значением У и предполагаемым значением У. учиты-

вая Л"( У), колеблется между положительным и отрицательным значениями при-

мерно на одинаковую величину на протяжении всех значений X. Если изобразить

эти остатки на графике, он будет выглядеть, как показано на рис. 5.2, б.

Одной из возможных причин автокорреляции является то, что существует

влияние на Y, которое не учитывается переменными, включенными в уравне-

ние регрессии. Также может оказаться, что реальная связь между У и независи-

мой переменной (или независимыми переменными) является нелинейной.

Однако независимо от причины, если в регрессионном анализе присутствует

автокорреляция, она создает проблему для точности t-теста. Проще говоря.

исследователями рынка крупных производителей потребительских товаров. Мы

знаем, что регрессия является полезным инструментом для этих исследовате-

лей, но, к сожалению, все их исследования являются частными. Читатели допэк-

ны понимать, что во многих современных исследованиях используется специ-

фика регрессионных уравнений, схожих с теми, которые были представлснц

в этой главе. Однако многие исследования, проводимые учеными, доступны ши-

рокой общественности. Мы выбрали два таких исследования прежде всего по-

тому, что они дают читателям пример изучения поведения потребителей за

пределами Соединенных Штатов.7

Пример i: регрессионный анализ основных продуктов питания в Испании

В периоде 1964 по 1991 г. было проведено продолжительное исследование спро-

са на 6 классов продуктов питания в Испании. Продукты питания были поде-

лены на следующие классы:

1) хлебобулочные изделия и крупы;

2) мясо;

3) рыба;

4) молоко, молочные продукты и яйца;

5) фрукты, овощи и картофель;

6) жиры и масла.

Результаты показывают, что изменение спроса на продукты питания (на

основе потребляемых калорий) зависит не только от текущего дохода и цен, но

и от запоздалых значений этих переменных. Потребители продуктов питания

в Испании не могут приспособить свои расходы одновременно с ростом дохо-

дов или цен. Они демонстрируют определенный уровень инертного поведения.

Из представленных выше шести категорий только мясо является лучшим

товаром с эластичностью по доходу, равной 1,54. Среди остальных пяти групп

только фрукты и овощи обладают эластичностью по доходу, близкой к единице

(0,9), в то время как эластичность жиров и масел самая низкая (равняется 0,35).

В показателях самой ценовой эластичности мясо демонстрирует наиболее вы-

сокий коэффициент, равный -0,8. Коэффициенты всех остальных классов про-

дуктов питания тоже отрицательные; результаты t-теста по всем классам зна-

чительно выше нуля. Большинство перекрестных эластичностей достаточно

низки и не представляют статистической значимости, что говорит о низком

уровне заменимости среди этих товаров. Существует ряд исключений, и наи-

более крупными из них являются рыба и мясо, результаты t-теста для которых

являются значимыми. R2 для их уравнения достаточно велик и равняется 0,63.

Пример 2: регрессионный анализ спроса на сигареты в Тайване

В ходе последнего исследования временного ряда спрос на сигареты изучался

не только как функция от дохода и цены; также рассматривалось влияние кам-

пании, направленной на борьбу с курением, а также последствия открытия

рынка в Тайване для импорта сигарет. Были использованы данные за 30 лет

(1966-1995 гг.). Основное уравнение выглядело следующим образом:

с< - а о + A + <*2Y, + аЛЛ + ч

гДе Ct ежегодное потребление сигарет на душу населения; Р( средняя роз-

ничная цена за пачку сигарет; Yt —чистый доход на душу населения в новых

тайваньских долларах 1991 г.; Ht - показатель информации по здравоохране-

нию, связанный с табакокурением; Xt —другие факторы; е( —случайная ошиб-

к а ; аа - 4 —коэффициенты регрессии.

Кроме того, были выведены отдельные функции спроса на отечественные

импортные сигареты. Уравнения, использованные в этих вычислениях, схо-

JK1T c показанными ранее с единственным исключением —в каждое уравнение

был добавлен еще один элемент. В уравнение спроса на отечественные сигаре-

ты была добавлена цена на импортные сигареты в качестве показателя пере-

крестной ценовой эластичности. В уравнение для импортных сигарет была до-

бавлена цена на отечественные сигареты. Были использованы два показателя

информации по здравоохранению: