Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
598070_078D2_zorina_t_g_slonimskaya_m_a_marketi...doc
Скачиваний:
296
Добавлен:
24.09.2019
Размер:
3.85 Mб
Скачать

Пример.

Фирма, которая занимается производством полуфабрикатов, провела опрос потребителей с целью изучения поведения потребителей. Один из вопросов анкеты звучал следующим образом: оцените по 10-ти балльной шкале степень важности для Вас следующих параметров при выборе полуфабрикатов: качество, цена, производитель, страна изготовления, вкус, полезность, вид упаковки, грамматура, питательная ценность, содержание наполнителей, срок хранения, скорость приготовления, экологичность.

Учитывая, что качество является комплексной характеристикой, важно знать, с какими другими параметрами оно ассоциируется, по мнению потребителей. С этой целью проанализируем корреляционную матрицу, которая была построена в программе SPSS по указанным выше тринадцати переменным – оценкам степени важности для респондентов отдельных параметров при выборе полуфабрикатов (табл. А).

По данным корреляционной матрицы можно сформулировать следующие предположения:

1. Понятие качества полуфабрикатов в сознании потребителей связано с их вкусом.

2. Понятие качества полуфабрикатов в сознании потребителей связано с их вкусом, полезностью, содержанием наполнителей и экологичностью.

Для устранения явления мультиколлинеарности из коррелирующих пар переменных (вкус – полезность; вкус – содержание наполнителей; полезность – содержание наполнителей; полезность – экологичность; содержание наполнителей - экологичность) при построении модели следует оставить только одну. Поэтому для анализа выбираем следующее сочетания независимых переменных: вкус – экологичность. Тогда второе предположение будет звучать следующим образом:

2. Понятие качества полуфабрикатов в сознании потребителей связано с их вкусом и экологичностью.

Продолжение примера.

Таблица А. Корреляционная матрица по переменным, характеризующим оценки респондентов степени важности отдельных параметров при выборе полуфабрикатов

Качество

Цена

Производитель

Страна изготовления

Вкус

Полезность

Вид упаковки

Грамматура

Питательная ценность

Содержание наполнителей

Срок хранения

Скорость приготовления

Экологичность

Качество

1,000

0,179

0,255

0,257

0,768

0,628

0,178

0,183

0,488

0,524

0,392

0,249

0,447

Цена

0,179

1,000

0,152

0,068

0,225

0,172

0,206

0,240

0,164

0,125

0,124

0,095

0,106

Производитель

0,255

0,152

1,000

0,720

0,323

0,198

0,321

0,338

0,311

0,390

0,199

0,250

0,296

Страна изготовления

0,257

0,068

0,720

1,000

0,277

0,208

0,264

0,288

0,333

0,359

0,238

0,294

0,341

Вкус

0,768

0,225

0,323

0,277

1,000

0,520

0,237

0,186

0,365

0,548

0,419

0,351

0,356

Полезность

0,628

0,172

0,198

0,208

0,520

1,000

0,317

0,300

0,587

0,552

0,417

0,234

0,539

Вид упаковки

0,178

0,206

0,321

0,264

0,237

0,317

1,000

0,418

0,250

0,158

0,311

0,373

0,201

Грамматура

0,183

0,240

0,338

0,288

0,186

0,300

0,418

1,000

0,371

0,327

0,307

0,411

0,350

Питательная ценность

0,488

0,164

0,311

0,333

0,365

0,587

0,250

0,371

1,000

0,594

0,456

0,282

0,607

Содержание наполнителей

0,524

0,125

0,390

0,359

0,548

0,552

0,158

0,327

0,594

1,000

0,470

0,317

0,573

Срок хранения

0,392

0,124

0,199

0,238

0,419

0,417

0,311

0,307

0,456

0,470

1,000

0,496

0,613

Скорость приготовления

0,249

0,095

0,250

0,294

0,351

0,234

0,373

0,411

0,282

0,317

0,496

1,000

0,452

Экологичность

0,447

0,106

0,296

0,341

0,356

0,539

0,201

0,350

0,607

0,573

0,613

0,452

1,000

2. Выбор метода и формулирование общей модели. Метод корреляционно-регрессионного анализа зависит от количества и типа используемых переменных (рисунок 5.6).

Frame59

Корреляционный анализ

Множественная

регрессия

Парная регрессия

Frame60 Frame61

Рисунок 5.6. Выбор метода корреляционно-регрессионного анализа в зависимости от количества и типа переменных.

Пример 1.

Для проверки предположения №1 о существовании связи в представлении потребителей между качеством полуфабрикатов и их вкусом целесообразно применение корреляционного анализа и построение модели парной регрессии, где

в качестве зависимой переменной будет выступать степень важности для респондентов параметра «качество» при выборе полуфабрикатов;

в качестве фактора – степень важности для потребителей параметра «вкус» при выборе полуфабрикатов.

Пример 2.

Для проверки предположения №2 о существовании связи в представлении потребителей между качеством полуфабрикатов, их вкусом и экологичностью целесообразно построение модели множественной регрессии, где

в качестве зависимой переменной будет выступать степень важности для респондентов параметра «качество» при выборе полуфабрикатов;

в качестве факторов – степень важности для потребителей параметров «вкус» и «экологичность» при выборе полуфабрикатов.

Для определения формы зависимости между двумя переменными используется поле корреляции. Это графическое изображение точек с координатами, соответствующими значениям двух переменных для всех случаев. Обычно значения зависимой переменной откладывают по вертикальной оси, а значения независимой – по горизонтальной. График дает исследователю первое представление о силе, направлении и форме связи (таблица 5.11). На графике легко идентифицировать любую необычную комбинацию переменных.

Поле корреляции показывает, можно ли зависимость Y по X выразить прямой линией и, следовательно, подходит ли к этим данным парная регрессионная модель.

Таблица5.11. Интерпретация расположения точек на диаграмме рассеяния

Расположение точек на диаграмме рассеяния

Интерпретация

Все точки расположены строго на прямой линии, направленной вверх и направо

Идеальная положительная взаимосвязь.

Точки данных довольно плотно сгруппированы (с небольшим случайным разбросом) вокруг прямой линии, направленной вверх и направо

Сильная положительная взаимосвязь.

Точки данных образуют случайное облако с незначительной ориентацией вверх и вправо

Незначительная положительная взаимосвязь.

Совершенно случайное облако, не имеющее ориентации ни вверх, ни вниз при движении вправо.

Отсутствие взаимосвязи.

Точки данных образуют случайное облако с незначительной ориентацией вниз и вправо

Незначительная отрицательная взаимосвязь.

Точки данных плотно сгруппированы (с небольшим случайным разбросом) вокруг прямой линии, направленной вниз и вправо

Сильная отрицательная взаимосвязь.

Все точки расположены строго на прямой линии, направленной вниз и вправо

Идеальная отрицательная взаимосвязь.

Точки данных располагаются строго на горизонтальной или вертикальной линии

Не определена

Продолжение примера 1.

На рисунке А представлен график зависимости степени важности для респондентов при выборе полуфабрикатов параметров «качество» и «вкус». Из рисунка видно, что точки располагаются полосой от нижнего левого угла в верхний правый. На графике можно увидеть форму зависимости: с ростом одной переменной другая переменная также увеличивается. Из рисунка видно, что зависимость между Y и X носит линейный характер и поэтому может быть описана уравнением прямой линии.

Рисунок А. График зависимости степени важности для респондентов при выборе полуфабрикатов параметров «качество» и «вкус».

В модели парной регрессии форма прямой линии выражается уравнением:

,

где Y зависимая, или критериальная переменная, X независимая переменная, или предиктор, β0 отрезок прямой, отсекаемый на оси OY, β1 угловой коэффициент (тангенс угла наклона).

Эта модель исходит из того, что Y полностью определяется X. При известных значениях β0 и β1 можно предсказать значение Y. Однако в маркетинговом исследовании немного связей между переменными четко детерминированы. Поэтому, чтобы учесть вероятностную при­роду связи, в регрессионное уравнение вводят ошибочный член. Базовое уравнение рег­рессии принимает вид:

где еi член уравнения, характеризующий ошибку i-го наблюдения.

В случае множественной регрессии построить корреляционное поле не представляется возможным, так как мы имеем дело более чем с двумерным изображением зависимости. Общая форма модели множественной регрессии имеет вид:

3. Вычисление параметров.

Самый распространенный метод для расчета уравнения линейной регрессии по данным на диаграмме рассеяния это метод наименьших квадратов.

Методом наименьших квадратов определяют наиболее подходящую прямую регрессии, минимизируя расстояния по вертикали всех точек поля корреляции от этой прямой. Наиболее подходящая прямая называется линией регрессии. Если точка поля не лежит на линии регрессии, то расстояние по вертикали от нее до линии называется ошибкой еj. Расстояния от всех точек до линии регрессии возводят в квадрат и суммируют, получая сумму квадратов ошибок, и это число показывает суммарную ошибку . Для определения наиболее подходящей линии с помощью метода наименьших квадратов минимизируют суммы квадратов ошибок. Если значения Y отложить по вертикальной оси, а значения Xпо горизонтальной, то полученная аппроксимированная линия называется регрессией Y по X, так как расстояния по вертикали минимизированы.

В большинстве случаев β0 и β1 неизвестны, и их определяют (оценивают), исходя из имеющихся выборочных наблюдений с помощью следующего уравнения:

где – теоретическое значение Yi , а а и b вычисленные значения β0 и β1, соответственно.

Константу b обычно называют ненормированным коэффициентом регрессии. Он выражает угол наклона линии регрессии и показывает ожидаемое изменение Y при изменении Х на единицу.

Угловой коэффициент b можно вычислить через ковариацию между Х и Y(COVxy) и дисперсию Х по формуле:

Отрезок, отсекаемый на оси OY а, можно вычислить по формуле:

Модель множественной регрессии оценивают следующим уравнением:

= a+b1X1+b2X2+b3X3 + ...bkXk

Как и раньше, коэффициент а представляет собой отрезок, отсекаемый на оси OY, но ко­эффициенты b являются теперь частными коэффициентами регрессии.

Интерпретация частного коэффициента регрессии b1 заключается в том, что он представляет ожидаемое изменение величины Y, когда Х1 изменяется на единицу, а Х2 остается постоянной, т.е. управляемой (контролируемой) переменной. В отличие от этого, b2 представляет ожидаемое изме­нение Y при изменении Х2 на единицу, когда Х1 остается постоянной. Поэтому названия b1 и b2частные коэффициенты регрессии, соответствуют действительности. Кроме того, результаты со­вместного влияния Х1 и Х2 на Y суммируются. Иначе говоря, если каждую из переменных Х1 и Х2 изменить на единицу, то ожидаемое изменение значения Y будет равно (b1 + b2).

Продолжение примера 1.

На рисунке Б представлены уравнение и линия регрессии, построенные по данным о значимости для потребителей качества и вкуса полуфабрикатов с использованием Excel.

Величина отрезка а, отсекаемого на оси OY, равна 2,148, угловой коэффициент (наклон кривой) b равен 0,762. Следовательно, вычисленное (теоретическое) уравнение рег­рессии иметь вид:

Степень важности параметра «качество» ( ) = 2,148 + 0,762 (степень важности параметра «вкус»)

Рисунок Б. Уравнение и линия регрессии, характеризующая зависимость значимости для потребителей качества полуфабрикатов от значимости для потребителей вкуса полуфабрикатов.

Продолжение примера 2.

Значение частного коэффициента регрессии для переменной X1 (степень важности параметра «вкус»), равное 0,692, отличается от значения, полученного в анализе парной регрессии. Частный коэффициент регрессии для переменной X2 (степень важности параметра «экологичность») равен 0,147.

Теоретическое уравнение рег­рессии иметь вид:

= 1,723 + 0,692X1 + 0,147X2

4. Оценка тесноты связи. Тесноту связи измеряют коэффициентом детерминации R2. В парной регрессии R2 представляет собой квадрат линейного коэффициента корреляции. Коэффициент R2 изменяется от 0 до 1. Он показывает долю от полной вариации Y, которая обусловлена вариацией переменной X. Разложение полной вариации переменной Y аналогично разложению полной вариации в дисперсионном анализе. Полная вариация SSy раскладывается на вариацию, которую можно объяснить, исходя из линии регрессии SSрегрессии, и вариацию ошибки или остаточную вариацию, SSошибки или SSостаточная:

SSy= SSрегрессии+ SSостаточная,

где

Теснота связи вычисляется следующим образом:

Продолжение примера 1.

Коэффициент детерминации (R2), рассчитанный по данным о значимости для потребителей при выборе полуфабрикатов параметров «качество» и «вкус» равен 0,590 или 59%. Это говорит о том, что на 59% вариация значимости для потребителей при выборе полуфабрикатов параметра «качество» объясняется вариацией значимости для них параметра «вкус», а остальная часть (41%) – связана с другими параметрами.

Продолжение примера 2.

Коэффициент детерминации (R2), рассчитанный по данным о значимости для потребителей при выборе полуфабрикатов параметров «качество», «вкус» и «экологичность» равен 0,625 или 62,5%. Это говорит о том, что на 62,5% вариация значимости для потребителей при выборе полуфабрикатов параметра «качество» объясняется вариацией значимости для них параметров «вкус» и «экологичность», а остальная часть (37,5%) – связана с другими параметрами.

5. Проверка значимости связи. Статистическую значимость линейной связи между Х и Y можно проверить, исследовав гипотезы:

Нулевая гипотеза предполагает, что между Х и Y не существует линейной зависимости. Альтернативная гипотеза утверждает, что между X и Y существует зависимость, либо положительная, либо отрицательная. Обычно проводят двустороннюю проверку. Можно использовать t-статистику с п-2 степенями свободы, где

Sb обозначает стандартное отклонение b, и этот показатель называют стандартной ошибкой коэффициента регрессии b.

Если зависимость между X и Y статистически значима, то имеет смысл вычислить значения Y, исходя из значений X, и оценить точность предсказания.

Другой равноценной проверкой значимости линейной зависимости между X и Y (значимости b) является проверка значимости коэффициента детерминации. В этом случае ги­потезы имеют следующий вид:

Соответствующей статистикой, лежащей в основе критерия, является F-статистика:

,

которая подчиняется F-распределению с 1 и п - 2 степенями свободы.

Продолжение примера 1.

Используя компьютерную программу (например, Excel или SPSS) и данные, полученные в результате анкетного опроса потребителей, регрессия степени важности для потребителей параметра "качество" от степени важности параметра "вкус" при выборе полуфабрикатов даст результаты, представленные в табл. Б.

Стандартная ошибка, или стандартное отклонение b определено как 0,411, и значение t-статистики равно: t = 5,221 с п-2 = 198 степенями свободы. Критическое значение t-статистики со 198 степенями свободы и уровнем значимости α = 0,05 равно 2,96 для двусторонней проверки. Поскольку вычислен­ное значение t-статистики больше критического значения, то нулевую гипотезу отклоняют. Следовательно, между степенью важности для потребителей при выборе полуфабрикатов параметра «вкус» и степенью важности параметра «качество» существует статистически значимая линейная зависимость. Положительный знак углового коэффициента указывает на то, что эта связь положительная (прямо пропорциональная). Другими словами, качество полуфабрикатов в сознании потребителей ассоциируется с их вкусом.

Таблица Б. Результаты регрессионного анализа степени важности для потребителей параметра «качество» от степени важности параметра «вкус» при выборе полуфабрикатов

Коэффициенты

Стандартная ошибка

t-статистика

Уровень значимости

Нижние 95%

Верхние 95%

Y-пересечение

2,148

0,411

5,221

0,000

1,337

2,960

Переменная X 1

0,762

0,045

16,892

0,000

0,673

0,852

5. Оценка точности предсказания.

Чтобы оценить точность предсказанных (теоретических) значений , полезно вычислить стандартную ошибку оценки уравнение регрессии S. Эта статистика представляет собой стандартное отклонение фактических значений Y от предсказанных значений :

или, в более общем виде, при наличии k независимых переменных

Стандартную ошибку оценки можно интерпретировать следующим образом: 1) можно ожидать, что примерно 2/3 точек данных будут находиться на расстоянии не более S выше или ниже линии регрессии; 2) около 95% значений данных должны находиться не расстоянии не более чем 2S от линии регрессии.

Продолжение примера 2.

Используя компьютерную программу (например, Excel или SPSS) и данные, полученные в результате анкетного опроса потребителей, регрессия степени важности для потребителей параметра «качество» от степени важности параметров «вкус» и «экологичность» при выборе полуфабрикатов даст результаты, представленные в таблице В.

По значениям коэффициентов можно сделать вывод о том, что параметр «вкус» вносит значительно больший вклад в представление о качестве при выборе полуфабрикатов, чем параметр «экологичность», так как коэффициенты равны, соответственно, 0,692 и 0,147. По данным t-статистики, оба коэффициента являются статистически значимыми и с достоверностью 95% могут находится в интервале от 0,601 до 0,784 и от 0,079 до 0,216, соответственно.

Таблица В. Результаты регрессионного анализа степени важности для потребителей при выборе полуфабрикатов параметра «качество» от степени важности параметров «вкус» и «экологичность»

 

Коэффициенты

Стандартная ошибка

t-статистика

Уровень значимости

Нижние 95%

Верхние 95%

Y-пересечение

1,723

0,407424

4,229725

0,000

0,920

2,527

Переменная X 1

0,692

0,046368

14,93461

0,000

0,601

0,784

Переменная X 2

0,147

0,034789

4,236934

0,000

0,079

0,216

F-статистика равна 163,853 и является значимой при α=0,05. Поскольку вычислен­ное значение F-статистики больше критического значения, то нулевую гипотезу отклоняют. Следовательно, между степенью важности для потребителей при выборе полуфабрикатов параметра «вкус» и степенью важности параметров «качество» и «экологичность» существует статистически значимая линейная зависимость. Положительный знак углового коэффициента указывает на то, что эта связь положительная (прямо пропорциональная). Другими словами, качество полуфабрикатов в сознании потребителей ассоциируется с их вкусом и экологичностью.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]