Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 11-12 (ЛМВ) а.doc
Скачиваний:
3
Добавлен:
16.08.2019
Размер:
2.2 Mб
Скачать

Глава 11. Маркетинговые исследования с использованием статистических методов

11.1. Прогнозирование объема продаж с использованием корреляционно-регрессионного анализа в системе statistica

В современных условиях практически все розничные торговые пред­прия­тия сталкиваются с необходимостью прогнозировать объемы продаж и оп­ти­ми­зи­ро­вать существующий товарный ассортимент. Для достижения этих це­лей мож­но использовать значительное количество различных мате­ма­тико-ста­ти­сти­че­ских ме­то­дов, одним из которых является корреляционно-ре­гре­сси­он­ный ана­лиз.

Цель исследования – выявить и изучить зависимость между по­ка­за­те­ля­ми про­даж нескольких групп товаров розничного торгового предприятия с по­мо­щью пакета STATISTICA.

Особенности проведения корреляционно-регрессионного анализа в системе STATISTICA

Корреляционно-регрессионный анализ позволяет не только установить и оце­нить зависимость изучаемой случайной величины (y) от одной или не­сколь­ких других факторных величин (x), но и прогнозировать значения y.

Корреляционно-регрессионный анализ включает в себя следующие этапы.

  1. Измерение тесноты связи между выбранными показателями.

  2. Отбор главных существенных факторов, оказывающих влияние на за­ви­си­мую переменную, и определение уравнения регрессии.

  3. Проверка адекватности модели (определение числовых значений па­ра­мет­ров уравнения регрессии).

  4. Экономическая интерпретация результатов анализа.

Измерение тесноты связи между выбранными показателями в системе STATISTICA проводится в модуле Basic Statistics and Tables: Correlation mat­ri­ces (основные статистики и таблицы: корреляционный анализ) путем рас­че­та пар­ных коэффициентов корреляции.

Степень линейной зависимости мож­но опре­де­лить с помощью коэф­фи­ци­ента корреляции Пирсона (линейного ко­эф­фи­ци­ен­та корреляции), кото­рый рас­счи­тывается по следующей формуле:

.

Значение линейного коэффициента корреляции находится между −1 и +1. Значения, близкие к +1, свидетельствуют о хорошей зависимости между па­ра­мет­рами, причем прямой зависимости. Значения, близкие к −1, также ука­зы­ва­ют на хорошую зависимость между переменными, но обратную за­ви­си­мо­сть. Зна­че­ние «0» говорит об отсутствии линейной зависимости меж­ду данными.

Кроме того, в процессе исследования может возникнуть ситуация, когда од­на величина коррелирует с другой, но эта связь означает, что обе вели­чины кор­ре­лированны с некой третьей величиной или набором величин, которые не во­шли в исследование корреляционной зависимости. В этом случае рассмат­ри­ва­ет­ся условная корреляция между двумя величинами при фиксированных зна­че­ни­ях остальных величин. Эту корреляцию называют частной. Коэффициент част­ной корреляции определяется по особой форму­ле: например, для пере­мен­ных X, Y, Z коэффициент частной корреляции rXY*Z между переменными X и Y при фикси­ро­ван­ном значении переменной Z можно вычислить так:

.

Аналогично рассчитывают коэффициенты частной корреляции rXZ*Y и rYZ*X:

;

.

Следует заметить, что представленные выше формулы симметричны, зна­ком «*» отделяются друг от друга переменные, значения которых фиксированы.

В процессе осуществления корреляционно-регрессионного анализа воз­ни­ка­ет необходимость расчета множественного коэффициента корреляции. Урав­не­ние регрессии имеет вид:

y=a + bx1 + cx2.

Коэффициенты a, b, c – неизвестные параметры. В широких пред­по­ло­же­ни­ях оптимальными оценками неизвестных параметров a, b, c являются оцен­ки ме­то­да наименьших квадратов. Обозначим оценки метода наимень­ших квад­ра­тов че­рез A, B, C. Эти оценки хороши тем, что сумма квадратов рас­стоя­ний меж­ду наблюдениями y и плоскостью, задаваемой уравнением ре­грес­сии, мини­маль­на. Затем, используя оценки метода наименьших квад­ра­тов, полу­ча­ем значения Y. Теперь коэффициент множественной корре­ля­ции меж­ду y, x1 и x2 можно опре­де­лить как обычный коэффициент корре­ляции Пир­со­на между y и Y.

Для расчета частного и множественного коэффициентов корреляции исполь­зу­ют модуль Multiple Regression (множественная регрессия) в сис­теме STATISTICA.

Кроме того, модуль Multiple Regression системы STATISTICA позво­ля­ет реализовать метод пошаговой регрессии, гребневой регрессии, осу­щест­вить ана­лиз остатков и прогноз зависимой переменной при изменении зна­че­ний не­за­висимых переменных.

Методы пошаговой регрессии позволяют из множества независимых пе­ре­менных отобрать только те, которые наиболее значимы для адекватного опи­са­ния модели множественной регрессии. В модуле Multiple Regression реа­ли­зованы две процедуры отбора переменных, каждая из которых может давать различный конечный набор переменных – в частности, последо­ва­тель­ное включение (Forward stepwise) и последовательное исключение (Back­ward stepwise). В процедуре пошаговой регрессии с последовательным вклю­че­ни­ем система начинает построение модели с одной независимой пере­мен­ной; затем, используя F-критерий, в модель включают еще одну переменную и т. д. Если предполагается, что в модели должно присут­ство­вать небольшое ко­личество независимых переменных, то лучше использо­вать метод пошаго­вой регрессии с включением. При другой ситуации, когда предполагается, что в модели должно присутствовать большое количество независимых пере­мен­ных, то рекомендуют использовать метод с исклю­че­нием.

Гребневая регрессия используется для получения более устойчивых оце­нок па­раметров регрессионной модели в условиях мультиколлинеарности пе­ре­мен­ных.

Установление зависимости между объемами продаж некоторых групп товаров розничного торгового предприятия

Для выявления и изучения зависимости между показателями продаж не­сколь­ких групп товаров одного из розничных торговых предприятий города Зе­ле­нограда был проведен корреляционно-регрессионный анализ с использо­ва­ни­ем программного пакета STATISTICA. Анализировали совокупность дан­ных по объе­му продаж девяти групп продовольственных товаров и две­над­ца­ти групп не­про­довольственных товаров за период с 01.01.2006 г. по 31.12.2006 г. (по­ме­сяч­но).

  1. Продовольственные товары:

    • бакалея;

    • вино;

    • гастрономия;

    • кондитерские изделия;

    • крепкие напитки и ликеры;

    • кулинария;

    • овощи-фрукты;

    • сыры;

    • чипсы-сухарики.

  2. Непродовольственные товары

  • бытовая косметика;

  • бытовая химия;

  • гигиенические товары;

  • декоративная косметика;

  • зонты;

  • канцтовары;

  • нижнее белье;

  • одноразовая посуда;

  • парфюмерия;

  • подарки, кожгалантерея;

  • посуда;

  • товары для дома.

Затраты на получение таких данных для предприятия минимальны, по­сколь­ку ими располагает практически каждая организация.

Цель исследования – выявить связь между покупкой посетителями мага­зи­на товаров различных групп.

В программный пакет STATISTICA занесли данные объема продаж по 21 то­варной группе и с помощью модуля Basic Statistics and Tables: Cor­re­la­ti­on matrices рассчитали парные коэффициенты корреляции.

Результаты корреляционного анализа представлены в корреляционных матрицах (таблицы 11.1 и 11.2).

Таблица 11.1

Корреляционная матрица объема продаж 9 групп продовольственных товаров

Бакалея

Вино

Гастро­номия

Конди­терские изделия

Крепкие напитки и ликеры

Кулинария

Овощи-фрукты

Сыры

Чипсы-сухарики

Бакалея

1,00

0,57

0,21

0,12

0,34

0,03

0,54

0,26

−0,10

Вино

0,57

1,00

0,75

0,50

0,90

0,49

0,52

0,84

0,33

Гастроно­мия

0,21

0,75

1,00

0,62

0,88

0,87

−0,07

0,94

0,31

229

Конди­терские изделия

0,12

0,50

0,62

1,00

0,64

0,67

0,13

0,71

0,27

Крепкие напитки и ликеры

0,34

0,90

0,88

0,64

1,00

0,73

0,21

0,98

0,19

Кулинария

0,03

0,49

0,87

0,67

0,73

1,00

−0,28

0,83

0,06

Овощи-фрукты

0,54

0,52

−0,07

0,13

0,21

−0,28

1,00

0,08

0,29

Сыры

0,26

0,84

0,94

0,71

0,98

0,83

0,08

1,00

0,20

Чипсы-сухарики

−0,10

0,33

0,31

0,27

0,19

0,06

0,29

0,20

1,00

Таблица 11.2

Корреляционная матрица объема продаж 12 групп промышленных товаров

230

Бытовая косме­тика

Бытовая химия

Гигиени­ческие товары

Декора­тив­ная косме­тика

Зонты

Канц­товары

Нижнее белье

Однора­зовая посуда

Парфю­мерия

Подарки, кожга­лан­терея

Посуда

Товары для дома

Бытовая косметика

1,00

0,70

0,73

0,52

0,19

0,24

0,85

0,35

0,82

0,96

0,83

0,95

Бытовая химия

0,70

1,00

0,85

0,15

0,30

0,14

0,59

0,17

0,46

0,69

0,65

0,70

Гигиени­ческие товары

0,73

0,85

1,00

0,30

0,31

0,21

0,65

0,55

0,45

0,67

0,64

0,82

Декора­тивная косметика

0,52

0,15

0,30

1,00

−0,21

0,29

0,60

0,07

0,71

0,56

0,68

0,55

Зонты

0,19

0,30

0,31

−0,21

1,00

0,33

0,13

0,09

−0,03

0,15

0,12

0,16

Канц­товары

0,24

0,14

0,21

0,29

0,33

1,00

0,25

−0,24

0,36

0,43

0,56

0,30

Нижнее белье

0,85

0,59

0,65

0,60

0,13

0,25

1,00

0,40

0,75

0,84

0,69

0,92

Одно­разовая посуда

0,35

0,17

0,55

0,07

0,09

−0,24

0,40

1,00

0,01

0,13

−0,01

0,49

Парфю­мерия

0,82

0,46

0,45

0,71

−0,03

0,36

0,75

0,01

1,00

0,90

0,86

0,77

Подарки, кожгалан­терея

0,96

0,69

0,67

0,56

0,15

0,43

0,84

0,13

0,90

1,00

0,91

0,91

Посуда

0,83

0,65

0,64

0,68

0,12

0,56

0,69

−0,01

0,86

0,91

1,00

0,80

Товары для дома

0,95

0,70

0,82

0,55

0,16

0,30

0,92

0,49

0,77

0,91

0,80

1,00

Данные матрицы содержат значения парных коэффициентов корреля­ции, ко­то­рые показывают силу и направление связи между исследуемыми пере­мен­ны­ми (объемами продаж 21 группы товаров). Сильной считается связь, если ко­эф­фи­ци­ент корреляции между переменными по модулю равен 0,7 и выше.

В качестве примера рассмотрим товарную группу «Вино» (из табли­цы 11.1) и то­вар­ную группу «Гигиенические товары» (из таблицы 11.2). По дан­ным кор­ре­ля­ционных матриц, группа «Вино» наиболее тесно связана с 3 груп­па­ми: «Гаст­ро­но­мия», «Крепкие напитки и ликеры» и «Сыры» (коэф­фи­ци­ен­ты кор­ре­ля­ции рав­ны 0,75, 0,90 и 0,84 соответственно). Группа «Гигие­ни­че­ские товары» кор­ре­ли­ру­ет с товарными группами: «Бытовая кос­ме­ти­ка», «Бытовая химия» и «То­ва­ры для дома» (коэффициенты корреляции рав­ны 0,73, 0,85 и 0,82 со­от­вет­ствен­но).

На практике предприятия розничной торговли могут использовать по­лу­чен­ные результаты корреляционного анализа, чтобы: пополнять товарные за­па­сы пу­тем в процессе совместной закупки товаров, объемы продаж которых кор­ре­ли­ру­ют между собой; выкладывать эти товары по соседству в торговом за­ле; эко­но­мить денежные средства на продвижение нескольких товаров (сти­му­ли­ро­вать покупку одного товара можно за счет стимулирования по­куп­ки другого).

Построение прогнозной модели изменения объема продаж группы товаров «Кондитерские изделия»

В

Multiple Regression Results

Dependent: КОНДИТЕРСКИЕ ИЗДЕЛИЯ Multiple R = ,71100039 F = 10,22333

R?= ,50552155 df = 1,10

No. of cases: 12 adjusted R?= ,45607371 p = ,009534

Standard error of estimate:7401,8413531

Intercept: 150628,26435 Std.Error: 19064,41 t( 10) = 7,9010 p = ,0000

СЫРЫ beta=,711

(significant betas are highlighted)

качестве примера демонстрации применения регрессионного анализа для построения прогноза изменения объема продаж рассмотрим группу про­до­вольственных товаров «Кондитерские изделия». Как видно из кор­ре­ля­ци­он­ной матрицы (таблица 11.1), наиболее высокий коэффициент корреляции у этой группы с товарной группой «Сыры» (он равен 0,71). Для построения модели воспользуемся модулем программного пакета Multiple Regression.

Рис. 11.1. Результаты регрессионного анализа

Dependent – имя зависимой переменной;

No. of cases – объем выборки, n = 12;

Multiple R – оценка коэффициента множественной корреляции; харак­те­ризует тесноту линейной связи между зависимой и всеми независимыми пе­ре­менными. Может принимать значения от 0 до 1.

R2 – оценка коэффициента детерминации; численно выражает долю ва­риа­ции зависимой переменной, объясненную с помощью регрессионного урав­нения. Чем больше R2, тем большую долю вариации объясняют пере­мен­ные, включенные в модель.

adjusted R2 – скорректированный коэффициент детерминации; скор­рек­ти­рованный R2 можно с большим успехом (по сравнению с R2) применять для выбора наилучшего подмножества независимых переменных в регрес­си­он­ном уравнении.

F – значение F-критерия расчетный.

df – число степеней свободы F-критерия.

p – уровень значимости.

Standard error of estimate – стандартная ошибка оценки, оценивает ме­ру рассеяния наблюдаемых значений относительно регрессионной прямой.

Intercept – оценка свободного члена, значения коэффициента b0 в урав­не­нии регрессии.

Std.Error – стандартная ошибка коэффициента b0 в уравнении регрес­сии.

t(df) и p-value – значение t-критерия и уровня p.

betaβ-коэффициенты уравнения: это стандартизированные регрес­си­он­ные коэффициенты, рассчитанные по стандартизированным значениям пе­ре­мен­ных. По их величине можно сравнить и оценить значимость неза­ви­си­мых переменных в регрессионной модели, так как β-коэффициент показы­ва­ет, на сколь­ко единиц стандартного отклонения изменится зависимая пере­мен­ная при из­ме­нении на одно стандартное отклонение независимой пере­мен­ной при усло­вии постоянства остальных независимых переменных.

Теперь рассмотрим основные результаты регрессионного анализа более подробно.

R egression Summary for Dependent Variable: Кондитерские изделия

(табл продажи кор-регр ан итог)

R= ,71100039 R?= ,50552155 Adjusted R?= ,45607371

F(1,10)=10,223 p<,00953 Std.Error of estimate: 7401,8

N=12

Beta

Std.Err.

B

Std.Err.

t(10)

p-level

Intercept

150628,26

19064,41

7,901017

0,000013

Сыры

0,711000

0,222369

0,24

0,08

3,197394

0,009534

Рис. 11.2. Результаты работы модуля «Multiple Regression»

Beta – стандартизованные β-коэффициенты уравнения регрессии.

Std.Err. of Beta – стандартные ошибки β-коэффициентов.

B – коэффициенты уравнения регрессии.

Std.Err. of B – стандартные ошибки коэффициентов уравнения регрес­сии.

t(3) – t-критерии для коэффициентов уравнения регрессии.

p-level – уровень значимости.

Для проверки адекватности полученной модели используют табличные зна­чения F-критерия Фишера для уровня значимости p = 0,05. В рассмат­ри­вае­мой нами модели Fфакт.>F(3,8) – следовательно, модель адекватно отра­жа­ет за­висимость между факторами и нет оснований отказываться от ее при­ме­не­ния на практике.

Таким образом, в результате проведенного регрессионного анализа по­лу­чено следующее уравнение взаимосвязи между объемом продаж товарной груп­пы «Кондитерские изделия» (Y, тыс. руб.) и объемом продаж товарной груп­пы «Сыры» (X, тыс. руб.):

Y = 150628,26 + 0,24X.

Кнопка Predict dependent variable в модуле «Multiple Regression» по­зво­ля­ет рассчитать по полученному регрессионному уравнению значение за­ви­си­мой переменной по значению независимой переменной. Зададим для это­го следующее конкретное значение фактора – например, X = 350 000 (тыс. руб.).

Прогнозируемые значения переменной «Кондитерские изделия»

P redicting Values for (табл продажи кор-регр ан итог)

variable: Кондитерские изделия

B-Weight

Value

B-Weight

Сыры

0,243515

350 000,0

85230,2

Intercept

150 628,3

Predicted

235 858,5

-95,0%CL

218 028,0

+95,0%CL

253 689,0

Рис. 11.3

Как видно из рисунка 11.3, прогнозируемое значение Y (Predicted) соста­вит 235 858,51 тыс. руб.

В заключение следует отметить, что цель данного исследования – не толь­ко построить модель прогноза изменения объемов продаж по товар­ным груп­пам, но и продемонстрировать применение программы STATISTICA для этих целей. В нашем примере для построения модели с целью иллюстрации ис­поль­зовался только один фактор, на практике в модель, как правило, вклю­чают больше факторных переменных, оказывающих существенное влияние на ре­зультативный показатель. При помощи корреляционно-регрессионного ана­лиза предприятие розничной торговли может не только планировать пред­полагаемый объем продаж и ожидаемую прибыль, но и использовать по­лу­чен­ные зависимости, чтобы сокращать издержки на поддержание товар­ных запасов и экономить денежные средства на стимулирование продаж.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]