- •1. Парная регрессия и корреляция
- •1.1. Оценка параметров, оценка адекватности модели
- •1.2. Виды нелинейной регрессии. Оценка параметров модели.
- •1.3. Коэффициент эластичности как характеристика силы связи фактора с результатом
- •1.4. Анализ гетероскедастичности
- •2. Множественная регрессия и корреляция
- •2.1. Нормальная линейная модель множественной регрессии
- •2.2. Традиционный метод наименьших квадратов для многомерной регрессии (ols)
- •2.3. Парный, частный и множественный коэффициент корреляции
- •3. Моделирование одномерных временных рядов
- •3.1. Основные понятия и определения
- •3.2. Требования к исходной информации
- •3.3. Этапы построения прогноза по временным рядам
- •4. Типичные примеры анализа моделей Задача 1
- •Задача 3
- •Задача 4
- •Задача 5
- •Задача 6
- •Задача 7
- •Задача 8
- •5. Задания для выполнения контрольных работ Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Приложение 1 Статистико-математические таблицы
- •Критические значения t-критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01 (двухсторонний)
- •Критические значения корреляции для уровневой значимости 0,05 и 0,01
- •Значения статистик Дарбина-Уотсона для 5%-го уровня значимости
- •Критические границы отношения rs на 5% уровне значимости
- •Содержание
4. Типичные примеры анализа моделей Задача 1
Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена следующими данным1(табл. 3).
Таблица 3
№ мага-зина |
Среднее число посетителей в день, тыс. чел, х |
Годовой товарооборот, млн руб., у |
№ мага-зина |
Среднее число посетителей в день, тыс. чел, х |
Годовой товарооборот, млн руб., у |
1 |
8,25 |
19,76 |
7 |
12,36 |
75,01 |
2 |
10,24 |
38,09 |
8 |
10,81 |
89,05 |
3 |
9,31 |
40,95 |
9 |
9,89 |
91,13 |
4 |
11,01 |
41,08 |
10 |
13,72 |
91,26 |
5 |
8,54 |
56,29 |
11 |
12,27 |
99,84 |
6 |
7,51 |
68,51 |
12 |
13,92 |
108,55 |
Задания:
1. Построить линейную модель y=b0+b1x, параметры которой оценить методом наименьших квадратов.
2. Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, найти коэффициент детерминации и пояснить его смысл.
3. Проверить значимость уравнения регрессии на 5%-м уровне по F-критерию, проверить значимость коэффициента регрессии поt-статистике.
Решение:
При анализе статистических зависимостей широко используются графические методы, которые задают направление его дальнейшего анализа. В Excelдля этого можно использовать средствоМастер диаграмм. Для создания диаграммы необходимо выделить данные, запустить мастер диаграмм, выбрать тип и вид диаграммы (для нашего примера тип диаграммы –Точечная), выбрать и уточнить ориентацию диапазона данных и ряда, настроить параметры диаграммы.
Для описания закономерностей в исследуемой выборке наблюдений строится линия тренда.
Для добавления линии тренда в диаграмму необходимо выполнить следующие действия:
1) щелкнуть правой кнопкой мыши по ряду данных;
2) в динамическом меню выбрать командуДобавить линию тренда. На экране появится окноЛиния тренда(рис. 2);
3) выбрать вид зависимости регрессии. Для нашего примера тип тренда определим, как Линейный;
4) перейти на вкладку Параметры. В полеПоказать уравнение на диаграмме установить подтверждение;
5) в случае необходимости можно задать остальные параметры.
Изобразим полученную зависимость графически точками координатной плоскости (рис. 2). Такое изображение статистической зависимости называется полем корреляции.
По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными хиу.
По данным табл. 2 найдем уравнение регрессии упох. Расчеты произведем в Excel по формулам (4) – (10), промежуточные вычисления представим в табл. 4.
Рис. 3. Поле корреляции
Таблица 4
N |
X |
Y |
X*Y |
X*X |
Y*Y |
1 |
8,25 |
19,76 |
163,02 |
68,0625 |
390,4576 |
2 |
10,24 |
38,09 |
390,0416 |
104,8576 |
1450,848 |
3 |
9,31 |
40,95 |
381,2445 |
86,6761 |
1676,903 |
4 |
10,01 |
41,08 |
411,2108 |
100,2001 |
1687,566 |
5 |
8,54 |
56,29 |
480,7166 |
72,9316 |
3168,564 |
6 |
7,51 |
68,51 |
514,5101 |
56,4001 |
4693,62 |
7 |
12,36 |
75,01 |
927,1236 |
152,7696 |
5626,5 |
8 |
10,81 |
89,05 |
962,6305 |
116,8561 |
7929,903 |
9 |
11,89 |
91,13 |
1083,536 |
141,3721 |
8304,677 |
10 |
13,72 |
91,26 |
1252,087 |
188,2384 |
8328,388 |
11 |
12,27 |
99,84 |
1225,037 |
150,5529 |
9968,026 |
12 |
13,92 |
108,55 |
1511,016 |
193,7664 |
11783,1 |
Сумма |
128,83 |
819,52 |
9302,173 |
1432,684 |
65008,55 |
Среднее |
10,73583333 |
68,2933 |
775,1811 |
119,3903 |
5417,38 |
Дисперсия |
4,132174306 |
753,4001222 |
b1 |
10,163 |
|
Cov(x,y) |
41,99527222 |
|
b0 |
-40,8149 |
|
Итак, уравнение регрессии упох:
=40,81 + 10,16x.
Из полученного уравнения регрессии следует, что при увеличении среднего числа посетителей на 1 тыс. чел. годовой товарооборот увеличивается в среднем на 10,16 млн руб.
По исходным данным вычислим коэффициент корреляции.
Расчеты произведем в Excel, промежуточные вычисления см. табл. 4 и формулы (11), (12).
= 0,753,
т.е. связь между переменными достаточно тесная.
Оценим на уровне значимости = 0,05 значимость уравнения регрессииупох.
1-й способ. Используя данные табл. 5 вычислим необходимые суммы по формулам табл. 1:
= 9040,801 (см. столбец 6);
QR= = 5121,574 (см. столбец 7);
Qe=QQR= 9040,801 – 5121,574 = 3919,228
По формуле (19)
F= = 13,07.
По статистическим таблицам F-распределенияF0,05;1;10= 4,96. Так какF>F0,05;1;26, то уравнение регрессии значимо.
Таблица 5
N |
X |
Y |
Yрег |
Yi-Yрег |
(Yi-Yср)^2 |
(Yрег-Yср)^2 |
(Xi-Xcp)^2 |
1 |
8,25 |
19,76 |
43,03 |
-23,2698 |
2355,484 |
638,2452 |
6,179367 |
2 |
10,24 |
38,09 |
63,254 |
-25,1642 |
912,2413 |
25,39306 |
0,245851 |
3 |
9,31 |
40,95 |
53,802 |
-12,8526 |
747,6579 |
209,9815 |
2,033001 |
4 |
10,01 |
41,08 |
60,916 |
-19,8367 |
740,5655 |
54,41484 |
0,526834 |
5 |
8,54 |
56,29 |
45,977 |
10,3129 |
144,08 |
498,0148 |
4,821684 |
6 |
7,51 |
68,51 |
35,509 |
33,0008 |
0,046944 |
1074,799 |
10,406 |
7 |
12,36 |
75,01 |
84,799 |
-9,7897 |
45,11361 |
272,4612 |
2,637917 |
8 |
10,81 |
89,05 |
69,047 |
20,0029 |
430,8392 |
0,568147 |
0,005501 |
9 |
11,89 |
91,13 |
80,023 |
11,1069 |
521,5133 |
137,588 |
1,332101 |
10 |
13,72 |
91,26 |
98,621 |
-7,3614 |
527,4678 |
919,7921 |
8,905251 |
11 |
12,27 |
99,84 |
83,886 |
15,9549 |
995,1922 |
243,102 |
2,353667 |
12 |
13,92 |
108,55 |
100,654 |
7,8960 |
1620,599 |
1047,213 |
10,13892 |
Сумма |
128,83 |
819,52 |
|
0,00 |
9040,801 |
5121,574 |
49,58609 |
Среднее |
10,736 |
68,293 |
|
|
|
|
|
b1 |
10,163 |
|
|
|
|
|
|
b0 |
-40,8149 |
|
|
|
|
|
|
2-й способ. Учитывая, чтоb1= 10,163,= 49,586 (табл. 4),= =391,92 (табл.1), по формуле (20)
t= =3,61.
По таблице t-распределенияt0,95;10= 2,23. Так какt>t0,95;26, то коэффициент регрессииb1, а значит, и уравнение парной линейной регрессии значимо.
Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR= 5121,574,Q= 9040,801. По формуле (22)= 0,5665 (илиR2=r2= 0,7532= 0,95665). Это означает, что изменения зависимой переменнойу– годовой товарооборот – на 56,7% объясняется вариацией объясняющей переменнойх– численностью покупателей.
Задача 2.
При изучении зависимости потребления материалов у от объема производства продукции х по 20 наблюдениям были получены следующие варианты уравнения регрессии:
1. у = 3 + 2х + е.
(6,48)
2. lnу = 2,5 + 0,2lnx + e, r2 = 0,68.
(6,19)
3. у = 1,1 + 0,8lnх + е, r2= 0,69.
(6,2)
4. у = 3 + 1,5х + 0,1х2 + е, r2 = 0,701.
(3,0) (2,65)
В скобках указаны фактические значения t-критерия.
Задания:
1. Определите коэффициент детерминации для 1-го уравнения.
2. Запишите функцию, характеризующую зависимость у от х во 2-м уравнении.
3. Определите коэффициенты эластичности для каждого из уравнений для х0 = 2,5 тыс. шт.
Решение:
1. Чтобы определить коэффициент детерминации воспользуемся формулой (21).
Для уравнения парной линейной регрессии коэффициент детерминации r2= 0,70.
2. Уравнение 2 – это степенная функция, к которой применили преобразование. В качестве преобразования выполнили логарифмирование. Чтобы записать функцию проведем обратные преобразования.
lnу= 2,5 + 0,2lnx+eу=е2,5∙х0,2у= 1,28х0,2.
3. Чтобы рассчитать коэффициенты эластичности воспользуемся данными табл. 2. Результаты расчетов объединим в табл. 6.
Таблица 6
Вид функции |
Коэффициент эластичности |
Линейная у = 3 + 2х + е | |
Парабола у = 3 + 1,5х + 0,1х2 + е | |
Степенная у = 1,28х0,2 |
Э= 1,28 |
Полулогарифмическая у = 1,1 + 0,8lnx |
Рассчитаем точечный коэффициент эластичности для значения х0= 2,5.
1. Для линейной модели у = 3 + 2х + е.
= 0,625.
2. Для параболы у = 3 + 1,5х + 0,1х2 + е.
= 0,678.
3. Для степенной функции у = 1,28х0,2.
Э = 1,28.
4. Для полулогарифмической функции у = 1,1 + 0,8lnx.
= 0,436.