- •Задача 1
- •1. Парные зависимости
- •2. Множественная зависимость.
- •3. Экономическая интерпретация.
- •Решение
- •1. Парные зависимости
- •2. Множественная зависимость
- •3. Экономическая интерпретация
- •Задача 2
- •2. Методом наименьших квадратов найти оценку уравнения линейного тренда
- •Решение
- •Задача 3
- •Решение
- •1. Для регрессионных моделей
- •2. Для регрессионной модели
- •Список использованной литературы
Задача 1
В базе данных магазина, торгующего подержанными автомобилями, содержится информация об их потребительских свойствах и ценах. Для анализа зависимости цены автомобиля Y от его возраста X1 и мощности двигателя X2 из базы данных выбраны сведения о 16 автомобилях.
1. Парные зависимости
1.1. Построить поля рассеяний для цены Y и возраста автомобиля X1, а также для цены Y и мощности двигателя X2. На основе их визуального анализа выдвинуть гипотезы о виде статистической зависимости Y от X1 и Y от X2 и записать их математически.
1.2. Методом наименьших квадратов найти оценки линейных уравнений регрессии: ,.
1.3. С помощью коэффициентов парной корреляции проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надёжностью 0,9.
1.4. Проверить статистическую значимость параметров и уравнений регрессии с надёжностью 0,9.
1.5. Построить доверительные полосы надёжности 0,95 для среднего значения цены автомобиля в зависимости от его возраста, а также от мощности двигателя. Изобразить графически линии регрессии и доверительные полосы вместе с полями рассеяний.
1.6. На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.
2. Множественная зависимость.
2.1. По методу наименьших квадратов найти оценки коэффициентов множественной линейной регрессионной модели
2.2. Проверить статистическую значимость параметров и уравнения множественной регрессии с надёжностью 0,9.
2.3. Рассчитать точечный и интервальный прогноз среднего значения цены поступивших автомобилей возраста 3 года и мощностью двигателя 165 л.с. с доверительной надёжностью 0,95.
3. Экономическая интерпретация.
На основе полученных в пунктах 1 и 2 статистических характеристик провести содержательный экономический анализ зависимости цены автомобиля от его возраста и мощности двигателя.
Решение
1. Парные зависимости
1.1. Построим поля рассеяний для цены Y и возраста автомобиля X1, а также для цены Y и мощности двигателя X2.
Рисунок 1. Поле рассеяния (возраст-цена).
Рисунок 2. Поле рассеяния (мощность-цена).
На основе визуального анализа выдвигаем гипотезы о линейной статистической зависимости Y от X1 и Y от X2 и записываем их математически.
1.2. Методом наименьших квадратов найдём оценки линейных уравнений регрессии:
, .
Оценки параметров можно получить по формулам.
Составим расчётную таблицу.
Таблица 2.
№ |
х1 |
х2 |
у |
х1^2 |
x2^2 |
x1*y |
x2*y |
x1*x2 |
y^2 |
1 |
6 |
126 |
3 |
36 |
15876 |
18 |
378 |
756 |
9 |
2 |
3 |
116 |
7 |
9 |
13456 |
21 |
812 |
348 |
49 |
3 |
6 |
137 |
3,9 |
36 |
18769 |
23,4 |
534,3 |
822 |
15,21 |
4 |
7 |
120 |
1,3 |
49 |
14400 |
9,1 |
156 |
840 |
1,69 |
5 |
3 |
109 |
6 |
9 |
11881 |
18 |
654 |
327 |
36 |
6 |
4 |
123 |
6 |
16 |
15129 |
24 |
738 |
492 |
36 |
7 |
5 |
148 |
5,1 |
25 |
21904 |
25,5 |
754,8 |
740 |
26,01 |
8 |
6 |
139 |
4 |
36 |
19321 |
24 |
556 |
834 |
16 |
9 |
7 |
92 |
0,9 |
49 |
8464 |
6,3 |
82,8 |
644 |
0,81 |
10 |
3 |
112 |
7,2 |
9 |
12544 |
21,6 |
806,4 |
336 |
51,84 |
11 |
4 |
166 |
7,4 |
16 |
27556 |
29,6 |
1228,4 |
664 |
54,76 |
12 |
5 |
192 |
7,1 |
25 |
36864 |
35,5 |
1363,2 |
960 |
50,41 |
13 |
4 |
155 |
7,30 |
16 |
24025 |
29,2 |
1131,5 |
620 |
53,29 |
14 |
7 |
101 |
1 |
49 |
10201 |
7 |
101 |
707 |
1 |
15 |
6 |
177 |
4 |
36 |
31329 |
24 |
708 |
1062 |
16 |
16 |
3 |
112 |
5 |
9 |
12544 |
15 |
560 |
336 |
25 |
Сумма |
79 |
2125 |
76,2 |
425 |
294263 |
331,2 |
10564,4 |
10488 |
442,02 |
Среднее |
4,94 |
132,81 |
4,76 |
26,56 |
18391,44 |
|
|
|
|
Следовательно,
- зависимость цены от возраста.
- зависимость цены от мощности.
1.3. С помощью коэффициентов парной корреляции проанализируем тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Проверить их значимость с надёжностью 0,9.
Коэффициент парной корреляции определяем по формуле.
1) Проанализируем тесноту линейной связи между ценой и возрастом автомобиля.
Рассчитаем матрицу парных коэффициентов корреляции
Не существует линейная зависимость между Х1 и У, т.к. -1≤ rx,y ≤ 1 – не выполняется.
2) Проанализируем тесноту линейной связи между ценой и мощностью двигателя.
Рассчитаем матрицу парных коэффициентов корреляции
Проверим значимость коэффициента корреляции с надёжностью 0,9.
Проверка осуществляется по формуле:
1) В нашем случае для второго коэффициента
Условие выполняется, следовательно, коэффициент корреляции существенно отличен от нуля, и существует сильная линейная положительная связь между х2 и у.
1.4. Проверим статистическую значимость параметров и уравнений регрессии с надёжностью 0,9.
Проверим с помощью критерия Фишера значимость уравнения регрессии (адекватность модели исследуемой зависимости):
1)
Рассчитаем коэффициенты детерминации для зависимости y от x2:
т.е. вариация цены на 21,16% объясняется мощностью автомобиля.
Рассчитаем фактическое значение F – статистики Фишера по формуле:
Пусть доверительная вероятность р=0,9. По таблице найдём: Ft(0,1; 1; 14)=3,1.
Т.к. FФ >Ft (0,1; 1; 14), то гипотеза Н0 отклоняется и признается статистическая значимость уравнения регрессии.
Проверим статистическую значимость параметров полученной модели:
Для парной регрессии существует связь между статистиками Стьюдента и Фишера:
,
Для зависимости y от x2 получаем: . Т.к. это значение больше=1,761, поэтому гипотезу о равенстве нулю коэффициентаβ1 отвергаем.
1.5. Построим доверительные полосы надёжности 0,95 для среднего значения цены автомобиля в зависимости от его возраста, а также от мощности двигателя. Изобразим графически линии регрессии и доверительные полосы вместе с полями рассеяний.
Доверительные интервалы среднего значения цены для рассчитываем по формуле.
где - соответственно верхняя и нижняя границы доверительного интервала в точке;- значение независимой переменнойx1, для которой определяется доверительный интервал; - квантиль распределения Стьюдента с доверительной вероятностью 1- и числом степеней свободы n-2. При =0,05 t0,95;14=2,1448.
Значение стандартной ошибки Sy определяется по формуле:
где ;- остаточная дисперсия уравнения регрессии.
Рассмотрим первое уравнение парной регрессии.
- зависимость цены от возраста.
Составим расчётную таблицу
Таблица 3.
х1 |
у
|
|
|
|
|
| |||
6 |
3 |
-0,39 |
0,155236 |
1,06 |
1,12890625 |
3,394 | |||
3 |
7 |
-0,26 |
0,068121 |
-1,94 |
3,75390625 |
7,261 | |||
6 |
3,9 |
0,51 |
0,256036 |
1,06 |
1,12890625 |
3,394 | |||
7 |
1,3 |
-0,81 |
0,648025 |
2,06 |
4,25390625 |
2,105 | |||
3 |
6 |
-1,26 |
1,590121 |
-1,94 |
3,75390625 |
7,261 | |||
4 |
6 |
0,03 |
0,000784 |
-0,94 |
0,87890625 |
5,972 | |||
5 |
5,1 |
0,42 |
0,173889 |
0,06 |
0,00390625 |
4,683 | |||
6 |
4 |
0,61 |
0,367236 |
1,06 |
1,12890625 |
3,394 | |||
7 |
0,9 |
-1,21 |
1,452025 |
2,06 |
4,25390625 |
2,105 | |||
3 |
7,2 |
-0,06 |
0,003721 |
-1,94 |
3,75390625 |
7,261 | |||
4 |
7,4 |
1,43 |
2,039184 |
-0,94 |
0,87890625 |
5,972 | |||
5 |
7,1 |
2,42 |
5,841889 |
0,06 |
0,00390625 |
4,683 | |||
4 |
7,30 |
1,33 |
1,763584 |
-0,94 |
0,87890625 |
5,972 | |||
7 |
1 |
-1,11 |
1,221025 |
2,06 |
4,25390625 |
2,105 | |||
6 |
4 |
0,61 |
0,367236 |
1,06 |
1,12890625 |
3,394 | |||
3 |
5 |
-2,26 |
5,112121 |
-1,94 |
3,75390625 |
7,261 | |||
79 |
76,2 |
-0,02 |
21,060233 |
|
34,9375 |
76,217 | |||
4,94 |
4,76 |
|
|
|
|
|
Представим полученные результаты графически
Рисунок 3. Поле рассеяния с полосой надежности.
Рассмотрим второе уравнение парной регрессии.
- зависимость цены от мощности.
Составим расчётную таблицу
Таблица 4.
№ |
х2 |
у |
|
|
|
|
| ||||
1 |
126 |
3 |
-1,52 |
2,322576 |
-6,81 |
46,41016 |
4,524 | ||||
2 |
116 |
7 |
2,85 |
8,099716 |
-16,81 |
282,6602 |
4,154 | ||||
3 |
137 |
3,9 |
-1,03 |
1,062961 |
4,19 |
17,53516 |
4,931 | ||||
4 |
120 |
1,3 |
-3,00 |
9,012004 |
-12,81 |
164,1602 |
4,302 | ||||
5 |
109 |
6 |
2,11 |
4,431025 |
-23,81 |
567,0352 |
3,895 | ||||
6 |
123 |
6 |
1,59 |
2,518569 |
-9,81 |
96,28516 |
4,413 | ||||
7 |
148 |
5,1 |
-0,24 |
0,056644 |
15,19 |
230,6602 |
5,338 | ||||
8 |
139 |
4 |
-1,01 |
1,010025 |
6,19 |
38,28516 |
5,005 | ||||
9 |
92 |
0,9 |
-2,37 |
5,597956 |
-40,81 |
1665,66 |
3,266 | ||||
10 |
112 |
7,2 |
3,19 |
10,20164 |
-20,81 |
433,1602 |
4,006 | ||||
11 |
166 |
7,4 |
1,40 |
1,948816 |
33,19 |
1101,41 |
6,004 | ||||
12 |
192 |
7,1 |
0,13 |
0,017956 |
59,19 |
3503,16 |
6,966 | ||||
13 |
155 |
7,30 |
1,70 |
2,900209 |
22,19 |
492,2852 |
5,597 | ||||
14 |
101 |
1 |
-2,60 |
6,754801 |
-31,81 |
1012,035 |
3,599 | ||||
15 |
177 |
4 |
-2,41 |
5,812921 |
44,19 |
1952,535 |
6,411 | ||||
16 |
112 |
5 |
0,99 |
0,988036 |
-20,81 |
433,1602 |
4,006 | ||||
Сумма |
2125 |
76,2 |
-0,22 |
62,735851 |
|
12036,44 |
| ||||
Среднее |
132,81 |
4,76 |
|
|
|
|
|
Представим полученные результаты графически
Рисунок 4. Поле рассеяния с полосой надежности.
1.6. На продажу поступила очередная партия однотипных автомобилей. Их возраст 3 года, мощность двигателя 165 л.с. Рассчитаем точечный и интервальный прогноз среднего значения цены поступивших автомобилей в зависимости от возраста и мощности двигателя с доверительной вероятностью 0,95.
1) Подставляем в первую модель возраст 3 года, получаем точечный прогноз:
7,261
Подставляем точечный прогноз среднего цены и в уравнения границ доверительного интервалаи получаем интервальный прогноз с доверительной вероятностью 0,95:
, или ; тыс. у.е.
2) Подставляем во вторую модель мощность 165 л.с., получаем точечный прогноз: тыс. у.е.
Подставляем точечный прогноз среднего цены ив уравнения границ доверительного интервалаи получаем интервальный прогноз с доверительной вероятностью 0,95:
, или ;тыс. у.е.