Задача № 6
Имеются сведения о среднем размере земельного участка крестьянского (фермерского) хозяйства – Nt, га, за период с 1998 по 2006 год (на конец года) в Российской Федерации.
Годы |
Nt |
Годы |
Nt |
1998 |
42 |
2003 |
54 |
1999 |
44 |
2004 |
62 |
2000 |
47 |
2005 |
67 |
2001 |
48 |
2006 |
75 |
2002 |
50 |
|
|
Задание:
1. Постройте график фактических уровней динамического ряда - Nt
2. Рассчитайте параметры уравнения линейного тренда
3. Оцените полученные результаты:
с помощью показателей тесноты связи ( r и r2 );
значимость модели тренда (F -критерий);
качество модели через корректированную среднюю ошибку аппроксимации , а также через коэффициент автокорреляции отклонений от тренда -
4. Выполните прогноз до 2008 года, рассчитайте ошибки прогноза, доверительный интервал прогноза и оцените его точность.
5. Проанализируйте полученные результаты.
Решение:
1. Построим график фактических уровней динамического ряда - Wt
2. Рассчитаем параметры уравнения линейного тренда
Параметры линейного тренда «а0», «а1» рассчитываются с помощью решения системы уравнений:
n* а0 + а1* t = y
а0 * t + а1* t2 = ty
Для этого построим вспомогательную таблицу:
t |
y |
y*t |
t2 |
1 |
42 |
42 |
1 |
2 |
44 |
88 |
4 |
3 |
47 |
141 |
9 |
4 |
48 |
192 |
16 |
5 |
50 |
250 |
25 |
6 |
54 |
324 |
36 |
7 |
62 |
434 |
49 |
8 |
67 |
536 |
64 |
9 |
75 |
675 |
81 |
Σ=45 |
489 |
2682 |
285 |
`
9 * а0 + а1* 45 = 489
а0 * 45 + а1* 285 = 2682
Решив систему уравнений, получим:
y = 3,95* t + 34,583
График этой функции:
3. Оценим полученные результаты:
с помощью показателей тесноты связи (η и η2);
значимость модели тренда через F -критерий;
качество модели через корректированную среднюю ошибку аппроксимации , а также через коэффициент автокорреляции отклонений от тренда -
Для определения тесноты связи воспользуемся формулой:
Построим вспомогательную таблицу:
y выров |
Уфак-Уср |
(Уфак-Уср)2 |
Уфак-Увыров |
(Уфак-Увыр)2 |
38,5 |
-12,33 |
152,11 |
3,47 |
12,02 |
42,5 |
-10,33 |
106,78 |
1,52 |
2,30 |
46,4 |
-7,33 |
53,78 |
0,57 |
0,32 |
50,4 |
-6,33 |
40,11 |
-2,38 |
5,68 |
54,3 |
-4,33 |
18,78 |
-4,33 |
18,78 |
58,3 |
-0,33 |
0,11 |
-4,28 |
18,35 |
62,2 |
7,67 |
58,78 |
-0,23 |
0,05 |
66,2 |
12,67 |
160,44 |
0,82 |
0,67 |
70,1 |
20,67 |
427,11 |
4,87 |
23,68 |
|
Σ |
1018,0 |
|
81,9 |
__________
= 81,9 / 1018 = 0,284
Коэффициент детерминации 2ylnx = 0,2842 = 0,08, это означает, что 8% всего разброса значений переменной Y (зависимой переменной) объясняется нашей моделью (уравнением регрессии), а 92% осталось не объяснено.
F-критерий:
Fрасч. = 2 (n – m) / (1 – 2)(m – 1) = 0,08 * (9-2) / (1-0,08)(2-1) = 0,61
При числе уровней свободы k1 = m = 2 и k2 =n-m-1 = 9 – 2 – 1 = 6, и уровне критерия значимости равном = 0,05 по таблице Фишера значение F-критерия должно быть не ниже 5,14 чтобы связь могла считаться существенной. Но в данном случае: 0,61 < 4,74. То есть корреляция факторов является случайностью с вероятностью 95 %.
4. Выполним прогноз до 2003 года. Подставляя следующие года в уравнение регрессии получим:
Годы |
y вырав |
2000 |
67 |
2001 |
75 |
2002 |
74,1 |
2003 |
78,0 |
5. Анализ полученных результатов:
Возможно, не имеет смысла проводить дальнейший анализ уровней ряда, т.к. выбранная модель регрессии не удовлетворяет критериям точности, либо в уровнях исследуемого ряда отсутствует связь.