Эконометрика, ТюмГСХА, в-64
.doc
Задача 1.
По 10 сельскохозяйственным предприятиям имеются данные о себестоимости молока и средней продуктивности молока (табл. 1).
Таблица 1
Себестоимость молока, руб./л |
7,8 |
7,0 |
5,9 |
8,0 |
7,5 |
6,0 |
5,2 |
8,3 |
5,8 |
6,9 |
Средняя продуктивность молока, кг |
139 |
174 |
201 |
221 |
135 |
222 |
185 |
156 |
123 |
247 |
Требуется:
1. Рассчитать параметры уравнения парной линейной регрессии зависимости себестоимости молока от средней продуктивности.
2. Оценить качество уравнения с помощью средней ошибки аппроксимации.
3. Найти средний (обобщающий) коэффициент эластичности.
4. Оценить тесноту связи с помощью показателей корреляции и детерминации.
5. Оценить значимость коэффициента корреляции через t-критерий Стьюдента при = 0,05.
6. Оценить статистическую надежность результатов регрессионного анализа с помощью F-критерия Фишера при = 0,05.
7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня.
Решение.
1. Уравнение парной линейной регрессии имеет вид:
,
где - себестоимость молока, руб./л;
x – средняя продуктивность молока, кг;
a, b - параметры уравнения.
Для определения параметров уравнения a и b составим систему нормальных уравнений. Исходное уравнение последовательно умножим на коэффициенты при неизвестных a и b, и затем каждое уравнение просуммируем:
,
где n – число единиц совокупности.
Для расчетов построим вспомогательную таблицу (табл. 2).
Таблица 2
№ п/п |
Себесто-имость молока, руб./л |
Средняя продук-тивность молока, кг |
|
|
|
|
|
А |
y |
x |
|||||||
1 |
7,8 |
139 |
60,84 |
19321 |
1084,2 |
6,93 |
0,87 |
11,2 |
2 |
7,0 |
174 |
49,00 |
30276 |
1218,0 |
6,79 |
0,21 |
3,0 |
3 |
5,9 |
201 |
34,81 |
40401 |
1185,9 |
6,69 |
-0,79 |
13,4 |
4 |
8,0 |
221 |
64,00 |
48841 |
1768,0 |
6,61 |
1,39 |
17,4 |
5 |
7,5 |
135 |
56,25 |
18225 |
1012,5 |
6,95 |
0,55 |
7,3 |
6 |
6,0 |
222 |
36,00 |
49284 |
1332,0 |
6,60 |
-0,60 |
10,0 |
7 |
5,2 |
185 |
27,04 |
34225 |
962,0 |
6,75 |
-1,55 |
29,8 |
8 |
8,3 |
156 |
68,89 |
24336 |
1294,8 |
6,87 |
1,43 |
17,2 |
9 |
5,8 |
123 |
33,64 |
15129 |
713,4 |
7,00 |
-1,20 |
20,7 |
10 |
6,9 |
247 |
47,61 |
61009 |
1704,3 |
6,50 |
0,40 |
5,8 |
Сумма |
68,4 |
1803 |
478,08 |
341047 |
12275,1 |
|
|
135,8 |
Подставим полученные данные в систему уравнений:
Параметры уравнения регрессии найдем по формулам:
Уравнение регрессии имеет вид:
.
Коэффициент регрессии b = −0,004 показывает, что при росте средней продуктивности молока на 1 кг себестоимость молока в среднем по данной совокупности хозяйств снижается на 0,4 коп. за литр.
2. Оценим качество уравнения с помощью средней ошибки аппроксимации по формуле:
В среднем расчетные значения себестоимости молока отклоняются от фактических на 13,58%. Качество уравнения регрессии можно оценить как среднее, так как средняя ошибка аппроксимации больше 10%.
3. Рассчитаем средний коэффициент эластичности по формуле:
.
.
Коэффициент эластичности показывает, что в среднем при росте средней продуктивности молока на 1% себестоимость молока снижается на 0,11%.
4. Для определения тесноты связи между исследуемыми признаками рассчитаем коэффициент корреляции. Для парной линейной зависимости формула имеет вид:
,
где - средняя сумма произведения признаков.
Найдем средние квадратические отклонения:
Коэффициент корреляции, равный (−0,142), свидетельствует, что связь между признаками слабая и обратная. Коэффициент детерминации показывает, что всего 2% изменений в уровне себестоимости объясняется различной продуктивностью молока.
5. Для проверки статистической значимости (существенности) линейного коэффициента парной корреляции рассчитаем t-критерий Стьюдента по формуле:
Вычисленное tфакт сравним с табличным (критическим) значением tтабл при принятом уровне значимости = 0,05 и числе степеней свободы = n – 2 = 10 – 2 = 8. Табличное значение по таблице распределения Стьюдента равно 2,306.
Так как < , то это свидетельствует о незначимости линейного коэффициента корреляции и несущественности связи между себестоимостью и продуктивностью молока.
6. Оценим значимость уравнения регрессии и показателя тесноты связи с помощью F-критерия Фишера. Для этого сравним его фактическое значение Fфакт с табличным Fтабл.
.
Фактическое значение критерия меньше табличного, что свидетельствует о статистической незначимости уравнения регрессии в целом и показателя тесноты связи , то есть они статистически ненадежны и сформировались под случайным воздействием фактора x.
7. Полученные оценки уравнения регрессии не позволяют использовать его для прогноза.
Задача 2.
По 25 сельскохозяйственным предприятиям имеются данные о средних значениях и вариации урожайности зерновых, количестве внесенных удобрений и насыщенности севооборота зерновыми, а также о значениях коэффициентов парной корреляции между этими признаками (табл. 3).
Таблица 3
Показатель |
Признак |
Среднее значение |
Среднее квадратическое отклонение () |
Линейные коэффициенты парной корреляции |
Урожайность зерновых, ц/га |
y |
17,5 |
7,4 |
|
Внесено органических удобрений, ц/га |
x1 |
22 |
2,7 |
|
Насыщенность севооборота зерновыми, % |
x2 |
63 |
11,0 |
Требуется:
1. Построить уравнение множественной линейной регрессии зависимости урожайности зерновых от количества внесенных удобрений и насыщенности севооборота зерновыми.
2. Определить линейный коэффициент множественной корреляции.
3. Рассчитать общий F-критерий Фишера при уровне значимости =0,05.
Решение.
1. Уравнение множественной линейной регрессии имеет вид:
,
где - урожайность зерновых с 1 га, ц;
x1 – внесено органических удобрений на 1 га, ц;
x2 – насыщенность севооборота, %;
a, b1, b2 – параметры уравнения.
Для расчета параметров уравнения сначала построим уравнение множественной регрессии в стандартизированном масштабе:
,
где - стандартизированные переменные;
- стандартизированные коэффициенты регрессии.
Стандартизированные коэффициенты регрессии определим по формулам:
Уравнение множественной регрессии в стандартизированной форме имеет вид:
.
Стандартизированные коэффициенты регрессии позволяют сделать заключение о сравнительной силе влияния каждого фактора на урожайность зерновых. Более значимое влияние оказывает второй фактор, а именно, насыщенность севооборота зерновыми. В целом же можно сказать, что влияние факторов на урожайность практически одинаково.
Для построения уравнения в естественной форме рассчитаем b1 и b2, используя формулы перехода от i к bi:
,
где - средние квадратические отклонения.
Параметр определим из соотношения:
Получим уравнение:
.
Каждый из коэффициентов уравнения регрессии определяет среднее изменение урожайности за счет изменения соответствующих факторов и фиксированного уровня другого. Так, коэффициент при x1 показывает, что увеличение (или снижение) количества внесения удобрений на 1 ц ведет к повышению (или снижению) урожайности зерновых на 0,932 ц. Соответственно, коэффициент при x2 определяет меру зависимости урожайности зерновых от насыщенности севооборота.
2. Для определения линейного коэффициента множественной корреляции используем формулу:
.
Коэффициент множественной корреляции показывает тесную зависимость между анализируемыми признаками. Коэффициент множественной детерминации свидетельствует, что 27,5% изменения урожайности зерновых связано с анализируемыми признаками.
3. Статистическую значимость уравнения регрессии в целом и показателя тесноты связи оценим с помощью общего F-критерия Фишера по формуле:
,
где n = 25 – число единиц совокупности; m = 2 – число факторов в уравнении линейной регрессии.
Табличное значение по таблице значений F-критерия Фишера при , и равно .
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и показателя тесноты связи , которые сформировались под неслучайным воздействием факторов x1 и x2.