МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ
|
Кафедра статистики
и информационных
систем в экономике
Лабораторные занятия. Корреляционно-регрессионный анализ с использованием ПП «ЕХСЕL»
Уфа 2011
УДК 311
ББК 65.051
М 54
Рекомендовано к изданию методической комиссией экономического факультета (протокол № 6 от 14 марта 2011г.)
Составители: д.э.н., проф. Рафикова Н.Т., асс. Насретдинова З.Т.
Рецензент: к.э.н., доцент кафедры бухгалтерского учета и анализа РахматуллинЮ.Я.
Ответственный за выпуск: заведующий кафедрой статистики и информационных систем в экономике к.э.н., доцент Аблеева А.М.
г.Уфа, БашГАУ, Кафедра статистики и информационных систем в экономике
Оглавление
Введение |
|
1 Методика проведения корреляционно-регрессионного анализа с использованием ПК «Ехсеl» |
5 |
2 Контрольные вопросы |
8 |
3. Задание для самостоятельной работы |
8 |
Библиографический список |
9 |
Введение
В системе экономических наук статистика является одной из фундаментальных дисциплин, формирующих профессиональный уровень экономиста. Важность общей теории и сельскохозяйственной статистики определяется комплексом решаемых ею проблем. Актуальность и значимость этой науки особенно возрастают сегодня в рыночных условиях хозяйствования.
Актуальные направления развития государственной статистики определены в Федеральной целевой программе «Развитие государственной статистики России в 2007—2011 годах», утвержденной постановлением Правительства РФ от 2 октября 2006 г. № 595.
При написании методических указаний авторы руководствовались Государственным образовательным стандартом высшего профессионального образования, программой по дисциплине «Общая теория статистики». Методические указания содержат цели и задачи работы, краткую теоретическую информацию по темам, задания, методические рекомендации к ним, контрольные вопросы, тесты и рекомендуемую литературу.
Цель занятий по статистике состоит в приобретении практических навыков по освоению методов и приемов изучения массовых явлений общества, системы статистических показателей деятельности предприятий, приемов статистического анализа условий, хода и результатов деятельности предприятий разных отраслей АПК
Цель данного занятия – освоить навыки выполнения корреляционно-регрессионного анализа с использованием ППП Excel.
В процессе занятий, выполняя методические указания, студент решает задачи приобретения навыков конструктивного использования методов статистического анализа, необходимых для предстоящей аналитической работы специалиста, руководителя при управлении экономикой.
Методические указания призваны помочь студентам лучше усвоить теоретические основы дисциплины, систему показателей, выработать навыки решения задач, научиться анализировать социально-экономические явления и процессы, делать правильные выводы и, в конечном счете, стать квалифицированными специалистами.
1 Методика проведения корреляционно-регрессионного анализа с использованием пк «ехсеl»
Методику проведения корреляционно-регрессионного анализа (КРА) рассмотрим на примере изучения зависимости (определим влияние) факторов: расхода кормов на 1 корову, прямых затрат труда на 1 корову и выхода телят в среднем на 100 коров на уровень надоя на 1 корову. Исходные данные для проведения анализа представлены в таблице 1.
Таблица 1- Исходные данные
|
у |
х 1 |
х 2 |
х 3 |
Наименование хозяйств |
Надой на 1 корову, кг |
Расход кормов на 1 корову, ц.к.ед.* |
Прямые затраты труда на 1 корову, чел.- час** |
Выход телят в среднем на 100 коров, гол. |
Чишма |
4741 |
66,4 |
227,1 |
103 |
Им. X. Валеева |
5535 |
74,7 |
217,5 |
100 |
Им. Р. Еникеева |
4097 |
66,8 |
83,3 |
99 |
Кушуль |
4568 |
74,0 |
79,3 |
94 |
Маяк |
3528 |
49,4 |
136,9 |
73 |
Игенче |
4622 |
82,3 |
147,4 |
100 |
Асян |
4258 |
60,5 |
198,8 |
99 |
Уныш |
4554 |
50,5 |
169,9 |
102 |
Им. Ленина |
5181 |
73,1 |
148,7 |
97 |
Им. Кирова |
6492 |
82,4 |
286,3 |
104 |
Урал |
4001 |
61,2 |
274,1 |
90 |
Им. Калинина |
2815 |
47,0 |
138,2 |
101 |
Россия |
5584 |
97,7 |
258,0 |
109 |
Победа |
5267 |
81,1 |
189,6 |
85 |
Им. Горшкова |
5492 |
72,5 |
285,6 |
104 |
Им. Свердлова |
2885 |
32,6 |
223,0 |
99 |
Им. Н. Наджми |
3765 |
53,8 |
171,3 |
90 |
Им. Крупской |
4195 |
72,6 |
283,3 |
97 |
Рассвет |
2862 |
37,8 |
125,4 |
89 |
Танып |
3005 |
40,0 |
114,2 |
99 |
*Расход кормов на 1 корову = Расход кормов на 1 ц молока*удой, ц.к.ед.
**Прямые затраты труда на 1 корову = Прямые затраты труда 1ц молока*удой, чел.- час
Введем таблицу с исходными данными в ПП Excel. Построим корреляционную модель связи уровня надоя на 1 корову (у) с включением трех факторов: расхода кормов на 1 корову (х1), прямых затрат труда на 1 корову (х 2) и выхода телят в среднем на 100 коров (х 3).
Для удобства анализа разобьем результаты статистической обработки корреляционно-регрессионного анализа на отдельные фрагменты.
Выберем пункт меню «Сервис»/ «Анализ данных» / выбрем «корреляция». Укажем диапазон анализа, т.е. все количественные показатели результативного и факторных показателей. Полученный результат в виде матрицы коэффициентов парной корреляции представлен в таблице 2.
Таблица 2 Матрица коэффициентов парной корреляции
|
Надой на 1 корову, кг |
Расход кормов на 1 корову, ц.к.ед. |
Прямые затраты труда на 1 корову, чел.- час. |
Выход телят в среднем на 100 коров, гол. |
Надой на 1 корову, кг |
1 |
|
|
|
Расход кормов на 1 корову, ц.к.ед. |
0,8646 |
1 |
|
|
Прямые затраты труда на 1 корову, чел.-час. |
0,4841 |
0,3574 |
1 |
|
Выход телят в среднем на 100 коров, гол. |
0,3750 |
0,3261 |
0,3307 |
1 |
Корреляционная матрица (таблица 2) содержит частные коэффициенты корреляции. Коэффициенты второго столбца матрицы характеризуют степень тесноты связи между результативным (у) и факторными признаками (х1, х2, х3).
Согласно значению коэффициента парной корреляции, равному r =0,8646, между расходом кормов на 1 корову и уровнем надоя на 1 корову связь прямая сильная, между прямыми затратами труда на 1 корову и выходом телят на 100 коров и надоем на 1 корову связь прямая умеренная.
Следующим этапом проведения КРА будет проведение регрессионного анализа. В пункте «Сервис»/ «Анализ данных» / выбрать «регрессия».в данном диалоговом окне указать диапазон результативного показателя (у), т.е. столбик с показателями надоя на 1 корову и факторных показателей (х), поставить «галочку» в строках: «вывод остатков» и «график остатков».
Таблица 3 Регрессионная статистика
Множественный R |
0,8864 |
R-квадрат |
0,7857 |
Нормированный R-квадрат |
0,7455 |
Стандартная ошибка |
523,00 |
Наблюдения |
20 |
Согласно коэффициенту множественной корреляции R=0,8864, связь между надоем на 1 корову и рассмотренными факторами сильная. Коэффициент детерминации R2=0,7857 показывает, что 78,57% изменения надоя на 1 корову обусловлено вариацией рассмотренными факторами: расходом кормов на 1 корову, прямыми затратами труда на 1 корову и выходом телят на 100 коров. На остальные 21,43% вариации результативного признака - у оказали влияние другие факторы, не включенные в модель.
Нормированный коэффициент детерминации был скорректирован на число степеней свободы.
Оценка значимости уравнения регрессии в целом приводится по F-критерию Фишера (табл. 4).
Таблица 4 Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
3 |
16042091 |
5347364 |
19,5493 |
1,34E-05 |
Остаток |
16 |
4376509 |
273531,8 |
|
|
Итого |
19 |
20418601 |
|
|
|
Если F факт>F табл, то уравнение является статистически значимым, если F факт<F табл - незначимым. При вероятности ошибки α = 0,05 и степенях свободы v1=k-1=3-1=2, v2=n-k=20-3=17, где k – число факторов в модели, n – число наблюдений Fфакт, приведенный в таблице 4, равен 19,549.Так как Fфакт = 19,549 > Fтабл = 3,59, то коэффициент корреляции значим, следовательно, построенная модель в целом адекватна.
По данным другого фрагмента КРА , представленного в таблице 5, линейное уравнение регрессии надоя на 1 корову имеет вид:
у=97,117 + 46,946 х1 + 2, 879 х 2 + 7 ,634 х3
Таблица 5 Основные характеристики параметров регрессионного уравнения
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
97,11745 |
1447,242 |
0,067105 |
0,94732 |
-2970,89 |
3165,13 |
Расход кормов на 1 корову, ц.к.ед. |
46,94643 |
7,688873 |
6,105762 |
1,52E-05 |
30,6467 |
63,2461 |
Прямые затраты труда на 1 корову, чел.- час |
2,879066 |
1,975755 |
1,457198 |
0,164408 |
-1,30935 |
7,06748 |
Выход телят в среднем на 100 коров |
7,634240 |
16,18065 |
0,471813 |
0,64343 |
-26,6672 |
41,9357 |
Интерпретация полученных параметров следующая:
а0 = 97,117 – свободный член уравнения регрессии, содержательной интерпретации не подлежит;
а1 = 46,946 – коэффициент чистой регрессии при первом факторе свидетельствует о том, что при увеличении расходом кормов на 1 корову на 1 ц.к.ед. уровень продуктивности коров в среднем по совокупности увеличится на 46,95 кг, при условии, что другие факторы остаются постоянными. Иными словами, прирост расхода кормов на 1 корову на 1 ц.к.ед. в среднем повысит надой на 1 корову на 46,95 кг.
а2 = +2, 879 – коэффициент чистой регрессии при втором факторе свидетельствует о том, что при увеличении прямых затрат труда на 1 корову на 1 чел.-час.уровень продуктивности коров в среднем по совокупности увеличится на 2, 879 кг при условии, что другие факторы остаются постоянными;
а3 = +7 ,634 – коэффициент чистой регрессии при третьем факторе свидетельствует о том, что при увеличении выхода телят на 1 теленка в расчете на 100 коров уровень продуктивности коров в среднем по совокупности увеличится на 2, 879 кг при условии, что другие факторы остаются постоянными.
Проверка значимости параметров уравнения регрессии проводится на основе t-критерий Стьюдента (t–статистика). Для этого сравниваются фактические значения t-критерия с табличным значением t-критерия. Если tфакт> tтабл, то параметр уравнения является статистически значим, а если не tфакт< tтабл , то незначим. В нашем примере при вероятности ошибки α = 0,05 и степени свободы v= n-k-1=20-3-1=16 (где k – число факторов в модели, n – число наблюдений, tтабл = 2,12) получим : t1факт = 6,105762> tтабл = 2,12,
t2факт = 1,457198< tтабл = 2,12, t3факт = 0,471813> tтабл = 2,12.
В целом tфакт, равный 0,067105, свидетельствует о статистически незначимости уравнения. tфакт параметра а2 (расход кормов на 1 корову), равный 6,105762 свидетельствует о его статистической значимости. Значит, статистически значимым является первый фактор. В этом случае модель пригодна для принятия решений, но не для прогнозов.
В таблице 6 приведены отклонения фактических данных результативного показателя от предсказанных, согласно уравнению прямой у=97,117 + 46,946 х1 + 2, 879 х 2 + 7 ,634 х3, после подстановки в него фактических значений х.
Таблица 6 Остатки
Наблюдение |
Предсказанное Надой на 1 корову, кг |
Остатки |
Стандартные остатки |
1 |
4653,2845 |
87,71554 |
0,182763 |
2 |
4994,7659 |
540,2341 |
1,125628 |
3 |
4227,8673 |
-130,8673 |
-0,272674 |
4 |
4517,1565 |
50,84347 |
0,105937 |
5 |
3367,2998 |
160,7002 |
0,334834 |
… |
… |
… |
… |
19 |
2911,0327 |
-49,03266 |
-0,102164 |
20 |
3057,952 |
-52,95204 |
-0,11033 |
Если с точки зрения целесообразности лучшей характеристикой для результативного показателя является его повышение, то о резервах роста будут свидетельствовать отрицательные остатки по каждому отдельному предприятию, если уменьшение, то положительные. В нашем примере резервы увеличения уровень надоя на 1корову за счет расхода кормов на 1 корову, прямых затрат труда на 1корову и выхода телят в среднем на 100коров имеют предприятия: им. Р.Еникеева, Маяк, Асян, Урал, им. Калинина, им.Свердлова, им.Н.Наджми, им.Крупской,Рассвет, Танып.