- •Содержание
- •Введение
- •1. Требования к знаниям, умениям и навыкам для выполнения
- •2.1. Лабораторная работа №1
- •Методические рекомендации и выполнение.
- •2.2. Лабораторная работа №2
- •2.3.Лабораторная работа №3
- •2. Проанализировать линейные коэффициенты парной и частной корреляции.
- •Входной интервал х – диапазон, содержащий данные факторов независимого признака
- •2. Проанализировать линейные коэффициенты парной и частной корреляции.
- •2.4.Лабораторная работа №4
- •2.5. Лабораторная работа №5
- •Литература
- •Приложения
- •1. Критические значения t – критерия Стьюдента при уровне значимости 0,01, 0,05, 0,01 (двухсторонний)
- •3 Значения статистик Дарбина – Уотсона dL, dU при уровне значимости 0,05
2.2. Лабораторная работа №2
Построение модели нелинейной парной регрессии, анализ статистической значимости и выполнение прогноза
Цель: провести спецификацию модели; оценить параметры линеаризованного уравнения показательной парной регрессии; проанализировать статистическую значимость показательного уравнения парной регрессии; оценить тесноту связи фактора с результативным признаком; выполнить прогнозирование; интерпретировать результаты; проверить полученные результаты с помощью ППП MS Excel.
Теоретические сведения
Парная регрессия – уравнение связи двух переменных у и х: ,
где у – зависимая переменная (результативный признак);х – независимая, объясняющая переменная (признак - фактор).Различают линейные и нелинейные регрессии. Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
- полиномы разных степеней
- равносторонняя гипербола
Регрессии, нелинейные по оцениваемым параметрам:
- степенная
- показательная
- экспоненциальная
При оценке параметров нелинейных регрессий используют МНК, предварительно преобразовывая уравнение к линейному виду:
- для равносторонней гиперболы вида , заменив на z, получим линейное уравнение регрессии: и система нормальных уравнений составит:
- для полулогарифмической кривой , заменив lnx на z, получим линейное уравнение регрессии
Регрессии, нелинейные по оцениваемым параметрам, подразделяются на два типа: нелинейные модели внутренне линейные и нелинейные модели внутренне нелинейные. Если нелинейная модель внутренне линейна, то она с помощью логарифмирования уравнения по основанию e или 10 может быть приведена к линейному виду. Например, для оценки параметров степенной функции применяется метод наименьших квадратов к линеаризованному уравнению , т.е. решается система нормальных уравнений: .
Параметр определяется непосредственно из системы, а параметр а – косвенным путем после потенцирования величины lnа.
Нелинейная модель внутренне нелинейная (например, ) не может быть преобразована в уравнение, линейное по коэффициентам. Для оценки параметров в этом случае используют итеративные процедуры.
Тесноту связи изучаемых явлений оценивает индекс корреляции для нелинейной регрессии : ,
где общая дисперсия результативного признака - остаточная дисперсия, определяемая исходя из уравнения регрессии
Для оценки качества подбора функции рассчитывается квадрат индекса корреляции, называемый индексом детерминации. Индекс детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака: .
Коэффициент эластичности, средняя ошибка аппроксимации определяются аналогично линейной парной регрессии (см. лабораторную работу №1).
Оценка значимости уравнения нелинейной парной регрессии в целом дается с помощью F – критерии Фишера и выполняется аналогично оценке значимости уравнения линейной парной регрессии (см. лабораторную работу №1).
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего прогнозного значения . Вычисляется средняя стандартная ошибка прогноза:
, где . и строится доверительный интервал прогноза, границы которого определяются как предельная ошибка прогноза.
Постановка задачи
По территориям региона приводятся данные за 199Х год (табл.6).
Таблица 6
№ региона |
Среднедушевой прожиточный минимум в день , руб.,x |
Среднедневная заработная плата , руб., y |
1 |
2 |
3 |
1 |
78 |
133 |
2 |
82 |
148 |
3 |
87 |
134 |
4 |
79 |
154 |
Продолжение таблицы 6
1 |
2 |
3 |
5 |
89 |
162 |
6 |
106 |
195 |
7 |
67 |
139 |
8 |
88 |
158 |
9 |
73 |
152 |
10 |
87 |
162 |
11 |
76 |
159 |
12 |
115 |
173 |
Требуется:
Для характеристики зависимости y от x:
а) построить показательное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью индексов корреляции и детерминации;
в) оценить качество показательного уравнения парной регрессии с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности;
д) оценить статистическую значимость результатов регрессионного моделирования с помощью F – критерия Фишера.
е) найти прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости =0,05 .
2. Проверить полученные результаты с помощью ППП MS Excel.
Методические рекомендации и выполнение
1. а) Построению показательной модели y=a·bx предшествует процедура линеаризации переменных. Логарифмируя обе части уравнения , получим:
ln y = ln a+ x·lnb . Введем обозначения : , , .Тогда уравнение запишется в виде: .Параметры полученной линейной модели рассчитываем аналогично тому, как это было сделано в лабораторной работе № 1. Используем данные расчетной таблицы 7
Таблица 7
Построим линейное уравнение парной регрессии Y по х. Используя данные таблицы 7, имеем: ,
.
Получим линейное уравнение регрессии: .
Проведя потенцирование уравнения, получим искомую нелинейную показательную модель:
.
б) Для расчета индекса корреляции нелинейной регрессии воспользуемся таблицу 7 .
Найдем индекс детерминации: .
Это означает, что 52% вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума.
в) Для оценки качества полученной модели найдем среднюю ошибку аппроксимации: .
В среднем, расчетные значения отклоняются от фактических на 5,851%. Качество построенной модели оценивается как хорошее, т.к. значение – менее 8 %.
г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности: , где ,
Таким образом, в среднем на 0,48% по совокупности изменится среднедневная зарплата от своей средней величины при изменении среднедушевого прожиточного минимума в день одного трудоспособного на 1%.
д) Рассчитаем фактическое значение F – критерия при заданном уровне значимости = 0,05
.
Сравнивая табличное Fтабл=4,96 (см. лабораторная работа №1) и фактическое значения, отмечаем, что , это указывает на необходимость отвергнуть гипотезу Но о статистически незначимых параметрах уравнения показательной парной регрессии.
ж) По условию задачи прогнозное значение фактора выше его среднего уровня на 5%, тогда оно составляет: ,
и прогнозное значение зарплаты при этом составит:
руб.
Найдем ошибку прогноза:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит: .
Доверительный интервал прогноза при уровне значимости = 0,05:
(129,4589; 187,9211).
2. Проверим полученные результаты с помощью ППП MS Excel.
Результаты вычисления параметров показательной парной регрессии можно проверить с помощью ППП Excel, для чего используем встроенную статистическую функцию ЛГРФПРИБЛ. Порядок вычисления аналогичен применению функции ЛИНЕЙН (см. лабораторную работу №1 ).
В результате применения функции ЛГРФПРИБЛ дополнительная регрессионная статистика будет выводиться в порядке, указанном выше (табл. 4 лабораторной работы №1), причем в первой строке таблицы (рис.11) функция ЛГРФПРИБЛ возвращает коэффициенты показательной модели, остальные параметры соответствуют линеаризованной модели (рис.11).
Рис. 11. Результат вычисления функции ЛГРФПРИБЛ
Прогнозное значение результата определим следующим образом:
активизируйте Мастер функций ,
в окне Категория (рис. 12) выберите Статистические, в окне Функция – РОСТ (рис. 3);
Рис.12. Диалоговое окно «Мастер функций»
Рис.13. Диалоговое окно ввода аргументов функции РОСТ
3) заполните аргументы функции (рис.13)
Изв знач у – диапазон, содержащий данные результативного признака;
Изв знач х – диапазон, содержащий данные факторов независимого признака;
Нов _ знач _ х – новые значения х, для которых возвращается соответствующие значения у;
Константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается свободным образом, если Константа = 0, то свободный член равен 0;
В данном случае прогнозируемое значение получилось равным 158,69. Сравнивая полученные вручную и с помощью ППП MS Excel. данные, убеждаемся в правильности выполненных действий.
Варианты заданий лабораторной работы №2
По территориям региона приводятся данные за 199Х год (табл.8).
Таблица 8
№ региона |
Среднедушевой прожиточный минимум в день , руб.,x |
Среднедневная заработная плата, руб., y |
1 |
70+2i |
133 |
2 |
90-4j |
148 |
3 |
80+i |
134 |
4 |
90-3i |
154 |
5 |
90+i |
162 |
6 |
110-5i |
195 |
7 |
60+j |
139 |
8 |
90-2j |
158 |
9 |
80-j |
152 |
10 |
87+0,5i |
162 |
11 |
75-0,1j |
159 |
12 |
110+0,1i |
173 |
где i, j две последние цифры номера зачетной книжки соответственно.
Требуется:
1. Для характеристики зависимости у от х:
а) построить показательное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью индексов корреляции и детерминации;
в) оценить качество показательного уравнения парной регрессии с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности;
д) оценить статистическую значимость результатов регрессионного моделирования с помощью F – критерия Фишера.
е) найти прогнозное значение результата, если прогнозное значение фактора увеличится на 7% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости =0,05 .
2. Проверить полученные результаты с помощью ППП MS Excel.
Вопросы для самопроверки
В чем состоят ошибки спецификации модели?
Поясните смысл коэффициента регрессии, назовите способы его оценивания.
Что такое число степеней свободы и как оно определяется для факторной, остаточной, общей сумм квадратов?
Какова концепция F – критерия Фишера для показательной парной регрессии?
Каковы методы подбора вида математической функции .
Какова концепция дисперсионного анализа результатов регрессии?
Как находится интервальная оценка прогнозного значения по уравнению регрессии?
Запишите все виды моделей, нелинейных относительно:
- включаемых переменных;
- оцениваемых параметров.
В чем отличие применения МНК к моделям, нелинейным относительно включаемых переменных и оцениваемых параметров?
Как определяются коэффициенты эластичности ?
Назовите показатели корреляции, используемые при нелинейных соотношениях рассматриваемых признаков.
В чем смысл средней ошибки аппроксимации и как она определяется?
Содержание отчета по лабораторной работе:
1) тема и цель лабораторной работы;
2) текст задания лабораторной работы;
3) результаты, зафиксированные на бумаге, в соответствии с изложенным выше выполнением типового задания лабораторной работы;
4) электронный вариант выполнения лабораторной работы;
5) защита лабораторной работы.