- •1 Введение в эконометрику
- •1.1 Предмет эконометрики
- •1.2 Типы статистических данныx
- •1.3 Классы моделей
- •1.4 Оценивание моделей и типы зависимостей
- •1.5 Элементы математической статистики
- •1.5.1 Операция суммирования
- •1.5.2 Случайные переменные (величины)
- •1.5.3 Числовые характеристики распределения
- •1.5.4 Вероятность в непрерывном случае
- •2 Постоянная и случайная составляющие случайной переменной
- •2.1Способы оценивания характеристик случайной величины и оценки
- •3 Выборочная ковариация. Выборочная дисперсия. Коэффициент корреляции
- •3.1 Выборочная ковариация
- •3.2 Выборочная дисперсия
- •3.3 Коэффициент корреляции
- •4 Парный регрессионный анализ
- •4.1 Модель парной линейной регрессии
- •4.2 Метод наименьших квадратов (мнк)
- •4.3 Качество оценки: Коэффициент детерминации
4 Парный регрессионный анализ
4.1 Модель парной линейной регрессии
Важнейший задачей экономического анализа является установление взаимосвязей экономических переменных, что помогает при анализе их поведения [2,15].
Коэффициент корреляции показывает, что две переменные связаны друг с другом, но он не дает представления о том, каким образом они связаны.
Рассмотрим случай двух переменных и и определим существует или нет линейная связь между ними.
Проведем случайную выборку.
При значениях наблюдаем значения соответственно. На плоскости отметим точки с координатами .
Предположим, что точки группируются вокруг некоторой прямой линии
точки не находятся точно на этой линии. Это неудивительно, т.к. помимо на поведение оказывают влияние и другие факторы.
На переменные накладывается ряд условий. Для описания природы связи используется термин «регрессия». «Регресс» (лаг) – отклонение, движение назад.
Зависимость между переменными и в генеральной совокупности можно представить как модель парной линейной регресии
где – результативная (или объясняемая, зависимая) переменная;
– факторная ( или объясняющая , независимая) переменная;
и – неизвестные параметры модели;
– случайный член (случайная ошибка регрессионной модели).
Величина состоит из двух составяющих:
1) случайный составляющий ;
2) случайного члена .
Основные предпосылки модели парной линейной регресии:
связь между переменными и линейная;
независимая переменная может быть использована для прогноза ;
остатки нормально распределены;
для всех данных математическое ожидание равно нулю;
ошибки независимы;
Наличие случайного члена связано с воздействием на зависимую переменную у других неучтенных в данной модели факторов.
Например, нелинейность модели, наличие других переменных, неучтенных в модели; неправильный выбор объясняющей переменной, ошибки в измерениях.
Рассмотрим как комбинация этих двух составляющих определяет величину .
Пусть объясняющая (факторная) переменная имеет значения . Если бы соотношение были бы точным, то вычисленные по формуле значения были бы представлены точками , которые лежали бы на прямой.
Наличие случайного члена приводит к тому, что в действительности значение у получается другим.
Обозначим через , точки которые отражают реальные значение ( рисунок 4.1).
Рисунок 4.1
На диаграмме рассеяния случайный член для точек и и для точек и .
Фактические значения параметров и , отсюда и положение точек
, а также фактическое значение случайного члена неизвестны.
Рассчитать истинные значения и практически невозможно.
Можно получить только оценки этих параметров.
Задача регрессионного анализа состоит в получении оценок параметров и и в определении положения прямой по точкам . Очевидно, чем меньше значение , тем легче эта задача.
Пусть имеем четыре наблюдения .
На основе выборочного наблюдения оценим выборочное уравнение регресии (линии регрессии) , где - отрезок, отсекаемый прямой на оси , является оценкой , – угловой коэффициент прямой, т.е. показатель наклона линии линейной регрессии, является оценкой .
Пусть при вычислим , соответствующей точкой на линии регрессии будет .
Разность между фактическим и расчетным значениями называется остатком в первом наблюдении и определяется отрезком .
Аналогично определим остатки:
Очевидно, что линию регрессии нужно строить так, чтобы остатки были бы минимальными.
При этом линия, строго соответствующая одним наблюдениям не будет соответствовать другим и наоборот.
Необходимо выбрать такой критерий подбора коэффициентов и в уравнении линии регрессии , который будет одновременно учитывать величину всех остатков.
Один из способов решения данной проблемы состоит в минимизации суммы
Величина зависит от выбора и , так как они определяют положение линии регрессии.
Чем меньше , тем строже может соответствовать.
Если , то получено абсолютно точное соответствие, так как это значит, что все остатки равны нулю.