- •1 Введение в эконометрику
- •1.1 Предмет эконометрики
- •1.2 Типы статистических данныx
- •1.3 Классы моделей
- •1.4 Оценивание моделей и типы зависимостей
- •1.5 Элементы математической статистики
- •1.5.1 Операция суммирования
- •1.5.2 Случайные переменные (величины)
- •1.5.3 Числовые характеристики распределения
- •1.5.4 Вероятность в непрерывном случае
- •2 Постоянная и случайная составляющие случайной переменной
- •2.1Способы оценивания характеристик случайной величины и оценки
- •3 Выборочная ковариация. Выборочная дисперсия. Коэффициент корреляции
- •3.1 Выборочная ковариация
- •3.2 Выборочная дисперсия
- •3.3 Коэффициент корреляции
- •4 Парный регрессионный анализ
- •4.1 Модель парной линейной регрессии
- •4.2 Метод наименьших квадратов (мнк)
- •4.3 Качество оценки: Коэффициент детерминации
4.2 Метод наименьших квадратов (мнк)
Рассмотрим задачу «наилучшей» аппроксимации набора наблюдений , линейным уравнением
где и – оценки параметров и в модели парной регресии
Пусть имеем n наблюдений
-
і
х
у
1
2
...
n
х1
х2
...
хn
у1
у2
...
уn
По этим данным можно построить оцененное уравнение регрессии
По этому уравнению вычислим , .
Величина является расчетным значением переменной , соответствующее .
Наблюдаемые значения не может в точности на линии регрессии, так как не совпадают с .
Остаток в –м наблюдении определяется как разность между фактическим и расчетным значениями зависимой переменной, т.е. .
Р
асположение
линии регрессии, задаваемой уравнением
определяется параметрами
и
.
. . .
.
.
Рисунок 4.2
Неизвестные значения определяются методом наименьших квадратов.
Суть МНК заключается в минимализации суммы квадратов остатков
где – известные значения наблюдения (числа);
– неизвестные.
Это квадратичная функция. Необходимые условия экстремума функции заключается в равенстве нулю частных производных по и :
В развернутом виде эти уравнения запишутся в виде:
Или
, .
Решение этой системы с двумя неизвестными и :
Расчетное значение зависимой переменной или линия регрессии имеет уравнение или .
Линия регрессии проходит через точку и выполняются равенства
.
Коэффициент есть угловой коэффициент регрессии, т.е. показатель наклона линии линейной регрессиии. Он показывает, на сколько единиц в среднем изменяется переменная у при увеличении независимой переменной на единицу.
Постоянная дает прогнозируемое значение зависимой переменной при .
Это может иметь смысл в зависимости от того, как далеко находится от выборочных значений .
После построения уравнения регрессии наблюдаемые значения у можно представить как .
Остатки , как и ошибки являются случайными величинами. Однако они в отличии от ошибок наблюдаемы.
Докажем, что
Доказано, так как , ;
,
Выборочные дисперсии вычисляются по формулам:
- дисперсия наблюдаемых значений у.
- дисперсия «расчетных» значений у.
- дисперсия остатков.
Задание 4.1
Докажите, что , где коэффициент корреляции между
– их стандартные отклонения.