Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
экзамен статистика.doc
Скачиваний:
5
Добавлен:
30.08.2019
Размер:
920.58 Кб
Скачать

1. Построение уравнений тренда и ур. Регрессии.

Уравнение регрессии – это уравнение, выражающее статистическую зависимость между различными показателями.

В зависимости от того, сколько различных факторов (показателей) связаны этой зависимостью, разделяют уравнения парной и множественной регрессии.

Уравнение парной регрессии выражает связь между двумя признаками (или показателями), один из которых (независимый) называется факторным, а второй (зависимый) – результативным.

Уравнение множественной регрессии выражает зависимость между более чем двумя показателями, один из которых называется результативным (обозначается обычно через y, а остальные факторными: обозначаются x1, x2, x3,…).

Уравнения парной регрессии могут иметь различный вид, в зависимости от того, какой функцией эта зависимость выражается (линейной, параболой и т.п.).

Чаще всего используются следующие функции:

линейнаяyx = a0 + a1x;

полулогарифмическаяyx = a0 + a1lgx;

показательная yx = a0 + a1x;

степенная yx = a0 xa1;

гиперболическаяyx = a0 + a1

Для расчета параметров уравнений регрессии используется метод наименьших квадратов.

Предположим, что имеется два ряда значений исходных показателей x и y (факторного и результативного признаков). Требуется построить уравнение парной линейной регрессии между признаками:

y = a0 + a1x.

Для определения его параметров составляется система нормальных уравнений:

n a0 + a1Σx = Σy;

a0Σx + a1Σx2 = Σxy

Для решения системы обычно используется метод определителей. В результате получаем следующие формулы для расчета параметров уравнения регрессии:

Система нормальных уравнений для поиска параметров двухфакторной линейной регрессии (y = a0 + a1x1 + a2x2) имеет более сложный вид:

Σ y = na0 + a1 Σx1 + a2Σx2;

Σyx1= a0 Σx1 + a1 Σx12 + a2 Σx1 x2;

Σyx2= a0 Σx2 + a1 Σx1 + a2 Σx22;

Очень похожий вид имеет система нормальных уравнений для расчета параметров квадратической регрессии (y = a0 + a1x + a2x2):

Σ y = na0 + a1 Σx + a2Σx2;

Σyx1 = a0 Σx + a1 Σx2 + a2 Σx3;

Σyx2 = a0 Σx2 + a1 Σx3 + a2 Σx4;

Эти системы также решаются методом определителей.

Вначале находится определитель Δ матрицы коэффициентов при неизвестных, затем столбцы этой матрицы поочередно заменяются столбцом свободных членов системы нормальных уравнений, и рассчитываются еще три соответствующих определителя: Δ0, Δ1, Δ2.

Параметры a0 , a1, a2 рассчитываются по формулам:

a0= Δ0/ Δ; a1 = Δ1/ Δ; a2 = Δ2/ Δ

Построение уравнений тренда

Для расчета параметров уравнений тренда также используется метод наименьших квадратов (МНК), но при этом используется особый прием – введение условного обозначения времени. За счет введения условного обозначения времени существенно упрощаются формулы для расчетов параметров уравнений тренда. В теории статистики доказывается, что результат расчета параметров не зависит от изменения начала координат на оси отсчета периодов времени. Это связано с тем, что время изменяется равномерно и в одном направлении. Расчет параметров уравнений регрессии значительно сложнее именно из-за того, что ввести условное обозначение переменной x в данном случае не удается.

При расчете параметров уравнений тренда обычно строится вспомогательная таблица, в которой специально вводят условное обозначение времени.

Условное время вводят таким образом, чтобы Σt = 0. Если число реальных периодов (моментов) времени нечетное, в середине ставится 0, а затем отсчет ведется вправо и влево от нуля.

Если число периодов четное, то 0 пропускается; при этом отсчет вправо ведется от 1, отсчет влево – от –1.

Формулы для расчета параметров тренда будут иметь следующий вид:

а) для линейного тренда (y = a0 + a1t):

б) для уравнения квадратического тренда, т.е. параболы (y = a0 + a1t + a2t2):

Необходимо обратить внимание, что параметр a1 рассчитывается по такой же формуле, как и для линейного тренда.

Обычно при построении уравнений тренда или регрессии возникает проблема выбора такой математической формы зависимости, которая лучше сглаживает исходный ряд данных или, иначе говоря, более адекватно отражает имеющуюся тенденцию развития (т.е. статистическую зависимость результативного показателя y от времени t).

Для этого, рассчитывается ошибка аппроксимации и выбирается то из уравнений, для которого эта ошибка меньше.