34. Корреляционно-регрессионный анализ

Регрессионный анализ – это метод установления функциональной (в виде уравнения) зависимости между переменными. При этом одна переменная зависима, а другая (другие) – не зависимые.

Чаще всего сталкиваются с уравнениями:

1 – для парной регрессии

2 - для множественной регрессии с двумя факторными признаками

Для расчета параметров уравнений: 1и 2 применяется метод МНК решая систему нормальных уравнений.

Для парной регрессии

Для множественной регрессии:

В уравнениях регрессии параметр а₀ – показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а₁ – показывает на сколько изменяется в среднем значение результативного признака при изменении i-го факторного на единицу его собственного измерения

Проверка адекватности моделей, построенных на основе уравнений регрессии начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью средней ошибки каждого параметра :

;

– среднее квадратическое отклонение признака х

– остаточная дисперсия.

Сопоставляя значения параметра с его средней ошибкой по значению судят о значимости данного параметра.

Если число наблюдений n >20, то параметр считается значимым при t>3.

Если n>20, то обращаются к специальным таблицам значений, t – критерий Стьюдента.

И в данном случае параметр считается значимым при

– уровень значимости;

k – число факторных признаков в упавнении.

Адекватность полученной модели можно оценить с помощью средней ошибки аппроксимации.

n – количество признаков (единиц наблюдения)

– точки на прямой (кривой)

Ее значение не должно превышать 12-15%, в противном случае модель считается не адекватной.

Оценка тесноты связи измеряется различными способами:

1. с помощью коэффициента Фихнера, основанного на количестве совпадений и несовпадений знаков отклонений, индивидуальных значений факторного и результативного признаков от их средних значений:

С – количество совпадений; Н – количество несовпадений.