Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika.docx
Скачиваний:
5
Добавлен:
24.09.2019
Размер:
364.17 Кб
Скачать

34. Корреляционно-регрессионный анализ

Регрессионный анализ – это метод установления функциональной (в виде уравнения) зависимости между переменными. При этом одна переменная зависима, а другая (другие) – не зависимые.

Чаще всего сталкиваются с уравнениями:

1 – для парной регрессии

и

2 - для множественной регрессии с двумя факторными признаками

Для расчета параметров уравнений: 1и 2 применяется метод МНК решая систему нормальных уравнений.

Для парной регрессии

Для множественной регрессии:

В уравнениях регрессии параметр а0 – показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а1 – показывает на сколько изменяется в среднем значение результативного признака при изменении i-го факторного на единицу его собственного измерения

Проверка адекватности моделей, построенных на основе уравнений регрессии начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью средней ошибки каждого параметра :

;

среднее квадратическое отклонение признака х

остаточная дисперсия.

Сопоставляя значения параметра с его средней ошибкой по значению судят о значимости данного параметра.

Если число наблюдений n >20, то параметр считается значимым при t>3.

Если n>20, то обращаются к специальным таблицам значений, t – критерий Стьюдента.

И в данном случае параметр считается значимым при

– уровень значимости;

k – число факторных признаков в упавнении.

Адекватность полученной модели можно оценить с помощью средней ошибки аппроксимации.

n – количество признаков (единиц наблюдения)

точки на прямой (кривой)

Ее значение не должно превышать 12-15%, в противном случае модель считается не адекватной.

Оценка тесноты связи измеряется различными способами:

1. с помощью коэффициента Фихнера, основанного на количестве совпадений и несовпадений знаков отклонений, индивидуальных значений факторного и результативного признаков от их средних значений:

С – количество совпадений; Н – количество несовпадений.

2. При линейной зависимости – с помощью линейного коэффициента корреляции.

3. При криволинейной зависимости измеряется с помощью эмпирического корреляционного отношения:

,

где – дисперсия результативного признака

– факторная дисперсия.

4. Коэффициент детерминации, определяемый по формуле:

т.е. корреляционное отношение в квадрате характеризует долю вариации результативного признака, обусловленную изменчивостью изучаемого фактора.

5. Для множественной регрессии тесноту связи можно оценить с помощью множественного коэффициента корреляции R.

Если находится зависимость результативного признака только от двух факторных, то множественный коэффициент корреляции можно найти по формуле:

где - полные коэффициенты корреляции (тождественны линейному коэффициенту корреляции)

Наличие мультиколлинеарности признается, если парный коэффициент корреляции между факторными признаками

Замечание: на практике все типы зависимости можно описать при помощи:

1) линейной зависимости

2) параболической зависимости

3)гиперболической зависимости

4) показательной зависимости

5) степенной зависимости

1) Выдвигают две альтернативные гипотезы:

– коэффициент детерминации статистически не значим (=0)

- коэффициент детерминации статистически значим ( )

2) ;

k – число независимых переменных в модели регрессии (при парной регрессии k=1);

n – объем выборки.

3) , то М0 – принимается; F – критерий Фишера.

, то М1 – принимается;

Fтабл (k; n-k-1; ) k – число степеней свободы числителя.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]