Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Витебский государственный технологический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Курс лекций КИТ Шарстнев.doc

Скачиваний:

Добавлен:

11.12.2018

Размер:

5.47 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3610 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Регрессионный и корреляционный анализ

Регрессионный и корреляционный анализ позволяет установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин X, и делать прогнозы значений Y. Параметр Y, значение которого нужно предсказывать, является зависимой переменной. Параметр X, значения которого нам известны заранее и который влияет на значения Y, называется независимой переменной. Например, X – величина затрат компании на рекламу своего товара, Y – объем продаж этого товара и т.д.

Корреляционная зависимость Y от X – это функциональная зависимость вида

где – среднее арифметическое (условное среднее) всех возможных значений параметра Y, которые соответствуют значению . Уравнение называется уравнением регрессии Y на X, функция – регрессией Y на X, а ее график – линией регрессии Y на X.

Основная задача регрессионного анализа – установление формы корреляционной связи, т.е. вида функции регрессии (линейная, квадратичная, показательная и т.д.).

Метод наименьших квадратов

Метод наименьших квадратов позволяет определить коэффициенты уравнения регрессии таким образом, чтобы точки, построенные по исходным данным , лежали как можно ближе к точкам линии регрессии. Формально это записывается как минимизация суммы квадратов отклонений (ошибок) функции регрессии и исходных точек

где – значение, вычисленное по уравнению регрессии; – отклонение (ошибка, остаток); n – количество пар исходных данных.

Простейший вариант модели - прямая линия на плоскости.

где b - значение y при x=0; a=tg(α) - тангенс угла наклона прямой по отношению к оси x.

Возможные варианты модели Анализ отклонений Первый шаг Второй шаг

Третий шаг

Четвертый шаг

Пятый шаг

Понятие отклонения для случая линейной регрессии

В регрессионном анализе предполагается, что математическое ожидание случайной величины равно нулю и ее дисперсия одинакова для всех наблюдаемых значений Y. Отсюда следует, что рассеяние данных возле линии регрессии должно быть одинаково при всех значениях параметра X. В случае, показанном на рисунке, приведенном ниже, данные распределяются вдоль линии регрессии неравномерно, поэтому метод наименьших квадратов в этом случае неприменим.

Неравномерное распределение исходных точек вдоль линии регрессии

Основная задача корреляционного анализа

Основная задача корреляционного анализа – оценка тесноты (силы) корреляционной связи. Теснота корреляционной зависимости Y от X оценивается по величине рассеяния значений параметра Y вокруг условного среднего . Большое рассеяние говорит о слабой зависимости Y от X, либо об ее отсутствии и, наоборот, малое рассеяние указывает на наличие достаточно сильной зависимости.

Коэффициент детерминации (по другому – детерминированности) показывает, на сколько процентов () найденная функция регрессии описывает связь между исходными значениями параметров X и Y

где – объясненная вариация; – общая вариация.

Графическая интерпретация коэффициента детерминации

для случая линейной регрессии

Соответственно, величина показывает, сколько процентов вариации параметра Y обусловлены факторами, не включенными в регрессионную модель. При высоком () значении коэффициента детерминации можно делать прогноз для конкретного значения .

Линейная регрессия

Коэффициенты линейной регрессии вычисляются по следующим формулам (все суммы берутся по n парам исходных данных)

Нелинейная регрессия

Рассмотрим наиболее простые случаи нелинейной регрессии: гиперболу, экспоненту и параболу. При нахождении коэффициентов гиперболы и экспоненты используют прием приведения нелинейной регрессионной зависимости к линейному виду. Это позволяет использовать для вычисления коэффициентов функций регрессии формулы линейной зависимости.

Гипербола

При нахождении гиперболы вводят новую переменную , тогда уравнение гиперболы принимает линейный вид . После этого используют формулы для нахождений линейной функции, но вместо значений используются значения

; .

Экспонента

Для приведения к линейному виду экспоненты проводят логарифмирование

;

Введя переменные и , тогда , откуда следует, что можно применять формулы линейной зависимости, в которых вместо значений надо использовать

; .

При этом получаем численные значения коэффициентов и , от которых надо перейти к и , используемых в модели экспоненты. Исходя из введенных обозначений и определения логарифма, получаем

, .

Парабола

Для нахождения коэффициентов параболы необходимо решить линейную систему из трех уравнений

При вычислении коэффициента детерминации экспоненты все значения параметра Y (исходные, регрессионные, среднее) необходимо заменить на их логарифмы, например, – на и т.д.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 3610 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
26.03.2016465.31 Кб26КП МАШП.docx
#
07.05.20194.33 Mб13Красавина Л.Н. МВКиФО.doc
#
26.03.201634.85 Кб18КУиТ-ЭА ПХДП реферат.docx
#
26.03.201693.38 Кб76кур-ч технлог 2015.docx
#
26.03.201693.51 Кб78кур-ч технлог 2015.docx
#
11.12.20185.47 Mб48Курс лекций КИТ Шарстнев.doc
#
01.06.20151.15 Mб159курс лекций основы экономической теории.doc
#
09.12.20181.25 Mб76курс лекций ОТТ.doc
#
04.05.20191.28 Mб20курс лекций ОТТ.doc
#
26.04.2019857.6 Кб15курс лекций по философии.doc
#
25.08.2019585.22 Кб8Курс. ТММ_головейко.doc