Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Новосибирский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

dsp15-Регрессия.doc

Скачиваний:

Добавлен:

16.12.2018

Размер:

158.21 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

Тема 15. Регрессия введение

Аппроксимация данных с учетом их статистических параметров относится к задачам регрессии. Они обычно возникают при обработке экспериментальных данных, полученных в результате измерений процессов или физических явлений, статистических по своей природе (как, например, измерения в радиометрии и ядерной геофизике), или на высоком уровне помех (шумов). Задачей регрессионного анализа является подбор математических формул, наилучшим образом описывающих экспериментальные данные.

Термин "регрессия" появился при исследовании соотношения роста родителей и их детей, в которых было установлено, что рост "регрессирует" к среднему, т.е. высокие родители имеют более низких детей, а низкие родители – более высоких.

В качестве основной математической системы для примеров будем использовать систему Mathcad.

15.1. Постановка задачи регрессии

Математическая постановка задачи регрессии заключается в следующем. Зависимость величины (числового значения) определенного свойства случайного процесса или физического явления Y от другого переменного свойства или параметра Х, которое в общем случае также может относиться к случайной величине, зарегистрирована на множестве точек x_k множеством значений y_k, при этом в каждой точке зарегистрированные значения y_k и x_k отображают действительные значения Y(x_k) со случайной погрешностью _k, распределенной, как правило, по нормальному закону. По совокупности значений y_k требуется подобрать такую функцию f(x_k, a0, a1, … , an), которой зависимость Y(x) отображалась бы с минимальной погрешностью. Отсюда следует условие приближения:

y_k = f(x_k, a0, a1, … , an) + _k.

Функцию f(x_k, a0, a1, … , an) называют регрессией величины y на величину х. Регрессионный анализ предусматривает задание вида функции f(x_k, a0, a1, … , an) и определение численных значений ее параметров a0, a1, … , an, обеспечивающих наименьшую погрешность приближения к множеству значений y_k. Как правило, при регрессионном анализе погрешность приближения вычисляется методом наименьших квадратов (МНК). Для этого выполняется минимизация функции квадратов остаточных ошибок:

a0, a1, … , an) =[f(x_k, a0, a1, … , an) - y_k]².

Для определения параметров a0, a1, … , an функция остаточных ошибок дифференцируется по всем параметрам, полученные уравнения частных производных приравниваются нулю и решаются в совокупности относительно всех значений параметров. Виды регрессии обычно называются по типу аппроксимирующих функций: полиномиальная, экспоненциальная, логарифмическая и т.п.

15.2. Линейная регрессия [25]

Общий принцип. Простейший способ аппроксимации по МНК произвольных данных s_k - с помощью полинома первой степени, т.е. функции вида y(t) = a+bt, которую обычно называют линией регрессии. С учетом дискретности данных по точкам t_k, для функции остаточных ошибок имеем:

(a, b) =[(a+b t_k) - s_k]².

Для вычисления оценок коэффициентов дифференцируем функцию остаточных ошибок по аргументам a и b, приравниваем полученные уравнения нулю и формируем два нормальных уравнения системы:

2((a+b t_k)-s_k)  a1 + bt_k –s_k = 0,

2((a+b t_k)-s_k) t_k  at_k + bt_k² – s_k t_k = 0,

Решение данной системы уравнений в явной форме для К-отсчетов:

b = [Kt_k s_k –t_ks_k] / [Kt_k² – (t_k)²] = (- ) / (- ).

a = [s_k – bt_k] /K = - b

Полученные значения коэффициентов используем в уравнении регрессии y(t) = a+bt. Прямая (s – ) = b (t - ) называется линией регрессии s по t. Для получения линии регрессии t по s, (t - ) = b (s – ), аргумент b в этой формуле заменяется на значение b = (- ) / (- ).

По аналогичной методике вычисляются коэффициенты и любых других видов регрессии, отличаясь только громоздкостью соответствующих выражений.

Реализация в Mathcad. Линейная регрессия в системе Mathcad выполняется по векторам аргумента Х и отсчетов Y функциями:

intercept(X,Y) – вычисляет параметр а, смещение линии регрессии по вертикали;
slope(X,Y) – вычисляет параметр b, угловой коэффициент линии регрессии.

Расположение отсчетов по аргументу Х произвольное. Функцией corr(X,Y) дополнительно можно вычислить коэффициент корреляции Пирсона. Чем он ближе к 1, тем точнее обрабатываемые данные соответствуют линейной зависимости.

Пример выполнения линейной регрессии приведен на рис. 15.2.1.

Рис. 15.2.1.

1 / 31 2 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.12.2018243.2 Кб8dsp10-Рекурсивные частотные фильтры.doc
#
16.12.2018359.42 Кб22dsp11-Адаптивные фильтры.doc
#
16.12.2018312.83 Кб13dsp12-Оптимальные фильтры.doc
#
16.12.2018429.06 Кб25dsp13-Деконволюция сигналов.doc
#
16.12.2018351.23 Кб40dsp14-Аппроксимация сигналов.doc
#
16.12.2018158.21 Кб22dsp15-Регрессия.doc
#
16.12.2018474.11 Кб45dsp16-Медианные фильтры.doc
#
16.12.2018731.65 Кб9dsp17-Обработка изображений.doc
#
16.12.2018388.61 Кб10dsp18-Распознавание объектов изображений.doc
#
16.12.2018522.75 Кб8dsp19-Основы WT.doc
#
16.12.2018635.9 Кб18dsp20-Свойства WT.doc