33.6.2. Метод наименьших квадратов.

Усреднение несовместных решений избыточной системы уравнений может быть произведено различными способами (на глаз, методом медианных центров и т. д.). Наиболее мощный метод был разработан в 1795-180 гг. Лежандром и Гауссом и получил название регрессионного анализа, или метода наименьших квадратов (МНК). Но теперь благодаря возможности широкого доступа исследователей к вычислительной технике этот метод получил второе рождение. Дело в том, что вычисления по МНК черезвычайно громоздки. С появлением компьютеров положение коренным образом изменилось. Программы обработки данных МНК содержатся в математическом обеспечении любого компьютера. Поэтому практически надо только ввести свои данные в соответствии с этой программой и дождаться готового ответа. Но чтобы представлять себе, что делает с нашими данными компьютер по программам МНК, рассмотрим сущность МНК на примере простейших задач.

Задача аппроксимации решается следующим образом. В декартовой прямоугольной системе координат наносят точки (x_i, y_i). По расположению этих точек высказывается предположение о принадлежности искомой функции к определенному классу функций. Например, линейная функция , квадратичная и т.д. В общем случае . Неизвестные параметры функции определяются из требования минимума суммы квадратов случайных ошибок, т. е. минимума величины

(33.12)

Величина называется также суммарной невязкой. Необходимым условием минимума функции нескольких переменных является обращение в нуль частных производных невязки:

. (33.13)

Отсюда и наименование: метод наименьших квадратов.

Решая систему уравнений (33.13), находим неизвестные параметры a_j и тем самым полностью определяем функцию, которая наилучшим образом (в смысле наименьших квадратов отклонений от исходных точек или наименьшей суммарной невязки) аппроксимирует (приближает) искомую функцию .

33.6.2.1. Линейная зависимость.

Остановимся подробнее на линейной зависимости.

. (33.14)

Задача состоит в том, чтобы найти параметры m и c, при которых прямая наилучшим образом проходила бы через экспериментальные точки.

Линейная зависимость очень широко распространена в физике. И даже когда зависимость нелинейная, обычно стараются строить график так, чтобы получить прямую линию.

Допустим, что имеется n пар измеренных значений , , …, и предположим, что ошибки содержат лишь величины y. Такое предположение очень часто оправдывается на практике. В противном случае анализ существенно усложняется.