Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции ФМФ 3-1Планирование эксперимента.doc
Скачиваний:
8
Добавлен:
27.09.2019
Размер:
1.31 Mб
Скачать

Нелинейная регрессия

Уравнение нелинейной регрессии также можно получить с помощью метода наименьших квадратов.

При этом возможны 2 подхода: либо тип уравнения фиксируется сразу, либо уравнение подвергается уточнению.

Уравнение регрессии можно считать окончательным, если соответствующая ему дисперсия незначимо отличается от дисперсии случайных наблюдений.

Часто теоретические предпосылки позволяют определить тип уравнения регрессии. Например, зависимость проводимости полупроводника от температуры- экспоненциальная.

Другие зависимости могут иметь логарифмический, степенной, гиперболический и др. вид.

Вычисление уравнений нелинейной регрессии можно значительно упростить, если путем замены переменных нелинейную зависимость преобразовать к линейной, параметры которой находят с помощью метода наименьших квадратов. После чего путем обратного преобразования находят параметры исходной нелинейной зависимости.

Пусть , - исходные данные, для которых необходимо получить уравнение нелинейной регрессии, а – это преобразованные данные, для которых находится линейная зависимость

Делая обратные преобразования, находим , тем самым получаем уравнение нелинейной регрессии .

Для некоторых типов нелинейных регрессий составим таблицу:

Уравнение регрессии

Уравнение нелинейной регрессии можно получить в виде полинома некоторой степени. Если степень полинома заранее не определена, то для определения степени находят начальное уравнение регрессии и вычисляют для него дисперсию; после чего степень полинома увеличивают на единицу и получают новое уравнение регрессии, для которого также вычисляют дисперсию. Если после увеличения степени полинома произошло значимое уменьшение (устанавливается по критерию Фишера), то степень полинома снова увеличивают на единицу и т.д. до тех пор, пока не будет происходить значимого уменьшения дисперсии.

Активный эксперимент и его виды.

Предположим, что исследуемая величина зависит от нескольких факторов и требуется изучить влияние этих факторов на исследуемую величину. Традиционный способ решения такой задачи предполагает постановку обычных пассивных экспериментов. При этом сначала фиксируются все факторы кроме одного- первого и производится несколько опытов, во время которых варьируется только этот первый фактор. Затем ставится вторая серия опытов, во время которых варьируется только второй фактор и т.д. По завершении всех опытов результаты обрабатываются на ЭВМ, и строится уравнение множественной регрессии: y=f(x1,x2,…,xk)

В пассивном эксперименте многие важные особенности исследуемого явления могут быть не обнаружены. Например, может быть не обнаружено взаимодействие факторов. Это связано с тем, что сложно провести опыты при всех возможных сочетаниях действующих факторов, так как это может потребовать большого числа опытов. Например, если число факторов , и число вариаций , то потребуется число опытов:

Более эффективным является активный эксперимент. В активном эксперименте в каждом опыте варьируются сразу все действующие факторы по специальному плану.

Методы планирования активных экспериментов стали разрабатываться в 30-х г.г. пошлого века. Первые работы были выполнены Фишером применительно к агробиологическим задачам. Фишер разработал основы дисперсионного анализа. Термин «дисперсионный анализ» можно понимать двояко. С одной стороны - это анализ влияния факторов на основе сопоставления их дисперсий. С другой стороны - это один из методов планирования и обработки экспериментов.

Планируемые эксперименты делятся на:

  • отсеивающие - предназначены для ранжирования;

  • экстремальные эксперименты - предназначены для нахождения оптимального решения;

  • эксперименты для описания поверхности отклика, т.е. предназначенные для получения математической модели или уравнения регрессии;

  • эксперименты для оценки влияния факторов;

  • эксперименты для специальных случаев.

Каждый фактор имеет область определения, т.е. совокупность всех значений, которые может принимать данный фактор. Она может быть непрерывной и дискретной.

На практике для факторов с непрерывной областью определения (например, для температуры) выбирают дискретное множество уровней.

Действующие факторы должны быть:

  1. управляемыми;

  2. операциональными (означает то, что нам известно то, как устанавливается значение фактора и что он означает);

  3. однозначными (не должны зависеть от других факторов);

  4. совместимыми (все сочетания осуществимы и безопасны).

Несовместимость может наблюдаться вблизи границ области определения.

При проведении многофакторного эксперимента возникают следующие задачи:

  1. выбор оптимальной стратегии эксперимента в условиях неопределенности;

  2. обработка результатов измерений;

  3. проверка гипотез и принятие решений.

Важным этапом планирования активного эксперимента является выбор математической модели эксперимента.

Чаще используют полиномиальную модель. Частным случаем такой модели является линейная модель. Достоинством таких моделей является их универсальность и линейность относительно параметров модели. Например, если число факторов 2, то модель второго порядка

Это уравнение линейно относительно , , , .

В этом полиноме слагаемое учитывает эффект взаимодействия фактора и .

До планирования эксперимента необходимо выбрать локальную область факторного пространства. Для этого необходимо оценить границы областей определения факторов, при этом учитывают ограничения нескольких типов:

  1. принципиальные ограничения (например, абсолютный ноль или температура плавления);

  2. ограничения технико-экономического характера;

  3. ограничения, обусловленные конкретными условиями.

На основе априорной информации в области определения формируется локальная подобласть для планирования эксперимента.

Для этого необходимо установить основной уровень и интервал варьирования. Основной или нулевой уровень должен соответствовать наилучшим условиям, определенным из анализа априорной информации. Это исходная точка для построения плана эксперимента. Она находится где-то в середине области определения.

Построение плана эксперимента сводится к выбору экспериментальных точек, симметричных относительно нулевого уровня. Затем для каждого фактора выбирают 2 крайних уровня- верхний и нижний. В пределах этих уровней будут варьироваться факторы во время эксперимента, о т нижнего до верхнего.

Интервалом варьирования называют число, прибавление которого к основному уровню дает верхний уровень фактора, а вычитание - нижний уровень. Для упрощения записи условий эксперимента и обработки данных масштабы факторов изменяют таким образом, чтобы верхнему

Харло

…уровню соответствовало значение +1, а нижнему -1, а основному нуль.

Для факторов с непрерывной областью определения это можно сделать с помощью преобразования:

- натуральное значение фактора

- натуральное значение основного уровня

- интервал выравнивания

Тогда - это кодированное значение фактора с № i

Процесс преобразования с помощью этих формул называется кодированием данных.

На интервал варьирования накладываются ограничения:

  1. он не должен быть меньше погрешности в измерении фактора.

  2. Верхний и нижний уровни должны быть в области определения.

Априорные данные в процессе эксперимента могут корректироваться.