Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическое моделирование в экологии.doc
Скачиваний:
478
Добавлен:
13.04.2015
Размер:
8.46 Mб
Скачать

Результаты проведенных опытов

п.п.

Уровни факторов

Значение

Опытное среднее

Значение из уравнения регрессии

x1

x2

y1

1

2

3

1,0

0,2

18,2

18,6

18,7

331,40

345,96

349,69

18,5

18,4

-0.2

0,2

0,3

0,04

0,04

0,09

4

5

6

2,0

0,4

21,6

23,4

23,7

466,56

547,56

561,69

22,9

22,8

-1,2

0,6

0,9

1,44

0,36

0,81

7

8

9

2,5

0,3

22,0

23,0

22,5

484,00

529,00

506,25

22,5

22,6

-0,6

0,4

-0,1

0,36

0,16

0,01

Сумма

191,7

4122,11

-

-

-

-

-

3,31

Вычисляем FB статистику

При уровне значимости α = 0,10 и числе степеней свободы

K1 = n - 1 = 9 - 1 = 8 и k2 = n - k - 1 = 9 - 3 - 1 =5 (см. приложение 6) находим = 3,3393, так как FB = 7,34 ≥ = 3,3393, то гипотеза о значимости уравнения регрессии принимается.

Множественный корреляционный анализ. При множественном корреляционном анализе можно вычислить два типа парных коэффициентов регрессии:

1)— коэффициент, определяющий тесноту связи между функцией отклика у и одним из факторов хi;

2)— коэффициент, показывающий на связь между двумя

факторами хi и хm (i, m = 1,k ). Их величины вычисляются по формулам

где

Если ввести обозначения

то

Проверка значимости коэффициентов корреляции может производиться:

а) сравнением статистического значения с табличным , значимость коэффициента корреляции устанавливается исходя из условия

где выбирается по таблице (см. приложение 10) при уровне значимости α и числе степеней свободы k = n - 2;

б) сравнением статистики tα с табличным значением t-кри- терия при уровне значимости α и числе степеней свободы k = n - 2, значимость коэффициента корреляции устанавливается исходя из условия

где величина tв выбирается по таблице (см. приложение 2), а среднеквадратич-ное отклонение коэффициента корреляции определяется по формуле

.

Для парных коэффициентов корреляции может быть определен доверитель-ный интервал по формуле

где р — парный коэффициент корреляции генеральной совокупности.

Последовательно вычисляя значения всех парных коэффициентов, строим матрицу коэффициентов корреляции

С помощью матрицы Rk вычисляют частные коэффициенты корреляции, показывающие степень влияния одного из факторов хi на функцию отклика Y при условии, что остальные факторы имеют постоянные значения.

Частные коэффициенты определяются по формуле

где Dij определитель матрицы Rk образованный вычеркиванием первой строки и j-того столбца для каждого определителя соответственно. Аналогично вычисляются и определители D11 и Djj. Значимость коэффициентов частной корреляции и доверитель- ный интервал вычисляются так же, как и для коэффициентов пар- ной корреляции, но число степеней свободы для критерия ta;k при- нимается равным k = (n - 2) - р -1, где (р-1) — порядок частного коэффициента парной корреляции.

Если необходимо изучить степень тесноты связи между функ- цией отклика Y и несколькими факторами x1, x2, ..., xр (р<k) используют коэффициент множественной корреляции RM, который всегда положителен и изменяется в пределах 0 < RM< 1. Чем ближе значение RM к единице, тем лучше качество предсказания полученной моделью процесса, по наблюдениям за которым получены статистические данные. Коэффициент множественной корреляции вычисляется по формуле

или

где D определитель корреляционной матрицы.

Если RM возвести в квадрат, то величина R2M называется множественным коэффициентом детерминации и показывает, какая часть дисперсии функции отклика объясняется вариацией линейной комбинации выбранных факторов.

При (р<k), х1, х2, ...., хp значимость RM можно проверить: а) по t-критерию

б) по F-критерию

где k1=n - р - 1 и k2 = р.

Пример. Для предыдущего примера, использовавшего данные табл. 7.2, вычислить коэффициенты корреляции.

Р е ш е н и е. С целью облегчения вычислений результаты работы сведем в табл. 7.3.

Таблица 7.3. Результаты вычислений исследования

п.п.

Уровни факторов

y1

у2

x1уi

x2уi

x1x2

x1

x1

1

1,0

0,2

18,2

331,4

18,2

3,64

1,0

0,04

0,2

2

1,0

0,2

18,6

345,9

18,6

3,72

1,0

0,04

0,2

3

1,0

0,2

18,7

349,7

18,7,

3,74

1,0

0,04

0,2

4

2,0

0,4

21,6

466,6

43,2

8,64

4,0

0,16

0,8

5

2,0

0,4

23,4

547,7

46,8

9,36

4,0

0,16

0,8

6

2,0

0,4

23,7

561,7

47,4

9,48

4,0

0,16

0,8

7

2,5

0,3

22,0

484,0

55,0

6,60

6,25

0,09

0,75

8

2,5

0,3

23,0

529,0

57,5

6,90

6,25

0,09

0,75

9

2,5

0,3

22,5

506,2

56,2

6,75

6,25

0,09

0,75

Σ

16,5

2,7

191,7

4122

361,6

58,8

33,75

0,87

5,25

Вычислим вспомогательные числа:

Вычисляем коэффициент, определяющий степень связи между функцией Y и фактором х1

Определяем тесноту связи между факторами Y и х2

Определяем тесноту связи между факторами x1 и x2

Где

Составляем корреляционную матрицу

и определяем частные коэффициенты корреляции

где

вычисляем коэффициент множественной корреляции

где

Величина множественного коэффициента детерминации равна:

.

Отсюда можно сделать вывод, что 78,7% дисперсии функции отклика объясняется вариацией линейной комбинации факто- ров х1 и х2.

Множественный нелинейный регрессионный анализ. При переходе от линейной к нелинейной модели для функции отклика Y анализ результатов статистических наблюдений начинают с модели так называемой квадратичной формы

Данное уравнение линеаризуется заменой переменных . По полученному уравнению регрессии представляют опытные данные и определяют коэффициенты b0, b1, b2, b11, ....

Затем производят все вычисления аналогично сделанным для случая линейного множественного корреляционно-регрессионного анализа. Если квадратичная форма неадекватна статистическому материалу (результатам эксперимента), то степень уравнения повышается. В практике предельным уравнением бывает кубическая форма. При переходе к высшей степени уравнение регрес-сии линеаризуется заменой переменных.

Кроме полиномиальной модели в нелинейном регрессионном анализе используются:

а) мультипликативные модели

,

логарифмируя которые, преобразуем в линейные модели

,

с заменой переменных: у' = lny; ;

б) экспоненциальные модели

у = ехр(b0 + b1x1 + b2х2 + ... + bkхk), логарифмируя которые, получим

lnу =b0+b1х1 +b2x2+...+bkхk;

в) обратные модели

,

можно привести к виду

Для определения корреляционной связи в нелинейных моделях используют множественное корреляционное отношение, при этом для вычисления остаточ-ной дисперсии используется нелинейная форма функции отклика у.

При поиске наилучшей модели функции отклика можно использовать раз-личные нелинейные функции, лучшей из них будет та, которая будет иметь наименьшую величину остаточной дисперсии .

При построении регрессивной модели для целевой функции Y на начальном этапе следует учитывать как можно большее число факторов, влияющих на изменение Y. В этом случае получаются достаточно сложные модели, особенно при использовании нелинейных форм. Часто эти модели можно значительно упростить, если в них выявить те факторы, которые незначительно влияют на функцию отклика или один из двух, имеющих сильную корреляцию между собой, и эти факторы не включать в уравнение регрессии.

Для анализа регрессионных моделей используется несколько методов: метод всех регрессий; метод исключения переменных; метод включения переменных; анализ остатков и др.

При применении метода всех регрессий функцию отклика представляют в виде комбинаций зависимостей, в которых меняют число факторов.

Так в уравнении регрессии

,

можно записать функцию отклика в различных комбинациях

и т.д.

Для каждого уравнения вычисляются коэффициенты регрессии и определяется остаточная дисперсия понаименьшему значению которой и выбирается лучшее уравнение. Применение этого метода связано с трудоемкими вычислениями.

При применении метода исключения переменных уравнение регрессии желательно представить сразу в полной квадратичной или кубичной форме с предварительным вычислением коэффициентов регрессии и корреляции и проверкой линейности модели по F-кри- терию. Исключение начинают с фактора, имеющего наименьший t-- критерий. На каждом этапе после исключения каждого фактора для нового уравнения регрессии вычисляется множественный коэффициент корреляции, остаточная дисперсия и F-критерий. Для прекращения исключения факторов следует следить за изменением остаточной дисперсии. Как только она начнет увеличиваться — исключение факторов следует прекратить. Используется также метод контроля значений t-критерия. Для исключения следующего фактора мы сравниваем его значение (t) с t-критерием предыдущего исключенного фактора и, если они отличаются незначительно, то фактор исключается. Если же различия t-критериев значительны, то исключение факторов прекращают.

Метод включения переменных состоит в том, что на первом этапе выбирают фактор, у которого ryx наибольший, и строят линейное уравнение

у = f(xi).

Затем вычисляют частный коэффициент корреляции. После это- го берут следующую величину хi+1 и находят второе уравнение

у = f(xi, xi+1)

и вычисляют частный коэффициент корреляции и т.д. Этот метод используется совместно с анализом остатков.

Метод анализа остатков состоит в том, что анализируется разница между значением функции уi и предсказываемым ее значением (уравнением регрес-сии). Определяя остатки

еi = уi -, i=,

мы проверяем их среднее значение, которое должно быть равно нулю, т.е.

.

Если это условие не соблюдается, то в уравнение вносят дополнительные члены или же проводятся другие преобразования исходных данных.

назад

Лекция 8.

(Самостоятельно Гринин А.С., Орехов Н.А., Новиков В.Н. Глава 3 §3.6.) Некоторые особенности применения экспериментально-статистических методов в экологии. Проверка статистических гипотез при планировании экспериментов.