книги из ГПНТБ / Мастеров, В. А. Практика статистического планирования эксперимента в технологии биметаллов
.pdfэкономия времени и расходов на исследования, что особенно важно в производственных условиях, при иссле* довании производства дорогостоящих материалов.
В рассмотренных ниже задачах математического пла нирования эксперимента широко применяют методы мно гомерной математической статистики, особенно регрес
сионный анализ.
КОНСПЕКТ ТЕОРИИ РЕГРЕССИОННОГО АНАЛИЗА
Пусть рассматриваемый результат у технологического процесса по мнению технолога связан с влиянием п не зависимых переменных (факторов) Х\, х2,...,хп:
У — y(xi)- |
(2) |
Поскольку вид функции отклика (2) технологу не из вестен, (2) приближенно заменяется полиномом — отрез ком ряда Тейлора, в который разлагается неизвестная функция отклика г/(**):
y ~ P o + S P t ^ + |
t b , xl x, + |
t v |
itx2l + ---, |
|
i=l |
i,/=1 |
i=l |
|
|
|
K i |
|
|
|
где неизвестные параметры |
|
|
|
|
Pi |
ду |
в.. = М . |
||
дх£дх/ х= о |
Н»1 |
- о |
||
дХ[ х= 0 |
|
дх. |
х*=0 |
На практике возможна зависимость у также от дру гих факторов Xn+i, хп+2,—, неизвестных технологу или априорно признанных несущественными. Практически неизбежны погрешности измерения у, задания факторов Х\, х2,..., неконтролируемые изменения факторов хп+\, *п+2, в ходе опытов. По этим причинам измеряемые ре
зультаты у параллельных опытов являются случайными величинами, оценивающими у. Соответственно определя емые расчетом параметры bQ, Ь£, b£j,... также являются случайными величинами — оценками параметров р0, Рг,
Р «,- и
У = Ь0 + 5 ]Ь£х£+ |
Л &,-/*,-*/+ |
(3) |
|
i= i |
i j = i |
i= l |
|
10
Для построения модели типа (3) и оценки ее истин ности используется регрессионный анализ. Поэтому урав нение (3) называют уравнением регрессии. Доказано, что наилучшие оценки параметров |30, Pi, Pij,... обеспечивает
метод наименьших квадратов. Термин «нанлучшие оцен ки параметров Pi» означает:
несмещенность: оценки bi несмещенные, если их ма тематические ожидания равны истинным значениям па раметров:
М(Ьд = Рь
состоятельность: оценки bi состоятельны, если они сходятся по вероятностям к истинным значениям пара метров:
lim Р [|Ь, — р,| > е] = 0, е > 0;
ДГ-*-оо
Эффективность: несмещенные оценки bi эффективны, если так называемая дисперсионная матрица оценок па раметров меньше или равна дисперсионной матрице лю бых других оценок параметров.
Отметим, что в качестве Xi могут быть использованы непосредственно технологические факторы (например, температура Т) или функции этих факторов (например, обратная температура Г-1 и др).
Для построения модели (3) проводится пассивный
или активный факторный эксперимент.
В активном эксперименте технолог работает одновре менно со всеми переменными хг-, задавая их значения в каждом опыте по заранее назначенному плану — мат рице планирования. Одновременное варьирование всеми факторами позволяет резко уменьшить число опытов, со кратить сроки и стоимость исследований. Особенно эф фективен активный эксперимент в многофакторных ис следованиях.
При пассивном эксперименте технолог не вмешивает ся в процесс, а только записывает значения всех Xi и со ответствующих им у. Близка к такой методике распро страненная практика варьирования факторов по очереди, остальные факторы при этом не варьируются, пока не за кончится перебор всех уровней одного фактора. В обоих случаях приходится ставить много опытов. В многофак торных задачах неизбежны сложные расчеты на ЭЦВМ и все-таки получаемые уравнения регрессии (как прави ло, линейные относительно Xi) нередко работают плохо.
11
По мнению В. В. Налнмова [1], это связано с влиянием неконтролируемых переменных, которое приводит к сме щению оценок параметров Ь{.
ОСНОВНЫЕ ДОПУЩЕНИЯ РЕГРЕССИОННОГО АНАЛИЗА
1. Входные переменные хь х2,.... хп задаются с пре небрежимо малой ошибкой по сравнению с ошибкой оп ределения у.
2. При повторении с раз опытов в одной точке фактор ного пространства (,v,) (все х,- фиксированы) получаем выборку независимых нормально распределенных слу чайных значений отклика у\, г/2,... ус с параметрами рас
пределения (г/, а2{*/}).
3. В исследуемом объеме факторного пространства дис персия а2{у) не зависит от координат:
s2 {#1 } = s2 [у2] = •••= s2 {^ ) = а2 {у}.
4.Каждый из Xi не является линейной комбинацией ос тальных входных переменных.
5.Погрешность задания каждого Xi меньше интервала
варьирования Дяу от опыта к опыту.
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Пусть измерен отклик у в 1,2,..., и,..., N точках фак торного пространства (х;), £=1,2,..., п. Натуральные зна чения координат Xi для дальнейших расчетов заменим кодированными значениями Xi нулевой размерности:
верхний уровень (max х,) |
X,- = |
|
1, |
нижний уровень (min х,) —>- Х ; = |
— 1, |
||
основной уровень I------—---------- |
)-> А; = |
U и т.д/ |
Составим таблицу условий и результатов факторного эк
сперимента (табл.1). |
|
|
||
Фиктивная переменная Х о= + 1 введена |
в |
таблицу |
||
для |
единообразия записи последующих |
вычислений.1 |
||
1 |
Как и |
ранее, часть Хс может представлять |
факторы вида |
|
X £X j или Х] |
и т. д. Способ их кодирования сохраняется. |
Например, |
||
символом Х3 обозначают произведение XtX2 и т. п. |
|
|
12
Часть |
этой |
табли |
|
|
|
|
|
Таблица |
||||
цы |
(координаты |
Xi |
Таблица |
условии |
и |
результатов |
||||||
всех |
N опытов) назы |
|
|
эксперимента |
|
|
||||||
вают матрицей |
плани |
еромН таыпо и |
|
|
|
|
|
|
|
|||
термин относят ко всей |
*0 |
*1 |
х2 . . . |
|
|
змИе рен ныйо т клик у |
||||||
рования. |
Иногда |
этот |
|
К оди рованны е зн ач ен и я |
|
|||||||
|
|
перем енны х |
|
|
||||||||
таблице. |
|
|
что |
|
|
|
|
|
|
• хп |
|
|
Предположим, |
|
|
|
|
|
|
|
|
||||
соответствующая |
таб |
1 |
* 0 1 |
Х п |
* 2 1 |
• |
• |
Х ш |
Л‘ |
|||
лице |
модель рассчита |
2 |
* 0 2 |
* | 2 |
Х 22 |
■ |
• |
* П 2 |
У-1 |
|||
|
||||||||||||
на и с учетом введен |
и |
* 0 U |
* , » |
|
|
|
* » « |
Уи |
||||
ных |
обозначений |
име |
|
|
|
|
|
|
|
|
||
ет вид однородного ли |
N |
X qN |
* I ) V |
* 2 f f |
• |
Дп)\Г |
Уы |
|||||
нейного |
уравнения: |
|
|
|
|
|
|
|
|
|||
|
|
У = Ь0Х0 + |
+ Ь2Х2 -1------- \-ЬпХп. |
|
(4) |
л
Составим сумму квадратов отклонений расчетных уи от опытных уи по всем N опытам:
ф = £ \Уи— Уи\2-
и=1
Наилучшие оценки параметров bi соответствуют ми нимуму этой суммы квадратов и находятся из условия
дФ |
О, i = 0, 1,2,- •-,п. |
(5) |
|
dbi |
|||
|
|
Выражение (5) представляет собой так называемую
систему нормальных уравнений Гаусса. Каждое из
(п-f-l) этих уравнений линейно относительно неизвест ных параметров Ъс
+ х . А , + - - +
иI'M
“ |
“ |
(& |
ь ,2 х » « Х ы + |
К 2 хгы + - - - + |
' |
ии
+ 1 > л х ы х „ , = г х иУ „
ии
13
* о Е * о Л „ + ‘.Ех„ |
■ |
|
и |
и |
(6) |
+ ь £ К . - Ъ х „ > .
Согласно теореме Крамера, система (6) имеет един ственное решение Ь0, Ьп, если ее определитель А не равен нулю:
2 * о „ |
1>ХоиХ1и--- У ,Х 0иХ па |
|||
и |
|
и |
и |
|
2 |
* 0A |
2 * ? « |
■■■11х 1их пи |
|
А = и |
|
и |
и |
Ф О . |
2 |
* 0их пи |
% х 1их пи. .. % |
X I |
|
и |
|
и |
и |
|
Соответствующая определителю А матрица называ ется информационной матрицей.
Напомним формулы Крамера решения системы (6) с помощью определителей:
где Ai — определитель, получаемый из А заменой t-того
столбца столбцом свободных членов системы уравнений
(6):
|
2 |
* о и УU |
|
и |
|
|
2 |
х 1и уп |
|
2 |
*/в уи |
|
и |
|
|
2 |
х пи уи |
|
и |
|
Поскольку в (7) |
каждый определитель Aj составляется |
|
с помощью всех |
(п+1)-уравнений, то получаемые оцен |
ки bi в общем случае не являются взаимонезависимыми.
14
Независимые оценки bi возможны только в том слу чае, когда система (6) распадается на (я+1) уравнений, каждое из которых содержит только один неизвестный параметр bi. Нетрудно убедиться, что это условие реали зуется, если в каждом уравнении суммы попарных произ ведений XiuXjи в левой части будут равны нулю, т. е.
£ X iu X iu = o;_i=hj. |
(8) |
U=l1
В этом случае матрицу планирования называют ортогональной. Соответствующая ей информационная матрица становится диагональной:
£ x l |
|
0 |
|
|
|
£ * ? „ |
|
|
|
|
|
и |
’ . |
|
|
|
|
|
О |
а « X W |
|
|
|
|
|
а |
|
|
|
|
|
|
' |
£ * |
L |
|
|
|
|
и |
|
а ее определитель равен: |
|
|
|
||
N |
N |
N |
|
N |
|
а = £ * 0V £ ; & • . . . ■ £ x L - . . . - £ * L ; |
|||||
0 = 1 |
0 = 1 |
0 = 1 |
|
0 = 1 |
|
соответственно определитель |
|
|
|
||
N |
N |
N |
|
N |
|
Дг = £ хЪи. £ |
Х\а-..,. £ |
х !иУи....' £ |
х пи2 , |
||
0=1 |
0=1 |
0=1 |
|
0=1 |
|
а неизвестные параметры |
|
|
|
||
|
|
N |
|
|
|
|
|
2 Xiuyu |
|
|
|
|
|
0 = 1 |
|
|
(9) |
|
|
N |
|
|
|
|
|
|
|
|
|
|
|
S |
* ? . |
|
|
|
|
о= 1 |
|
|
|
Из допущения нормальности |
распределения ошибок |
||||
измерения у и условия ортогональности |
(8) |
следует, что |
15
и оценки bi распределены нормально с центром распре деления (3;, а дисперсия оценки bi равна:
2 4,
и= 1
Если переменные кодированы, как указано выше (minХ{ = — 1, max^i== + l) и количество уровней выше и ниже основного уровня Х г= 0 одинаковы, то оценка b t еще больше упрощается:
N
( 10)
и=1
а дисперсия s2{6,} не зависит от номера i
= |
( 11) |
л
По закону накопления ошибок дисперсия s2{y} рас четных значений функции отклика (4)
з2 [у} = s* [Ь(} ■(1 + X 2 + Х\ + ■■•+ X I) = s- ^ i (1 + г \
где г2=Х\-\- Х\ +••• + Х2п— радиус гиперсферы, |
центр |
которой совпадает с центром эксперимента X t= 0 . |
Сле- |
л |
|
довательно ошибка прогноза у зависит только от длины радиуса г, а не от его направления в факторном прост ранстве. Это свойство матрицы планирования называют
ротатабельностыо.
Повторим необходимые |
и достаточные |
условия для |
применения расчетов модели с помощью |
формул (4), |
|
(10), (11): |
|
|
выполняются основные |
допущения регрессионного |
анализа, указанные на стр. 12; симметричность плана относительно центра экспери
мента |
|
£ Х 1и= 0 , |
(12) |
0=1 |
|
т. е. сумма элементов Хы любого столбца матрицы пла нирования равна нулю;
16
нормировка
I > X l = N, |
(13) |
и= 1
т. е. сумма квадратов элементов любого столбца равна числу опытов; ортогональность
% х1их 1и= о, i=hj,
и= 1
т. е сумма построчных парных произведений элементов Xiu, Xju любых двух столбцов матрицы планирования равна нулю.
СТАТИСТИЧЕСКИЙ АНАЛИЗ УРАВНЕНИЯ РЕГРЕССИИ
Анализ проводится после |
вычисления коэффициентов |
|
регрессии |
Возможны два |
варианта анализа: |
1)нет оценки для дисперсии воспроизводимости s2{y}.
2)есть оценка s2{y}.
Впервом варианте сначала вычисляется остаточная дис
персия
|
N |
|
|
|
2 |
\уи — уи? |
(14) |
|
2 _ u=1 |
||
|
*0 — |
N — 1 |
|
|
|
|
|
характеризующая разброс измеренных |
уи относительно |
||
средней арифметической у: |
|
|
|
У = |
(#i + |
У2 Н------- |
|
Затем подсчитывается дисперсия1
" |
л |
|
2 |
Iуи — уи\* |
|
м=1________ |
(15) |
|
si = |
N — d |
|
|
|
характеризующая разброс экспериментальных уи отно-
л
сительно уи, предсказанных по уравнению регрессии.
1 Дисперсия вида (15) называется дисперсией неадекватности мо дели; часто обозначается символом
ГОС . ЛVБ.П'
Число степеней свободы |
дисперсии |
s2 равно лц — |
— N— 1, а дисперсии s2 равно |
v z = N —d, |
где d — число |
членов уравнения регрессии |
(4). |
|
Далее составляется отношение дисперсий: |
|
|
F Q= |
s y s l |
(16) |
которое сравнивается с табличным значением критерия Фишера EVi.v.a для выбранного уровня значимости а.
Если критическое значение Е из приложения I не мень ше Е0, утверждается, что в исследованных интервалах переменных зависимость у от х* не описывается получен ным уравнением регрессии. Если Егс:Е0 и число точек N больше числа коэффициентов следует попытаться рас считать уравнение второго порядка относительно выб ранных факторов, вычислить для него дисперсию s^no
формуле (15), отношение F\=s\!s\ и проверить его зна
чимость по Е-критерию. Если окажется, что Е^Етабл, то в качестве модели процесса принимается предпослед няя модель.
Во втором варианте представляется возможным оце нить значимость отдельных коэффициентов регрессии и адекватность модели. Если матрица планирования ор тогональна, то доверительный интервал А6,- устанавлива ется для каждого коэффициента в отдельности:
= ± С | / |
•*{*} = |
(17) |
|
а~\ |
|
где tv.a — табличное значение ^-критерия |
Стыодента |
с v = N —1;
а — уровень значимости (см. приложение II).
Если |A&i|>|6j|, коэффициент bi признается незна чимым (вычеркивается из уравнения регрессии). Если матрица планирования не ортогональна, то доверитель ные границы i-того коэффициента, как и численные зна чения других коэффициентов, взаимосвязаны и необхо дим последовательный статистический анализ (подроб нее см. [3]).
Для проверки адекватности уравнения регрессии со поставляется дисперсия неадекватности s2A[формула
(15)] с дисперсией воспроизводимости э2{г/}:
= |
( 18) |
18
Гипотезе об адекватности уравнения регрессии соот ветствует условие:
F < F V*v,;a>
где Fv .v .a — критическое значение Е-критерия из при
ложения I; а — уровень значимости. Числа степеней свободы:
— N — d, v2 = N — 1.
На практике каждый из N опытов повторяется с ^ 1 раз или с > 1 раз повторяется опыт в центре эксперимента
X i= 0 . В первом случае получаем N раздельных |
оценок |
дисперсий воспроизводимости |
|
С |
|
2 \Уи1— Уи? |
|
$ 0 } = 1=1-------:----- , v = c - ;i . |
(19) |
С — X |
|
Гипотеза об однородности полученных дисперсий про веряется с помощью отношения наибольшей из диспер сий s,,{y} к их сумме по всем опытам:
, _ |
max Sg {t/} |
|
max — |
N |
(20) |
|
2 4 |
M |
|
u=\ |
|
Полученное значение Gm&x сравнивается с критичес |
||
ким значением критерия G |
а |
из приложения III для |
v i= c — 1, V2= N ( c — 1) и уровня значимости а.
Е сл и |
G m a x < G Vl; v.;a, ДИСПерСИИ |
СЧИТЭЮТСЯ ОДНОРОД |
|||
НЫМИ с |
н ад еж н о сть ю |
( 1 — а ) . |
Д л я |
д ал ьн ей ш и х |
р асч ето в |
п р и н и м ается оц ен к а ди сп ер си и в о сп р ои звод и м о сти |
|||||
|
N |
|
|
|
|
|
2 |
S2 { у и ) |
|
|
|
|
s2{«/} = fiL ^ -----, |
v = W(c — 1), |
(21) |
||
т. е. дисперсии усредняются. |
|
|
|
||
Если опыты повторялись |
только в центре экспери |
мента, то оценка дисперсии воспроизводимости
С
2 |yi — у\* |
|
*2 {У} = — ----- :-----, v = N ( c - 1). |
(22) |
с — 1 |
|
2* |
19 |