Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы и модели - Костин В.Н., Тишина Н.А

..pdf
Скачиваний:
61
Добавлен:
24.05.2014
Размер:
995.16 Кб
Скачать

SSε = 5622750 5557320 = 65430.

9 Рассчитывают оценку дисперсии S 2 x :

S 2 x =

SSx

 

;

m 1

 

 

S 2 x = 448204 1 =14940 . 10 Рассчитывают оценку дисперсии S 2ε :

 

 

S

2

ε =

SSε

 

 

 

 

;

 

 

 

m(n 1)

 

2

 

 

65430

 

S

ε

=

4(5 1) = 4089 .

11 Вычисляем расчетное значение F - критерия:

Fрасч

=

S 2 x

;

 

 

 

S 2ε

=14940 =

Fрасч 4089 3,6537 .

12 Определяем критическое табличное значение F - критерия (приложение Б):

Fтабл. (α = 0,05; f1 = m 1 = 3; f2 = m(n 1)=16)= 3.2389.

13 Сравним Fрасч и Fтабл:

Fрасч = 3,6537 > Fтабл = 3,2389 .

Таким образом, влияние поточных линий на величину начальной скорости полета снаряда V0 следует признать значимым.

14 Определяем величину влияния номера поточной линии:

σ x2 =

Sx2 Sε2

=

14940 4089

= 2170 .

n

 

5

 

 

 

101

15 Производим сравнение влияния номеров поточных линий по критерию Дункана. С этой целью:

- вычисляем нормированную ошибку среднего:

S

 

=

Sε2

=

4089

= 28.60 ;

 

n

5

 

y

 

 

 

 

 

 

 

- располагаем значения средних по столбцам (смотреть таблицу 2.3) в порядке возрастания их величин:

y1

 

 

y4

 

 

y2

 

 

y3

;

492

492

510

606

- выписываем из таблицы Дункана (приложение В)

nD = fSε2 = m(n 1)=16;

α = 0.05;

 

 

p = 2.3..., m все

(m

1)

значения значимых рангов

р

2

3

4

;

ранги

3,00

3,15

3,23

- вычисляем (m-1) наименьшие значимые ранги (НЗР), умножая ранги на нормированную ошибку среднего:

р

2

3

4

;

НЗР S

 

 

85.80

90.09

92.38

 

 

y

- проверяем значимость различия между средними по столбцам для всех m(m-1)/2 парами:

 

3

 

 

1 =606 492 =114 >92,38

различия значимо;

y

 

y

 

3

 

 

4

=606

492 =114 >92,09

различия значимо;

y

 

y

 

3

 

 

2

=606

510 =96 >85.80

различия значимо;

y

 

y

 

2

 

1

=510 492 =18 <85.80

различия незначимо;

y

y

 

2

 

4 =510 492 =18 <85.80

различия незначимо;

y

y

 

4

 

1

= 492 492 =0 <85.80 различия незначимо.

y

y

Таким образом, для выпуска однородной продукции усовершенствование целесообразно начать с третьей поточной линии.

102

4.4 Двухфакторный дисперсионный анализ

Дисперсионный анализ особенно эффективен при одновременном изучении нескольких факторов. В этом случае при постановке активного эксперимента одновременно варьируют все факторы, и каждое наблюдение выходного параметра Y используют для их одновременной оценки. При этом немаловажен и тот факт, что в ряде случаев можно не делать параллельных наблюдений, ограничиваясь лишь одним наблюдением для каждого сочетания уровней изучаемых факторов.

Пусть требуется изучить одновременное влияние на процесс двух качественных факторов ХА и ХВ. Фактор ХА исследуется на уровнях ХА1, ХА2, …, ХАi,

…, ХАК, фактор ХВ – на уровнях ХВ1, ХВ2, …, ХВj, …, ХВm. Допустим, что при каждом сочетании уровней исследуемых факторов было проведено по n парал-

лельных наблюдений (равное количество взято для упрощения вкладок). Матрицу наблюдений в рассматриваемом случае можно представить в виде табли-

це 4.4.

Общее число наблюдений равно

N = n k m .

Таблица 4.4 – Исходные данные для двухфакторного ДА с равным числом повторений опытов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XA

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ХВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y j

 

 

 

xA1

 

 

xA2

 

 

 

xAi

 

 

 

xAK

 

 

 

 

 

y111, y112,

y211, y212,

 

yi11, yi12,

yK11, yK12,

 

 

 

 

 

 

 

 

 

…, y11n

…, y21n

 

…, yi1n

…, yK1n

 

 

 

 

 

 

 

xB1

 

 

 

y 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

21

 

 

 

 

 

 

 

 

i1

 

 

 

 

 

 

 

 

K1

 

 

 

 

 

 

 

 

 

 

 

y

11

 

 

y

 

y

y

 

 

 

 

 

 

 

 

 

y121, y122,

y221, y222,

 

yi21, yi22,

yK21, yK22,

 

 

 

 

 

 

 

 

 

…, y12n

…, y22n

 

…, yi2n

…, yK2n

 

 

 

 

 

 

 

xB2

 

 

 

y 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i2

 

 

 

 

 

K 2

 

 

 

 

 

 

 

y

12

 

 

y

22

 

 

 

y

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y1j1, y1j2,

y2j1, y2j2,

 

yij1, yij2,

yKj1, yKj2,

 

 

 

 

 

 

 

 

 

…, y1jn

…, y2jn

 

…, yijn

…, yKjn

 

 

 

 

 

 

 

xBj

 

 

 

y j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

1 j

 

 

y

2 j

 

 

 

y

ij

 

 

 

y

Kj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y1m1, y1m2,

y2m1, y2m2,

 

yim1, yim2,

yKm1,yKm2,

 

 

 

 

 

 

 

 

 

…, y1mn

…, y2mn

 

…, yimn

…, yKmn

 

 

 

 

 

 

 

xBm

 

 

y m

 

 

 

 

 

 

 

 

 

 

 

 

 

Km

 

 

 

 

 

 

y

 

 

 

y

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1m

 

 

2m

 

 

im

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

y

 

 

 

y

 

 

 

 

y

 

 

 

 

y

 

 

 

 

 

 

 

i

 

 

1

 

 

2

 

 

 

i

 

 

 

K

 

 

 

 

y

 

103

В таблице 4.4. обозначено:

i=1,k – число уровней фактора ХА (число столбцов); J=1,m – число уровней фактора ХВ (число строк);

l=1,n – число наблюдений ячейке (число параллельных опытов); y111, y112,…, y11n,…, уkmn наблюдавшиеся значения выходного парамет-

ра;

yij – среднее значение в ячейке;

 

 

1

n

 

y

ij =

yijl ;

(4.42)

 

 

 

n l=1

 

y j – среднее значение по уровням фактора ХВ (средние по строкам);

 

 

1

k

 

 

 

y

j =

y

ij* ;

(4.43)

k

 

 

i=1

 

yi – среднее значение по уровням фактора ХА (средние по столбцам);

 

 

1

m

 

 

 

y

i* =

y

ij* ;

(4.44)

 

 

 

m j=1

 

y – общее среднее;

 

 

1

k

m

 

 

 

 

 

 

y =

∑ ∑

y

ij* .

(4.45)

 

 

 

km i=1

j=1

 

Будем полагать, что предпосылки проведения ДА выполнены. В рассматриваемых условиях любое наблюдение из таблицы 4.4 может быть представлено виде следующей модели:

yijl = µ + di +γ j + diγi +εijl ,

(4.46)

где µ – общая средняя (математическое ожидание для среднего

по всей таблице 4.4);

di – эффект фактора ХА на i-ом уровне (отклонение математи-

ческого ожидания выходного параметра при i-ом уровне фактора ХА от общего математического ожидания);

104

γ j

diγi

εijl

эффект фактора ХВ на j-ом уровне (отклонение математи-

ческого ожидания выходного параметра при j-ом уровне фактора ХB от общего математического ожидания);

эффект взаимодействия факторов ХА и ХВ;

случайный остаток или вариация результатов внутри отдельной ячейки (ошибка воспроизводимости).

Эффект взаимодействия факторов diγi представляет собой отклонение

среднего по наблюдениям в ij-ой серии от суммы первых трех членов модели (4.46). Если предположить, что между факторами нет взаимодействия, то можно построить линейную модель вида:

yij = µ + di +γ j +εijl .

(4.47)

Эта модель, как правило, применяется лишь в случае отсутствия параллельных опытов, например, как показано в таблице 4.5. (при анализе трех и более факторов отдельные эффекты взаимодействия удается оценить и без параллельных наблюдений).

Таблица 4.5 – Исходные данные для двухфакторного ДА с одним наблюдением в ячейке

 

 

 

 

 

 

 

 

 

 

 

 

XA

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ХВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y j

 

 

xA1

 

xA2

 

 

xAi

 

 

xAK

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xB1

 

y11

 

y21

 

 

yi1

 

 

yK1

 

 

 

 

1

 

 

 

y

 

xB2

 

y12

 

y22

 

 

y

 

 

yK 2

 

 

 

 

 

 

 

 

 

y

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

y

 

 

 

 

 

y

 

 

 

y

 

 

 

 

 

 

 

 

xBj

 

2 j

 

 

Kj

 

 

y

j

 

 

1 j

 

 

 

 

 

 

 

ij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xBm

y1m

 

y2m

 

 

yim

 

 

 

 

 

 

 

 

 

m

 

 

y

 

 

 

 

 

Km

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

y

 

 

y

 

 

 

y

 

 

 

y

 

 

 

 

 

 

 

i

 

1

 

2

 

 

i

 

 

K

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В таблице 4.5 обозначено:

i=1,k

– число уровней фактора ХА (число столбцов);

J=1,m

– число уровней фактора ХВ (число строк);

 

y11 ,…, уkmn

наблюдавшиеся значения выходного параметра;

 

 

j

среднее значение по уровням фактора ХB (средние по

 

y

 

 

 

 

столбцам);

105

yi

y

 

 

 

1

k

 

y

* j

=

yij ;

(4.48)

k

 

 

 

i=1

 

среднее значение по уровням фактора ХА (средние по столбцам);

 

 

1

m

 

y

i * =

yij ;

(4.49)

 

 

 

m j=1

 

– общее среднее;

 

 

1

k

m

 

 

 

 

y =

∑ ∑yij .

(4.50)

 

 

 

km i=1

j=1

 

В рассматриваемом случае (модель (4.47)) оценки общей дисперсии, как и ранее, можно получить из основного тождества ДА. Однако следует подчеркнуть, что в двухфакторном ДА, в отличие от однофакторного, общая сум-

ма квадратов отклонений наблюдений yij от общего среднего y (числитель

(4.9)) раскладывается согласно (4.47) уже не на две, а на три части: часть, обусловленную влиянием фактора ХА, часть, обусловленную влиянием фактора ХВ, и часть, обусловленную влиянием всех неучтенных факторов.

SSобщ

= k m (y ji

 

 

)2

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1 j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= k

m (yij

 

i*

 

j* +

 

+

 

 

i*

 

+

 

* j

 

)2

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

y

y

y

y

y

y

 

i=1 j=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= km (y

 

 

)2

+ mk (y

 

 

 

 

 

)2

+ k m (yij

 

 

 

 

 

)2

(4.51)

* j

 

i*

 

 

i*

 

j* +

 

=

 

 

 

y

y

y

y

y

j=1

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

i=1 j=1

 

 

 

 

 

 

= SS X B + SS X A + Sε .

Слагаемое SSX B представляет собой сумму квадратов разностей между

средними по строкам и общим средним и характеризует изменение выходного параметра по фактору ХB:

SS X B

= km (y

* j

 

)2 .

(4.52)

 

y

 

j=1

 

106

Слагаемое SSX A представляет собой сумму квадратов разностей между

средними по строкам и общим средним и характеризует изменение выходного параметра по фактору ХA:

SS X A

= mk (y

i*

 

)2 .

(4.53)

 

y

 

i=1

 

Слагаемое SSЕ называется остаточной суммой квадратов и характеризует влияние неучтенных моделью (4.47) факторов:

Sε = k

m (yij

 

i*

 

j* +

 

)2 .

(4.54)

 

 

 

y

y

y

i=1

j=1

 

Зная суммы квадратов отклонений, определим оценки соответствующих дисперсий:

S 2общ = mkSSобщ1 = SSN общ1 ;

 

 

S 2 X B

=

SSX B

 

;

 

 

 

m 1

 

 

 

 

 

 

 

 

 

S 2 X A

=

SSX A

 

;

 

 

 

K 1

 

 

 

 

 

 

 

S

2

ε =

 

 

SSε

 

.

 

(m 1)(K 1)

(4.55)

(4.56)

(4.57)

(4.58)

Нулевые гипотезы о незначимости факторов ХА и ХВ проверяют по критерию Фишера. Если дисперсионное отношение

Fрасч =

S 2 X B

Fтабл(α, f1

, f2 ),

(4.59)

S 2ε

где

 

 

 

 

f1 = m 1;

 

 

 

f2 = (m 1)(k 1),

 

 

принимается гипотеза H0 :γ j

= 0.

 

 

 

107

Если дисперсионное отношение

S 2

Fрасч = X B > Fтабл(α, f1, f2 ), (4.60)

S 2ε

нулевая гипотеза отвергается, и влияние фактора ХВ считается значимым. Аналогично, если дисперсионное отношение

 

S

2

 

 

 

 

 

Fрасч =

 

X A

Fтабл(α, f1 , f2 ),

(4.61)

S

 

 

2ε

 

 

 

где

 

 

 

 

 

 

 

 

f1 = k 1;

 

 

 

 

 

 

 

f2 = (k 1)(m 1),

 

 

принимается гипотеза H0 : di =0.

При несправедливости неравенства

 

Fрасч =

S 2 X A

> Fтабл (α, f1

, f2 ),

(4.62)

S

2

ε

 

 

 

 

 

влияние фактора ХА считается значимым. При проверке нулевых гипотез, также принимается односторонний F-критерий (приложение Б).

При проведении ДА в условиях линейной модели (4.47) удобно использовать следующий алгоритм расчета. Находят:

- итоги по столбцам:

m

X Ai = yij ; j=1

- итоги по строкам:

k

X B j = yij ; i=1

- сумму квадратов всех наблюдений:

k

m

 

Q1 = ∑ ∑yij

2 ;

i=1

j=1

 

108

-сумму квадратов итогов по столбцам, деленную на число наблюдений

встолбце:

Q2 = m1 k X A2i ;

i=1

- сумму квадратов итогов по строкам, деленную на число наблюдений в строке:

 

1

m

Q3 =

X B2j ;

k

 

j=1

- квадрат общего итога, деленный на число всех наблюдений (корректирующий член):

1

k

 

2

1 m

2

Q4 =

 

=

XAi

 

=

 

=

XBj ;

m k

m k

 

 

i 1

 

 

 

 

j 1

 

-сумму квадратов для столбца:

SSX A = Q2 Q4 ;

-сумму квадратов для строки:

SSX B = Q3 Q4 ;

-общую сумму квадратов:

SSобщ. = Q1 Q4 ;

-остаточную сумму квадратов:

SSε = SSобщ SSXB SSXA =

=Q1 Q4 Q3 +Q4 Q2 Q4 =

=Q1 Q2 Q3 +Q4 ;

109

-оценку дисперсии

-оценку дисперсии

-оценку дисперсии

S 2 X A :

S

2 X A

=

SSX A

;

k 1

 

 

 

 

S 2 X B

:

 

 

 

S

2 X B

=

SSX B

;

m 1

 

 

 

 

S 2 ε :

 

 

 

 

S 2 SSε

ε = (m 1)(k 1).

Результаты расчета удобно представлять в виде таблицы 4.6.

Таким образом, установив при помощи ДА значимость влияния факторов, выясняют затем, какие именно средние значения Y различны.

Как было отмечено ранее, линейная модель вида (4.47) справедлива лишь при отсутствии взаимодействия факторов. В противном случае этому взаимодействию как самостоятельному фактору присуща своя дисперсия

σ X2 A X B .

В приведенном выше алгоритме при наличии взаимодействия между факторами ХА и ХВ дисперсия σ X2 A X B , как составная часть, входит в дисперсию

ошибки σε2 . Выделить и оценить эту дисперсию можно только при наличии

параллельных наблюдений (таблица 4.4). При указанном расположении наблюдений их рассеяние в каждой ячейке относительно среднего той же ячейки

обусловлено действием только случайных причин с дисперсией σ X2 A X B . Рассея-

ние же самих средних в ячейках по всем возможным сочетаниям уровней факторов ХА и ХВ вокруг общего среднего, помимо фактора случайности, вызыва-

ется влиянием фактора взаимодействия ХА ХВ с дисперсией σ X2 A X B . Кроме этих факторов на рассеяние средних по строкам оказывает влияние только один фактор ХВ с дисперсией σ X2 B , а на рассеяние средних по столбцам – только один фактор ХА с дисперсией σ X2 A , так как все уровни другого фактора в каж-

дом из этих случаев осреднены.

В этом случае для получения модели вида (4.46) общую сумму квадратов отклонений, наблюдений от общего среднего SSобщ. необходимо разложить уже на четыре компонента, отвечающие перечисленным выше факторам.

110

Соседние файлы в предмете Экономика