Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МатСтГл5-.doc
Скачиваний:
81
Добавлен:
01.06.2015
Размер:
489.98 Кб
Скачать

5.9. Элементы дисперсионного анализа

Дисперсионный анализ применяют, если требуется установить, оказывает ли некоторый качественный фактор F, который имеет k уровней F1, F2, .., Fk , существенное влияние на изучаемую величинуX . Например, если нужно выяснить, какое вещество, входящее в состав промышленных выбросов, является наиболее вредным, то факторF - это исследуемые промышленные выбросы, а уровни фактора – вещества, входящие в состав выбросов.

Основная идея дисперсионного анализа заключается в следующем: если фактор F оказывает существенное влияние на признакX, то средние значения исследуемого признакаX , соответствующие различным уровням фактораF, будут различаться между собой в большей степени, чем в случае слабого влияния фактора.

5.9.1. Общая, факторная и остаточная суммы квадратов отклонений

Пусть на нормально распределенный признак X оказывает влияние факторF, имеющийk постоянных уровней. Положим, что число измеренных значений признакаX на каждом уровне одинаково и равноm.Результаты измерений представлены в таблице 5.4. Черезxij в таблице обозначены измеренные значения признакаX (iномер испытания,jномер уровня фактора). Всего проведеноn = mkизмерений, гдеnобъем выборки. Каждому уровню фактора соответствует своя группа измеренных значений.

Таблица 5.4

Номер испытания

Уровни фактора Fj

F1

F2

Fk

1

2

m

x11

x21

xm1

x12

x22

xm2

x1k

x2k

xmk

Групповая средняя

гр1

гр2

грk

Введем по определению:

общую сумму квадратов отклонений измеренных значений от общей средней

Sобщ=; (5.4)

факторную сумму квадратов отклонений групповых средних от общей средней

Sф=m , (5.5)

которая характеризует разброс значений признака, входящих в разные группы;

остаточную сумму квадратов отклонений измеренных значений группы от своей групповой средней

Sост=, (5.6)

которая характеризует разброс значений Xвнутри групп.

Практически остаточную сумму легче находить по равенству

Sост =Sобщ -Sф .

С помощью элементарных преобразований можно получить более удобные для расчетов формулы:

Sобщ =,Sф =, (5.7)

где Pj = - сумма квадратов значений признака, соответствующих уровнюFj,

Rj = - сумма измеренных значений, соответствующих уровнюFj .

Чтобы еще больше упростить вычисления, можно из каждого измеренного значения вычесть одно и то же число С, примерно равное общей средней. Тогда, если обозначить

yij = xij C, получим

Sобщ =,Sф =, (5.8)

где Qj = - сумма квадратов уменьшенных значений признакаX на уровнеFj ,

Tj = - сумма уменьшенных значений признака, соответствующих уровнюFj .

Для проверки формул (5.8) следует подставить

Pj =

и

Rj =

в соотношение (5.7).

Величина суммы Sф отражает действие фактораF. Действительно, пусть фактор F оказывает существенное влияние на признакX, причем на некотором уровнеj это влияние оказывается более сильным, чем на других уровнях. Тогда группа значений признака, соответствующих уровнюj , должна отличаться от значений признака в группах, соответствующих другим уровням. Будут различаться и групповые средние, причем квадраты их отклоненийот общей средней будут тем больше, чем сильнее воздействие фактора. Поэтому, чем сильнее воздействие фактора, тем больше значениеSф .

Величина суммы Sост отражает влияние случайных (помимо фактораF) воздействий на признакX. Действительно, если уровень фактора не меняется, то это не значит, что измеренные на данном уровне (входящие в одну группу) значения признакаX должны быть одинаковыми. Так как случайные воздействия устранить невозможно, значения признака, входящие в одну и ту же группу, должны быть различными и должны быть рассеянными вокруг своей групповой средней. Поэтому влияние случайных причин можно выразить в виде суммы квадратов отклонений значений признака "внутри" каждой группы от соответствующих групповых средних.

Величина суммы Sобщ отражает действие и фактора и случайных причин.