- •Глава 5. Проверка статистических гипотез
- •5.1. Статистические гипотезы.
- •5.2. Статистические критерии.
- •5.3. Область принятия гипотезы. Критическая область. Критические точки
- •5.4. Нахождение критических точек
- •5.5. Проверка гипотезы о равенстве двух средних значений нормальных генеральных совокупностей
- •5.6. Проверка гипотезы о равенстве генеральной средней нормальной совокупности гипотетическому числовому значению
- •5.7. Проверка гипотез о соотношении двух дисперсий нормальных генеральных совокупностей
- •5.8. Проверка гипотезы о нормальности распределения генеральной совокупности
- •5.8.1. Критерий согласия χ 2 (“хи квадрат”) Пирсона
- •5.8.2. Метод вычисления теоретических частот нормального распределения. Пример применения критерия χ 2
- •5.9. Элементы дисперсионного анализа
- •5.9.1. Общая, факторная и остаточная суммы квадратов отклонений
- •5.9.2. Общая, факторная и остаточная дисперсии
- •5.9.3. Расчетная схема дисперсионного анализа
5.9. Элементы дисперсионного анализа
Дисперсионный анализ применяют, если требуется установить, оказывает ли некоторый качественный фактор F, который имеет k уровней F1, F2, .., Fk , существенное влияние на изучаемую величинуX . Например, если нужно выяснить, какое вещество, входящее в состав промышленных выбросов, является наиболее вредным, то факторF - это исследуемые промышленные выбросы, а уровни фактора – вещества, входящие в состав выбросов.
Основная идея дисперсионного анализа заключается в следующем: если фактор F оказывает существенное влияние на признакX, то средние значения исследуемого признакаX , соответствующие различным уровням фактораF, будут различаться между собой в большей степени, чем в случае слабого влияния фактора.
5.9.1. Общая, факторная и остаточная суммы квадратов отклонений
Пусть на нормально распределенный признак X оказывает влияние факторF, имеющийk постоянных уровней. Положим, что число измеренных значений признакаX на каждом уровне одинаково и равноm.Результаты измерений представлены в таблице 5.4. Черезxij в таблице обозначены измеренные значения признакаX (i– номер испытания,j – номер уровня фактора). Всего проведеноn = mkизмерений, гдеn – объем выборки. Каждому уровню фактора соответствует своя группа измеренных значений.
Таблица 5.4
-
Номер испытания
Уровни фактора Fj
F1
F2
…
Fk
1
2
…
m
x11
x21
…
xm1
x12
x22
…
xm2
…
…
…
…
x1k
x2k
…
xmk
Групповая средняя
гр1
гр2
…
грk
Введем по определению:
общую сумму квадратов отклонений измеренных значений от общей средней
Sобщ=; (5.4)
факторную сумму квадратов отклонений групповых средних от общей средней
Sф=m , (5.5)
которая характеризует разброс значений признака, входящих в разные группы;
остаточную сумму квадратов отклонений измеренных значений группы от своей групповой средней
Sост=, (5.6)
которая характеризует разброс значений Xвнутри групп.
Практически остаточную сумму легче находить по равенству
Sост =Sобщ -Sф .
С помощью элементарных преобразований можно получить более удобные для расчетов формулы:
Sобщ =,Sф =, (5.7)
где Pj = - сумма квадратов значений признака, соответствующих уровнюFj,
Rj = - сумма измеренных значений, соответствующих уровнюFj .
Чтобы еще больше упростить вычисления, можно из каждого измеренного значения вычесть одно и то же число С, примерно равное общей средней. Тогда, если обозначить
yij = xij – C, получим
Sобщ =,Sф =, (5.8)
где Qj = - сумма квадратов уменьшенных значений признакаX на уровнеFj ,
Tj = - сумма уменьшенных значений признака, соответствующих уровнюFj .
Для проверки формул (5.8) следует подставить
Pj =
и
Rj =
в соотношение (5.7).
Величина суммы Sф отражает действие фактораF. Действительно, пусть фактор F оказывает существенное влияние на признакX, причем на некотором уровнеj это влияние оказывается более сильным, чем на других уровнях. Тогда группа значений признака, соответствующих уровнюj , должна отличаться от значений признака в группах, соответствующих другим уровням. Будут различаться и групповые средние, причем квадраты их отклоненийот общей средней будут тем больше, чем сильнее воздействие фактора. Поэтому, чем сильнее воздействие фактора, тем больше значениеSф .
Величина суммы Sост отражает влияние случайных (помимо фактораF) воздействий на признакX. Действительно, если уровень фактора не меняется, то это не значит, что измеренные на данном уровне (входящие в одну группу) значения признакаX должны быть одинаковыми. Так как случайные воздействия устранить невозможно, значения признака, входящие в одну и ту же группу, должны быть различными и должны быть рассеянными вокруг своей групповой средней. Поэтому влияние случайных причин можно выразить в виде суммы квадратов отклонений значений признака "внутри" каждой группы от соответствующих групповых средних.
Величина суммы Sобщ отражает действие и фактора и случайных причин.