Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

10535

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
6.66 Mб
Скачать

Двухвыборочный F – тест для дисперсий

Сравнение объектов по степени изменчивости, характеризуемой дисперсией,

необходимо в различных задачах. Так, это используют для обоснования приме-

нения принципа аналогии. Другим его применением является сравнение раз-

личных методов проведения анализов – при отсутствии систематической ошиб-

ки более надежным является тот метод, который дает меньший разброс изучае-

мого свойства, то есть характеризуется меньшей дисперсией.

Параметрический критерий Фишера используют для проверки гипотезы о при-

надлежности двух дисперсий одной генеральной совокупности и, следователь-

но, их равенстве. Предполагается, что данные независимы и распределены по нормальному закону.

Н0: D(X)=D(Y)

Н1: D(X)>D(Y)

В математической статистике доказывается, что если данная гипотеза вы-

2

полняется, то величина = 2 имеет F-распределение с (n-1) и (m-1) числом

степеней свободы. Величина F, называемая отношением Фишера (статистикой Фишера) используется в качестве критерия при проверке гипотезы H0.

В диалоговом окне данного режима задаются параметры, аналогичные пара-

метрам, задаваемым в диалоговом окне «Двухвыборочный z-тест для средних»,

только отсутствуют поля Дисперсия переменной 1 (известная), Дисперсия пе-

ременной 2 (известная) и Гипотетическая средняя разность.

30

Пример: Сравнить точность обработки изделий по двум технологиям. Решение

Контрольные вопросы

1. Сформулируйте определение понятия ―закон распределения случайной вели-

чины‖.

2. Приведите примеры применения закона распределения для описания случай-

ных событий.

3. Перечислите параметры нормального распределения.

4. Какие случайные события можно описать с помощью нормального закона распределения?

5. Что такое статистическая гипотеза?

6. Перечислите основные виды гипотез.

7. Какие инструменты предлагает MS Excel для проверки гипотез?

31

Тема 3: Дисперсионный анализ

Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путѐм исследования зна-

чимости различий в средних значениях.

В отличие от t-критерия позволяет сравнивать средние значения трѐх и более групп. Дисперсионный анализ был разработан Р. Фишером для анализа резуль-

татов экспериментальных исследований. Суть анализа сводится к изучению влияния одной или нескольких независимых переменных, обычно именуемых факторами, на зависимую переменную.

В зависимости от типа и количества переменных различают:

однофакторный и многофакторный дисперсионный анализ (одна или несколько независимых переменных);

одномерный и многомерный дисперсионный анализ (одна или несколько зави-

симых переменных);

дисперсионный анализ с повторными измерениями (для зависимых выборок);

дисперсионный анализ с постоянными факторами, случайными факторами, и

смешанные модели с факторами обоих типов.

Однофакторный дисперсионный анализ

Многие приложения связаны с экспериментами, в которых рассматривается не-

сколько групп или уровней одного фактора. Некоторые факторы, например,

температура обжига керамики, могут иметь несколько числовых уровней (т.е. 300°, 350°, 400° и 450°). Другие факторы, например, местоположение товаров в супермаркете, могут иметь категориальные уровни (например, первый постав-

щик, второй поставщик, третий поставщик, четвертый поставщик). Однофак-

торные эксперименты, в ходе которых экспериментальные единицы случайным образом распределяются по группам или уровням фактора, называются полно-

стью рандомизированными. В тех случаях, когда есть несколько независимых выборок, полученных из одной генеральной совокупности путем изменения ка-

32

кого-либо независимого фактора, используется однофакторный дисперсионный анализ. В данной процедуре полная вариация результатов измерений подраз-

ляется на межгрупповую и внутригрупповую. Внутригрупповая вариация объ-

ясняется ошибкой эксперимента, а межгрупповая — эффектами условий экспе-

римента.

Предполагается, что выборки имеют различные выборочные средние и одина-

ковые выборочные дисперсии. Разброс данных между выборками должен быть не больше, чем разброс данных внутри этих выборок. Другими словами, оказал ли изменяемый фактор существенное влияние на разброс выборочных средних или же разброс является следствием случайностей, вызванных небольшими объемами выборок.

Возникает задача проверки гипотезы H0: τ1 = τ2 = … = τm

H1: τ1 ≠τ2 ≠ … ≠τm,

где τi – эффект i – ой обработки (i = 1; ), m – номер уровня фактора.

Поясним основную гипотезу (рис.1) и альтернативную (рис.2).

Рис.1

Рис.2

 

Замечание: обратите внимание на то, что за исключением величины математи-

ческих ожиданий все пять совокупностей идентичны (т.е. имеют одинаковую изменчивость и форму).

33

Пакет анализа MS Excel позволяет провести вычисления для однофакторного дисперсионного анализа.

В диалоговом окне указываются следующие параметры:

1. Входной диапазон – это ссылка на ячейки, содержащие анализируемые дан-

ные. Ссылка должна состоять как минимум из двух смежных диапазонов дан-

ных, организованных в виде столбцов или строк.

2. Группирование − установите переключатель в положение ―по столбцам‖ или

―по строкам‖ в зависимости от расположения данных во входном диапазоне.

3. Метки в первом столбце − установите переключатель в положение ―Метки в первом столбце‖, если названия строк находятся в первом столбце входного диапазона. Если входной диапазон не содержит меток, то необходимые заго-

ловки в выходном диапазоне будут созданы автоматически.

4. Выходной диапазон − введите ссылку на ячейку, расположенную в левом верхнем углу выходного диапазона. Размеры выходной области будут рассчи-

таны автоматически, и соответствующее сообщение появится на экране в том случае, если выходной диапазон занимает место существующих данных или его размеры превышают размеры листа.

Пример. Изготовителя индикаторов интересует влияние четырех различных типов покрытия электронно-лучевых трубок на их проводимость. Данные пред-

ставлены в таблице.

34

Результат

Вывод: так как выборочное значение статистики (14,3) больше критической точки (3,49), то основная гипотеза отвергается. Следовательно, исследуемый фактор имеет значимое влияние на процесс. Таким образом, покрытие элек-

тронно-лучевых трубок действительно влияет на их проводимость.

Двухфакторный дисперсионный анализ

Если на результативный признак одновременно влияет два фактора − А и В,

следовательно, используется метод двухфакторного анализа.

Дисперсионный анализ в этом случае учитывает еще и взаимодействия между факторами. Гипотезы, проверяемые в данном случае созвучны с однофактор-

ным анализом, но относительно двух факторов.

H0: τ1

= τ2 = … = τm

H0: β1 = β2 = … = βn

H0: (τβ)ij = 0, где = 1;

H1: τ1

≠τ2 ≠ … ≠τm.

H1: β1 ≠β2 ≠ … ≠βn.

H1: (τβ)ij ≠ 0 = 1; .

 

 

35

 

В двухфакторном эксперименте факторы А и В, считаются взаимодействую-

щими, если эффект фактора А зависит от уровня фактора В.

Вследствие сложности вычислений, особенно при большом количестве уровней каждого фактора и реплик, для двухфакторного анализа следует применять ли-

бо MS Excel, либо специализированное программное обеспечение.

Microsoft Excel располагает двумя функциями для обработки данных с помо-

щью двухфакторного дисперсионного анализа:

- если каждому уровню фактора соответствует только одна реплика, то приме-

няется двухфакторный дисперсионный анализ без повторения;

- если каждому уровню фактора соответствует несколько реплик, то применя-

ется двухфакторный дисперсионный анализ с повторениями.

Замечание: в первом случае взаимодействие факторов не рассматривается.

Пример применения двухфакторный дисперсионный анализ без повторения;

Приведены данные об урожайности четырех сортов пшеницы (фактор А), дос-

тигнутой при использовании пяти типов удобрений (фактор В). Данные полу-

чены на двадцати участках одинакового размера и аналогичного почвенного покрова. Необходимо определить влияние сорта и типа удобрения на урожай-

ность.

Для решения применяем

36

Результатом анализа будет следующие таблицы:

Вывод:

Относительно фактора А: выборочное значение (1,67) меньше критической точки (3,7955) при уровне значимости 0,05, то основная гипотеза не отвергается и сорт пшеницы не влияет на урожайность.

Относительно фактора В: выборочное значение (2,03) меньше критической точки (3,5269) при уровне значимости 0,05, то основная гипотеза не отвергается и тип вносимых удобрений не влияет на урожайность.

37

Пример применения двухфакторный дисперсионный анализ с повторениями.

Инженер полагает, что на чистоту поверхности металлической детали влияет скорость подачи и глубина резания. Данные эксперимента приведены ниже.

Для обработки данных применяем

В этом диалоговом окне задаются следующие параметры.

1. В поле Входной интервал вводится ссылка на диапазон ячеек, содержащий анализируемые данные. Необходимо обратить внимание на то, как выделен входной интервал (включены названия уровней факторов)

38

2. В поле Число строк для выборки определяется число выборок, которое при-

ходится на каждый уровень одного из факторов. Каждый уровень фактора дол-

жен содержать одно и то же количество выборок (строк таблицы). В нашем случае число строк равно трем.

Результат представлен в таблицах

Вывод:

Относительно фактора «Глубина резания»: выборочное значение (24,66) боль-

ше критической точки (3,008) при уровне значимости 0,05, то основная гипоте-

за - отвергается и глубина резания влияет на чистоту поверхности металличе-

ской детали.

Относительно фактора «Скорость подачи»: выборочное значение (55,018)

больше критической точки (3,4028) при уровне значимости 0,05, то основная

39

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]