Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 11 Дисперсионный анализ.rtf
Скачиваний:
61
Добавлен:
06.06.2015
Размер:
2.96 Mб
Скачать

Тема 11 Дисперсионный анализ

§ 11.1 Сущность метода. Основные понятия и термины

Сущность метода. Наряду с относительно простыми способами сравнения одной выборки с другой в исследовательской работе встречаются и более сложные задачи, когда приходится сравнивать одновременно несколько выборок, объединяемых в единый статистический комплекс. В таких случаях метод попарных сравнений выборочных характеристик оказывается обременительным, требующим большой вычислительной работы. Учитывая это обстоятельство, Р. Фишер в 1925 г. предложил метод комплексной оценки сравниваемых средних, получивший название дисперсионного анализа. Этот метод основан на разложении общей дисперсии статистического комплекса на составляющие ее компоненты, сравнивая которые друг с другом посредством F-критерия можно определить, какую долю общей вариации учитываемого (результативного) признака обуславливает действие на него как регулируемых, так и не регулируемых в опыте факторов.

Внутри каждой группы, входящей в статистический (дисперсионный) комплекс, тоже обнаруживается варьирование, вызванное влиянием на признак не регулируемых в опыте факторов. Зависимость между этими источниками варьирования выразится следующим равенством

, (11.1)

где Dx – межгрупповая девиата, определяемая выражением

; (11.2)

De – внутригрупповая девиата, которая находится по следующей формуле

; (11.3)

Dy – общая девиата, определяемая по формуле

. (11.4)

Здесь a – общее число групповых средних ,– общая средняя комплекса,n – число вариант в группе, – общее число вариант комплекса.

Выборочные дисперсии определяются делением девиат на число степеней свободы, т.е.

,

,

,

которые в свою очередь служат оценками соответствующих генеральным параметров: S2y является оценкой общей дисперсии всего комплекса σ2y; S2х – оценкой межгрупповой, или факториальной, дисперсии σ2х; S2е – оценкой внутригрупповой, или остаточной, дисперсии σ2е.

Критерием оценки влияния регулируемых в опыте факторов на результирующий признак является следующее отношение при.

Нулевая гипотеза сводится к предположению, что генеральные межгрупповые средние и дисперсии равны между собой и различия, наблюдаемые между выборочными показателями, вызваны случайными причинами, а не влиянием на признак регулируемых факторов. Нулевую гипотезу отвергают, если для принятого уровня значимостиα и чисел степеней свободы kx и ke, и принимают, если ; при этом различия, наблюдаемые между групповыми средними комплекса, принимают статистически недостоверными.

После того как действие регулируемого фактора, нескольких факторов или их совместного действия на признака будет доказано, т.е. окажется статистически достоверным, переходят к сравнительной оценке групповых средних. Заключительным этапом дисперсионного анализа является оценка силы влияния отдельных факторов или их совместного действия на признак.

Дисперсионный анализ, как метод одновременных сравнений выборочных средних, предъявляет требования к группировке выборочных данных и к планированию наблюдений. Результаты наблюдений, подлежащие дисперсионному анализу, группируют с учетом градации каждого регулируемого фактора, воздействующего на признак.

Правильное применение дисперсионного анализа предполагает также нормальное или близкое к нормальному распределению совокупности, из которой взяты выборки, объединяемые в дисперсионный комплекс. При этом важно, чтобы дисперсии выборочных групп были одинаковыми или не очень сильно отличались друг от друга. Кроме того, в группах комплекса должно быть одинаковое или пропорциональное число вариант.

Дисперсионный анализ возник в процессе усовершенствования методики сельскохозяйственного опытного дела. Однако вскоре его стали применять не только в биологии и смежных с ней областях знаний, но и в технике, а затем в психологии и педагогике.

Дисперсионный анализ характеризуется строгой логичностью и последовательностью вычислительных операций. Ценность этого метода заключается в том, что он позволяет выявить и суммарное действие факторов, и действие каждого регулируемого в опыте фактора в отдельности, и действие различных сочетаний факторов друг с другом на результативный признак.

Основные понятия и символы. Признаки, изменяющиеся под воздействием тех или иных причин, называют результативными. Причины, вызвавшие изменение величины результативного признака или признаков, называют факторами. Факторы обозначаются прописными начальными буквами латинского алфавита (A, B, C, …), учитываемые признаки – конечными (X, Y, Z).

Существует много факторов, воздействующих на один и тот же признак. В опыте регулируются лишь некоторые из них, их называют регулируемыми или организованными факторами в отличие от факторов, которые не подвергаются регулированию, хотя и оказывают воздействие на величину результативного признак. Обычно каждый регулируемый фактор испытывают серийно, т.е. в виде нескольких независимых друг от друга групп или градаций.

Градации принято обозначать теми же буквами, что и факторы, но с индексом номера градации. Например, градации фактора А обозначают через А1, А2, А3 и т.д. Число градации того или иного фактора определяется условиями опыта. Результативные признаки также могут иметь свои градации, на которых испытывают действие регулируемых факторов.

Выше было указано, что дисперсионный анализ позволяет учитывать различные сочетания действия регулируемых факторов на результативный признак. Эти свойства не распространяются на не регулируемые в опыте факторы, действие которых на признак учитывают не дифференцированно, а суммарно. При этом дисперсионный анализ позволяет выражать учитываемые признаки не только в абсолютными единицами измерения и счета, но и в баллах, индексах и других относительных и условных единицах.

Условия образования и виды дисперсионных комплексов. Статистические, или дисперсионные, комплексы могут формироваться как в планах намечаемых исследований, так и на основании уже собранных данных, подвергаемых дисперсионному анализу. При образовании дисперсионных комплексов необходимо соблюдать два важных условия, гарантирующих правильное применение дисперсионного анализа:

  1. Действующие на признак регулируемые факторы должны быть независимыми друг от друга.

  2. Выборки, группируемые в статистический комплекс, должны производиться по принципу рандомизации, т.е. способом случайного отбора из нормально распределяющейся совокупности.

Структуру дисперсионного комплекса определяют число градаций регулируемого фактора или факторов, а также число подразделений или групп, образуемых по результативному признаку. Форму дисперсионного комплекса задают таблицей, в которой число строк соответствует числу подразделений результативного признака, а число столбцов равно числу градаций регулируемого фактора или нескольких факторов с их градациями.

Если испытывают действие на признак одного регулируемого фактора, дисперсионный комплекс будет однофакторным, если одновременно исследуют действие на признак двух, трех или большего числа регулируемых факторов, комплекс называют двух-, трех- и многофакторным. Числовые значения результативного признака, т.е. варианты, могут распределяться по градациям комплекса равномерно, пропорционально и неравномерно, поэтому дисперсионные комплексы называют равномерными, пропорциональными и неравномерными. Равномерные и пропорциональные комплексы носят общее название ортогональные, а неравномерные комплексы называют неортогональными.

В ортогональных комплексах осуществляется равенство ; в двухфакторных –; в неортогональных комплексах это равенство нарушается. Эту особенность следует учитывать при планировании опыта, а при проведении дисперсионного анализа – стремиться к тому, чтобы в градациях многофакторного комплекса были одинаковые или пропорциональные числа вариант, что значительно облегчает и упрощает вычислительную работу.