- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
«Проверка статистических гипотез»
1. Пусть первые столбцы таблиц 1–30 лабораторной работы «Описательные статистики» являются выборками значений нормально распределенного признака , а вторые нормально распределенного признака . Требуется при уровне значимости проверить гипотезу .
2. Если в задании предыдущего пункта нулевая гипотеза о равенстве дисперсий и не была отвергнута, то на тех же выборках при уровне значимости проверить гипотезу о равенстве генеральных средних.
3. По выборкам значений признака из таблиц 130 лабораторной работы «Описательные статистики» проверить при уровне значимости с помощью критерия Пирсона гипотезу о нормальном распределении .
КОНТРОЛЬНЫЕ ВОПРОСЫ К ЛАБОРАТОРНОЙ РАБОТЕ
«Проверка статистических гипотез»
Что такое статистическая гипотеза, критерий? Что такое критическая область и область принятия гипотезы?
Сформулируйте постановку задачи проверки гипотезы о равенства генеральных дисперсий двух нормально распределенных признаков и опишите алгоритм ее решения.
Сформулируйте постановку задачи проверки гипотезы о равенстве средних двух нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы. Опишите алгоритм ее решения.
Сформулируйте постановку задачи проверки гипотезы о нормальном распределении признака с помощью критерия Пирсона. Опишите алгоритм ее решения.
Приведите пример первых четырех интервалов выборочного распределения признака, подготовленного для использования критерия Пирсона. Как ищется, например, ?
Пусть проверяется гипотеза о нормальном распределении признака, причем (здесь m итоговое число частичных интервалов после подготовки выборочного распределения к использованию критерия Пирсона). Какой вывод следует сделать?
Тема 12. |
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ |
Основные понятия
При изучении различных явлений или процессов важно выяснить, в какой мере существенно влияние того или иного фактора, а также их комбинаций на рассматриваемый признак. Ведь средние значения наблюдаемых величин при проведении любого эксперимента меняются не только в связи с изменением уровней факторов (как количественных, так и качественных), определяющих условия проведения опытов, но и из-за наличия случайных причин, отражающихся на проведении экспериментов и их результатах. Задачей дисперсионного анализа является изучение степени влияния различных факторов на изменчивость средних.
Выдающийся английский математик-статистик Р.А.Фишер определил в 1925 году дисперсионный анализ как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”. Основной принцип, лежащий в основе дисперсионного анализа, заключается в разложении суммы квадратов отклонений от общего среднего на составляющие, обусловленные независимыми факторами. При этом с помощью каждой из составляющих получается оценка дисперсии генеральной совокупности. Проверка значимости влияния того или иного фактора проводится путем сравнения выборочной дисперсии, соответствующей этому фактору, с дисперсией, обусловленной случайными факторами (остаточной дисперсией). Для этого вычисляется эмпирическое значение критерия Фишера-Снедекора и сравнивается с табличным значением этого критерия (приложение 5). В случае если вычисленное по результатам наблюдений значение критерия Фишера-Снедекора окажется меньше табличного, оснований считать влияние рассматриваемого фактора значимым нет. В противном случае рассматриваемый фактор признается статистически значимым, т.е. существенно влияющим на изменчивость средних.
Отметим, что при выполнении процедуры дисперсионного анализа считаются выполненными следующие предположения:
а) случайные ошибки наблюдений имеют нормальное распределение с нулевым математическим ожиданием;
б) эксперименты считаются равноточными, дисперсия наблюдений постоянна и равна .
Сформулируем в общем виде задачу и алгоритм однофакторного дисперсионного анализа.
Пусть исследуется влияние одного количественного или качественного фактора на нормально распределенную случайную величину (признак) . Предположим, что фактор фиксируется на уровнях и на каждом уровне в одинаковых условиях с одинаковой степенью точности проведена серия из наблюдений над , результаты которых представлены таблицей:
Уровни фактора A |
|||||
|
|
... |
|
... |
|
|
|
… |
|
… |
|
|
|
… |
|
... |
|
... |
... |
... |
... |
... |
... |
|
|
... |
|
... |
|
Пусть общее число наблюдений
.
Положим
, , (12.1)
Сформулируем нулевую гипотезу «влияние фактора незначимо» и выберем уровень значимости .
Для проверки нулевой гипотезы необходимо реализовать следующий алгоритм действий.
1. Вычислить суммы квадратов
= факторная или межгрупповая сумма квадратов;
= остаточная или внутригрупповая сумма квадратов.
2. Найти соответствующие этим суммам числа степеней свободы
; .
3. Вычислить дисперсии
; .
4. Вычислить -отношение ( ):
.
5. Сравнить с табличным значением
,
где заданный уровень значимости.
Если , влияние фактора статистически значимо (нулевая гипотеза отвергается).
Если , то при заданном уровне значимости нет оснований отвергнуть нулевую гипотезу (влияние фактора статистически не значимо).
Результаты дисперсионного анализа принято представлять в виде таблицы 12.1.
Таблица 12.1
Дисперсионный анализ данных (общая форма)
Источник вариации |
Суммы квадратов ( ) |
Числа степеней свободы ( ) |
Дисперсии (средние квадраты) |
F-отношение ( ) |
Между группами |
|
|
|
|
Внутри Групп |
|
|
|
|
Общий |
|
|
|
Отметим, что в таблице 12.1
и
Наряду с оценкой достоверности (значимости) влияния фактора дисперсионный анализ позволяет оценить и силу этого влияния. Показателем силы влияния фактора служит величина
,
которая характеризует долю вариации, обусловленной влиянием фактора, в общей вариации признака.
Пример 12.1. Оценивались технологические показатели рыхления почвообрабатывающим рабочим органом. Для трех скоростей обработки (м/с) получены следующие данные о глубине рыхления (мм):
|
Скорость обработки, м/с |
||
|
1.1 |
1.7 |
2.0 |
Глубина рыхления, мм |
62 67 74 75 |
80 75 76 84 |
85 80 77 81 |
Сумма |
278 |
315 |
323 |
Определим, существенны ли различия в средней глубине рыхления почвы на различных скоростях ее обработки исследуемым почвообрабатывающим рабочим органом (иначе говоря, значимо ли влияние фактора “скорость обработки почвы” на показатель “глубина рыхления”).
Решение. Задаемся уровнем значимости = 0.05 и вычисляем групповые средние, групповые дисперсии, общее среднее по формулам (12.1):
Далее проводим вычисления по предложенной выше схеме.
1. Находим факторную (межгрупповую) и остаточную (внутригрупповую) суммы квадратов:
=
=
2. Находим числа степеней свободы:
3. Вычисляем дисперсии (средние квадраты):
4. Находим F-отношение:
5. По таблицам приложения 5 ищем :
Таким образом, в итоге получены результаты, которые в соответствии с таблицей 12.1 могут быть представлены в следующем виде:
Источник рассеяния |
Суммы квадратов |
Числа степеней свободы |
Дисперсии (средние квадраты) |
F- отношение ( ) |
|
Между группами
Внутри групп
|
288.17
196.52
|
2
9
|
144.08
21.84 |
6.60 |
4.26
|
Общий |
484.69 |
11 |
|
Поскольку , то при уровне значимости делаем вывод о значимости влияния скорости вспашки рассматриваемым почвообрабатывающим рабочим органом на глубину рыхления почвы.
Завершая решение примера, определим силу влияния фактора на результативный признак. Для этого вычисляем отношение
В ы в о д. Влиянием фактора обусловлено 59% общей вариации признака.