- •С.Н.Дементьев, а.М.Слиденко, с.О.Стрыгина
- •Воронеж
- •Дементьев с.Н.
- •Часть I. Теория вероятностей Введение
- •Основные понятия
- •Классическое определение вероятности
- •Основные понятия комбинаторики
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Основные понятия
- •Формула Бернулли
- •Формула Пуассона
- •Локальная формула Лапласа
- •Интегральная формула Лапласа
- •Основные понятия
- •Основные понятия Равномерное распределение
- •Показательное (экспоненциальное) распределение
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Пример решения индивидуального задания
- •Основные понятия
- •Распределение Стьюдента ( распределение)
- •Распределение Фишера ( -распределение)
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Часть II. Математическая статистика Введение
- •Основные понятия Методика рациональной организации выборки большого объема
- •Нахождение точечных и интервальных статистических оценок неизвестных числовых характеристик теоретических распределений
- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
- •«Однофакторный дисперсионный анализ»
- •«Однофакторный дисперсионный анализ»
- •Основные понятия
- •Проверка качества модели регрессии с помощью коэффициента детерминации
- •Проверка значимости регрессии по критерию Фишера
- •Построение доверительных интервалов для генеральных параметров регрессии
- •Построение доверительного интервала для прогноза индивидуального значения отклика
- •«Корреляционный и регрессионный анализ»
- •«Корреляционный и регрессионный анализ»
- •Часть III. Примеры лабораторных работ по математической статистике в системе mathcad Темы лабораторных работ и их основные цели
- •Лабораторная работа №1 (листинги 1-5) Распределения, связанные с нормальным законом распределения
- •Лабораторная работа №2 (листинги 6-8) Метод статистических испытаний (метод Монте-Карло)
- •Лабораторная работа №3 (листинги 9-15) Описательные статистики
- •Лабораторная работа №4 (листинги 16-18) Проверка гипотезы о нормальном распределении
- •Лабораторная работа №5 (листинги 19-24) Примеры проверки статистических гипотез
- •Лабораторная работа №6 (листинги 25-27) Однофакторный дисперсионный анализ
- •Лабораторная работа №7 (листинги 28-31) Корреляция и регрессия
- •Продолжение приложения 2
- •Приложение 4
- •Критические точки распределения Фишера
- •Критические точки распределения Фишера
- •Примеры тестовых вопросов по теории вероятностей и математической статистике
- •394087, Воронеж, ул. Мичурина, 1
«Проверка статистических гипотез»
1. Пусть первые столбцы таблиц 1–30 лабораторной работы «Описательные статистики» являются выборками значений нормально распределенного признака , а вторые нормально распределенного признака . Требуется при уровне значимости проверить гипотезу .
2. Если в задании предыдущего пункта нулевая гипотеза о равенстве дисперсий и не была отвергнута, то на тех же выборках при уровне значимости проверить гипотезу о равенстве генеральных средних.
3. По выборкам значений признака из таблиц 130 лабораторной работы «Описательные статистики» проверить при уровне значимости с помощью критерия Пирсона гипотезу о нормальном распределении .
КОНТРОЛЬНЫЕ ВОПРОСЫ К ЛАБОРАТОРНОЙ РАБОТЕ
«Проверка статистических гипотез»
1.Что такое статистическая гипотеза, критерий? Что такое критическая область и область принятия гипотезы?
2.Сформулируйте постановку задачи проверки гипотезы о равенстве генеральных дисперсий двух нормально распределенных признаков и опишите алгоритм ее решения.
3.Сформулируйте постановку задачи проверки гипотезы о равенстве средних двух нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы. Опишите алгоритм ее решения.
4.Сформулируйте постановку задачи проверки гипотезы о нормальном распределении признака с помощью критерия Пирсона. Опишите алгоритм ее решения.
5.Приведите пример первых четырех интервалов выборочного распределения признака, подготовленного для использования критерия Пирсона. Как ищется, например, ?
6.Пусть проверяется гипотеза о нормальном распределении признака, причем (здесь m итоговое число частичных интервалов после подготовки выборочного распределения к использованию критерия Пирсона). Какой вывод следует сделать?
Тема 12. |
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ |
Основные понятия
При изучении различных явлений или процессов важно выяснить, в какой мере существенно влияние того или иного фактора, а также их комбинаций на рассматриваемый признак. Ведь средние значения наблюдаемых величин при проведении любого эксперимента меняются не только в связи с изменением уровней факторов (как количественных, так и качественных), определяющих условия проведения опытов, но и из-за наличия случайных причин, отражающихся на проведении экспериментов и их результатах. Задачей дисперсионного анализа является изучение степени влияния различных факторов на изменчивость средних.
Выдающийся английский математик-статистик Р.А.Фишер определил в 1925 году дисперсионный анализ как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”. Основной принцип, лежащий в основе дисперсионного анализа, заключается в разложении суммы квадратов отклонений от общего среднего на составляющие, обусловленные независимыми факторами. При этом с помощью каждой из составляющих получается оценка дисперсии генеральной совокупности. Проверка значимости влияния того или иного фактора проводится путем сравнения выборочной дисперсии, соответствующей этому фактору, с дисперсией, обусловленной случайными факторами (остаточной дисперсией). Для этого вычисляется эмпирическое значение критерия Фишера-Снедекора и сравнивается с табличным значением этого критерия (приложение 5). В случае если вычисленное по результатам наблюдений значение критерия Фишера-Снедекора окажется меньше табличного, оснований считать влияние рассматриваемого фактора значимым нет. В противном случае рассматриваемый фактор признается статистически значимым, т.е. существенно влияющим на изменчивость средних.
Отметим, что при выполнении процедуры дисперсионного анализа считаются выполненными следующие предположения:
а) случайные ошибки наблюдений имеют нормальное распределение с нулевым математическим ожиданием;
б) эксперименты считаются равноточными, дисперсия наблюдений постоянна и равна .
Сформулируем в общем виде задачу и алгоритм однофакторного дисперсионного анализа.
Пусть исследуется влияние одного количественного или качественного фактора на нормально распределенную случайную величину (признак) . Предположим, что фактор фиксируется на уровнях и на каждом уровне в одинаковых условиях с одинаковой степенью точности проведена серия из наблюдений над , результаты которых представлены таблицей:
Уровни фактора A |
|||||
|
|
... |
|
... |
|
|
|
… |
|
… |
|
|
|
… |
|
... |
|
... |
... |
... |
... |
... |
... |
|
|
... |
|
... |
|
Пусть общее число наблюдений
.
Положим
, , (12.1)
Сформулируем нулевую гипотезу «влияние фактора незначимо» и выберем уровень значимости .
Для проверки нулевой гипотезы необходимо реализовать следующий алгоритм действий.
1. Вычислить суммы квадратов:
= факторная, или межгрупповая, сумма квадратов;
= остаточная, или внутригрупповая, сумма квадратов.
2. Найти соответствующие этим суммам числа степеней свободы:
; .
3. Вычислить дисперсии:
; .
4. Вычислить -отношение ( ):
.
5. Сравнить с табличным значением:
,
где заданный уровень значимости.
Если , влияние фактора статистически значимо (нулевая гипотеза отвергается).
Если , то при заданном уровне значимости нет оснований отвергнуть нулевую гипотезу (влияние фактора статистически не значимо).
Результаты дисперсионного анализа принято представлять в виде таблицы 12.1.
Таблица 12.1
Дисперсионный анализ данных (общая форма)
Источник вариации |
Суммы квадратов ( ) |
Числа степеней свободы ( ) |
Дисперсии (средние квадраты) |
F-отношение ( ) |
Между группами |
|
|
|
|
Внутри групп |
|
|
|
|
Общий |
|
|
|
Отметим, что в таблице 12.1
и
Наряду с оценкой достоверности (значимости) влияния фактора дисперсионный анализ позволяет оценить и силу этого влияния. Показателем силы влияния фактора служит величина
,
которая характеризует долю вариации, обусловленной влиянием фактора, в общей вариации признака.
Пример 12.1. Оценивались технологические показатели рыхления почвообрабатывающим рабочим органом. Для трех скоростей обработки (м/с) получены следующие данные о глубине рыхления (мм):
|
Скорость обработки, м/с |
||
|
1.1 |
1.7 |
2.0 |
Глубина рыхления, мм |
62 67 74 75 |
80 75 76 84 |
85 80 77 81 |
Сумма |
278 |
315 |
323 |
Определим, существенны ли различия в средней глубине рыхления почвы на различных скоростях ее обработки исследуемым почвообрабатывающим рабочим органом (иначе говоря, значимо ли влияние фактора “скорость обработки почвы” на показатель “глубина рыхления”).
Решение. Задаемся уровнем значимости = 0.05 и вычисляем групповые средние, групповые дисперсии, общее среднее по формулам (12.1):
Далее проводим вычисления по предложенной выше схеме.
1. Находим факторную (межгрупповую) и остаточную (внутригрупповую) суммы квадратов:
=
=
2. Находим числа степеней свободы:
3. Вычисляем дисперсии (средние квадраты):
4. Находим F-отношение:
5. По таблицам приложения 5 ищем :
Таким образом, в итоге получены результаты, которые в соответствии с таблицей 12.1 могут быть представлены в следующем виде:
Источник рассеяния |
Суммы квадратов |
Числа степеней свободы |
Дисперсии (средние квадраты) |
F- отношение ( ) |
|
Между группами
Внутри групп
|
288,17
196,52
|
2
9
|
144,08
21,84 |
6,60 |
4,26
|
Общий |
484,69 |
11 |
|
Поскольку , то при уровне значимости делаем вывод о значимости влияния скорости вспашки рассматриваемым почвообрабатывающим рабочим органом на глубину рыхления почвы.
Завершая решение примера, определим силу влияния фактора на результативный признак. Для этого вычисляем отношение
В ы в о д. Влиянием фактора обусловлено 59% общей вариации признака.
ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ К ЛАБОРАТОРНОЙ РАБОТЕ