![](/user_photo/2706_HbeT2.jpg)
- •Глава xvматематическая статистика § 1. Задачи математической статистики
- •§ 2. Выборочный метод
- •2.1 Генеральная и выборочная совокупности
- •2.2 Статистическое распределение выборки
- •2.3 Эмпирическая функция распределения
- •2.4 Полигон и гистограмма
- •2.5 Оценки математического ожидания
- •2.6 Оценки дисперсии
- •2.7 Общие замечания об оценке параметров статистического распределения
- •2.8 Оценка параметров статистического распределения с точки зрения генеральной совокупности и выборки
- •§ 3. О статистической проверке гипотез
§ 3. О статистической проверке гипотез
Пусть дана случайная величина
и проведено
независимых испытаний этой величины,
в результате чего получены значения
,
,
…,
.
Такое множество называют статистической
совокупностью.
Положим
,
и разделим отрезок
на
равных частей
,
,
…,
.
Пусть
– количество элементов статистической
совокупности, принадлежащих
.
Поставим следующий вопрос: насколько
вероятно предположение о том, что данная
случайная величина
распределена по дифференциальному
закону
?
Этот вопрос решают обычно следующим
образом. Предполагают, что
распределена по закону
.
Тогда событие, состоящее в том, что
результаты
ее испытаний окажутся распределенными
по интервалам
,
,
…,
с помощью чисел
,
,
…,
,
имеет некоторую вероятность
,
зависящую главным образом от гипотетического
распределения
.
Если эта вероятность окажется малой,
то высказанную гипотезу (о распределении
по закону
)
следует опровергнуть. Если же вероятность
окажется близкой к 1, то отвергать
гипотезу нет оснований.
Наряду с понятием статистической
совокупности используют понятие
статистического ряда. Если расположить
интервалы
в порядке возрастания их центров
и для каждого интервала указать
,
то получится статистический ряд.
Статистический ряд гораздо более удобен
для исследований, чем статистическая
совокупность.
Уточнение поставленной задачи заключается
в следующем. Каждому интервалу
соответствует вероятность
того, что случайная величина
примет значение в этом интервале (
теоретическая вероятность, которая
равна
), а также частота наступления этого
события в серии из
испытаний, равная
( эмпирическая вероятность того, что
примет значение в
).
Если сделанная гипотеза справедлива,
то в силу закона больших чисел отклонения
малы при большом количестве испытаний
.
Для выполнения описанной в общих чертах
программы проверки гипотезы необходимо
уметь вычислять вероятности того или
иного отклонения набора теоретических
частот
от набора эмпирических частот
.
Оказывается, что существуют такие
функции от случайных величин
,
,
…,
,
распределение которых не зависит ни от
гипотетического распределения
,
ни от количества испытаний
,
если только оно велико. Среди таких
функций чаще других рассматривают
функцию:
. (1)
Как установлено американским математиком
К. Пирсоном, случайная величина
при больших
распределена по дифференциальному
закону:
(2)
где
– гамма функция.
Функция
табулирована.
Тот факт, что величина
распределена по закону (2), позволяет
вычислить вероятность того, что случайная
величина
принадлежит тому или другому интервалу.
Интерес представляют интервалы
и
.
В случае хорошего совпадения теоретических
и эмпирических частот величина
не будет принимать слишком больших
значений. Поэтому вероятности
в случае справедливости гипотезы должны
быть малы при больших
.
Можно задать некоторую малую вероятность
и найти
такое, что
.
При этом естественно считать, что в
случае, когда полученное из опыта
значение
будет больше, чем
,
гипотезу следует признать противоречащей
опытным данным, в противном случае –
непротиворечащей им. В первом случае
говорят, что гипотеза несостоятельна
на уровне значимости
.
Иногда поступают так. Вычисляют по
формуле (1)
,
а затем по таблицам находят вероятность
того, что случайная величина
превзойдет значение
.
Если вероятность такого события мала
(это значит, что
неправдоподобно велико), то гипотеза
опровергается.
Параметр
в формуле (2) находится из соотношения
, (3)
где – количество интервалов
,
– количество связей, налагаемых на
эмпирические частоты
.
Чаще всего
(
) или
(условия на математическое ожидание и
дисперсию).
Распределение
называют
– распределением с
степенями свободы, а изложенный способ
проверки гипотез –
–критерием Пирсона.
Пример.
Пусть результаты 50 испытаний дали
следующее распределение значений
величины
по интервалам:
|
|
|
|
|
|
|
|
8 |
11 |
9 |
15 |
7 |
50 |
Проверить
гипотезу о равномерном распределении
случайной величины
на отрезке
.
Решение.
,
,
,
,
.
.
По формуле (1) ,
.
По таблице находим, что
,
следовательно, гипотеза опровергается
при уровне значимости более
.