Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statistika.doc
Скачиваний:
8
Добавлен:
13.08.2019
Размер:
7.68 Mб
Скачать

Критерий согласия хи-квадрат

Задача 3.6.

Вернемся к задаче 2.1, которая состояла в построении гистограммы для вариационного ряда распределения значений роста. Гистограмма дает определенную информацию о функции плотности теоретического распределения. В частности, в задаче 2.1 визуально было выявлено, что функция плотности нормального распределения достаточно хорошо аппроксимирует построенную выборку. Однако визуальный подход не может считаться решением задачи. Рассмотрим критерий согласия (хи-квадрат) выборочных данных с гипотезой о типе распределения. Этот критерий основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам нормального распределения. Нулевая гипотеза для этой задачи записывается в форме , где - эмпирическая функция распределения, построенная по имеющимся данным, а - гипотетическая (теоретическая) функция распределения с которой и сравнивается эмпирическая функция. Критерий согласия основан на статистике , где - число интервалов, - количество значений выборки, попавшей в -й интервал, - объем выборки, - теоретическая вероятность попадания изучаемой с.в. в -й интервал. Данная статистика имеет распределение хи-квадрат с степенями свободы. Если при выбранном уровне значимости выполняется , то на уровне значимости гипотеза отклоняется, в противном случае считается, что гипотеза верна. Алгоритм решения задачи можно описать следующим образом:

  1. Выдвинуть гипотезу о виде распределения выборочных данных.

  2. Разбить область значений наблюдаемых данных на интервалов

  3. По выборочным данным построить таблицу частот аналогично тому, как это делалось при построении гистограммы выборки.

  4. Для каждого интервала вычислить теоретические вероятности попадания значения с.в. в этот интервал.

  5. Вычислить статистику

,

представляющую меру расхождения между ожидаемыми (теоретическими) частотами и выборочными частотами

  1. Задать уровень значимости , проверить соотношение

  2. Принять решение о статистической значимости проверяемой гипотезы.

Необходимо проверить гипотезу согласия выборочных данных с функцией нормального распределения для задачи 1.1. На первом этапе по выборке вычисляются выборочные характеристики, которые сводятся в таблицу:

Среднее значение выборки

=СРЗНАЧ()

Стандартное отклонение

=СТАНДАРТОТКЛОНП()

Объем выборки

=СЧЁТ()

Минимальное значение

=МИН()

Максимальное значение

=МАКС()

Длина интервала

6

Уровень значимости

0,05

На основе построенной таблицы строится таблица группировки данных по интервалам и подсчитывается вспомогательная информация для проверки нулевой гипотезы(см. задание 2). Ниже приведен заголовок этой таблицы

Номер интервала

Границы

Частоты

теоретическая функция распределения

Ожидаемые частоты попадания значения с.в. в интервал

значение отклонения наблюдаемых частот от ожидаемых

Построение первых трех столбцов таблицы производится аналогично построениям, проводившимся при построении гистограммы с использованием функции =ЧАСТОТА(). При этом длина интервала, вообще говоря, зависит от выборочных данных. На практике число интервалов можно взять равным и . Для задачи 1.1. значение рекомендуется взять равным 5. При построении теоретической функции распределения можно использовать функцию =НОРМРАСП( ) для каждого значения границы интервала. В результате столбец «теоретическая функция распределения» должен заполниться неубывающей последовательностью чисел (вероятностей) , где - теоретическая вероятность попадания в интервал с номером . Столбец «Ожидаемые частоты попадания значения с.в. в интервал» вычисляется по формуле , где . Для -го интервала вычисляется значение и записывается в столбец «значение отклонения наблюдаемых частот от ожидаемых». Суммированием значений этого столбца получаем значение статистики . Далее это значение необходимо сравнить со значением функции =ХИ2ОБР(уровень значимости, )15 и принять решение о статистической значимости проверяемой гипотезы. Если , то эмпирическое распределение не соответствует нормальному распределению на выбранном уровне значимости, в противном случае нет оснований отрицать это соответствие.

Задача 3.7.

Проверить гипотезу о нормальности распределений для данных из задач 1.2 – 1.6.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]