Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика.doc
Скачиваний:
35
Добавлен:
03.05.2019
Размер:
3.12 Mб
Скачать

2.8. Распределение долей признаков

Критерий используют еще в одном простом, но очень распространенном случае.

Пусть выполняются следующие условия:

Генеральную совокупность можно разбить на непересекающиеся классы A1, A2, …, доли которых в генеральной совокупности составляют p1, p2, … .

Имеется выборка объема n, пусть выполняются условия:

np1  5, np2  5, … . (2.11)

Обозначим далее mi  число представителей выборки, попадающих в категорию i, ni  ожидаемое число в каждом классе, вычисленное согласно нулевой гипотезе. Тогда отклонение выборочных значений от ожидаемых вычисляется по формуле

, (2.12)

где суммирование производится по всем классам.

При ранее сформулированных условиях эта статистика подчиняется распределению с k = (r1) степенями свободы, где r  число категорий.

Пример 2.7. Данные о различных заболеваниях, определенные на основе сводных данных за год по всем поликлиникам Москвы, представлены в следующей таблице:

Виды

забол.

Грипп

Сердечно-сосудистые

Кишечные

Онкологические

Травматологические

Иммунные

Доля

34%

18%

12%

10%

15%

11%

В некоторой районной поликлинике Москвы аналогичные данные о частоте заболеваний за тот же период представлены ниже.

Виды

забол.

Грипп

Сердечно-сосудистые

Кишечные

Онкологические

Травматологические

Иммунные

mi

1116

502

341

313

415

413

ni

1054

558

372

310

465

341

Следует поверить, соответствует ли распределение заболеваний в данной поликлинике общей структуре заболеваний?

Решение. Вычислим общее количество заболеваний за год:

n = 1116 + 502 + 341 + 313 + 415 + 413 = 3100.

Найдем предполагаемые значения теоретических частот по каждой категории и внесём их 3-ю строку таблицы. Пусть уровень значимости = 0,01. Для проверки нулевой гипотезы вычислим критерий .

=

.

Поскольку =15,1 и > , то наша гипотеза не принимается. Более подробный анализ слагаемых, из которых состоит сумма наблюдаемых значений критерия, показывает, что основной вклад даёт последнее слагаемое. Районным властям следует обратить внимание на неблагополучную экологическую обстановку, приводящую к росту иммунных заболеваний.

2.9. Сравнение выборочной исправленной дисперсии с заданной дисперсией нормальной генеральной совокупности

Рассмотрим ещё один класс задач, связанный с параметрической проверкой статистических гипотез. в которых применяется критерий .

Рассматривается выборка, предположительно извлечённая из нормально распределённой генеральной совокупности с заданной дисперсией . Однако случайная величина, которой в данном случае является дисперсия, не подчиняется нормальному закону распределения. В этом случае применяется критерий .

На практике нулевая гипотеза Н0: E(S2) = проверяется, если нужно проверить точность приборов, методики контроля ритмичности работы и т.д. В качестве критерия проверки нулевой гипотезы примем случайную величину

.

Здесь S2 - выборочная исправленная дисперсия. Можно показать, что случайная величина К имеет теоретическое распределение с (n - 1)-й степенью свободы.

Итак, по данным эмпирического ряда вычисляется величина

, (2.13)

затем по таблице определяется критическое значение . Если > , то нулевую гипотезу отвергают, т.е. принимают одностороннюю альтернативную гипотезу Н1: S2 > . В противном случае можно считать различие исправленной выборочной дисперсии S2 и гипотетической дисперсии незначимым.

Пример 2.8. Ритмичность работы кассира сбербанка по приёму коммунальных платежей определяется дисперсией времени обслуживания клиентов, которая не должна превышать величины D = 1 мин2. Результаты 30 наблюдений за работой нового кассира приведены в таблице:

Время обслуживания клиента ti

5,5

6,5

7,5

8,5

9,5

10,5

11,5

Число наблюдений n

2

10

11

3

2

1

1

Проверим нулевую гипотезу о допустимой ритмичности работы новичка при уровне значимости 0,05.

Решение. Введем новую переменную и составим вспомогательную таблицу:

ni

2

10

11

3

2

1

1

Среднее

xi = ti-7,5

-2

-1

0

1

2

3

4

0

0

xi2

4

1

0

1

4

9

16

54

1,8

Dв(t) = 1,8 , = = 1,86.

Вычислим статистику по формуле (2.13) и применим критерий .

= = =53,94.

(0,05; 29) = 42,6, > .

Нулевая гипотеза о равенстве дисперсий должна быть отвергнута, следовательно, новый кассир пока ещё не вошёл в требуемый ритм работы.

Рассмотренные примеры применения основных правил проверки статистических гипотез не исчерпывают всех сфер применения указанной теории, являющейся частью более общей теории планирования эксперимента. Дополним вышеперечисленные правила таблицей, позволяющей легче ориентироваться в многообразных задачах проверки параметрических и непараметрических гипотез (см. Таблица 2.1).

Рассмотрим пример применения этой таблицы.

Пример 2.9. Вероятность приобрести выигрышный билет в некоторой лотерее р = 0,2. Предприятие приобрело 100 лотерейных билетов, из которых в результате очередного розыгрыша лотереи оказалось 14 выигрышных билетов. При уровне значимости 0,05 требуется проверить правильность случайной выборки.

Решение. Проверим нулевую гипотезу Н0 о равенстве фактической вероятности выигрыша сотрудника предприятия, приобретшего на предприятии один лотерейный билет, гипотетической вероятности. Согласно таблице критериев проверки статистических гипотез выбираем 4-ую строку таблицы. Критерий проверки имеет вид:

.

Вычислим наблюдаемое значение критерия

= -1,5.

По условию задачи критическая область – двусторонняя. Найдём правую критическую точку из равенства = 0,5 – 0,025 == 0,475, отсюда zкрит = 1,96. Таким образом < zкрит. Следовательно, нет оснований отвергнуть нулевую гипотезу. Наблюдаемая относительная частота 0,14 незначимо отличается от гипотети ческой вероятности 0,2.

п/п

задача

статистика

Теоретическое. распределение

1.

Сравнение выборочной средней с математическим ожиданием нормальной ГС

N(0;1)

H0 принимается, если

2.

Сравнение двух выборочных средних из нормальных ГС с равными n и

- ,, -

3.

Сравнение выборочных средних (две выборки) из нормальных ГС с разными, но заданными и

- ,, -

4

Сравнение доли признака в выборке с вероятностью p

- ,, -

5.

Сравнение выборочных средних (две выборки) с большими и независимыми выборками любого распределения

Приближенный N(0;1)

H0 принимается, если

6.

Сравнение выборочной исправленной дисперсии с заданной норм. ГС

«хи-квадрат»

7.

Сравнение выборочного распределения долей признаков с теоретическим распределением

«хи-квадрат»

8.

Сравнение выборочной гистограммы с плотностью нормального закона

«хи-квадрат»

9.

Сравнение средних (две малые независимые выборки из нормальных ГС) с неизвестными, но равными дисперсиями

Распределение Стьюдента

10.

Сравнение двух дисперсий нормальных ГС

(sx > sy)

Распределение Фишера-

Снедекора