Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций целиком_.doc
Скачиваний:
13
Добавлен:
09.09.2019
Размер:
1.43 Mб
Скачать

Лекция № 8

План лекции

1.2. Графическое изображение и основные характеристики вариационного ряда.

1.2.2. Основные показатели (характеристики) ряда распределения.

1.2.2.8. Критерии согласия эмпирического и теоретического

распределений.

1.2.2.8. Критерии согласия эмпирического и теоретического распределений.

Критерии согласия используют для проверки правильности выбора изученного теоретического закона для описания эмпирического распределения. Они основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и теоретической функцией распределения признака в генеральной совокупности.

Одним из наиболее часто употребляемых критериев согласия является критерий «хи-квадрат» ( ), предложенный К. Пирсоном,

, (1.42)

где и - соответственно частоты эмпирического и теоретического распределений в -том интервале.

Чем больше разность между наблюдаемыми и теоретическими частотами, тем больше расчетная величина критерия Пирсона. Чтобы отличить существенные (значимые) значения от значений, которые могут возникнуть в результате случайностей выборки, рассчитанное значение критерия сравнивается с табличным значением при соответствующем числе степеней свободы и заданном уровне значимости. Уровень значимости выбирается таким образом, что (величина принимается равной 0,05 или 0,01).

При определении значения критерия Пирсона по данным конкретной выборки, можно встретиться с такими вариантами:

1) , т. е. попадает в критическую область. Это означает, что расхождение между теоретическими и эмпирическими частотами существенно и его нельзя объяснить случайными колебаниями выборочных данных. В таком случае гипотеза о близости эмпирического распределения к нормальному отвергается.

2) , т. е. рассчитанный критерий не превышает максимально возможную величину расхождений эмпирических и теоретических частот, которая может возникнуть в силу случайных колебаний выборочных данных. В этом случае гипотеза о близости эмпирического распределения к нормальному не отвергается.

Как уже указывалось, табличное значение критерия Пирсона определяется при фиксированном уровне значимости и соответствующем числе степеней свободы.

Число степеней свободы равно , где - число условий, которые предполагаются выполненными при вычислении теоретических частот, - число групп.

Так как при вычислении теоретических частот нормального распределения в качестве оценок генеральной средней и дисперсии используются соответствующие выборочные характеристики, то для проверки гипотезы о нормальности распределения число степеней свободы равно . При расчете критерия Пирсона нужно соблюдать следующие условия: 1) число наблюдений должно быть достаточно велико, во всяком случае ; 2) если теоретические частоты в некоторых интервалах меньше 5, то такие интервалы объединяют так, чтобы частоты были более 5.

Воспользуемся данными примера приведенного в табл. 1.4, для расчета критерия «хи-квадрат», предварительно округлив теоретические частоты в строке 8 табл. 1.4, а также объединив частоты двух первых и трех последних интервалов, выполняя требование . После таких предварительных расчетов получают частоты эмпирического и теоретического распределений, приведенные в табл. 1.6. Число степеней свободы равно: 7-3=4. При уровне значимости 0,05 и числе степеней свободы 4 значение критерия Пирсона по соответствующей статистической таблице определяют .

Таблица 1.6.

Номер

интервала

Эмпирические

частоты

Теоретические

частоты

1

5

6

1

0,17

2

12

8

16

2,00

3

12

13

1

0,08

4

15

15

0

0,00

5

9

13

16

1,23

6

9

9

0

0,00

7

9

7

4

0,57

Итого

71

71

4,05

Таким образом, расчетное значение критерия Пирсона не превышает табличного значения при , т. е. проведенный расчет дает право не отвергать гипотезу о нормальном характере эмпирического распределения.

Используя величину , В.И. Романовский предложил оценку близости эмпирического распределения к теоретической кривой нормального распределения производить по отношению:

, (1.43)

где - число групп, а величина равна числу степеней свободы при вычислении частот нормального распределения. Если отношение

, (1.44)

то расхождение частот эмпирического распределения и рассчитанных теоретических частот нормального распределения нельзя признать случайным, и гипотезу о нормальном законе распределения следует отвергнуть. Если

, (1.45)

то возможно принять гипотезу о нормальном характере эмпирического распределения. Продолжая рассмотренный выше пример, рассчитаем критерий В.И. Романовского.

.

Так как рассчитанное отношение значительно меньше трех, следует принять гипотезу о нормальности эмпирического распределения.

Следующий весьма распространенный критерий согласия – критерий А.Н. Колмогорова. Для определения соответствия между теоретическим и эмпирическим распределениями академик А.Н. Колмогоров предложил рассматривать максимальную разность между значениями интегральной функции теоретического распределения и значениями интегральной функции эмпирического распределения .

Обозначим символом абсолютную величину максимальной разности и , т. е. . А.Н. Колмогоров установил, что когда неограниченно возрастает, вероятность того, что будет меньше величины , приближается к значениям функции.

т. е. . (1.46)

По таблицам вероятностей можно найти величину , соответствующую данной величине вероятности . Если известен объем выборки, можно рассчитать соотношение . Величина , рассчитанная по данным выборки, сравнивается с величиной .

Если , то с вероятностью можно считать, что рассматриваемое распределение соответствует нормальному закону.

Если же , то вероятность того, что гипотеза о соответствии теоретического и эмпирического распределений верна, определяется величиной .

Так как величину выбирают равной 0,95 или 0,99, то . В силу малой вероятности такого события гипотеза о нормальном характере эмпирического распределения отвергается.

Приведем краткую выдержку из таблицы значений функции А.Н. Колмогорова:

Таблица 1.7.

1,23

1,36

1,63

1,80

2,00

0,9030

0,9505

0,9902

0,9970

0,9993

Покажем расчет критерия А.Н. Колмогорова на рассмотренном ранее примере, результаты расчета приведены в табл. 1.8.

Таблица 1.8.

Номер

интервала

Частоты

Частоты

абсолютные

накопленные

Частоты

отностельные

накопленные

эмпири-

ческие

теорети-

ческие

эмпири-

ческие

теорети-

ческие

эмпири-

ческие

теорети-

ческие

1

2

3

4

5

6

7

8

9

1

5

6

5

6

0,0704

0,0845

0,0141

1

2

12

8

17

14

0,2394

0,1972

0,0422

3

3

12

13

29

27

0,4085

0,3803

0,0282

2

4

15

15

44

42

0,6197

0,5915

0,0282

2

5

9

13

53

55

0,7465

0,7746

0,0281

2

6

9

9

62

64

0,8732

0,9014

0,0282

2

7

9

7

71

71

1,0000

1,0000

0,0000

0

Наибольшая по абсолютной величине разность накопленных относительных частот соответствует (столбец 8).

Принимая уровень значимости , т. е. при доверительной вероятности , по таблицам значений функций А.Н. Колмогорова находим , и, следовательно, для величина равна 0,1614. Вероятность того, что была установлена нами равной 0,05 ( ). Такой результат является практически невозможным, когда проверяемая гипотеза о соответствии эмпирического распределения нормальному закону верна. Поскольку величина , рассчитанная по данным приводимого примера, получилась меньше величины , с вероятностью 95 % принимается гипотеза о нормальности эмпирического распределения.

Для расчета функции (критерия Колмогорова) можно использовать и максимальную разность абсолютных накопленных частот, т. е. величину . Тогда между и будет соотношение: , т. е. . Максимальная величина разности абсолютных накопленных частот равна 3 (столбец 9). Величина , соответствующая равна 1,36. Следовательно, для величина равна 11,4594. Так как значение меньше , то можно считать, что результаты выборки не противоречат предположению о нормальном характере распределения исследуемого признака.