- •Утверждаю
- •Одномерный статистический анализ Лекция № 1
- •Введение.
- •Генеральная совокупность значений
- •1.1.1. Погрешности (ошибки) результатов (наблюдений) при проведении исследований.
- •1.1.2. Типы выборок при использовании статистических методов управления качеством продукции.
- •Лекция № 2
- •1.1.3. Однородность и репрезентативность выборки.
- •1.1.4. Среднее и дисперсия выборки.
- •Лекция № 3
- •1.1.5. Средняя квадратическая ошибка выборки
- •1.1.6. Определение необходимой численности выборки.
- •1.1.7. Малые выборки.
- •1.2. Графическое изображение и основные характеристики вариационного ряда. Лекция № 4
- •1.2.1. Графическое изображение рядов распределения.
- •- Тарифный разряд рабочего; - число рабочих (частота).
- •Теоретической кривой нормального распределения.
- •- Тарифный разряд рабочего; - число рабочих (накопленная частота).
- •1.2.2. Основные показатели (характеристики) ряда распределения.
- •Лекция № 5
- •Относительное линейное отклонение
- •Коэффициент вариации
- •Лекция № 6
- •И отрицательным (справа) эксцессом.
- •В зависимости от расстояния от среднего значения.
- •Лекция № 7
- •Лекция № 8
- •1.3. Виды статистических оценок параметров распределения. Лекция № 9
- •1.4. Дополнительные показатели распределения:
- •Контрольные вопросы по разделу 1.
Лекция № 8
План лекции
1.2. Графическое изображение и основные характеристики вариационного ряда.
1.2.2. Основные показатели (характеристики) ряда распределения.
1.2.2.8. Критерии согласия эмпирического и теоретического
распределений.
1.2.2.8. Критерии согласия эмпирического и теоретического распределений.
Критерии согласия используют для проверки правильности выбора изученного теоретического закона для описания эмпирического распределения. Они основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и теоретической функцией распределения признака в генеральной совокупности.
Одним из наиболее часто употребляемых критериев согласия является критерий «хи-квадрат» ( ), предложенный К. Пирсоном,
, (1.42)
где и - соответственно частоты эмпирического и теоретического распределений в -том интервале.
Чем больше разность между наблюдаемыми и теоретическими частотами, тем больше расчетная величина критерия Пирсона. Чтобы отличить существенные (значимые) значения от значений, которые могут возникнуть в результате случайностей выборки, рассчитанное значение критерия сравнивается с табличным значением при соответствующем числе степеней свободы и заданном уровне значимости. Уровень значимости выбирается таким образом, что (величина принимается равной 0,05 или 0,01).
При определении значения критерия Пирсона по данным конкретной выборки, можно встретиться с такими вариантами:
1) , т. е. попадает в критическую область. Это означает, что расхождение между теоретическими и эмпирическими частотами существенно и его нельзя объяснить случайными колебаниями выборочных данных. В таком случае гипотеза о близости эмпирического распределения к нормальному отвергается.
2) , т. е. рассчитанный критерий не превышает максимально возможную величину расхождений эмпирических и теоретических частот, которая может возникнуть в силу случайных колебаний выборочных данных. В этом случае гипотеза о близости эмпирического распределения к нормальному не отвергается.
Как уже указывалось, табличное значение критерия Пирсона определяется при фиксированном уровне значимости и соответствующем числе степеней свободы.
Число степеней свободы равно , где - число условий, которые предполагаются выполненными при вычислении теоретических частот, - число групп.
Так как при вычислении теоретических частот нормального распределения в качестве оценок генеральной средней и дисперсии используются соответствующие выборочные характеристики, то для проверки гипотезы о нормальности распределения число степеней свободы равно . При расчете критерия Пирсона нужно соблюдать следующие условия: 1) число наблюдений должно быть достаточно велико, во всяком случае ; 2) если теоретические частоты в некоторых интервалах меньше 5, то такие интервалы объединяют так, чтобы частоты были более 5.
Воспользуемся данными примера приведенного в табл. 1.4, для расчета критерия «хи-квадрат», предварительно округлив теоретические частоты в строке 8 табл. 1.4, а также объединив частоты двух первых и трех последних интервалов, выполняя требование . После таких предварительных расчетов получают частоты эмпирического и теоретического распределений, приведенные в табл. 1.6. Число степеней свободы равно: 7-3=4. При уровне значимости 0,05 и числе степеней свободы 4 значение критерия Пирсона по соответствующей статистической таблице определяют .
Таблица 1.6.
Номер интервала |
Эмпирические частоты |
Теоретические частоты |
|
|
1 |
5 |
6 |
1 |
0,17 |
2 |
12 |
8 |
16 |
2,00 |
3 |
12 |
13 |
1 |
0,08 |
4 |
15 |
15 |
0 |
0,00 |
5 |
9 |
13 |
16 |
1,23 |
6 |
9 |
9 |
0 |
0,00 |
7 |
9 |
7 |
4 |
0,57 |
Итого |
71 |
71 |
|
4,05 |
Таким образом, расчетное значение критерия Пирсона не превышает табличного значения при , т. е. проведенный расчет дает право не отвергать гипотезу о нормальном характере эмпирического распределения.
Используя величину , В.И. Романовский предложил оценку близости эмпирического распределения к теоретической кривой нормального распределения производить по отношению:
, (1.43)
где - число групп, а величина равна числу степеней свободы при вычислении частот нормального распределения. Если отношение
, (1.44)
то расхождение частот эмпирического распределения и рассчитанных теоретических частот нормального распределения нельзя признать случайным, и гипотезу о нормальном законе распределения следует отвергнуть. Если
, (1.45)
то возможно принять гипотезу о нормальном характере эмпирического распределения. Продолжая рассмотренный выше пример, рассчитаем критерий В.И. Романовского.
.
Так как рассчитанное отношение значительно меньше трех, следует принять гипотезу о нормальности эмпирического распределения.
Следующий весьма распространенный критерий согласия – критерий А.Н. Колмогорова. Для определения соответствия между теоретическим и эмпирическим распределениями академик А.Н. Колмогоров предложил рассматривать максимальную разность между значениями интегральной функции теоретического распределения и значениями интегральной функции эмпирического распределения .
Обозначим символом абсолютную величину максимальной разности и , т. е. . А.Н. Колмогоров установил, что когда неограниченно возрастает, вероятность того, что будет меньше величины , приближается к значениям функции.
т. е. . (1.46)
По таблицам вероятностей можно найти величину , соответствующую данной величине вероятности . Если известен объем выборки, можно рассчитать соотношение . Величина , рассчитанная по данным выборки, сравнивается с величиной .
Если , то с вероятностью можно считать, что рассматриваемое распределение соответствует нормальному закону.
Если же , то вероятность того, что гипотеза о соответствии теоретического и эмпирического распределений верна, определяется величиной .
Так как величину выбирают равной 0,95 или 0,99, то . В силу малой вероятности такого события гипотеза о нормальном характере эмпирического распределения отвергается.
Приведем краткую выдержку из таблицы значений функции А.Н. Колмогорова:
Таблица 1.7.
|
1,23 |
1,36 |
1,63 |
1,80 |
2,00 |
|
0,9030 |
0,9505 |
0,9902 |
0,9970 |
0,9993 |
Покажем расчет критерия А.Н. Колмогорова на рассмотренном ранее примере, результаты расчета приведены в табл. 1.8.
Таблица 1.8.
Номер интервала |
Частоты |
Частоты абсолютные накопленные |
Частоты отностельные накопленные |
|
|
|||
эмпири- ческие
|
теорети- ческие
|
эмпири- ческие
|
теорети- ческие
|
эмпири- ческие
|
теорети- ческие
|
|||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
5 |
6 |
5 |
6 |
0,0704 |
0,0845 |
0,0141 |
1 |
2 |
12 |
8 |
17 |
14 |
0,2394 |
0,1972 |
0,0422 |
3 |
3 |
12 |
13 |
29 |
27 |
0,4085 |
0,3803 |
0,0282 |
2 |
4 |
15 |
15 |
44 |
42 |
0,6197 |
0,5915 |
0,0282 |
2 |
5 |
9 |
13 |
53 |
55 |
0,7465 |
0,7746 |
0,0281 |
2 |
6 |
9 |
9 |
62 |
64 |
0,8732 |
0,9014 |
0,0282 |
2 |
7 |
9 |
7 |
71 |
71 |
1,0000 |
1,0000 |
0,0000 |
0 |
Наибольшая по абсолютной величине разность накопленных относительных частот соответствует (столбец 8).
Принимая уровень значимости , т. е. при доверительной вероятности , по таблицам значений функций А.Н. Колмогорова находим , и, следовательно, для величина равна 0,1614. Вероятность того, что была установлена нами равной 0,05 ( ). Такой результат является практически невозможным, когда проверяемая гипотеза о соответствии эмпирического распределения нормальному закону верна. Поскольку величина , рассчитанная по данным приводимого примера, получилась меньше величины , с вероятностью 95 % принимается гипотеза о нормальности эмпирического распределения.
Для расчета функции (критерия Колмогорова) можно использовать и максимальную разность абсолютных накопленных частот, т. е. величину . Тогда между и будет соотношение: , т. е. . Максимальная величина разности абсолютных накопленных частот равна 3 (столбец 9). Величина , соответствующая равна 1,36. Следовательно, для величина равна 11,4594. Так как значение меньше , то можно считать, что результаты выборки не противоречат предположению о нормальном характере распределения исследуемого признака.