- •Утверждаю
- •Одномерный статистический анализ Лекция № 1
- •Введение.
- •Генеральная совокупность значений
- •1.1.1. Погрешности (ошибки) результатов (наблюдений) при проведении исследований.
- •1.1.2. Типы выборок при использовании статистических методов управления качеством продукции.
- •Лекция № 2
- •1.1.3. Однородность и репрезентативность выборки.
- •1.1.4. Среднее и дисперсия выборки.
- •Лекция № 3
- •1.1.5. Средняя квадратическая ошибка выборки
- •1.1.6. Определение необходимой численности выборки.
- •1.1.7. Малые выборки.
- •1.2. Графическое изображение и основные характеристики вариационного ряда. Лекция № 4
- •1.2.1. Графическое изображение рядов распределения.
- •- Тарифный разряд рабочего; - число рабочих (частота).
- •Теоретической кривой нормального распределения.
- •- Тарифный разряд рабочего; - число рабочих (накопленная частота).
- •1.2.2. Основные показатели (характеристики) ряда распределения.
- •Лекция № 5
- •Относительное линейное отклонение
- •Коэффициент вариации
- •Лекция № 6
- •И отрицательным (справа) эксцессом.
- •В зависимости от расстояния от среднего значения.
- •Лекция № 7
- •Лекция № 8
- •1.3. Виды статистических оценок параметров распределения. Лекция № 9
- •1.4. Дополнительные показатели распределения:
- •Контрольные вопросы по разделу 1.
Лекция № 7
План лекции
1.2. Графическое изображение и основные характеристики вариационного ряда.
1.2.2. Основные показатели (характеристики) ряда распределения.
1.2.2.7. Пример построения теоретической нормальной кривой
распределения.
1.2.2.7. Пример построения теоретической нормальной кривой распределения.
Рассмотрим построение теоретической кривой нормального распределения на примере, характеризующем распределение процесса изготовления партии деталей по длительности (времени) производственного цикла (табл. 1.4).
Таблица 1.4.
Границы интервала (часы) |
Эмпирические частоты |
|
|
|
|
Вероятности
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
- ∞ - 28 |
0 |
- ∞ |
-1,927 |
-0,5000 |
-0,4732 |
0,0268 |
1,9 |
28 - 113 |
5 |
- 1,927 |
-1,393 |
-0,4732 |
-0,4177 |
0,0555 |
3,94 |
113 - 198 |
12 |
- 1,393 |
-0,852 |
-0,4177 |
-0,3023 |
0,1154 |
8,19 |
198 - 283 |
12 |
- 0,952 |
-0,312 |
-0,3023 |
-0,1217 |
0,1806 |
12,82 |
283 - 368 |
15 |
- 0,312 |
+0,229 |
-0,1217 |
-0,0910 |
0,2127 |
15,11 |
368 - 453 |
9 |
+0,229 |
+0,769 |
-0,0910 |
+0,2791 |
0,1884 |
13,40 |
453 - 538 |
9 |
+0,769 |
+1,310 |
+0,2791 |
+0,4049 |
0,1258 |
8,93 |
538 - 623 |
7 |
+1,310 |
+1,860 |
+0,4049 |
+0,4686 |
0,0637 |
4,52 |
623 - 708 |
2 |
+1,860 |
+2,390 |
+0,4686 |
+0,4915 |
0,0229 |
1,63 |
708 - + ∞ |
0 |
+2,290 |
+ ∞ |
+0,4915 |
+0,5000 |
0,0085 |
0,59 |
|
71 |
|
|
|
|
|
71 |
Напомним, что предварительный анализ распределения одномерного массива (совокупности) исследуемого признака заключается в следующем:
Из анализа массива данных устанавливают наибольшее и наименьшее значение исследуемого признака, определяют размах выборки, разбивают его на интервалы (например по правилу Стэрджерса), подсчитывают частоты попадания отдельных значений исследуемого признака в каждый интервал. Осуществляют графическое построение гистограммы и полигона распределения. Для полного построения выровненной кривой распределения в расчеты добавляют условно нулевой и последний (с другого края распределения) интервалы с одной границей, уходящей в , имеющие эмпирическую частоту, равную нулю.
Вычисляют параметры эмпирического распределения: - среднее выборки (центр группирования); - среднеквадратическое отклонение (стандарт – для нормального распределения) (параметр рассеяния). Для табл. 1.4 значения и
Затем необходимо принять гипотезу о законе распределения, построить теоретическую кривую принятого распределения и осуществить проверку гипотезы о принятом законе распределения с помощью одного из критериев согласия. Эту часть анализа проводим по методике, изложенной в конце п. 1.2.2.5.
По формуле (1.32) производится нормирование границ принятых интервалов и заполняются столбцы 3 и 4 табл. 1.4.
По рассчитанным нормированным границам интервалов с помощью статистических таблиц значений функции Лапласа для различных нормированных аргументов (например, ) находят соответствующие значения функции Лапласа для границ интервалов , и заполняют столбцы 5 и 6 табл. 1.4.
По зависимости (1.31) оценивают теоретическую вероятность попадания исследуемого признака в соответствующий интервал (как разность значений функций Лапласа для границ интервала) для всех интервалов и заполняют столбец 7 табл. 1.4.
Теоретические частоты рассчитывают умножением интервальной теоретической вероятности на общий объем выборки и заполняют столбец 8 табл. 1.4.
Рассчитанные теоретические частоты относят к середине интервалов и получают координаты точек теоретической кривой распределения, которую можно нанести на гистограмму, совмещенную с эмпирической кривой распределения.
Далее необходимо проверить правильность принятой гипотезы о законе распределения с помощью одного из известных критериев согласия.
Часто используют другую, несколько упрощенную процедуру расчета теоретической кривой распределения, при которой используются таблицы нормированной функции плотности распределения (а не самой функции распределения). В этом случае общее правило выравнивания состоит в следующем. Найденные параметры эмпирического распределения и необходимо подставить в функцию плотности вместо теоретических значений этих величин, рассчитать вероятности середин всех интервалов и по соответствующей зависимости получить теоретические значения частот исследуемого признака, которые являются координатами точек выровненной теоретической кривой распределения.
По данной методике границы добавляемых крайних интервалов определяют вычитанием из минимального значения признака из выборки величины ширины интервала (в табл. 1.4 ширина интервала ) для крайней границы нулевого интервала и прибавлением этой ширины интервала к максимальному значению выборки – для крайней границы последнего интервала. Расчеты относят не к границам, а к серединам интервалов, которые нормируют, определяют для них соответствующие вероятности и теоретические частоты . В этом случае табл. 1.4 приобретает вид табл. 1.5. Пункты методики расчета координат теоретической кривой распределения преобразуется к следующему виду.
3. Формула (1.31) для нормирования значений исследуемого признака преобразуется к виду
, (1.40)
где , - натуральные и нормированные значения середин интервалов и заполняется столбец 4 табл. 1.5.
Таблица 1.5.
Границы интервала (часы) |
Середины интервалов
|
Эмпирические частоты
|
|
Плотность вероятности
|
Теоретич. частоты
|
1 |
2 |
3 |
4 |
5 |
6 |
- 57 - 28 |
-14,5 |
0 |
- 2,197 |
0,0350 |
1,34 |
28 - 113 |
70,5 |
5 |
- 1,657 |
0,1012 |
3,92 |
113 - 198 |
155,5 |
12 |
- 1,116 |
0,2141 |
8,26 |
198 - 283 |
240,5 |
12 |
- 0,576 |
0,3381 |
12,93 |
283 - 368 |
325,5 |
15 |
- 0,035 |
0,3987 |
15,35 |
368 - 453 |
410,5 |
9 |
+ 0,506 |
0,3512 |
13,63 |
453 - 538 |
495,5 |
9 |
+ 1,046 |
0,2311 |
8,92 |
538 - 623 |
580,5 |
7 |
+ 1,587 |
0,1151 |
4,51 |
623 - 708 |
665,5 |
2 |
+ 2,127 |
0,0416 |
1,66 |
708 - 793 |
750,5 |
0 |
+ 2,668 |
0,0114 |
0,48 |
|
|
71 |
|
|
71 |
4. По статистической таблице значений плотности вероятности нормированного нормального распределения (нормированного распределения Гаусса) определяют плотность вероятности значений середин интервалов и заполняют столбец 5 табл. 1.5.
5. Теоретические частоты рассчитывают по следующей формуле
, (1.41)
где: - ширина интервала; - общий объем выборки; - стандарт выборки; - предварительно рассчитанная по статистической таблице плотность вероятности, соответствующая середине интервала. Полученные значения подставляют в столбец 6 табл. 1.5.
Как и ранее строят теоретическую кривую распределения, которую можно нанести на гистограмму, совмещенную с эмпирической кривой распределения.