- •1. Ввод исходных данных
- •2. Построение графика динамики цен на нефть (поля рассеивания)
- •3. Определение параметров выборки, описательные статистики
- •4. Построение гистограммы частоты признака
- •5. Построение теоретического закона распределения признака
- •6. Проверка согласия эмпирического и теоретического законов распределения по критерию хи-квадрат Пирсона
5. Построение теоретического закона распределения признака
Для построения теоретического распределения и проверки согласия по критерию хи-квадрат Пирсона надо далее заполнить (дополнить двумя столбцами) таблицу, уже полученную в Excel в результате применения процедуры Гистограмма (рис. 14).
Границы интервалов
группировки
Эмпирические Теоретические
частоты частоты
Статистика критерия
Пирсона
Рис. 14. Таблица для построения теоретического распределения частоты .
–границы интервалов группировки (карманы)
–эмпирическая (наблюденная) частота, количество элементов выборки, попавших в i–ый интервал (частота – получена в результате процедуры Гистограмма);
Эта таблица в Excel (рис. 14.) аналогично той, что была дана в лекции (таблица 1)
Таблица №1
| |||
границы интервалов группировки карманы |
эмпирическая частота |
теоретическая частота |
статистика |
| |||
| |||
… |
… |
… |
… |
| |||
|
|
|
–теоретическая (ожидаемая) частота попадания элементов выборки в i-ый интервал группировки для принятой гипотезы о нормальном распределении генеральной совокупности.
В четвертом столбце вычисляется статистика хи-квадрат Пирсона
Теоретическая частота попадания признакав интервалопределяется по формуле
.
Или ,
где накопленная частота – сумма частот признака, попавшего в промежуток
–теоретическая (ожидаемая) частота попадания элементов выборки в i–ый интервал группировки для принятой гипотезе о нормальном распределении генеральной совокупности в Excel вычисляется с использованием функцией НОРМРАСП.
Для вычисления необходимо вызватьМастер функций → Статистические → НОРМРАСП и заполнить поля ввода, как показано на рис. 15.
Рис. 15. Диалоговое окно НОРМОАСП с заполненными полями ввода.
В поле x – внесите адрес ячейки верхней границы первого кармана, первого интервала группировки (y1 = 98)
В поля Среднее; Стандартное_откл – адреса соответствующих ячеек таблицы описательной статистики;
В поле Интегральная внесите 1 (что означает вычисление накопленных частот)
В строке формул появится запись
Это выражение в строке формул умножьте на объем выборки N = 53
В выделенную ячейку, таким образом, как показано на рис. 15, будет внесена формула
= (НОРМРАСП(y1; среднее; стандартное_откл; 1) * N для
вычисления теоретической частоты попадания признака в интервал .
НОРМРАСП(A70;E23;E27;1)
Рис. 16. Таблица для построения теоретического распределения частоты .
В ячейке появится теоретическое значение числа попаданий признак в промежуток (может быть и дробное).
Рис. 17. Таблица с вычисленным значением=НОРМРАСП(A70;$E$23;$E$27;1).
В следующую ячейку внесите формулу, используя процедуру НОРМРАСП.
= (НОРМРАСП(yi; среднее; стандартное_откл; 1) –
– НОРМРАСП(yi-1; среднее; стандартное_откл; 1)) * N.
В строке формул эта запись будет иметь следующий вид
Размножьте эту формулу в остальные ячейки столбца соответствующие всем оставшимся карманам (рис. 17).
Рис. 17. Таблица с вычисленными значениями теоретических частот
= (НОРМРАСП(A71; $E$23; $E$27; 1) – НОРМРАСП(A70; $E$23; $E$27; 1)) * 53.
В выделенную курсором ячейку (рис. 17.) внесите формулу для вычисления частоты попадания признака в промежуток.
=(1 – НОРМРАСП(yk; среднее; стандартное_откл; 1))*N
yk – верхняя граница последнего кармана
В строке формул появится запись
Окончательный вид таблицы с полностью заполненным результатами вычислений столбцом показан нарис. 18.
В нижней ячейке столбца вычислена сумма теоретических частоткоторая должна равняться объему выборкиN = 53
Рис. 18. Таблица значений теоретических частот нормального распределения,
столбец
Теперь можно построить совместный график гистограммы частот и теоретического нормального распределения.
Щелкните правой кнопкой мыши по любому столбцу гистограммы → в открывшемся окне → Выбрать данные… в диалоговом окне Выбор источника данных выбрать Добавить → заполнить поля ввода диалогового окна Изменения ряда:
Имя ряда: - ,
Значения: массив (столбец) значений теоретических частот
Рис. 19. Совмещенный график гистограммы эмпирических и теоретическихчастот
Измените тип диаграммы, для этого щелкните правой кнопкой мыши по одному из появившихся столбцов графика → Изменить тип диаграммы ряда… → Точечная → выберите гладкую линию. OK
Рис. 20. Совмещенный график гистограммы и теоретического нормального распределения