- •Курсовая работа «математическая обработка статистических данных»
- •Задание для курсовой работы
- •ВВедение
- •Содержание
- •Статистическая обработка случайной велечины у(Среднегодовое превышение нормы)
- •Построим график Эмпирической функции
- •Статистическая обработка случайной велечины х(стаж работы)
- •Пункт 9 Корреляционный анализ
- •Пункт 8 Интервальные оценки параметров нормального закона распределения
Построим график Эмпирической функции
рис.6—График эмпирической функции и полигона
Сравнение полигона относительных частот и нормальной кривой показывает, что построенная кривая удовлетворительно сглаживает полигон
ПУНКТ 8 Интервальные оценки параметров нормального закона распределения
Интервальные оценки параметров нормального закона распределения определяются только в том случае, если подтверждается гипотеза о нормальном распределении. В нашем случае, =33.098 а χ2крит=7.815
Так как условие < χ2крит не выполняется, гипотезу о нормальном распределении стоит отвергнуть, следовательно, оценка параметров нормального закона распределения для случайной величины У(среднегодовое превышение нормы), в данной курсовой работе не проводится.
Статистическая обработка случайной велечины х(стаж работы)
ПУНКТ 1 Интервальный и дискретный статистические ряды распределения частот и относительных частот.
Статистическая обработка результатов эксперимента в случае выборки большого объема(n> 50) начинается с группировки выборочных значений, то есть с разбиения наблюдаемых значений СВ на k частичных интервалов равной длины и подсчета частот попаданий значений СВ в частичные интервалы.
Сделаем группировку наблюдаемых значений. Оптимальную длину интервала определим по формуле Стэрджеса:
,
где Хmax , Xmin –соответственно максимальное и минимальное выборочные значения СВ Х(Стаж работы), n—объем выборки.
Для СВ Х(Стаж работы) n=100, Хmax =11, Xmin=6. Следовательно,
В качестве левого конца первого интервала возьмем величину, равную
а1= Xmin--=6--=6—0.35=5.65. Если аi-начало i-го интервала, тогда
а2= а1+h=5.65+0.7=6.35 и т д. Составим таблицу (таб.2)
Таблица.2
Вспомогательная таблица для расчета числовых характеристик выборки
интервалы (аi;ai+1) |
середины интервалов |
подсчет частот
|
частоты ni |
относит. частоты Wi=ni/n |
накопительные относительные частоты |
1 |
2 |
3 |
4 |
5 |
6 |
(5.65;6.35]
|
6 |
|
13 |
0.13 |
0,13 |
(6.35;7.05]
|
6.7 |
|
20 |
0.2 |
0,33 |
(7.05;7.75]
|
7.4 |
|
0 |
0 |
0,33 |
(7.75;8.45]
|
8.1 |
|
35 |
0.35 |
0,68 |
(8.45;9.15]
|
8.8 |
|
18 |
0.18 |
0,86 |
(9.15;9.85]
|
9.5 |
|
0 |
0 |
0,86 |
(9.85;10.55]
|
10.2 |
|
11 |
0.11 |
0,97 |
(10.55;11.25]
|
10.9 |
|
3 |
0.03 |
1,00 |
ПУНКТ 2 Гистограмма и полигон относительных частот
Первый и пятый столбцы таблицы 1 составляют интервальный статистический ряд относительных частот, графическое изображение которого—гистограмма относительных частот (ступенчатая фигура на рис.1)
Дискретный статистический ряд относительных частот задается вторым и пятыми столбцами, графическое изображение, которого—полигон относительных частот (изображен на рис.1 ломаной линией)
Рис.1—гистограмма и полигон относительных частот
ПУНКТ 3 Эмпирическая функция распределения и ее график
Эмпирическая функция распределения F*(х) выборки служит для оценки функции распределения F(х) генеральной совокупности.
Функция F*(х) определяет для каждого значения х относительную частоту событий Х<х:
F*(х)=,
где nx-число выборочных значений, меньших х; n-объем выборки.
Шестой столбец таблицы 1 содержит накопленные частоты, то есть значения эмпирической функции распределения F*(х), они относятся к верхней границе частного интервала.
Эмпирическая функция распределения F*(х) имеет вид:
F*(х)=
График эмпирической функции распределения F*(х) изображен на рис.2
рис.2—График эмпирической функции распределения
ПУНКТ 4 Числовые характеристики выборки
Для вычисления числовых характеристик выборки (х, Дх, Sх*, Эх*) удобно использовать таблицу.3,где в первых двух столбцах приведены сгруппированные исходные данные, а остальные столбцы служат для вычисления числовых характеристик
Таблица 3
Таблица для расчета числовых характеристик выборки
середин интервалов хi |
Частоты ni |
xi—x |
(xi—x )ni |
(xi—x )2ni |
(xi—x )3ni |
(xi—x )4ni |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
6 |
13 |
-1.988 |
-25.844 |
51.378 |
-102.139 |
203.053 |
6.7 |
20 |
-1.288 |
-25.76 |
33.178 |
-42.734 |
55.042 |
7.4 |
0 |
-0.588 |
0 |
0 |
0 |
0 |
8.1 |
35 |
0.112 |
3.92 |
0.439 |
0.049 |
0.005 |
8.8 |
18 |
0.812 |
14.616 |
11.868 |
9.637 |
3.478 |
9.5 |
0 |
1.512 |
0 |
0 |
0 |
0 |
10.2 |
11 |
2.212 |
24.332 |
53.822 |
119.055 |
263.350 |
10.9 |
3 |
2.912 |
8.736 |
25.439 |
74.079 |
215.718 |
Σ |
100 |
- |
0 |
175.942 |
57.947 |
740.646 |
Выборочное среднее вычисляется по формуле:
,
где m—число интервалов, хi—середины интервалов
Выборочное среднее дает усредненное значение стажа работы для данной выборки.
Выборочную дисперсию для сгруппированных данных вычисляют по формуле:
1.3
Выборочное среднее квадратическое отклонение находят по формуле:
. Для СВ Х Sх=
Оно показывает разброс выборочных значений хi, относительно выборочного среднего х=7.988
Выборочные коэффициенты асимметрии и эксцесса вычисляются по формулам:
Используя суммы из последних строк шестого и седьмого столбцов таблицы 3,
получим:
0 говорит о несимметричности полигона (гистограммы) относительно выборочного среднего х(стажа работы).
Отрицательность выборочного коэффициента эксцесса показывает, что полигон
менее крут, чем нормальная кривая
ПУНКТ 5 Предварительный выбор закона распределения наблюдаемой случайной величины Х(стажа работы)
Мы предварительно предполагаем, что СВ Х(стаж работы) распределена нормально по совокупности следующих признаков.
Вид полигона и гистограммы относительных частот напоминает нормальную кривую (кривую Гаусса)
Выборочные коэффициенты асимметрии и эксцесса
отличаются от значений асимметрии и эксцесса для нормального распределения (которые равны нулю) не более чем на утроенные средние квадратические ошибки
их определения.
,
,
где
Можно предположить, что стаж работы (СВ Х) изменяется под влиянием большого числа факторов, примерно равнозначных по силе.
Итак, по совокупности указанных признаков можно предположить, что распределение СВ Х является нормальным
ПУНКТ 6 Точечный оценки параметров нормального закона распределения
Функция плотности нормального распределения имеет вид
В качестве неизвестных параметров а и σ возьмем их точечные оценки 7.988 и Sх= соответственно. Тогда дифференциальная f(x) и интегральная функции F(x) предполагаемого нормального закона распределения примут вид:
;
ПУНКТ 7 Гипотеза том, что выборка извлечена из генеральной совокупности с предполагаемым нормальным законом распределения
Гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по предлагаемому нормальному закону, назовем нулевой
(Но:Х N(a,σ)), тогда На:Х N(a, σ)
Проверяем ее с помощью критерии согласия χ2 Пирсона.
Согласно критерию Пирсона сравниваются эмпирические ni(наблюдаемые) и теоретические npi(вычисленные в предложении нормального распределения)
частоты. В качестве критерия проверка нулевой гипотезы принимается случайная величина.
По таблице критических точек распределения χ2 по заданному
уровню значимости а и числу степеней свободы v=S-r-1 находим критическое
значение χ2крит(а,v)
Если проверяется гипотеза о нормальном распределении, то вероятности pi рассчитываются с помощи функции Лапласа Ф(х):
где х=7.988, Sx=1.326
Вычисления сведем в таблицу.3 Количество интервалов S=6.
Так как предполагается нормальное распределение имеющее два параметра(математическое ожидание а и среднее квадратические отклонение σ), поэтому r=2, тогда число степеней свободы v=S-r-1=6-2-1=3
Таблица 3
Расчетная таблица для вычисления
интервалы (хi;хi+1) |
частоты эмпирические ni |
Вероятности рi |
Теоретические частоты npi |
|
(-∞;6.35]
|
13 |
0.10935 |
10.93 |
0.3920 |
(6.35;7.05]
|
20 |
0.12335 |
12.34 |
4.7549 |
(7.05;7.75]
|
0 |
0.19588 |
19.59 |
19.59 |
(7.75;8.45]
|
35 |
0.20825 |
20.83 |
9.6576 |
(8.45;9.15]
|
18 |
0.17374 |
17.37 |
0.0228 |
(9.15;9.85]
|
0 |
0.10867 |
10.87 |
10.87 |
(9.85;10.55]
|
11 |
0.005396 |
5.40 |
5.8074 |
(10.55;+ ∞]
|
3 |
0.05396 |
2.68 |
0.0358 |
Σ |
100 |
1.00 |
100 |
51.130 |
Значение =51.130
В таблицах критических точек распределения по уровню значимости а=0.05 и числу степеней свободы v=3 найдем критическое значение χ2крит(0.05,3) =7.815
Так как условие < χ2крит не выполняется будем считать, что гипотеза не согласуется с экспериментальными данными и ее надо отвергнуть
Построим график Эмпирической функции
рис.3—График эмпирической функции и полигона
Сравнение полигона относительных частот и нормальной кривой показывает, что построенная кривая удовлетворительно сглаживает полигон
ПУНКТ 8 Интервальные оценки параметров нормального закона распределения
Интервальные оценки параметров нормального закона распределения определяются только в том случае, если подтверждается гипотеза о нормальном распределении. В нашем случае, =51.130 а χ2крит=7.815
Так как условие < χ2крит не выполняется, гипотезу о нормальном распределении стоит отвергнуть, следовательно, оценка параметров нормального закона распределения, в данной курсовой работе не проводится.
ПУНКТ 9 Корреляционный анализ
Проведем корреляционный анализ выборочных данных случайных величин Х(стажа работы) и У(среднегодовое превышение нормы).
а) Составляем корреляционную таблицу.
Для случайной величины Х(стажа работы) выбраны следующие интервалы:
(5.65;6.35] , (6.35;7.05], (7.05;7.75], (7.75;8.45], (8.45;9.15], (9.15;9.85], (9.85;10.55], (10.55;11.25]
Для случайной величины У(среднегодовое превышение нормы):
(1.6;2.4], (2.4;3.2], (3.2;4], (4;4.8], (4.8;5.6], (5.6;6.4], (6.4;7.2], (7.2;8]
Подсчитываем количество пар исходной выборки (хi,yi), попадающих в прямоугольники, образованные границами интервалов(Таблица.8). Для этого принадлежность пары (хi,yi) к определенному прямоугольнику отмечаем внутри этого прямоугольника точкой.
Таблица 8
Таблица для частот nху пар значений (хi;yi)
интервалы для У |
интервалы для Х
|
||||||||
(5.65; 6.35] |
(6.35; 7.05] |
(7.05; 7.75] |
(7.75; 8.45] |
(8.45 ;9.15] |
(9.15; 9.85] |
(9.85; 10.55], |
(10.55; 11.25]
|
|
|
(1.6;2.4]
|
|
|
|
|
|
|
|
|
|
(2.4;3.2]
|
|
|
|
|
|
|
|
|
|
(3.2;4]
|
|
|
|
|
|
|
|
|
|
(4;4.8]
|
|
|
|
|
|
|
|
|
|
(4.8;5.6]
|
|
|
|
|
|
|
|
|
|
(5.6;6.4]
|
|
|
|
|
|
|
|
|
|
(6.4;7.2]
|
|
|
|
|
|
|
|
|
|
(7.2;8]
|
|
|
|
|
|
|
|
|
|