- •2. Чтобы построить полигон частот для случайной величины X, найдем середину и относительную частоту для каждого интервала (табл.2.4).
- •3. Для вычисления оценок числовых характеристик для X используем таблицу (2.5).
- •5. Проверим гипотезу о нормальном распределении случайной величины X с помощью критерия Пирсона.
- •7. Построим линейную регрессионную модель.
5. Проверим гипотезу о нормальном распределении случайной величины X с помощью критерия Пирсона.
График полигона частот и гистограммы (внешняя схожесть с кривой Гаусса) позволяют предположить, что генеральная совокупность подчиняется нормальному закону распределения.
Выдвигаем основную гипотезу:
H0: генеральная совокупность подчиняется нормальному закону распределения.
Тогда альтернативная гипотеза принимает вид:
H1: закон распределения не является нормальным.
Задаемся уровнем значимости α=0,05.
Расширяя границы первого и последнего интервалов (табл. 2.3), результаты всех вычислений сводим в таблицу 2.7.
Таблица 2.7
Границы интервалов |
Частота
|
|
|
|
–∞ – 9,5 |
|
0,0618 |
|
0,022 |
9,5 – 10,7 |
0,11440 |
|||
10,7 – 11,9 |
10 |
0,1983 |
8,3286 |
0,335 |
11,9 – 13,1 |
8 |
0,2396 |
10,0632 |
0,423 |
13,1 – 14,3 |
10 |
0,2218 |
9,9356 |
0,082 |
14,3 – 15,5 |
|
0,0986 |
|
0,018 |
15,5 – +∞ |
0,0654 |
|||
Сумма |
42 |
1,0062 |
1,0000 |
0,88 |
В таблице 2.7 четвертый столбец представляет результаты вычислений теоретических вероятностей, найденных в предположении, что случайная величина подчиняется нормальному закону распределения, по формуле:
Значения функции Лапласа можно отыскать в таблице 2 приложения.
Найдем вероятности попадания в каждый интервал:
Теоретическая частота первых двух интервалов и последних двух меньше 5, поэтому объединяем их во втором и четвертом столбцах (табл. 2.7).
Пятый столбец (табл. 2.7) является результатом вычислений по формуле:
Не следует забывать, что первых два и последние два интервала объединены.
Таким образом, суммой пятого столбца (табл.2.7) является расчетное значение критерия:
Так как после объединения осталось 5 интервалов (l=5), а по выборке определены оценки двух параметров, т.е. r=2, то число степеней свободы равно . По таблице 3 приложения найдем значение статистики для p=1–α=0,95 и k=2:
Сравнивая полученные значения, видим, что
5,99> 0,88,
следовательно, гипотеза о нормальном распределении не отвергается.
6. Для проведения корреляционного анализа по данным выборки составим корреляционную таблицу (табл.2.8):
Таблица 2.8
Границы и середины интервалов для Y |
Границы и середины интервалов для X |
|
||||||
8,3–9,5
8,9 |
9,5–10,7
10,1 |
10,7–11,9
11,3 |
11,9–13,1
12,5 |
13,1–14,3
13,7 |
14,3–15,5
14,9 |
15,5–16,7
16,1 |
||
1,5–3,3
2,4 |
1 |
– |
1 |
– |
– |
– |
– |
2 |
3,3–5,1
4,2 |
1 |
2 |
– |
1 |
– |
– |
– |
4 |
5,1–6,9
6,0 |
1 |
1 |
3 |
2 |
1 |
– |
– |
8 |
6,9–8,7
7,8 |
– |
1 |
3 |
4 |
3 |
– |
– |
11 |
8,7–10,5
9,6 |
– |
– |
3 |
1 |
4 |
2 |
– |
10 |
10,5–12,3
11,4 |
– |
– |
– |
– |
2 |
1 |
1 |
4 |
12,3–14,1
13,2 |
– |
– |
– |
– |
– |
– |
3 |
3 |
|
3 |
4 |
10 |
8 |
10 |
3 |
4 |
42 |
Используя полученные в пункте 3 оценки числовых характеристик, найдем выборочный корреляционный момент по формуле:
Предварительно вычислим сумму:
Выборочный коэффициент корреляции найдем по формуле:
Следует отметить, что близость выборочного коэффициента корреляции по модулю к единице является серьезным аргументом в пользу выбора линейной регрессионной модели.