- •Введение
- •1.Структура пакета STATISTICA
- •Структура данных
- •Редактирование данных
- •Источники данных
- •Открытие файла данных
- •Создание файла данных
- •Сохранение файла
- •Импорт файла данных
- •Экспорт файла данных
- •Вычисление основных статистик и построение графиков
- •2. Лабораторные работы по теории вероятностей
- •Выполнение в пакете STATISTICA
- •. Работа с Probability Distr. Calculator
- •Моделирование распределений случайных величин
- •3. Лабораторные работы по статистическим методам
- •Выполнение в пакете STATISTICA
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 5. Доверительные интервалы для разности средних и отношения дисперсий
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 6. Группировка данных по классифицирующему признаку
- •Выполнение в пакете STATISTICA
- •4. Непараметрические методы математической статистики
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Коэффициент ранговой корреляции Спирмена
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Задание 1
- •Задание 2
- •4.8. Критерий знаков (Sign test)
- •4.9. Критерий Вилкоксона (Wilcoxon watched pairs test)
- •Задания для самостоятельной работы
- •5. Однофакторный дисперсионный анализ
- •5.1. Основные понятия
- •5.2. Решение примеров в пакете STATISTICA
- •6. Регрессионный анализ
- •Работа 7. Простая линейная регрессия
- •Литература
Рис.4.3. Выбор биноминального распределения в диалоговом окне Function Wizard
Для рассматриваемого примера, при n = 55, α = 0,05 и при двусторонней гипотезе Н1 критические значения
будут x = 19 ( IBinom (19;0,5;55) ≈ 0,015 ) и x = 55 – 19 = 36
(IBinom(36;0,5;55) ≈ 0,9850, 1 – |
0,985 = |
0,015), так |
как |
|
соответствующие |
вероятности |
должны |
быть |
|
приблизительно |
равными |
α 2 = 0,025 . Наблюдаемые |
частоты попадают в критическую область: α = 10 < 19, d = 45 > 36 и, следовательно, на уровне значимости α = 0,05 гипотеза Н0 отклоняется.
Задания для самостоятельной работы
Решите следующие задачи. Определите меры связи χ2 и ϕ2 , прокомментируйте результаты.
1. Исследуются два производственных процесса изготовления поршневых колец. Используя критерий χ2, проверить гипотезу о равенстве процента брака в обоих процессах по следующим данным при α = 0,01:
Кольца |
Процесс |
|
|
1 |
2 |
Годные |
195 |
149 |
Бракованные |
5 |
2 |
2. В течение месяца завод поставил предприятию 200 корпусов, из которых 3 оказались дефектными. В следующий месяц завод поставил 850 корпусов, из которых 7 оказались дефектными. Изменилась ли доля дефектных корпусов в поставках завода? Принять α = 0,01.
3. 1000 человек классифицировали по признаку дальтонизма. По приведенным ниже данным проверить,
89
есть ли зависимость между наличием дальтонизма и
полом человека. Принять α = 0,05. |
|
||
|
|
Мужчины |
Женщины |
|
Дальтоники |
38 |
6 |
|
Не дальтоники |
442 |
514 |
4. Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания.
Получены следующие результаты: |
|
||
После прививки |
Без прививки |
||
Заболели |
Не заболели |
Заболели |
Не заболели |
4 |
192 |
34 |
111 |
Указывают ли эти результаты на эффективность прививок?
Принять α = 0,01.
4.2. Статистика χ2 для сравнения
наблюдаемых и ожидаемых частот (Observed versus expected Xi)
В данной опции статистика χ2 используется проверки согласия наблюдаемых и ожидаемых частот. Ожидаемые частоты могут вычисляться на основе теоретической модели некоторого предполагаемого закона распределения случайной величины (вспомните критерий χ2 для проверки гипотезы о виде распределения ([1], гл.19, §6; [13], [22]). Выборочное
значение статистики χв2 вычисляется по формуле:
90
|
r |
(nk − nkI )2 |
|
|
χв2 = å |
nI |
, |
|
|
|
k =1 |
k |
|
|
где n - наблюдаемые частоты; nI |
- ожидаемые частоты, |
|||
k |
|
k |
|
|
k = 1, 2, …, r. |
|
|
|
|
Если теоретическая |
модель |
верна, то при |
r → ∞ |
|
выборочная статистика |
χв2 |
имеет распределение |
χ2 с |
числом степеней свободы (r – l – 1), где l - число параметров распределения, оцениваемых по выборке, либо число связей, налагаемых моделью.
Гипотеза о согласии наблюдаемых и ожидаемых частот принимается, если
|
χ2 |
< χ2 |
(r − l −1) , |
|
в |
1−α |
|
где χ2 |
(r − l −1) - квантиль распределения χ2 (r − l −1) |
||
1−α |
|
|
|
порядка 1 – α, α - заданный уровень значимости; в противном случае гипотеза о согласии частот отклоняется.
Пример 4.3. Метод получения случайных чисел
применялся 250 |
раз, |
при |
этом получены |
следующие |
|||||||
результаты: |
|
|
|
|
|
|
|
|
|
|
|
Число |
0 |
1 |
2 |
|
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Частота |
27 |
18 |
23 |
|
31 |
21 |
23 |
28 |
25 |
22 |
32 |
появления |
|
|
|
|
|
|
|
|
|
|
|
nk |
|
|
|
|
|
|
|
|
|
|
|
Можно ли считать, что примененный метод дает числа появляющиеся с одной и той же частотой? Принять α = 0,10.
Решение. Если метод дает случайные числа, то частоты появления цифр должны быть равны и
составлять nI |
= 25, k = 1, 2, ....,10 . Выборочное значение |
k |
|
статистики равно: χв2 = 7,2
91
Рис.4.4. Решение примера 4.3
Так как квантиль c0,92 (9) = 14,7 , что превышаетcв2 , то гипотеза о согласии наблюдаемых и ожидаемых частот принимается на уровне значимости α = 0,10. Таким образом, следует считать, что метод действительно дает числа, появляющиеся с одной и той же частотой.
Такой же результат получим, введя данные в модуль Nonpar. Stat. пакета STATISTICA (рис.4.4).
Вычисленный |
|
|
|
уровень |
значимости p = P éc2 |
> 7,2ù |
= 0,616307 , |
что |
больше |
ë |
û |
|
|
|
заданного уровня значимости, следовательно, гипотеза о согласии наблюдаемых и ожидаемых частот принимается.
Задания для самостоятельной работы
1. Числа выпадений герба при 20 подбрасываниях двух монет распределились следующим образом:
92
Число выпадений |
0 |
1 |
2 |
герба |
|
|
|
Число |
4 |
8 |
8 |
подбрасываний |
|
|
|
Согласуются ли эти результаты с предположениями о симметричности монет и независимости результатов подбрасываний? Принять
α= 0,05.
2.Ниже приводятся данные о фактических объемах сбыта продукции (в условных единицах) в пяти районах:
Район |
|
1 |
2 |
3 |
4 |
5 |
Объем |
сбыта |
110 |
130 |
70 |
90 |
100 |
продукции |
|
|
|
|
|
|
Согласуются ли эти результаты с предположением о том, что сбыт продукции в этих районах должен быть одинаковым? Принять α = 0,01.
3. На экзамене студент отвечает только на один вопрос по одной из трех частей курса. Анализ вопросов, заданных 60 студентам, показал, что 23 студента получили вопросы из первой, 15 - из второй и 22 - из третьей части курса.
Можно ли считать, что студент, идущий на экзамен, с равной вероятностью получит вопрос по любой из трех частей курса? Принять α = 0,10.
4. В цехе с 10 станками ежедневно регистрировалось число вышедших из строя станков. Всего было проведено 200 наблюдений, результаты которых приведены ниже:
93
Число |
|
0 |
1 |
|
|
2 |
|
|
|
3 |
|
|
4 |
|
|
5 |
|
6 |
|
|
7 |
|
|
8 |
9 |
10 |
||||||
вышедших из |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
строя станков |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Число |
|
41 |
62 |
|
|
45 |
|
|
22 |
|
16 |
|
8 |
|
4 |
|
|
2 |
|
|
0 |
0 |
0 |
|||||||||
зарегистрирова |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
нных случаев |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Проверить гипотезу Н0 о том, что число вышедших |
|
||||||||||||||||||||||||||||||
из строя станков имеет распределение Пуассона. |
|
|||||||||||||||||||||||||||||||
Принять α = 0,05. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
5. Во время второй мировой войны на Лондон упало |
|
||||||||||||||||||||||||||||||
537 самолетов-снарядов. Вся территория Лондона была |
|
|||||||||||||||||||||||||||||||
разделена на 576 участков площадью по 0,25 км2. Ниже |
|
|||||||||||||||||||||||||||||||
приведены числа |
участков nk , на которые |
|
упало |
k |
|
|||||||||||||||||||||||||||
снарядов: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
k |
|
0 |
|
|
1 |
|
2 |
|
3 |
|
4 |
|
|
|
|
|
5 и |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
больше |
|
|
|||||||
|
|
nk |
|
229 |
211 |
93 |
|
35 |
|
7 |
|
|
|
|
|
1 |
|
|
|
|
|
|
||||||||||
|
Согласуются ли эти данные с гипотезой о том, |
|
|
|||||||||||||||||||||||||||||
что число снарядов, упавших на каждый из участков, |
|
|||||||||||||||||||||||||||||||
имеет распределение Пуассона? Принять α = 0,05. |
|
|
||||||||||||||||||||||||||||||
|
6. Ниже приводятся данные о числе деталей, |
|
||||||||||||||||||||||||||||||
поступающих на конвейер в течение 600 двухминутных |
|
|||||||||||||||||||||||||||||||
интервалов: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Число деталей |
|
0 |
|
|
1 |
|
2 |
|
3 |
|
|
4 |
|
5 |
|
6 |
|
|
|
||||||||||||
|
Число интервалов |
|
400 |
|
|
167 |
|
29 |
|
3 |
|
|
0 |
|
0 |
|
1 |
|
|
|
||||||||||||
|
Используя |
|
критерий χ2 , |
|
проверить |
гипотезу |
|
H0 |
о |
|
||||||||||||||||||||||
пуассоновском распределении числа деталей при α = |
|
|||||||||||||||||||||||||||||||
0,05. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В следующих заданиях при α = 0,10 необходимо |
|
||||||||||||||||||||||||||||||
проверить гипотезу Н0 |
|
о том, |
что выборки получены из |
|
нормально распределенной генеральной совокупности.
94
|
|
7. Рост 1004 девушек в возрасте 16 лет (см): |
|
|
|
|
|||||||||||||||||||||||||
Границы |
|
134 - |
|
|
137 - |
|
|
140 - |
|
|
143 - |
|
146 - |
|
149 - |
|
|
152 - |
|||||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||||||||
интервала |
|
137 |
|
|
140 |
|
|
|
143 |
|
|
146 |
|
149 |
|
|
152 |
|
|
155 |
|||||||||||
Частота |
|
1 |
|
|
4 |
|
|
|
16 |
|
|
53 |
|
121 |
|
|
197 |
|
|
229 |
|||||||||||
Границы |
|
155 - |
|
|
158 - |
|
|
161 - |
|
|
164 - |
|
|
167 – |
|
|
170 – |
||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||||||||
интервала |
|
158 |
|
|
|
|
161 |
|
|
164 |
|
|
167 |
|
|
|
170 |
|
|
|
173 |
|
|||||||||
Частота |
|
186 |
|
|
|
|
121 |
|
|
53 |
|
|
17 |
|
|
|
5 |
|
|
|
|
|
1 |
|
8. 200 отклонений размера вала от номинального значения (мкм):
Середина |
|
–0,14 |
|
|
–0,12 |
|
|
|
– |
–0,08 |
|
–0,06 |
|
|
|
–0,04 |
–0,02 |
||||||||||||||||||
интервала |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Частота |
|
|
3 |
|
|
|
|
8 |
|
11 |
|
20 |
|
27 |
|
|
|
36 |
|
|
29 |
||||||||||||||
|
|
Середина |
|
0,00 |
|
|
0,02 |
|
|
0,04 |
|
|
0,06 |
|
0,08 |
|
|
0,10 |
|
|
0,12 |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
интервала |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Частота |
|
|
18 |
|
|
17 |
|
|
|
17 |
|
|
8 |
|
|
4 |
|
|
1 |
|
|
1 |
|
|
|||||||||
|
|
9. Величина контрольного размера 68 деталей, |
|||||||||||||||||||||||||||||||||
|
|
изготовленных на одном станке (мм): |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
Границы |
|
|
|
|
|
|
2,9 - |
|
3,9 - |
|
4,9 - |
|
5,9 - |
|
6,9 - |
|
|
||||||||||||||||
|
|
интервала |
|
|
|
|
|
3,9 |
|
4,9 |
|
5,9 |
|
6,9 |
|
7,9 |
|
|
|||||||||||||||||
|
|
Частота |
|
|
|
|
|
|
5 |
|
15 |
|
23 |
|
|
|
19 |
|
6 |
|
|
95