- •Введение
- •1.Структура пакета STATISTICA
- •Структура данных
- •Редактирование данных
- •Источники данных
- •Открытие файла данных
- •Создание файла данных
- •Сохранение файла
- •Импорт файла данных
- •Экспорт файла данных
- •Вычисление основных статистик и построение графиков
- •2. Лабораторные работы по теории вероятностей
- •Выполнение в пакете STATISTICA
- •. Работа с Probability Distr. Calculator
- •Моделирование распределений случайных величин
- •3. Лабораторные работы по статистическим методам
- •Выполнение в пакете STATISTICA
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 5. Доверительные интервалы для разности средних и отношения дисперсий
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 6. Группировка данных по классифицирующему признаку
- •Выполнение в пакете STATISTICA
- •4. Непараметрические методы математической статистики
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Коэффициент ранговой корреляции Спирмена
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Задание 1
- •Задание 2
- •4.8. Критерий знаков (Sign test)
- •4.9. Критерий Вилкоксона (Wilcoxon watched pairs test)
- •Задания для самостоятельной работы
- •5. Однофакторный дисперсионный анализ
- •5.1. Основные понятия
- •5.2. Решение примеров в пакете STATISTICA
- •6. Регрессионный анализ
- •Работа 7. Простая линейная регрессия
- •Литература
Работа 5. Доверительные интервалы для разности средних и отношения дисперсий
Проверка гипотез о равенстве средних и дисперсий двух нормально распределенных генеральных совокупностей.
Основные понятия
Доверительные интервалы для разности средних и отношения дисперсий.
Литература.
[1], гл. 19, §3, §4.
Задание
По выборкам из своего и следующего по номеру вариантов выполнить следующие расчеты и задания:
1)вычислить доверительный интервал для отношения дисперсий при доверительной вероятности, равной 0,95;
2)проверить гипотезу о равенстве дисперсий двух генеральных совокупностей;
3)Если в п. 2) гипотеза о равенстве дисперсий принимается, то вычислить доверительный интервал для разности средних и проверить гипотезу о равенстве
средних на уровне значимости α = 0,05;
4)если в п. 2) гипотеза о равенстве дисперсий отклоняется, то проверить гипотезу о равенстве средних по критерию Уэлча ([1], с. 260, нижняя строка табл.4.2);
5)ввести данные в пакет STATISTICA, выполнить все расчеты пп. 2) - 4), сравнить результаты и записать в отчет.
57
Выполнение в пакете STATISTICA
Проверим гипотезу о равенстве средних двух генеральных совокупностей по двум выборкам объема 20. Одна из выборок записана в переменной VAR1 и анализировалась в работах 3 и 4. Другая выборка: 21, 14, 7, 13, 17, 18, 15, 17, 8, 14, 20, 11, 10, 11, 13, 20, 18, 19, 17, 11 записывается в переменную VAR2. Предполагается, что обе выборки получены из генеральных совокупностей, имеющих нормальное распределение, следовательно, для проверки гипотезы о равенстве средних используется статистика Стьюдента.
В пакете STATISTICA для проверки гипотезы о равенстве средних
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t = |
|
|
|
X |
1 − X2 |
|
|
|
≈ −2,499 , |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
s |
1/ n1 +1/ n2 |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
(n −1)s2 |
|
+ (n −1)s |
2 |
|
|
|
||||||||
(где |
s = |
1 |
|
1 |
|
2 |
|
|
2 |
) |
последовательно |
||||||
n1 + n2 − 2 |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
используем модуль Basic statistics → T-test for independent samples (T - критерий для независимых выборок) → Each variable contains the data for one group (каждая выборка представлена как переменная). В соответствующие поля вводим VAR1 и VAR2.
Результаты вычисления выводятся в таблице: средние обеих выборок X1 = 11,5; X2 = 14,7; объемы
выборок n1 = 20, n2 = 20; средние квадратические отклонения выборок s1 = 3,954, s2 = 4,144; значение t-статистики: 2,499….; число степеней свободы t- статистики:
df =20 + 20 – 2 = 38 и вычисленный уровень значимости:
p = P[│T(n1 + n2 – 2)│>│t│] = P[│T(38)│> 2,499] = 0,0169,
58
где T(38) – случайная величина, имеющая распределение Стьюдента с 38 степенями свободы.
Вычисленный уровень значимости р = 0,0169 показывает, что на уровне значимости α = 0,05 гипотеза о равенстве средних отклоняется (гипотеза принимается на уровне значимости α = 0,0169).
Приведенная выше t-статистика может быть использована только в случае, если дисперсии обеих генеральных совокупностей равны. Гипотезу
H0:s2 |
= s2 |
= s2 |
можно проверить используя статистику |
|
|
1 |
2 |
|
|
s2 |
s2 |
(в числитель ставится большая оценка дисперсии); |
||
1 |
2 |
|
|
|
гипотеза H0 принимается, если:
s2
1áF α (n1 -1, n2 -1) , s22 1− 2
где F 1 – α/2 (n2 – 1, n1 – 1) - квантиль распределения Фишера порядка 1 – α/2 с n1 – 1 и n2 – 1 степенями свободы.
Для |
рассматриваемого |
примера |
s2 |
s2 = 1,098 , а |
квантиль |
|
|
2 |
1 |
|
|
|
|
|
F0,975 (19,19) = 2,526 (это значение можно вычислить в |
||||
Probability |
Calculator). Так |
как s2 |
s2 |
< F (19,19) , |
|
|
2 |
1 |
0,975 |
гипотеза о равенстве дисперсий принимается на уровне значимости α = 0,05 и применение t-статистики правомерно.
Проверку гипотезы о равенстве средних двух нормально распределенных
генеральных совокупностей можно провести, используя и другую опцию пакета STATISTICA: Basic Stat./Tables → Other significance tests → Difference between two means. В этой же опции можно проверить гипотезы о
59
сравнении коэффициентов корреляции и долей признака двух генеральных совокупностей.
Задания для самостоятельной работы
Используя пакет STATISTICA, решите следующие задачи.
1. При исследовании влияния двух типов покрытия на удельную проводимость телевизионных трубок получены следующие результаты (в условных
единицах): |
|
|
|
|
|
|
|
|
Номер трубки |
1 |
2 |
3 |
4 |
5 |
6 |
|
1-й тип |
6 |
5 |
12 |
9 |
10 |
- |
|
покрытия |
||||||
|
|
|
|
|
|
|
|
|
2-й тип |
14 |
11 |
0 |
5 |
6 |
8 |
|
покрытия |
||||||
|
|
|
|
|
|
|
Действительно ли тип покрытия оказывает влияние на удельную проводимость? Принять α = 0,05 .
2. Чтобы определить, какое влияние оказывает температура окружающей среды на систематическую ошибку угломерного инструмента, проведены измерения горизонтального угла δ объекта утром (t = 10 °С) и днем (t = 26 °С). Результаты измерений δ (в угловых секундах)
следующие: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Утром |
|
38,2 |
|
36,4 |
|
37,7 |
|
36,1 |
|
37,9 |
|
37,8 |
|
- |
|
- |
|
|
|
|
|
|
|
|
|||||||||
Днем |
|
39,5 |
|
38,7 |
|
37,8 |
|
38,6 |
|
39,2 |
|
39,1 |
|
38,9 |
|
39,2 |
Можно ли считать, что температура окружающей среды влияет на систематическую ошибку угломерного инструмента? Принять α = 0,05.
3. На двух станках А и В производят одну и ту же продукцию, контролируемую по внутреннему диаметру изделия. Из продукции станка А была взята выборка из 16
60
изделий, а из продукции станка В - выборка из 25 изделий. Выборочные оценки средних и дисперсий
контролируемых размеров X A = 37,5 мм при SA2 = 1,21
мм2 и XB = 36,8 мм при SВ2 = 1,44 мм2.
Используя двух сторонний критерий, проверить гипотезу о равенстве математических ожиданий контролируемых размеров в продукции обоих станков,
если: а) α = 0,05 б) α = 0,10.
61