Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛБ_4.doc
Скачиваний:
44
Добавлен:
01.02.2015
Размер:
2.58 Mб
Скачать

15

Дисциплина: Системы статистического анализа данных

Лабораторная работа №4

Поверка статистических гипотез. Сравнение двух средних и t-критерий

Различные варианты обработки данных с применением t-критерия позволяют сделать вывод о различии двух средних значений. Применение t-критерия на сегодняшний день является самым распространенным методом статистического анализа различия двух выборок. Основное требование к данным для применения этого критерия – представление переменных, по которым сравниваются выборки, в метрической шкале измерения.

1. Реализация в SPSS

SPSS позволяет применять три варианта t-критерия:

  • критерий для независимых выборок (Independent-Samples t-Test),

  • критерий для зависимых выборок (Paired-Samples t-Test),

  • критерий для одной выборки (One-Samples t-Test).

1.1. Применение t-критерия для независимых выборок

С помощью применения t-критерия для независимых выборок проверяется достоверность различия двух выборок по количественной переменной. Для этих выборок вычисляются средние значения количественной переменной, затем по t-критерию определяется статистическая значимость различия средних. Основное требование к данным для применения этого критерия — представление переменных, по которым сравниваются выборки, в метрической шкале измерения. Если есть сомнения в соответствии этому требованию, нужно воспользоваться непараметрическими методами.

Для применения t-критерия для независимых выборок необходимо использовать следующую последовательность команд:

Analyze (Анализ) - Compare Means (Сравнение средних) - Independent-Samples T-Test (t-Test для независимых выборок)

В открывшемся диалоговом окне (рис.1) необходимо задать параметры для применения t-критерия. Левая часть окна содержит список всех доступных переменных, а правая – список проверяемых переменных. Список Test Variables (Проверяемые переменные) может содержать любое количество переменных, а сами переменные должны быть метрического типа.

В поле Grouping Variable (Группирующая переменная) указывается переменная, значениям (градациям) которой соответствует две независимые выборки для t-критерия. Как правило, группирующая переменная дискретна и имеет две градации. Группирующая переменная может иметь более двух уровней и даже непрерывный тип, но в обоих случаях необходимо разбить множество значений переменной на две категории или задать два значения из существующих.

Рис.1.ДиалоговоеокноIndependent-Samples T-Test

Чтобы определить категории группирующей переменной необходимо щелчком на кнопке Define Variable (Определить переменную) открыть диалоговое окно (рис.2) определить категории групп и нажать кнопку Continue (Продолжить)

Рис.2. Диалоговое окно Define Groups

После нажатия кнопки ОК в диалоговом окне Independent-Samples T-Test на экран будет выведен результат, который содержит:

  • количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних в обеих группах,

  • результаты теста Левена на равенство дисперсий.

Как правило, гипотеза о равенстве (гомогенности) дисперсий не принимается, если тест Левена дает значение р < 0,05. Для случаев как гомогенности (равенства), так и гетерогенности (неравенства) выводятся следующие результаты t-теста: значение распределения t, количество степеней свободы df, вероятность ошибки р (под обозначением "Значимость (2-сторонняя)"), а такжеразница средних значений, ее стандартная ошибка и доверительный интервал.

В случае, если уровень значимости (Sig.(2-tailed)) оказывается меньшим, чем 0,05 различие средних признается статистически значимым.

Пример сравнения среднего значения индекса массы тела до программы похудения для мужчин и женщин представлен на рис.3.

Рис.3. Применение t-критерия для независимых выборок

(по одной переменной)

Из результатов следует, что выборка из 32 женщин имеет средний индекс массы тела до программы похудения 43,9594, выборка из 16 мужчины — средний индекс массы тела до программы похудения 33,1661. Различия статистически достоверны на высоком уровне значимости (p = 0,000). Критерий равенства дисперсий Ливиня указывает на то, что дисперсии двух распределений статистически значимо не различаются (p = 0,630), следовательно, применение t-критерия корректно.

На рис.4. приведен пример сравнения индексов массы тела до и после программы похудения для мужчин и женщин.

Рис.4. Применение t-критерия для независимых выборок

(по двум переменным)

Если в диалоговом окне Define Groups (рис.2.) установить переключатель Cut Point (Разбивающее значение), то в поле справа необходимо указать значение, разбивающее весь диапазон интервалов на два непересекающихся значения.

На рис.5. представлено вычисление t-критерия, где в качестве группирующей использована переменная relatives, которая является количественной. Установив в качестве точки деления значение «3» разделим респондентов на тех, у кого количество полных родственников в семье меньше 3, и тех, у кого больше или равно трем.

Рис.5. Применение t-критерия для независимых выборок

(по одной переменной с использованием разделителя Cut Point)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]