Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛБ_6

.doc
Скачиваний:
40
Добавлен:
01.02.2015
Размер:
1.07 Mб
Скачать

Дисциплина: Теоретические основы статистических исследований

Лабораторная работа №6

Корреляционный анализ

При проведении корреляционного анализа различают параметрические и непараметрические методы анализа наличия зависимости.

1. Параметрические методы оценки корреляции. Коэффициент линейной корреляции Пирсона

Коэффициент линейной корреляции отражает меру линейной зависимости между двумя переменными. Предполагается, что переменные измерены в интервальной или количественной шкале.

1.1. Реализация в SPSS

Для того, чтобы рассчитать коэффициент линейной корреляции Пирсона необходимо использовать следующую последовательность команд:

Analyze (Анализ) – Correlate (Корреляция) – Bivariate (Двумерная)

В результате чего, откроется диалоговое окно (рис.1), в котором необходимо указать переменные, для которых будет рассчитан коэффициент корреляции Пирсона. И установить флажок в поле Pearson.

Рис.1. Диалоговое окно Bivariate Correlations

После нажатия на кнопку ОК на экран будет выведена матрица корреляций Пирсона для указанных переменных.

Пример расчета коэффициентов линейной корреляции Пирсона для переменных height, weight_1, index_1 приведен на рис.2.

Рис.2. Матрица коэффициентов корреляции Пирсона

Значимая положительная корреляция в этой таблице наблюдается для всех переменных. Например, коэффициент корреляции между переменными height и weight, равный 0,732 (уровень значимости р=0,001), говорит о тесной положительной связи между этими переменными. Т.е. Чем больше рост респондента, тем больше его вес.

1.2. Реализация в STATISTICA

Для того, чтобы рассчитать коэффициент линейной корреляции Пирсона необходимо использовать следующую последовательность команд:

Statistics (Статистики) – Basic Statistics and Tables (Основные статистики и таблицы) – Correlation matrices (Корреляционные матрицы)

В результате откроется диалоговое окно (рис.3.), в котором необходимо указать переменные для расчета линейного коэффициента корреляции Пирсона

Рис.3. Диалоговое окно Product-Moment and Partial Correlations

После нажатия на кнопку Summary: Correlations на экран будет выведена корреляционная матрица.

Пример расчета коэффициентов линейной корреляции Пирсона для переменных height, weight_1, index_1 приведен на рис.4.

Рис.4. Матрица коэффициентов корреляции Пирсона

2. Непараметрические методы оценки корреляции.

Коэффициенты Спирмена и Кенделла

Оба показателя, основаны на корреляции не самих значений рассматриваемых признаков, а их рангов. С их помощью можно изучать и измерять связь не только между количественными, но и качественными (атрибутивными) признаками, ранжированными определенным образом.

2.1. Реализация в SPSS

Для того, чтобы рассчитать коэффициенты ранговой корреляции Спирмена и Кенделла, необходимо использовать следующую последовательность команд:

Analyze (Анализ) – Correlate (Корреляция) – Bivariate (Двумерная)

В открывшемся диалоговом окне Bivariate Correlations (рис.1.) установить флажок в поле Kendalls tau-b и Spearman. После нажатия на кнопку ОК на экран будет выведена матрица корреляций Спирмена и Кендалла для указанных переменных.

Пример расчета коэффициентов ранговой корреляции Спирмена и Кендалла для переменных sex, diet, weight_2, sport_2 приведен на рис.5.

Рис.5. Матрица корреляций Спирмена и Кенделла

Из полученной матрицы видно, что переменные diet и sport_2 имеют тесную обратную связь. Т.к. переменная diet принимает два значения: 1- соблюдает и 2-не соблюдает, то коэффициент корреляции равный -0,718 по Кендаллу и -0,79 по Спирмену можно трактовать так: если респондент при программе похудения придерживался диеты, то он чаще занимался спортом. Также обратную корреляцию имеет пара переменных sport_2 и weight_2, что можно трактовать так: чем больше респондент занимался спортом, участвуя в программе похудения, тем меньше стал вес после программы похудения.

Значительную прямую корреляцию имеют пары переменных: sex и diet (учитывая кодировку данных переменных это означает, что женщины соблюдают диету чаще, чем мужчины), weight_2 и diet (учитывая кодировку переменной diet – если респондент не соблюдал диету во время программы похудения, то его вес после программы похудения окажется выше).

2.2. Реализация в STATISTICA

Для того, чтобы рассчитать коэффициенты ранговой корреляции Спирмена и Кенделла, необходимо использовать следующую последовательность команд:

Statistics (Статистики) – Nonparametrics (Непараметрические) –

Correlations (Корреляции)

В результате чего откроется диалоговое окно (рис.6.), в котором необходимо указать переменные, для которых будут рассчитаны коэффициенты корреляции.

Рис.6. Диалоговое окно Correlations

После нажатия на кнопку Spearman rank R на экран будет выведена матрица корреляций Спирмена, а после нажатия кнопки Kendall Tau – матрица корреляций Кенделла.

Пример расчета коэффициентов ранговой корреляции Спирмена и Кендалла для переменных sex, diet, weight_2, sport приведен соответственно на рис.7. и рис.8.

Рис.7. Матрица корреляций Спирмена

Рис.8. Матрица корреляций Кендалла

Полученные результаты схожи с результатами расчета коэффициентов ранговой корреляции в пакете SPSS.

3. Частные корреляции. Выявление ложных корреляций.

На практике иногда возникают ситуации, когда в результате корреляционного анализа обнаруживаются логически необъяснимые, противоречащие объективному опыту исследователя корреляции между двумя переменными (например, оказы­вается, что между уровнем дохода респондентов и количеством детей в семье сущес­твует статистически значимая зависимость). В этом случае говорят о так называе­мой ложной корреляции, исследовать которую помогают частные коэффициенты корреляции.

3.1. Реализация в SPSS

В SPSS коэффициент частной корреляции можно рассчитать используя следующую последовательность команд:

Analyze (Анализ) – Correlate (Корреляции) – Partial (Частные)

В результате откроется диалоговое окно (рис.9.), в котором необходимо ввести в поле Variables переменные для которых нужно вычислить коэффициент корреляции, а в окно Controlling for – переменную, значение которой нужно исключить

Рис.9. Диалоговое окно Partial Correlations

После нажатия на кнопку ОК на экран будет выведена матрица частных коэффициентов корреляции.

Пример расчета коэффициентов частной корреляции для переменных height и index_1 за исключением переменной weight_1 приведен на рис.10.

Рис.10. Матрица коэффициентов частной корреляции.

Рассчитанный коэффициент корреляции с высокой точностью (p<0,001) говорит о том, что существует тесная обратная связь между переменными height и index_1 (за исключением переменной weight_1), т.е. чем выше рост респондента, тем ниже его индекс массы тела. Заметим, что коэффициент линейной корреляции Пирсона для этих переменных с высокой точностью (p=0,001) давал значение 0,45 (рис.2.), что свидетельствует о прямой связи переменных.

3.2. Реализация в STATISTICA

Для того, чтобы рассчитать коэффициент частной корреляции необходимо использовать следующую последовательность команд:

Statistics (Статистики) – Basic Statistics and Tables (Основные статистики и таблицы) – Correlation matrices (Корреляционные матрицы)

В открывшемся диалоговом окне Product-Moment and Partial Correlations (рис.3.) необходимо перейти на вкладку Advanced / plot где, щелкнув на кнопку Partial correlations. В открывшемся окне, в поле First list указать переменные для которых нужно вычислить коэффициент корреляции, а в поле Second list - переменную, значение которой нужно исключить.

После нажатия на кнопку ОК на экран будет выведена матрица частных коэффициентов корреляции.

Пример расчета коэффициентов частной корреляции для переменных height и index_1 за исключением переменной weight_1 приведен на рис.11.

Рис.11. Матрица коэффициентов частной корреляции.

Индивидуальное задание:

Для имеющихся данных в пакетах MS Excel (или Mathcad), SPSS и Statistica рассчитать:

  • значение ковариации и коэффициента корреляции Пирсона,

  • коэффициенты корреляции Спирмена и Кенделла,

  • корреляционную матрицу,

  • коэффициент множественной корреляции ,

  • коэффициент частной корреляции,

  • коэффициент детерминации,

  • коэффициент конкордации.

Сделать выводы о наличии или отсутствии связи в каждом конкретном случае и о ее силе.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]