Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RGSU_OTVETY_GIA_SOTsIOLOGIYa_4_2_7 .doc
Скачиваний:
327
Добавлен:
11.06.2015
Размер:
2.11 Mб
Скачать

Тема 66. Нормальное распределение, его распространенность в социологии

Многочисленные методы, с помощью которых обрабатываются переменные, относящиеся к интервальной шкале, исходят из гипотезы, что их значения подчиняются нормальному распределению. При таком распределении большая часть значений группируется около некоторого среднего значения, по обе стороны от которого частота наблюдений равномерно снижается.

На диаграмме нанесена кривая нормального распределения (Колокол Гаусса). Реальное распределение в большей или меньшей степени отклоняется от этой идеальной кривой. Выборки, строго подчиняющиеся нормальному распределению, на практике, как правило, не встречаются. Поэтому почти всегда необходимо выяснить, можно ли реальное распределение считать нормальным и насколько значительно заданное распределение отличается от нормального.

Перед применением любого метода, который предполагает существование нормального распределения, наличие последнего нужно проверять в первую очередь. Классическим примером статистического теста, который исходит из гипотезы о нормальном распределении, можно назвать t-тест Стьюдента, с помощью которого сравнивают две независимые выборки. Если же данные не подчиняются нормальному распределению, следует использовать соответствующий непараметрический тест, в случае двух независимых выборок — U-тест Манна и Уитни. Если визуальное сравнение реальной гистограммы с кривой нормального распределения кажется недостаточным, можно применить тест Колмогорова-Смирнова, который находится в меню Analyze (анализ данных) в наборе непараметрических тестов. Третий способ проверки «правило трех сигм»

Тема 67. Корреляционный анализ как метод изучения взаимосвязи признаков

Корреляционной называют зависимость, при которой изменения одной из величин повлекут за собой изменения среднего значения другой величины. Для оценки корреляционной зависимости используется коэффициент ранговой корреляции Спирмена, Кендалла, изменяющийся в диапазоне -1<=r<=1, если r=1 – зависимость линейная, если r=0 – переменные независимы, r>1 – прямая связь, r<0 – обратная связь. Чем больше абсолютное значение коэффициента, тем сильнее связь между признаками.

Метод вычисления коэффициента корреляции зависит от вида шкалы, которой относятся переменные. Процедуру присвоения рангов можно выполнять для порядковых и интервальных шкал. Для номинальных шкал она неосуществима. При вычислении коэффициентов ранговой корреляции каждому наблюдению (т.е. респонденту) ставится в соответствие величина, называемая рангом. Ранг имеет смысл порядкового номера ответа респондента после того, как ответы всех респондентов расположили в порядке возрастания исследуемого признака. Поясним на примере: Пусть были получены следующие ответы на некоторый вопрос:

Номер респондента 1 2 3 4 5 6 7 8 9

Ответ 10 7 4 8 6 2 25 15 17

Расположим ответы в порядке возрастания:

Номер респондента 6 3 5 2 4 1 8 9 7

Ответ 2 4 6 7 8 10 15 17 25

Теперь запишем вместо ответов порядковые номера ответов.

Это и будут ранги:

Номер респондента 6 3 5 2 4 1 8 9 7

Ранг 1 2 3 4 5 6 7 8 9

Например, ранг 2-го респондента будет равен 4. Коэффициент линейной корреляции Пирсона R служит для измерения силы связи двух признаков, каждый из которых измеряется по интервальной шкале. В остальном его свойства схожи с коэффициентами ранговой корреляции. Диапазон его изменения - от -1 до 1, притом значение ~0 означает отсутствие связи между ответами на изучаемые вопросы (т.е. то, что признаки независимы). Значение R~1 означает, что чем больше у респондента значение 1-го фактора, тем больше у него ожидаемое значение 2-го фактора. Наоборот, R~ -1 означает, что чем больше значение 1-го фактора, тем меньше ожидаемое значение 2-го фактора.

Рассмотрим вычисление коэффициента корреляции на следующем примере. Пусть студенты сдавали математику и информатику и получили следующие оценки:

Оценка по математике 5 4 2 4 5 3 2 4 4

Оценка по информатике 4 4 3 5 5 3 3 5 4

Требуется проверить, связаны ли оценки по математике и информатике.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]