Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_методичка.doc
Скачиваний:
66
Добавлен:
12.02.2016
Размер:
1.25 Mб
Скачать

2.3.2. Построение таблиц сопряженности (комбинированная группировка)

Это более сложные таблицы, так как содержат частоты нескольких переменных.

Кросстабуляция – это процесс объединения двух (или нескольких) таблиц частот так, что каждая ячейка (клетка) в построенной таблице представляется единственной комбинацией значений или уровней табулированных переменных. Таким образом, кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов (переменных). Исследуя эти частоты, можно определить связи между табулированными переменными.

Обычно табулируются категориальные переменные или переменные с относительно небольшим числом значений. Если необходимо табулировать непрерывную переменную (например, доход), то вначале ее следует перекодировать, разбив диапазон изменения на небольшое число интервалов (например, доход: низкий, средний, высокий).

Crosstabulation tables – Таблицы сопряженности доступны через стартовую панель модуля Basic Statistics and Tables – Основные статистики и таблицы, где в меню Analysis-Анализ следует выбрать Tables and banners – Таблицы и заголовки (рисунок 1.15).

Диалоговое окно построения таблиц сопряженности, или кросстабуляционных таблиц, (рисунок 1.16) содержит группу кнопок Stub-and-banner table, позволяющую определить данные для построения двувходовой таблицы частот, и группу кнопок Multyway crosstabulation tables – для многовходовых таблиц частот.

Группа кнопок Stub-and-banner table позволяет определить данные для построения двувходовой таблицы частот, группа кнопок Multyway crosstabulation tables – для многовходовых таблиц частот.

Выявим в нашем примере (файл ex1.sta) связи между переменными FOOTBALL и BASEBALL. Для этого построим двувходовую таблицу частот, воспользовавшись группой кнопок Stub-and-banner table (см. рисунок 1.16). Нажав кнопку Specify tables – Специфицировать таблицу, выберем переменные для анализа: FOOTBALL и BASEBALL (рисунок 1.17).

Рисунок 1.15 – Выбор Frequency tables – Таблицы частот в меню Analysis-Анализ в модуле Basic Statistics and Tables – Основные статистики и таблицы

Рисунок 1.16 – Диалоговое окно построения таблиц сопряженности (кросстабуляционных таблиц)

Рисунок 1.17 – Выбор переменных для построения двувходовой таблицы частот

По нажатию кнопки ОК открывается окно результатов (рисунок 1.18), где в свою очередь нажатием кнопки Review summary tables – Посмотреть таблицу результатов или кнопки ОК открывается двувходовая таблица сопряженности.

Рисунок 1.18 –Окно результатов построения таблиц сопряженности

В нашем случае двухвходовая таблица сопряженности (сопряжены переменные FOOTBALL и BASEBALL) выглядит следующим образом (рисунок 1.19).

Рисунок 1.19 – Двувходовая таблица сопряженности частот переменных FOOTBALL и BASEBALL

Каждая ячейка таблицы содержит единственную комбинацию значений двух табулированных переменных (в строках указаны значения переменной FOOTBALL, в столбцах – значения переменной BASEBALL). Числа в каждой ячейке, на пересечении определенной строки и определенного столбца, показывают, сколько наблюдений соответствует данным значениям переменных. Так, например, мы видим, что 13 человек, всегда смотрящих футбол, всегда смотрят и бейсбол.

В целях исследования отдельные строки и столбцы построенной таблицы сопряженности удобно представлять в виде графиков.

Графические средства, например Categorized Histograms – Категоризованные гистограммы или 3D histograms – 3D гистограммы, дают особые преимущества и позволяют выявить закономерности, которые трудно поддаются количественному описанию и которые весьма сложно обнаружить с помощью вычислительных процедур (например, сложные взаимосвязи, исключения или аномалии). В этих случаях графические методы предоставляют уникальные возможности многомерного аналитического исследования.

Построение графиков Categorized Histograms – Категоризованных гистограмм (см. рисунок 1.18), где каждая переменная представлена индивидуальными гистограммами на каждом уровне другой переменной, производится нажатием соответствующей кнопки. На категоризованной гистограмме, представленной на рисунке 1.20, показаны частоты увлечения респондентов бейсболом (BASEBALL) на каждом уровне переменной FOOTBALL.

Рисунок 1.20 – Категоризованная гистограмма, построенная по таблице сопряженности (сопряжены переменные FOOTBALL и BASEBALL)

Например, мы видим, что 13 человек из тех, кто всегда смотрит соревнования по футболу, всегда смотрят и соревнования по бейсболу, 5 человек смотрят бейсбол как правило, 4 – иногда, 2 – никогда. Кроме того, 8 человек, иногда смотрящих соревнования по футболу, также иногда смотрят и соревнования по бейсболу, 6 человек из тех, кто никогда не смотрит соревнования по футболу, никогда не смотрят и соревнования по бейсболу.

Преимущество 3D histograms – 3D гистограммы в том, что она позволяет представить на одном графике таблицу целиком (рисунок 1.21).

Рисунок 1.21 – 3D гистограмма, построенная по таблице сопряженности (сопряжены переменные FOOTBALL и BASEBALL)

Анализ построенных таблиц сопряженности и соответствующих графиков позволяет предположить прямую взаимосвязь между частотой просмотра респондентами спортивных соревнований по футболу и по бейсболу. Графические средства позволяют представить указанную тенденцию более наглядно.

Задание № 1

Проработать и представить в электронном и печатном виде рассмотренные выше примеры.

Задание № 2

Имеются следующие данные об одновременных покупках соков и фруктов в супермаркете пятидесяти покупателей мужского и женского пола.

Пол

Сок

Фрукт

Пол

Сок

Фрукт

муж.

апельс.

апельс.

муж.

апельс.

виногр.

муж.

яблочн.

яблоки

муж.

апельс.

яблоки

жен.

яблочн.

апельс.

жен.

апельс.

апельс.

муж.

апельс.

апельс.

жен.

апельс.

апельс.

муж.

виногр.

яблоки

муж.

виногр.

яблоки

жен.

апельс.

яблоки

муж.

апельс.

апельс.

жен.

яблочн.

апельс.

жен.

яблочн.

яблоки

муж.

апельс.

апельс.

жен.

апельс.

апельс.

жен.

апельс.

апельс.

муж.

яблочн.

яблоки

муж.

апельс.

апельс.

муж.

виногр.

виногр.

жен.

виногр.

виногр.

муж.

виногр.

апельс.

муж.

виногр.

виногр.

жен.

виногр.

апельс.

муж.

апельс.

яблоки

жен.

апельс.

яблоки

муж.

яблочн.

апельс.

жен.

апельс.

яблоки

жен.

апельс.

виногр.

муж.

яблочн.

апельс.

жен.

апельс.

виногр.

муж.

апельс.

яблоки

муж.

яблочн.

апельс.

муж.

яблочн.

яблоки

жен.

виногр.

виногр.

жен.

апельс.

апельс.

жен.

яблочн.

апельс.

муж.

апельс.

апельс.

муж.

апельс.

яблоки

муж.

яблочн.

яблоки

муж.

апельс.

апельс.

муж.

виногр.

виногр.

жен.

виногр.

виногр.

жен.

виногр.

виногр.

муж.

виногр.

виногр.

жен.

апельс.

яблоки

жен.

апельс.

апельс.

жен.

яблочн.

апельс.

муж.

яблочн.

яблоки

муж.

яблочн.

яблоки

1) Определить процентное соотношение мужчин и женщин, принявших участие в опросе.

Определить по данной выборке долю (в %) каждого вида соков (фруктов) в общем объеме купленных соков (фруктов).

2) Определить по данной выборке частоты предпочтения различных фруктов на каждом уровне предпочтения соков:

а) по всем респондентам в целом,

б) отдельно по мужчинам и женщинам.

Сравнить результаты анализа по пунктам а) и б).

Примечание. Для занесения данных в таблицу используйте английские эквиваленты:

пол – gender, мужской – male, женский – female, сок – juice, фрукты – fruits, апельсин/апельсиновый – orange, яблоки/яблочный – apple, виноград/виноградный – grape.

Задание № 3

В результате наблюдения получены следующие данные о величине процентной ставки коммерческих банков (%).

14,7

19,0

24,5

20,8

12,3

24,6

17,0

14,2

19,7

18,8

18,1

20,5

21,0

20,7

20,4

14,7

25,1

22,7

19,0

19,6

19,0

18,9

17,4

20,0

13,8

25,6

13,0

19,0

18,7

21,1

13,3

20,7

15,2

19,9

21,9

16,0

16,9

15,3

21,4

20,4

12,8

20,0

14,3

18,0

15,1

23,8

18,5

14,4

21,0

19,0

Произвести группировку коммерческих банков на основе величин их процентных ставок, задав пять равных интервалов. Какой интервал имеет наибольшую частоту? Перегруппируйте данные, используя опцию «Neat» intervals app.no. – Приближенное число интервалов. Какая из группировок более наглядна для экономического анализа?