Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры 2-й семестр.doc
Скачиваний:
6
Добавлен:
29.10.2018
Размер:
345.09 Кб
Скачать

23. Простая и кросс-табуляция: принципы, область применения, достоверность результатов.

Табуляция

Табуляцией называется подсчет количества случаев, относящихся к различным категориям. При простой табуляции исследуется одна переменная, при перекрестной табуляции – две или более одновременно.

Способы проведения табуляции подразделяются на ручной, компьютерный, смешанный.

Сложность табуляции зависит от количества рассматриваемых переменных и количества категорий переменных.Простая табуляция

С помощью простой табуляции выполняется целый ряд действий.

1. Обобщение результатов исследования. Результаты представляются в удобной и компактной форме.

2. Выявление ошибок. Они могут возникнуть при редактировании, кодировании, вводе данных в компьютер. Например, при сборе данных об объеме продаж по городам из одного города пришли странные данные. Выяснилось, что один из служащих со скуки приписал к данным пять нулей.

Данные лучше представлять в процентах, причем с точностью до целых. В исключительных случаях, если на то есть веские причины, можно вводить один знак после запятой. Хорошее представление: абсолютная величина и рядом, в скобках, процент.

3. Определение выбросов (посторонних значений). Выброс – не обязательно ошибка. Это просто измерение, сильно отличающееся от других. Обычно его убирают из общего анализа и исследуют его отдельно.

4. Определение эмпирического распределения переменной. Строится гистограмма, частотный полигон или функция распределения. Пример полезности построения распределения – исследования мнений об одной марке кетчупа. Часть респондентов считала его очень мягким, другая часть – очень острым. В результате распределение получилось двухмодальным, что дало идею по-новому сегментировать рынок.

5. Получение суммарных статистик. По гистограмме легко можно получить моду, по функции распределения – медиану, квартили и процентили. По данным таблицы рассчитывается среднее и дисперсия (среднеквадратичное отклонение).

6. Решение вопроса, что делать с неответами по отдельным пунктам. Возможны следующие варианты:

  • оставить неответ и отчитаться категорией нет ответа;

  • для каждого вопроса указать, из скольких ответов получено среднее;

  • заменить неответ медианой, модой или другой оценкой.

Перекрестная табуляция

В данном методе выборка делится на подгруппы и исследуется, как изменяются зависимые переменные по подгруппам. Это дает более полезные результаты для принятия решений, чем простая табуляция.

Результаты перекрестной табуляции заключаются в гипотезах о наличии или отсутствии связей между двумя переменными, чаще всего – причиной и следствием.

Пример гипотезы. Количество автомобилей в семье зависит от дохода. Чем выше доход, тем больше автомобилей имеется в семье.

Однако гипотезы, выдвинутые при анализе перекрестных таблиц, могут оказаться и неверными.

26.Регрессионный анализ

Если корреляционный анализ исследует тесноту взаимосвязи между двумя или большим количеством переменных, то регрессионный – определяет форму этой связи, уравнение, которое связывает зависимую переменную с одной или несколькими причинными (независимыми). Оба метода часто используются совместно.

Следует отметить, что на самом деле регрессионный анализ имеет дело лишь с математической зависимостью, а не с причинно-след­ствен­ны­ми связями. Последние определяются той или иной теорией.

Применение регрессионного анализа будет рассмотрено на примере.

Пусть имеется производитель – компания по производству шариковых ручек. Она проводит кампании – стимулирование торговых представителей и рекламу по телевидению. Мера эффективности деятельности – годовой объем продаж по территориям Yi, где i – номер территории.

Для исследований собираются следующие данные по территориям:

X1i – количество торговых представителей;

X2i – количество реклам по телевидению в месяц;

X3i – общая оценка эффективности торговой сети (4 балла – отличная; 3 – хорошая; 2 – средняя; 1 – плохая).

Производится выборка n территорий из всей их совокупности. В координатах {X1,Y}, {X2,Y}, {X3,Y} строятся точки, соответствующие каждой из территорий выборки. Они распределяются некоторым случайным образом, что объясняется неучетом других многочисленных параметров, случайными отклонениями, ошибками измерения и другими причинами.

Чтобы предсказать Y по известному значению Xi, можно построить аппроксимирующие функции. Для простоты они чаще всего делаются линейными:

29

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]