23. Простая и кросс-табуляция: принципы, область применения, достоверность результатов.

Табуляция

Табуляцией называется подсчет количества случаев, относящихся к различным категориям. При простой табуляции исследуется одна переменная, при перекрестной табуляции – две или более одновременно.

Способы проведения табуляции подразделяются на ручной, компьютерный, смешанный.

Сложность табуляции зависит от количества рассматриваемых переменных и количества категорий переменных.Простая табуляция

С помощью простой табуляции выполняется целый ряд действий.

1. Обобщение результатов исследования. Результаты представляются в удобной и компактной форме.

2. Выявление ошибок. Они могут возникнуть при редактировании, кодировании, вводе данных в компьютер. Например, при сборе данных об объеме продаж по городам из одного города пришли странные данные. Выяснилось, что один из служащих со скуки приписал к данным пять нулей.

Данные лучше представлять в процентах, причем с точностью до целых. В исключительных случаях, если на то есть веские причины, можно вводить один знак после запятой. Хорошее представление: абсолютная величина и рядом, в скобках, процент.

3. Определение выбросов (посторонних значений). Выброс – не обязательно ошибка. Это просто измерение, сильно отличающееся от других. Обычно его убирают из общего анализа и исследуют его отдельно.

4. Определение эмпирического распределения переменной. Строится гистограмма, частотный полигон или функция распределения. Пример полезности построения распределения – исследования мнений об одной марке кетчупа. Часть респондентов считала его очень мягким, другая часть – очень острым. В результате распределение получилось двухмодальным, что дало идею по-новому сегментировать рынок.

5. Получение суммарных статистик. По гистограмме легко можно получить моду, по функции распределения – медиану, квартили и процентили. По данным таблицы рассчитывается среднее и дисперсия (среднеквадратичное отклонение).

6. Решение вопроса, что делать с неответами по отдельным пунктам. Возможны следующие варианты:

оставить неответ и отчитаться категорией нет ответа;
для каждого вопроса указать, из скольких ответов получено среднее;
заменить неответ медианой, модой или другой оценкой.

Перекрестная табуляция

В данном методе выборка делится на подгруппы и исследуется, как изменяются зависимые переменные по подгруппам. Это дает более полезные результаты для принятия решений, чем простая табуляция.

Результаты перекрестной табуляции заключаются в гипотезах о наличии или отсутствии связей между двумя переменными, чаще всего – причиной и следствием.

Пример гипотезы. Количество автомобилей в семье зависит от дохода. Чем выше доход, тем больше автомобилей имеется в семье.

Однако гипотезы, выдвинутые при анализе перекрестных таблиц, могут оказаться и неверными.

26.Регрессионный анализ

Если корреляционный анализ исследует тесноту взаимосвязи между двумя или большим количеством переменных, то регрессионный – определяет форму этой связи, уравнение, которое связывает зависимую переменную с одной или несколькими причинными (независимыми). Оба метода часто используются совместно.

Следует отметить, что на самом деле регрессионный анализ имеет дело лишь с математической зависимостью, а не с причинно-следственными связями. Последние определяются той или иной теорией.

Применение регрессионного анализа будет рассмотрено на примере.

Пусть имеется производитель – компания по производству шариковых ручек. Она проводит кампании – стимулирование торговых представителей и рекламу по телевидению. Мера эффективности деятельности – годовой объем продаж по территориям Y_i, где i – номер территории.

Для исследований собираются следующие данные по территориям:

X_1i – количество торговых представителей;

X_2i – количество реклам по телевидению в месяц;

X_3i – общая оценка эффективности торговой сети (4 балла – отличная; 3 – хорошая; 2 – средняя; 1 – плохая).

Производится выборка n территорий из всей их совокупности. В координатах {X₁,Y}, {X₂,Y}, {X₃,Y} строятся точки, соответствующие каждой из территорий выборки. Они распределяются некоторым случайным образом, что объясняется неучетом других многочисленных параметров, случайными отклонениями, ошибками измерения и другими причинами.

Чтобы предсказать Y по известному значению X_i, можно построить аппроксимирующие функции. Для простоты они чаще всего делаются линейными:

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1313

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.08.2019203.26 Кб21Шпора по Физике.doc
#
09.02.20155.62 Mб15шпора(менеджмент).rtf
#
25.09.20198.94 Mб24шпора.rtf
#
25.09.2019153.6 Кб7Шпора_4 семестр.doc
#
15.04.201918.37 Mб39Шпорки).doc
#
29.10.2018345.09 Кб6Шпоры 2-й семестр.doc
#
28.10.20181.3 Mб21Шпоры АиГ 2 сем.doc
#
29.10.20189.55 Mб16Шпоры дрищ.doc
#
23.09.2019339.35 Кб8шпоры информатика.docx
#
17.04.2019229.38 Кб4шпоры логика 74 вопроса__.doc
#
09.02.20153.48 Mб64шпоры от 7401.doc