Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Индивидуальное задание.docx
Скачиваний:
6
Добавлен:
12.05.2022
Размер:
921.78 Кб
Скачать

Дискриминантный анализ

С помощью дискриминантного анализа на основании некоторых признаков (независимых переменных) респондент может быть причислен к одной из двух (или к одной из нескольких) заданных заранее групп.

В нашем примере число респондентов, принявших участие в опросе, составляет 35; из этих данных 34 анкеты являются действительными (есть один респондент, не давший ответ на какой-либо из вопросов (в 5м кластере, далее он не учитывается)).

В таблице "Групповые статистики" (Статистические показатели по группам) показаны результаты расчета средних значений независимым переменных в каждой группе.

С данных таблицы можно сделать вывод, что потребителям при выборе йогуртов важными факторами в первую очередь являются качество и вкус, а наименее значимым - упаковка. В среднем все потребители практически одинаково принадлежат к критериям выбора йогуртов.

Исходя из таблицы «Критерий равенства групповых средних», необходимо выбрать независимые дискриминационные переменные. Для проведения теста на равенство средних значений в группах используется коэффициент Лямбда Уилкса, значение которого должно быть минимальным.

Значимость всех переменных меньше 0,05. Это означает, что различия между потребителями, которые оценивали качество, вкус, упаковку, цену и отзывы – значимы.

Следует также доказать, что они являются действительно независимыми. Значения этих переменных не должны обусловливать друг друга. Для этого рассчитывается коэффициент корреляции, характеризующий связь между исследуемыми переменными.

Поскольку есть три группы, можно определить значения двух функций. Собственное значение первой функции равен 3,395, и эта функция объясняет 72,0% понятной дисперсии. Собственное значение невелико, но первая функция, вероятно старше. Вторая функция имеет собственное значение еще ниже, равное 1,291, и объясняет 27,6% понятной дисперсии.

Значение коэффициента Уилкса равняется 0,099, и он превращается в статистику X-Квадрат, равному 66,975, с 10 ступенями свободы, значение которых выше 0,05. Таким образом, 2 функции вместе значительно дискриминируют (различают) 3 группы. Однако после исключения первой функции, коэффициент Уилкса, соответствующий 2 функции, равняется 0,436, и является незначащим при уровне 0,05. Поэтому вторая функция не вносит значительный вклад в групповые отличия. В нашем примере значение показателя «Знач.» составляет <0,001, что свидетельствует о высокой значимости различий средних значений.

При помощи стандартизированных коэффициентов дискриминантной функции можно оценить относительный вклад каждой дискриминационной переменной в различие двух исследуемых групп.

В нашем случае определяем дискриминантные модели двух функций. В первой дискриминантной функции переменной с крупнейшим коэффициентом оказалась переменная «Цена» (0,689). Во второй функции переменными с крупнейшими коэффициентами оказалась «Отзывы» (0,861).

В соответствии с данными, представленными в таблице «Коэффициенты канонической дискриминантрой функции», дискриминантная модель, построенная в результате проведения дискриминантного анализа, имеет следующий вид:

Функция «Цена»

d = - 8,628 + 0,295Х1 + 0,534Х2 + 0,779Х3 + 0,822Х4 - 0,054Х5

где Х1 — Качество; Х2— Вкус; Х3 — Упаковка; Х4 — Цена; Х5 — Отзывы.

Функция «Отзывы»

d = - 2,130 + 0,291Х1 - 0,556Х2 + 0,247Х3 - 0,558Х4 + 1,376Х5

где Х1 — Качество; Х2— Вкус; Х3 — Упаковка; Х4 — Цена; Х5 — Отзывы.

Как отмечалось ранее, построенная дискриминантная модель должна как можно более четко разделять исследуемые группы. Четкость разделения исследуемых групп характеризуется расстоянием между средними значениями дискриминантной функции в исследуемых группах.

Насколько четко разделены группы респондентов на тех, кто высоко оценивал Упаковку и тех, кто высоко оценивал Отзывы можно определить на основе расстояний между средними в группах (центроиды групп).

В данном случае расстояние между средними в первой группе значительно - от +1, 744 до - 1,895. Чем больше расстояние между средними в группах, тем больше различий между группами. Расстояние между средними второй группы незначительно (от – 1,895 до – 1,037).

В нашем случае все начальные сгруппированы наблюдения классифицированы правильно.