Кластерный анализ

В результате кластерного анализа при помощи предварительно заданных переменных формируются группы наблюдений — отдельные личности (респонденты). Члены одной группы (одного кластера) должны обладать схожими проявлениями переменных, а члены разных групп различными.

Проведя анализ в программе SPSS, получили такие данные:

		Сводка обработки наблюдений^a
		Наблюдения
		Валидные					Пропущенные				Всего
		N		Процент			N N			Процент	N		Процент
		35		100,0			00			,0	35		0,0
Шаги агломерации
Этап	Кластер объединен с				Коэффициенты			Этап первого появления кластера						Следующий этап
	Кластер 1		Кластер 2					Кластер 1			Кластер 2

1	22		34			,000			0			0			24
2	17		27			,000			0			0			16
3	8		25			,000			0			0			11
4	11		21			,000			0			0			10
5	2		4			,000			0			0			25
6	23		31			,500			0			0			12
7	18		29			1,000			0			0			18
8	12		19			1,500			0			0			16
9	1		10			2,000			0			0			20
10	11		14			2,667			4			0			20
11	6		8			3,333			0			3			25
12	7		23			4,167			0			6			23
13	13		33			5,167			0			0			28
14	28		32			6,167			0			0			26
15	3		24			7,167			0			0			21
16	12		17			8,417			8			2			19
17	16		26			9,917			0			0			23
18	5		18			11,417			0			7			26
19	12		20			13,667			16			0			24
20	1		11			16,500			9			10			30
21	3		35			19,500			15			0			32
22	15		30			23,000			0			0			29
23	7		16			26,567			12			17			28
24	12		22			30,281			19			1			27
25	2		6			34,014			5			11			31
26	5		28			38,214			18			14			27
27	5		12			44,883			26			24			30
28	7		13			51,769			23			13			29
29	7		15			61,761			28			22			31
30	1		5			73,354			20			27			34
31	2		7			87,819			25			29			32
32	2		3			108,118			31			21			33
33 34	2 1		9 2			132,454 215,887			32 30			0 33			34 0

По двум колонкам, расположенным под общей шапкой «Объединение в кластеры», можно увидеть, что на первом шаге были объединены наблюдения 22 и 34. Эти две марки максимально похожи друг на друга и отдалены друг от друга очень малое расстояние. Эти два наблюдения образовывают кластер с номером 12, в то время как кластер 34 в обзорной таблице больше не появляется. На следующем шаге происходит объединение наблюдений 17 и 27, затем 8 и 25 и т.д.

Для определения, какое количество кластеров следовало бы считать оптимальным, решающее значение имеет показатель, выводимый под заголовком "Коэффициенты". Под этим коэффициентом подразумевается расстояние между двумя кластерами, определенное на основании выбранной дистанционной меры с учётом предусмотренного преобразования значений. В нашем случае это квадрат евклидового расстояния, определенный с использованием стандартизованных значений. На этом этапе, где эта мера расстояния между двумя кластерами увеличивается скачкообразно, процесс объединения в новые кластеры необходимо остановить, так как в противном случае были бы объединены уже кластеры, находящиеся на относительно большом расстоянии друг от друга.

В приведенном примере — это скачок с 73,354 до 87,819 (этап 30-31). От 35 переменных отнимаем 30 и получаем 5 кластеров. Это означает, что после образования четырёх кластеров мы больше не должны производить никаких последующих объединений, а результат с четырьмя кластерами является оптимальным. Оптимальным считается число кластеров равное разности количества наблюдений (здесь: 35) и количества шагов, после которого коэффициент увеличивается скачкообразно (здесь: 61).

Согласно данной дендрограмме, можно выделить такие 5 кластеров:

Кластер 1 – 22, 34, 17, 27, 12, 19, 20, 28, 32, 32, 18, 29, 5, 1, 10, 11, 21, 14.

Кластер 2 – 3, 24, 35.

Кластер 3 – 2, 4, 8, 25, 6.

Кластер 4 – 15, 30, 13, 33, 23, 31, 7, 16, 26.

Кластер 5 – 9.

<<< < Предыдущая 1 2 34 / 64 5 6 > Следующая >>>

Соседние файлы в предмете Маркетинговые исследования

#
12.05.202228.23 Кб37все тесты Сотников экз.docx
#
12.05.2022921.78 Кб6Индивидуальное задание.docx