Кластерный анализ
В результате кластерного анализа при помощи предварительно заданных переменных формируются группы наблюдений — отдельные личности (респонденты). Члены одной группы (одного кластера) должны обладать схожими проявлениями переменных, а члены разных групп различными.
Проведя анализ в программе SPSS, получили такие данные:
|
|
Сводка обработки наблюденийa |
|
||||||||||||||
|
|
Наблюдения |
|
||||||||||||||
|
|
Валидные |
Пропущенные |
Всего |
|
||||||||||||
|
|
N |
Процент |
N N |
Процент |
N |
Процент |
|
|||||||||
|
|
35 |
100,0 |
00 |
,0 |
35 |
0,0 |
|
|||||||||
Шаги агломерации |
|||||||||||||||||
Этап |
Кластер объединен с |
Коэффициенты |
Этап первого появления кластера |
Следующий этап |
|||||||||||||
Кластер 1 |
Кластер 2 |
Кластер 1 |
Кластер 2 |
||||||||||||||
1 |
22 |
34 |
,000 |
0 |
0 |
24 |
|||||||||||
2 |
17 |
27 |
,000 |
0 |
0 |
16 |
|||||||||||
3 |
8 |
25 |
,000 |
0 |
0 |
11 |
|||||||||||
4 |
11 |
21 |
,000 |
0 |
0 |
10 |
|||||||||||
5 |
2 |
4 |
,000 |
0 |
0 |
25 |
|||||||||||
6 |
23 |
31 |
,500 |
0 |
0 |
12 |
|||||||||||
7 |
18 |
29 |
1,000 |
0 |
0 |
18 |
|||||||||||
8 |
12 |
19 |
1,500 |
0 |
0 |
16 |
|||||||||||
9 |
1 |
10 |
2,000 |
0 |
0 |
20 |
|||||||||||
10 |
11 |
14 |
2,667 |
4 |
0 |
20 |
|||||||||||
11 |
6 |
8 |
3,333 |
0 |
3 |
25 |
|||||||||||
12 |
7 |
23 |
4,167 |
0 |
6 |
23 |
|||||||||||
13 |
13 |
33 |
5,167 |
0 |
0 |
28 |
|||||||||||
14 |
28 |
32 |
6,167 |
0 |
0 |
26 |
|||||||||||
15 |
3 |
24 |
7,167 |
0 |
0 |
21 |
|||||||||||
16 |
12 |
17 |
8,417 |
8 |
2 |
19 |
|||||||||||
17 |
16 |
26 |
9,917 |
0 |
0 |
23 |
|||||||||||
18 |
5 |
18 |
11,417 |
0 |
7 |
26 |
|||||||||||
19 |
12 |
20 |
13,667 |
16 |
0 |
24 |
|||||||||||
20 |
1 |
11 |
16,500 |
9 |
10 |
30 |
|||||||||||
21 |
3 |
35 |
19,500 |
15 |
0 |
32 |
|||||||||||
22 |
15 |
30 |
23,000 |
0 |
0 |
29 |
|||||||||||
23 |
7 |
16 |
26,567 |
12 |
17 |
28 |
|||||||||||
24 |
12 |
22 |
30,281 |
19 |
1 |
27 |
|||||||||||
25 |
2 |
6 |
34,014 |
5 |
11 |
31 |
|||||||||||
26 |
5 |
28 |
38,214 |
18 |
14 |
27 |
|||||||||||
27 |
5 |
12 |
44,883 |
26 |
24 |
30 |
|||||||||||
28 |
7 |
13 |
51,769 |
23 |
13 |
29 |
|||||||||||
29 |
7 |
15 |
61,761 |
28 |
22 |
31 |
|||||||||||
30 |
1 |
5 |
73,354 |
20 |
27 |
34 |
|||||||||||
31 |
2 |
7 |
87,819 |
25 |
29 |
32 |
|||||||||||
32 |
2 |
3 |
108,118 |
31 |
21 |
33 |
|||||||||||
33 34 |
2 1 |
9 2 |
132,454 215,887 |
32 30 |
0 33 |
34 0 |
По двум колонкам, расположенным под общей шапкой «Объединение в кластеры», можно увидеть, что на первом шаге были объединены наблюдения 22 и 34. Эти две марки максимально похожи друг на друга и отдалены друг от друга очень малое расстояние. Эти два наблюдения образовывают кластер с номером 12, в то время как кластер 34 в обзорной таблице больше не появляется. На следующем шаге происходит объединение наблюдений 17 и 27, затем 8 и 25 и т.д.
Для определения, какое количество кластеров следовало бы считать оптимальным, решающее значение имеет показатель, выводимый под заголовком "Коэффициенты". Под этим коэффициентом подразумевается расстояние между двумя кластерами, определенное на основании выбранной дистанционной меры с учётом предусмотренного преобразования значений. В нашем случае это квадрат евклидового расстояния, определенный с использованием стандартизованных значений. На этом этапе, где эта мера расстояния между двумя кластерами увеличивается скачкообразно, процесс объединения в новые кластеры необходимо остановить, так как в противном случае были бы объединены уже кластеры, находящиеся на относительно большом расстоянии друг от друга.
В приведенном примере — это скачок с 73,354 до 87,819 (этап 30-31). От 35 переменных отнимаем 30 и получаем 5 кластеров. Это означает, что после образования четырёх кластеров мы больше не должны производить никаких последующих объединений, а результат с четырьмя кластерами является оптимальным. Оптимальным считается число кластеров равное разности количества наблюдений (здесь: 35) и количества шагов, после которого коэффициент увеличивается скачкообразно (здесь: 61).
Согласно данной дендрограмме, можно выделить такие 5 кластеров:
Кластер 1 – 22, 34, 17, 27, 12, 19, 20, 28, 32, 32, 18, 29, 5, 1, 10, 11, 21, 14.
Кластер 2 – 3, 24, 35.
Кластер 3 – 2, 4, 8, 25, 6.
Кластер 4 – 15, 30, 13, 33, 23, 31, 7, 16, 26.
Кластер 5 – 9.