Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Индивидуальное задание.docx
Скачиваний:
6
Добавлен:
12.05.2022
Размер:
921.78 Кб
Скачать

Кластерный анализ

В результате кластерного анализа при помощи предварительно заданных переменных формируются группы наблюдений — отдельные личности (респонденты). Члены одной группы (одного кластера) должны обладать схожими проявлениями переменных, а члены разных групп различными.

Проведя анализ в программе SPSS, получили такие данные:

Сводка обработки наблюденийa

Наблюдения

Валидные

Пропущенные

Всего

N

Процент

N N

Процент

N

Процент

35

100,0

00

,0

35

0,0

Шаги агломерации

Этап

Кластер объединен с

Коэффициенты

Этап первого появления кластера

Следующий этап

Кластер 1

Кластер 2

Кластер 1

Кластер 2

1

22

34

,000

0

0

24

2

17

27

,000

0

0

16

3

8

25

,000

0

0

11

4

11

21

,000

0

0

10

5

2

4

,000

0

0

25

6

23

31

,500

0

0

12

7

18

29

1,000

0

0

18

8

12

19

1,500

0

0

16

9

1

10

2,000

0

0

20

10

11

14

2,667

4

0

20

11

6

8

3,333

0

3

25

12

7

23

4,167

0

6

23

13

13

33

5,167

0

0

28

14

28

32

6,167

0

0

26

15

3

24

7,167

0

0

21

16

12

17

8,417

8

2

19

17

16

26

9,917

0

0

23

18

5

18

11,417

0

7

26

19

12

20

13,667

16

0

24

20

1

11

16,500

9

10

30

21

3

35

19,500

15

0

32

22

15

30

23,000

0

0

29

23

7

16

26,567

12

17

28

24

12

22

30,281

19

1

27

25

2

6

34,014

5

11

31

26

5

28

38,214

18

14

27

27

5

12

44,883

26

24

30

28

7

13

51,769

23

13

29

29

7

15

61,761

28

22

31

30

1

5

73,354

20

27

34

31

2

7

87,819

25

29

32

32

2

3

108,118

31

21

33

33

34

2

1

9

2

132,454

215,887

32

30

0

33

34

0

По двум колонкам, расположенным под общей шапкой «Объединение в кластеры», можно увидеть, что на первом шаге были объединены наблюдения 22 и 34. Эти две марки максимально похожи друг на друга и отдалены друг от друга очень малое расстояние. Эти два наблюдения образовывают кластер с номером 12, в то время как кластер 34 в обзорной таблице больше не появляется. На следующем шаге происходит объединение наблюдений 17 и 27, затем 8 и 25 и т.д.

Для определения, какое количество кластеров следовало бы считать оптимальным, решающее значение имеет показатель, выводимый под заголовком "Коэффициенты". Под этим коэффициентом подразумевается расстояние между двумя кластерами, определенное на основании выбранной дистанционной меры с учётом предусмотренного преобразования значений. В нашем случае это квадрат евклидового расстояния, определенный с использованием стандартизованных значений. На этом этапе, где эта мера расстояния между двумя кластерами увеличивается скачкообразно, процесс объединения в новые кластеры необходимо остановить, так как в противном случае были бы объединены уже кластеры, находящиеся на относительно большом расстоянии друг от друга.

В приведенном примере — это скачок с 73,354 до 87,819 (этап 30-31). От 35 переменных отнимаем 30 и получаем 5 кластеров. Это означает, что после образования четырёх кластеров мы больше не должны производить никаких последующих объединений, а результат с четырьмя кластерами является оптимальным. Оптимальным считается число кластеров равное разности количества наблюдений (здесь: 35) и количества шагов, после которого коэффициент увеличивается скачкообразно (здесь: 61).

Согласно данной дендрограмме, можно выделить такие 5 кластеров:

Кластер 1 – 22, 34, 17, 27, 12, 19, 20, 28, 32, 32, 18, 29, 5, 1, 10, 11, 21, 14.

Кластер 2 – 3, 24, 35.

Кластер 3 – 2, 4, 8, 25, 6.

Кластер 4 – 15, 30, 13, 33, 23, 31, 7, 16, 26.

Кластер 5 – 9.