Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
измерение и моделирование_ред_ Воронов_69.doc
Скачиваний:
11
Добавлен:
31.08.2019
Размер:
5.06 Mб
Скачать

Раздел II. Типология в.Л. Устюжанинов проБлема классификации в социологии и теория информации

Пусть имеем множество объектов α, на элементах которого определено множество признаков F.

Каждый признак имеет множество градаций ; α=1,2,…,tα ,где tα –количество градаций признака α

Допустим, хотя это и не принципиально, что нет признаков, принимающих несколько значений на одном объекте. Во множестве выделяются подмножества и Причем и – пустое множество.

Образуем признак, эквивалентный множеству признаков N. Обозначим его Хq, а соответствующее ему множество градаций . Определим множество подмно

94

жеств объектов . К – относятся объекты, попавшие в градацию по признаку Xq. Классы образуются в результате объединения элементов множества α.

При этом за систему признаков, по которой различаются классы, принимается множество признаков М. Очевидно, что конкретный объект из α попадает только в одно из множеств αi и, следовательно, только в один класс, полученный в результате объединения нескольких множеств αi. Это означает, что признаки однозначно описывают классы.

Для решения проблемы классификации необходимо решить следующие две задачи:

а) как разделять множество признаков F на подмножества N и М;

б) по какому принципу объединять элементы множества α.

Помимо содержательного разбиения всех признаков на два подмножества можно предложить следующий нестрогий формальный принцип.

Разбиение множества признаков на подмножества

Запишем матрицу парных информаций вида

Рассмотрим множество элементов столбца i, из которого исключен диагональный элемент. Максимальный элемент этого множества обозначим max Ji. Очевидно, он будет равен максимальной информации, даваемой о признаке і некоторым другим признаком. Образуем множество признаков S, для которых действительно неравенство max Ji ≥ к Н(Xi); 0 < к ≤ 1 едино

95

для всех признаков и выбирается произвольно.

Требования на М и N следующие:

1. Для любого признака из М должен существовать хотя бы один признак из N, такой, что . Очевидно, что при таком условии

2. Количество признаков множества N должно быть минимальным.

3. Должно выполняться равенство .

М и N удобнее искать на графах парных информаций.

Введем множества , для элементов которого действительно неравенство

; (1)

Для Хα, неравенство (1) очевидно, так как

Правила построения графов парных информаций:

1. Для столбца 1 матрицы J выделяются Т(1). Если Т(1)≡Х, . то делается шаг 2, иначе признаки изображаются вершинами графа от вершин признаков проводятся дуги к вершине признака Х1.

2. На S + 1 шаге для столбца S + 1 матрицы J выделяются T(S+1). Если T(S+1)ХS+1, то делается шаг S + 2, иначе признаки, вошедшие в , изображаются вершинами графа и от вершин признаков, вошедших в проводятся дуги к вершине признака ХS+1.

3. Построение графа кончается на шаге.

96

Пример. На рис. 1 дана матрица J. На главной диагонали-энтропии признаков. Используя значения энтропий и к =0.8, получаем, что S={Х1, Х2, Х3, Х4, Х5, Х6, Х7, Х8};

Т(1) = {X1}; Т(2) = {X1, X2}; Т(3) = {X1, X4, X3}; Т(4) = {X1, X3, X5, X4}; Т(5) = 3, Х7, Х5}; Т(6) = { Х4, Х6}; Т(7) = 5, Х7}; Т(8) = 4, Х8}; Т(9) = 9}.

Строится граф с использованием найденных T(i) (i = 1,2,…,9) (см. рис.2).

97

На графе выбраны множества N = {X1, X2, X3} и M = {X2, X3, X6, X7, X8}. Однако выбор не единствен, так как возможны N = {X1, X4, X7} и M = {X2, X3, X5, X4, X8}.