Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Воронов Ю.П., Ершова Н.П. Общие принципы социологического измерения.doc
Скачиваний:
40
Добавлен:
21.01.2014
Размер:
4.82 Mб
Скачать

Об иерархии групп объектов в исследуемой совокупности

Пусть заданы множества признаков и. Используя их, необходимо построить и описать древовидную структуру групп объектов ( см. рис.5), чтобы:

а) каждая группа объектов, изображенная на графе вершиной, описывалась признаками из множества N;

б) общая мера различия по признакам множества М между группами, находящимися на одном уровне, была наибольшей из всех возможных.

Заметим, что количество ветвей, исходящих из вершин, расположенных на одном уровне, может быть различным и даже равным 1.

Выполнить первое условие несложно. Для этого достаточно, используя N, произвести f – признаковую группировку объектов и получить множество . Если для организации графа (см. рис.5) использовать как исходные группы объектов, то первое условие будет выполнено.

Допустим, что множество М таково, что любое его подмножество дает информацию об N меньшую J(N,M). Тоже допущение примем для N. Если N и М таковы, то отпадает необходимость в поиске таких N' и М' , чтобы

106

J(N,M)= J(N',M') и количества признаков в N' и М' были минимальны.

Объединим подмножества объектов множества α(1) в соответствии с изложенным ранее алгоритмом классификации. Пусть на шаге ν1 величина R(s) = (Xq,Xz) как функция номера шага S достигла максимума. Получим множества объектов . Введем эквивалентный признак. Изобразим эти группы объектов вершинами нижнего ряда графа (см. рис. 5). Очевидно, они удовлетворяют второму условию.

В М найдем подмножество, состоящее из (m – 1) признака и дающее максимальную информацию о . Обозначим это подмножествоМ(1) и соответствующий ему эквивалентный признак . Считая множество подмножеств объектовза исходное, проведем внутри его объединение. При этом мера близости междуиустанавливается по признакам подмножества М(1).

Объединение прекращается на шаге , когдадостигает максимума. Получаем множество подмножеств объектов, которое также удовлетворяет второму условию. Эти группы объектов изобразим вершинами предпоследнего уровня дерева графа.

Пусть подмножества объектов объединились в подмножествов результате второго объединения. Изобразим это на графе дугами, соединив вершины, соответствующиев последнем уровне графа, с вершинойв предпоследнем уровне.

В множестве М(1) найдем подмножество М(2), состоящее из m – 2 признаков и дающее максимальную информацию о среди всех подмножеств признаков принадлежащихМ(1).

Используя найденное М(2) произведем объединение групп объектов в группы объектов.

107

Получим группы объектов третьего уровня снизу.

Продолжая этот процесс, получим все m уровней графа, так как в исходном множестве М содержалось m признаков и на каждом цикле объединения удалялся всего один признак.

Неявные допущения

Пусть произведено W объединений и получены и эквивалентный признак. Очевидно, что для объединенияW использовалось множество М(w-1) из (m – W + 1) признака. Следуя изложенному алгоритму, нужно найти М(w) для которого и– максимально. Это первое неявное допущение при изложении алгоритма.

Однако не существует доказательства, что во множестве М не найдется такого подмножества М* с количеством признаков, что и в M(w), и такое, что . Кроме того, если даже допустить, чтомаксимально, т.е., то нельзя гарантировать, что объединение по множеству признаков М(w) эффективнее объединения с использованием М*, т.е. возможно, что все равно окажется больше. Это второе допущение. Можно предложить такой алгоритм объединения групп объектов:.

В М выделяются все подмножества, содержащие m – W признаков. По каждому из них производится объединение подмножеств объектов множества и запоминается максимум, которого достигает общая мера различия между группами объектов. Очевидно, таких величин нужно найти. Введем множествогде.

В R находится максимальный элемент. Пусть это будет Ræ. То подмножество признаков, при объединении которых был получен Ræ, и естъ искомое подмножество, наиболее выгодное для объединения подмножеств из .

108

Сомнительно, что последний алгоритм можно воплотить на машине. Именно поэтому были предложены сравнительно простые правила получения иерархии групп объектов.