Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Моделирование (студентам).doc
Скачиваний:
115
Добавлен:
07.12.2018
Размер:
3.11 Mб
Скачать

2.3.2. Основные методы классификации

Как следует из вышеизложенного, классификация есть искусство разделять множество объектов на подмножества. Вместе с тем разработано несколько стандартных схем классификации. Здесь мы рассмотрим лишь две различающиеся разной стратегией применения классификационных признака схем: иерархическую и фасетную.

Иерархическая схема классификации – есть реализация последовательного разбиения исходного множества объектов на подмножества (классы, группы). Фасетная схема классификации – есть процесс параллельного разбиения исходного множества объектов на подмножества (классы, группы).

Рассмотрим основные идеи этих методов для создания систем классификации, следуя работе1.

Иерархическая схема классификации.

В теории систем термин иерархия (от греч. hieros - священный и arche – власть) означает расположение компонентов элементов системы в порядке от высшего (старшего, главного) к низшему. Схема построения иерархической классификации выглядит следующим образом:

  • вначале все исходное множество элементов составляет условный 0-й уровень;

  • элементы этого множества делятся в соответствии с выбранным для этого уровня классификационным признаком на классы, которые образуют 1-й уровень иерархической структуры;

  • каждый класс 1-го уровня с помощью классификационного признака характерного только для этого уровня делится на подклассы, которые образуют 2-й уровень;

  • каждый класс 2-го уровня аналогично (по своему признаку) делится на группы, которые образуют 3-й уровень и т.д.

Иерархическая классификация формирует весьма жесткие структуры. Поэтому здесь особое внимание следует уделить выбору классификационных признаков. В частности в иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному и тому же классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей классификации в каждом новом классе необходимо задавать свои классификационные признаки и их значения. Каждый уровень классификации называется уровнем иерархии. Заметим, что выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации и зависит от решаемой задачи.

К неоспоримым достоинствам иерархической системы классификации можно отнести:

  • простоту построения;

  • использование независимых классификационных признаков в различных ветвях иерархической структуры.

Основные недостатки иерархической системы классификации таковы:

  • жесткость полученной структуры, которая приводит к сложности внесения последующих изменений, так как для этого приходится перераспределять все классификационные группировки;

  • невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Рассмотрим следующий пример. Поставлена задача - создать иерархическую систему классификации для системы "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей. Одним из результатов такой классификации будут следующий:

  • 0-й уровень. Информационный объект "Университет";

  • 1-й уровень. Выбирается классификационный признак - название факультета, что позволяет сформировать несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах соответствующих факультетов;

  • 2-й уровень. Выбирается классификационный признак - возраст, который имеет, например, три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. Таким образом, на каждом факультете выделяются три возрастные подкласса студентов;

  • 3-й уровень. Выбирается классификационный признак - пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы - мужчин и женщин;

  • 4-й уровень. Выбирается классификационный признак - наличие детей у женщин: есть, нет.

Очевидно, что созданная иерархическая система классификации имеет глубину классификации, равную четырем.

Рассмотрим некоторые основные типы иерархических структур.

Линейные структуры. Это самый простой вариант иерархической структуры. Иерархическая структура называется линейной, когда на каждом уровне иерархии может находиться только одна структурная единица - элемент структуры (Рис.2.3). В этом случае мы будем иметь упорядоченное множество, состоящее из элементов .

Структурные свойства этого множества, по сути, ограничиваются лишь линейным (одномерным) относительным положением элементов, т.е. условиями: - является первым элементом (корнем структуры), если , то - му элементу предшествует элемент , а за ним непосредственно следует элемент , последний элемент структуры есть . Поскольку в иерархических структурах упорядочение элементов осуществляется в соответствии с их структурной «сложностью», отражающей преемственность их строения, то различают восходящую линейную структуру: и нисходящую линейную структуру: . Знак означает предпочтение преимущество, старшинство и т.п. (не путать со знаком “>” означающим “больше“ и определенным только на множестве действительных чисел). Например, если группа людей построена по росту, то имеем нисходящую структуру, если же расположить виды образования в следующем порядке: начальное, среднее, высшее, то получим восходящую линейную структуру1

Рис.2.3. Линейная структура

Древовидные структуры. Древовидные структуры являются, по-видимому, одними из самых «древних» структур, которые в течение многих веков постоянно находили и находят множество применений, достаточно вспомнить понятие «генеалогическое дерево» (напомним, что деревом называется связный граф, не имеющий циклов).

Удобной моделью древовидной структуры выступает ориентированное дерево. Действительно, когда изображают древовидную структуру, то удобно использовать следующее описание. Имеется один специально обозначенный элемент, называемый корнем дерева. Он непосредственно связан с несколькими другими элементами - элементами первого уровня. В свою очередь каждый элемент первого уровня связан с несколькими элементами второго уровня и т.д. Важно, что каждый нижестоящий связан лишь с одним из элементов более высокого уровня. В итоге будет построена древовидная структура. На Рис.2.4. изображена древовидная структура, состоящая из 10 элементов, корнем является элемент , элементами второго уровня являются элементы и .

Каждый элемент может рассматриваться как корень некоторого поддерева (подсистемы). Например, элементы , и образуют поддерево с корнем . Это обстоятельство означает, что древовидная структура обладает рекурсивным характером, т.е. дерево может быть определено в терминах самих же деревьев, что является существенным свойством такого рода структур. Так рекурсивный характер деревьев проявляется в природе: почки молодого дерева вырастают в ветви, имеющие собственные почки, которые дают новые ветви и т.д.

Сетевые иерархические структуры. Если любой элемент системы может быть произвольным образом быть связан с любыми другими элементами этой системы, то говорят, что она имеет сетевую структуру. В общем случае моделью такой иерархической структуры является ориентированный граф. Следует понимать, что всегда существует возможность осуществить разложение системы на части и изобразить отдельные ее компоненты, или даже всю систему, в виде двоичных деревьев. В частности сетевая иерархическая структура может рассматриваться как обобщение древовидной иерархической структуры (см. Рис.2.5.).

Рис.2.4. Древовидная структура

Например, генеалогические деревья являются древовидными структурами только потому, что не включают женщин. Однако если учесть, что каждый человек имеет двух родителей, то вместо генеалогического дерева мы получили бы более общую иерархическую структуру – сетевую генеалогическую структуру.

Рис.2.5. Пример сетевой иерархической структуры

Фасетная система классификации.

Фасетами называют признаки классификации (facet - рамка). Каждый фасет содержит совокупность однородных значений данного классификационного признака. Например, фасет «Цвет» может иметь значения: красный, оранжевый, желтый, зеленый, голубой, синий, фиолетовый. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Фасетная схема классификации основана на делении классифицируемого множества сразу по нескольким классификационным признакам одновременно. Процедура фасетной классификации состоит в присвоении объекту соответствующих значений признаков по каждому из определенного набора фасетов. Таким образом, каждому из классифицируемых объектов приписывается вектор значений признаков. Тем самым фасетная схема классификации обеспечивает как бы «параллельное разделение множества объектов на независимые классификационные группировки.

Схема построения фасетной схемы классификации удобно реализовать в виде таблицы, в которой названия столбцов соответствуют выделенным классификационным признакам (фасетам), название строк – имена объектов, а в клетках таблицы стоят значения соответствующих фасет. В результате классификации каждому объекту будут сопоставлены конкретные значения некоторых классификационных признаков.

Пусть, например, для классификации объектов выбраны следующие признаки (фасеты): цвет, размер, цена. Тогда классификация четырех объектов A, B, C и D может быть отображена, например, следующей таблицей

Объект

Цвет

Размер

Цена

A

Голубой

46

1079

B

Красный

48

1203

C

Черный

46

1264

D

Красный

50

3105

Примечания.

1. При реализации классификации по фасетной схеме необходимо, чтобы значения, используемые в различных фасетах, не повторялись.

2. В перечне признаков для данного объекта могут быть представлены не все фасеты.

Достоинства фасетной схемы классификации следующие:

  • возможность реализации классификации большой емкости, т.е. можно использовать большое число признаков классификации и их значений для создания группировок;

  • возможность достаточно простой модификации схемы классификации по одним признакам без изменения структуры по другим признакам;

  • фасетная схема классификации позволяет (в отличие от иерархической) выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта.

Основным недостатком фасетной схемы классификации является сложность ее построения, так как для каждого объекта необходимо учитывать все многообразие классификационных признаков.

Дескрипторная схема классификации. В основе дескрипторной (описательной) схемы классификации положен дескрипторный язык – язык информационных запросов посредством дескрипторов и/или ключевых слов. Вначале формируется некоторая совокупность дескрипторов, относительно которых данное множество объектов разбивается на классы. Дескриптор — это термин естественного языка (слово или словосочетание), используемый при описании объектов, который имеет самостоятельный смысл и неделим без изменения своего значения (лексическая единица). Это может быть и ключевое слово, определяющее данный объект и, следовательно, определяющее принадлежность объекта к соответствующему классу1

Отметим, что если фасетная классификация в обязательном порядке требует нескольких независимых наборов ключевых слов, то дескрипторная - всего один набор признаков. В этой связи дескрипторную классификацию можно рассматривать как частный случай фасетной. Однако в связи с ее широким распространением она часто выделяется в качестве отдельной схемы.

Схема реализации дескрипторной классификации следующая:

  • отбирается совокупность ключевых слов (словосочетаний), описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

  • выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребляемых;

  • создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации, среди которых нет синонимов.

Между дескрипторами сформированного словаря устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

  • синонимические указывающие на некоторую совокупность ключевых слов как на синонимы. Так связь: студент-учащийся-обучаемый довольно часто может считаться синонимической. Вместе с тем, когда хотят подчеркнуть различие учебных заведений, то эту связь уже нельзя отнести к синонимической;

  • родовидовые, отражающие включение некоторого класса объектов в более представительный класс; Пример родовидовой связи: университет-факультет-кафедра;

  • ассоциативные, соединяющие дескрипторы, обладающие общими свойствами. Так, например, связь студент-лекция-профессор-аудитория относится к ассоциативной, поскольку каждый из этих дескрипторов может быть отнесен к одному и потому же понятию, например, быть компонентом описания учебного занятия.

2.3.3. Некоторые классы систем

Классификацию систем можно проводить по самым различным признакам, например, по факту взаимодействия со средой — открытые и закрытые, по виду отображаемого объекта (технические, биологические, экономические и т.д.), различая живые и неживые, абстрактные и материальные системы. Так в работе1 представлена следующая таблица классификации систем

Основание (критерии) классификации

Классы систем

По взаимодействию с внешней средой

Открытые Закрытые Комбинированные

По структуре

Простые Сложные Большие

По характеру функций

Специализированные Многофункциональные (универсальные)

По характеру развития

Стабильные Развивающиеся

По степени организованности

Хорошо организованные Плохо организованные (диффузные)

По сложности поведения

Автоматические Решающие Самоорганизующиеся Предвидящие Превращающиеся

По характеру связи между элементами

Детерминированные Стохастические

По характеру структуры управления

Централизованные Децентрализованные

По назначению

Производящие Управляющие Обслуживающие

Здесь мы рассмотрим классификации, которые представляются наиболее важными с позиций моделирования систем.

Детерминированные и стохастические системы. Системы, состояние которых однозначно определяется начальными значениями их параметров и может быть предсказано для любого момента времени, называются детерминированными системами.

Многие математические модели детерминированных систем реализуются в форме уравнений. Пусть, например, модель системы выражена в виде дифференциальных уравнений. Тогда решение этих уравнений – есть модель траектории движения описываемой системы в соответствующем фазовом пространстве. Это позволяет при выбранных начальных условиях получить однозначное описание состояния системы в любой последующий момент времени.

Стохастические системы – системы, изменения в которых носят случайный характер. Следовательно, однозначно описать состояние стохастической системы в какой-то предстоящий момент времени невозможно. Например, невозможно точно предсказать, сколько вызовов может поступить в дежурную часть скорой медицинской помощи между двумя и пятью часами ночи или, какое количество осадков выпадет в предстоящем месяце. Случайные воздействия могут прикладываться к системе извне, или возникать внутри ее некоторых элементов (например, внутренние шумы).

При моделировании таких систем обычно применяется аппарат стохастического моделирования, использующего результаты теории вероятности и математической статистики. При этом оценки случайных параметров, как правило, формируются по результатам предварительных экспериментов (испытаний).

Стохастические системы можно моделировать, используя и детерминированные модели, ориентируясь, например, на средние или наиболее вероятные значения параметров. Однако этот путь обычно приводит к чрезмерному загрублению моделей и, как следствие, недопустимому снижению точности результатов исследования.

Несомненно, что все реальные системы в той или иной мере относятся к стохастическим. Детерминированными их считают в тех случаях, если при решении поставленной задачи учет их стохастических свойств не требуется.

Классификация систем по размеру и сложности. Классификация систем по размеру, обычно на малые и большие, осуществляется по мере достаточности материальных ресурсов для ее описания. Та система, для исследования которой недостает определенных материальных ресурсов (машинного времени, емкости памяти и др.) называется большой системой1. Отсюда следует, что перевод системы из большой в небольшую систему производится за счет добавления соответствующего ресурса.

С этих позиций система является большой, когда количество ее возможных состояний (разнообразие) превышает возможности исследователя проанализировать все из них. Известно, что при использовании изощренных шифров задачи расшифровки требую проведения огромного количество вычислительных операций. Если при имеющихся вычислительных мощностях для решения задачи не хватает времени, то проблема, вообще-то, разрешается, если в достаточной мере увеличить, например, скорость вычислений, использовав более мощную технику или более эффективные алгоритмы.

Классификация систем по сложности, разделение на простые и сложные, осуществляется по мере достаточности информации для ее описания. Понятие сложность представляет собой нечто, относящееся к разнообразным проявлениям жизни (вспомним, что «нельзя объять необъятное»). Систему называют сложной, если для ее адекватного описания и/или управления ею располагают недостаточной информацией, в противном случае система считается простой. Следовательно, для перевода системы из сложной в простую необходимо получение некоторой дополнительной информации.

Признаки сложных систем: многоаспектность (многомерность) многосвязность, многоконтурность, а так же многоуровневый, составной и многоцелевой характер построения. При разработке сложных систем возникают проблемы, относящиеся не только к свойствам составляющих их элементов и подсистем, но также к закономерностям функционирования системы в целом. При этом появляется широкий круг специфических задач, таких, как определение общей структуры системы; организация взаимодействия между элементами и подсистемами; учет влияния внешней среды; выбор оптимальных режимов функционирования системы; оптимальное управление системой и др.

Чем определяется сложность систем? Сложность системы, прежде всего, зависит от принятого уровня описания или изучения системы - макроскопического или микроскопического1.. Сложность системы может также определяться не только большим количеством подсистем и сложной структурой, но и сложностью ее поведения.

Сложность системы может быть внешней и внутренней. Внутренняя сложность определяется сложностью множества внутренних состояний, потенциально оцениваемых по проявлениям системы и сложности управления в системе. Внешняя сложность определяется сложностью взаимоотношений с окружающей средой, сложностью управления системой.

Типизация сложности систем зависит от того, каких сведений не хватает:

  • о структуре или организации (не хватает сведений для построения, описания или управления структурой);

  • о поведении системы в динамике и/или во времени (не хватает сведений для достаточно точного описания динамики поведения системы и управления ее траекторией);

  • о логике построения или функционирования системы;

  • о точности описания системы;

  • о способности к развитию, эволюции, самоорганизации.

Чем сложнее рассматриваемая система, тем более разнообразные и более сложные внутренние информационные процессы приходится актуализировать для того, чтобы была достигнута цель системы, т.е. система функционировала или развивалась.

Примечание. Сложные системы, как правило, являются одновременно и большими, хотя сложной может быть и система, не являющаяся большой системой. Видимо в этой связи во многих работах понятия большая система и сложная система не различаются. Чтобы еще раз подчеркнуть существенную разницу между понятиями “большая” и “сложная” системы, а также относительность такой классификации, приведем из работы2] следующую таблицу:

 

Система

Малая

Большая

Простая

Сложная

1

Исправный бытовой прибор для пользователя

+

 

+

 

2

Неисправный бытовой прибор для мастера

+

 

 

+

3

Шифрозамок для похитителя

 

+

+

 

4

Мозг, живого организма

 

+

 

+