- •Системный анализ и моделирование процессов в техносфере
- •1.1. Понятие системы. Базовые категории систем
- •1.2. Классификация систем
- •1.3. Общее представление о системном анализе
- •1.4. Принципы системного анализа
- •2.1. Этапы анализа и синтеза
- •2.2. Понятие о структурном анализе
- •2.3. Методы декомпозиции
- •2.4. Требования, предъявляемые к декомпозиции
- •2.5. Алгоритм декомпозиции
- •2.5. Программно-целевой подход к решению системных задач
- •1. Область применения и этапы программно-целевого подхода
- •2. Дерево целей
- •3.1. Агрегирование системы и эмерджентность
- •3.2. Виды связей в системе
- •Связи взаимодействия (координации):
- •Связи преобразования:
- •3.3. Виды агрегирования
- •4.1. Общие свойства процесса принятия решений
- •4.2. Участники процесса принятия решения
- •4.3. Схема ппр
- •4.4. Формулирование проблемы
- •4.5. Определение целей
- •4.6. Генерирование альтернатив
- •4.7. Формирование критериев
- •4.8. Физиология принятия решений
- •4.9. Виды и особенности задач принятия решений
- •4.10. Формализация принятия решений
- •Лекция 5. Информационное обеспечение ппр
- •5.1. Понятие информации
- •5.2. Информационная структура процесса принятия решений
- •6.1. Особенности группового выбора
- •6.2. Экспертные методы выбора
- •6.3. Методы типа мозговой атаки или коллективной генерации идей
- •6.4. Методы типа сценариев
- •6.5. Методы типа «Делфи»
- •6.6. Методы типа дерева целей
- •6.7. Морфологические методы
- •7.1 Основные положения теории управления
- •7.2 Аксиомы теории управления
- •7.3 Модели основных функций организационно-технического управления
- •7.4 Описание функций управления
- •Лекция 8. Понятие и классификация моделей
- •8.1 Понятие модели, моделирования
- •8.2 Познавательные и прагматические модели
- •8.3 Статические и динамические модели
- •8.4 Классификация моделей по способу воплощения
- •8.5 Место математического моделирования в системных исследованиях
- •8.6 Типы и виды математических моделей
- •8.7 Процесс построения математической модели
- •8.8 Структура моделирования происшествий в техносфере
- •9.1 Конфликт ‒ предмет рассмотрения теории игр
- •9.2 Понятие игры. Классификация игр. Формальное представление игр
- •9.3 Определение бескоалиционной игры
- •9.4 Приемлемые ситуации и ситуации равновесия
- •9.5 Примеры игровых задач
- •10.1 Граф и его виды
- •10.2 Задача о кратчайшем пути
- •10.3 Задача о максимальном потоке
- •11.1 Поверхность отклика
- •11.2 Этапы планирования эксперимента
- •11.3 Обработка и анализ результатов моделирования
- •12.1 Полный факторный эксперимент
- •12.2 Дробный факторный эксперимент
- •12.3 Метод наименьших квадратов
- •13.1 Основная цель кластерного анализа
- •13.2 Объединение (древовидная кластеризация)
- •13.3 Двувходовое объединение
- •13.4 Метод k средних
- •13.5 Алгоритм нечеткой кластеризации
- •14.1 Понятие когнитивного моделирования
- •14.2 Подсистема представления субъективной информации
- •14.3 Подсистема извлечения предпочтений эксперта
- •14.4 Подсистема обработки
- •14.5 Подсистема представления результатов моделирования
- •14.6 Подсистема поддержки аналитической деятельности эксперта
- •14.7 Моделирование бизнес процессов на основе bpmn-диаграмм
- •14.8 Метод анализа иерархий (маи): введение
- •14.9 Основные принципы маи
- •1. Принцип идентичности и декомпозиции
- •2. Принцип дискриминации и сравнительных суждений
- •3. Принцип синтеза
- •14.10 Общая оценка маи как метода принятия решений
- •15.1 Общий ход решения задачи на основе метода конечных элементов
- •15.2 Сети одномерных конечных элементов
- •15.3 Виды конечных элементов
- •16.1 Основные понятия
- •16.2 Приближенное решение оду при заданных начальных условиях
- •16.3 Метод Эйлера и его модификации
- •16.4 Метод Рунге-Кутта
- •16.5 Приближенное решение ду n-го порядка при заданных начальных условиях
- •16.6 Приближенное решение ду при заданных граничных условиях (краевых задач)
- •16.6.1 Метод начальных параметров
- •16.6.2 Редукция к задаче Коши для линейного ду второго порядка
- •17.1 Основные понятия
- •17.2 Типы элементов
- •17.3 Источники энергии и преобразователи. Аналоги топологических уравнений
- •17.4 Метод получения топологических уравнений
- •18.1 Свойства задач принятия решения со многими критериями
- •18.2. Формирование множества критериев
- •18.3 Методология решения многокритериальных задач
- •18.4 Технологии отыскания эффективных решений
- •18.5 Методы принятия решения при нескольких критериях
13.3 Двувходовое объединение
Ранее этот метод обсуждался в терминах "объектов", которые должны быть кластеризованы (см. Объединение (древовидная кластеризация)). Во всех других видах анализа интересующий исследователя вопрос обычно выражается в терминах наблюдений или переменных. Оказывается, что кластеризация, как по наблюдениям, так и по переменным может привести к достаточно интересным результатам. Например, представьте, что медицинский исследователь собирает данные о различных характеристиках (переменные) состояний пациентов (наблюдений), страдающих сердечными заболеваниями. Исследователь может захотеть кластеризовать наблюдения (пациентов) для определения кластеров пациентов со сходными симптомами. В то же самое время исследователь может захотеть кластеризовать переменные для определения кластеров переменных, которые связаны со сходным физическим состоянием.
После этого обсуждения, относящегося к тому, кластеризовать наблюдения или переменные, можно задать вопрос, а почему бы не проводить кластеризацию в обоих направлениях? Модуль Кластерный анализ содержит эффективную двувходовую процедуру объединения, позволяющую сделать именно это. Однако двувходовое объединение используется (относительно редко) в обстоятельствах, когда ожидается, что и наблюдения и переменные одновременно вносят вклад в обнаружение осмысленных кластеров.
Так, возвращаясь к предыдущему примеру, можно предположить, что медицинскому исследователю требуется выделить кластеры пациентов, сходных по отношению к определенным кластерам характеристик физического состояния. Трудность с интерпретацией полученных результатов возникает вследствие того, что сходства между различными кластерами могут происходить из (или быть причиной) некоторого различия подмножеств переменных. Поэтому получающиеся кластеры являются по своей природе неоднородными. Возможно это кажется вначале немного туманным; в самом деле, в сравнении с другими описанными методами кластерного анализа (Объединение (древовидная кластеризация) и Метод K средних), двувходовое объединение является, вероятно, наименее часто используемым методом. Однако некоторые исследователи полагают, что он предлагает мощное средство разведочного анализа данных (за более подробной информацией вы можете обратиться к описанию этого метода у Хартигана (Hartigan, 1975)).
13.4 Метод k средних
Этот метод кластеризации существенно отличается от таких агломеративных методов, как Объединение (древовидная кластеризация) и Двувходовое объединение. Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Пример
В примере с физическим состоянием (в пункте 13.3 Двувходовое объединение), медицинский исследователь может иметь "подозрение" из своего клинического опыта, что его пациенты в основном попадают в три различные категории. Далее он может захотеть узнать, может ли его интуиция быть подтверждена численно, то есть, в самом ли деле кластерный анализ K средних даст три кластера пациентов, как ожидалось? Если это так, то средние различных мер физических параметров для каждого кластера будут давать количественный способ представления гипотез исследователя (например, пациенты в кластере 1 имеют высокий параметр 1, меньший параметр 2 и т.д.).
Вычисления
С вычислительной точки зрения вы можете рассматривать этот метод, как дисперсионный анализ "наоборот". Программа начинает с K случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы: (1) ‒ минимизировать изменчивость внутри кластеров, и (2) ‒ максимизировать изменчивостьмежду кластерами. Данный способ аналогичен методу "дисперсионный анализ (ANOVA) наоборот" в том смысле, что критерий значимости в дисперсионном анализе сравнивает межгрупповую изменчивость с внутригрупповой при проверке гипотезы о том, что средние в группах отличаются друг от друга. В кластеризации методом K средних программа перемещает объекты (т.е. наблюдения) из одних групп (кластеров) в другие для того, чтобы получить наиболее значимый результат при проведении дисперсионного анализа (ANOVA).
Интерпретация результатов
Обычно, когда результаты кластерного анализа методом K средних получены, можно рассчитать средние для каждого кластера по каждому измерению, чтобы оценить, насколько кластеры различаются друг от друга. В идеале вы должны получить сильно различающиеся средние для большинства, если не для всех измерений, используемых в анализе. ЗначенияF-статистики, полученные для каждого измерения, являются другим индикатором того, насколько хорошо соответствующее измерение дискриминирует кластеры.