Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ермолаев А. Метод многомерного шкалирования и его применение в социологии.doc
Скачиваний:
162
Добавлен:
21.01.2014
Размер:
1.09 Mб
Скачать
  1. Модели многомерного шкалирования

История развития метода включает в себя четыре основных этапа [132]:

  1. Разработка метрического многомерное шкалирования

Первая процедура метрического многомерного шкалирования была разработана Ричардсоном [100]. Его идеи были развиты в работе Торгерсона [159].

  1. Разработка неметрическое многомерного шкалирования

Следующим значительным шагом стала разработка алгоритма многомерного шкалирования, позволяющего обрабатывать неметрические данные. Первую процедуру неметрического многомерного Шепард [110-111], идеи которого развил Краскал [73-74]. Подход Краскала лег в основу современных методов неметрического многомерного шкалирования.

  1. Разработка модели индивидуального многомерного шкалирования

Очередной «прорыв» в развитии методов многомерного шкалирования был осуществлен благодаря разработке метода индивидуального многомерного шкалирования, который позволял получать не только обобщенный результат, но и анализировать индивидуальные различия. Первая метрическая модель индивидуального многомерного шкалирования была предложена Хораном [56] и Блоксомом [11] и реализована Кэрроллом и Чангом [21-22].

  1. Интеграция различных подходов и дальнейшее развитие метода МШ.

Дальнейшее развитие методов МШ. Разработка моделей вероятностного МШ, модели МШ в внешними ограничениями, модели МШ для анализа асимметричных матриц близости.

    1. Классическое многомерное шкалирование

Классическое многомерное шкалирование в качестве исходных данных использует квадратные симметричные двумерные матрицы близости с одним набором данных. В результаты анализа каждый объект представляется как точка в мерном пространстве.

      1. Метрическое многомерное шкалирования

Идея МШ и первый алгоритм был предложен Ричардсоном [100]. Однако, он недостаточно четко сформулировал свои идеи. Основателем современного направления методов МШ считается Торгерсон, который предложил алгоритм МШ на основе работы Т. Юнга и А. Хаусхолдера [133]. Торгерсон предположил, что оценки различий равны расстояниям в евклидовом пространстве небольшой размерности :

,

где .

Далее на основе исходной матрицы близостей рассчитывается матрица с двойным центрированием, каждый элемент которой равен

, где

,

,

.

Затем Торгерсон доказал, что каждый элемент полученной матрицы будет равен

.

Предположение о том, что оценки различия равны расстояниям является очень жестким. Менее жесткой является следующая модель, в которой различия соответствуют расстояниям с точности до некоторой аддитивной константы:

,

Проблема первоначальной оценки аддитивной константы в литературе по многомерному шкалированию называется «проблемой аддитивной константы» [141].

Метрический алгоритм Торгерсона сейчас используется в неметрических алгоритмах многомерного шкалирования, основанных на итеративных процедурах, для оценки стартовых значений параметров модели.

      1. Неметрическое многомерное шкалирования

Настоящим прорывом в области методов шкалирования стало появление модели неметрического многомерного шкалирования. Первое решение этой проблемы была дано Р. Шепардом [110-111]. Его алгоритм был основан на предположении, что меры различия являются монотонной функцией от расстояний в евклидовом пространстве небольшой размерности:

,

где - монотонная функция, такая, что

для всех .

Вскоре Дж. Краскал [73-74] предложил более общий алгоритм НМШ, где

.

Наиболее часто в литературе упоминаются евклидова метрика, метрика доминирования и метрика города.

Таблица 2. Наиболее часто используемые метрики

Метрика

Значение

Формула

Евклидова метрика

Метрика доминирования (sup‑метрика)

Метрика города (block‑city)

Евклидова метрика используется наиболее широко, поскольку обладает рядом преимуществ:

  1. простота интерпретации,

  2. простота графического представления,

  3. простые математические свойства [124, 252].

В алгоритме Краскала решается задача минимизации функции соответствия модели исходным данным STRESS (STandardize REsidual Sum of Squares), которая также называется STRESS-1:

,

где - отклонения или ранговые образы данных, которые являются оптимально шкалированными близостями, т.е. чтобы максимально соответствовать расстояниям при условии монотонности:

для всех ,

, где .

Кроме формулы STRESS-1, Краскал предложил формулу STRESS-2 отличается от первой только числителем:

, где .

Формула STRESS-2 лучше работает в задачах многомерного развертывания, о которых речь пойдет ниже, поскольку реже приводит к вырожденным решениям.

НМШ Краскала позволило в качестве исходных данных использовать ранговые данные, поэтому данный метод быстро стал популярен в социальных науках, в которых большая часть данных измерены в ранговых шкалах. Именно с появления алгоритма Краскала началось активное использование метода МШ в исследовательской практике.

Существует также ряд моделей НМШ, в которых оптимизируется функция соответствия другого вида. Юнг [120] предложил функцию, названную SSTRESS (Squared STRESS), отличающуюся от функции STRESS Краскала тем, что основан на квадратах расстояний и оптимально шкалированных близостях

, где .

Среди них анализ пространств наименьшей размерности (Smallest Space Analysis) Гуттмана [50], в котором используется коэффициент отчуждения

, где

Джонсон предложил функцию соответствия, которая не требует вычисления ранговых образов данных [58]

Исследование приведенные мер соответствия см. обзор Каменсокго [143].