- •Метод МногомерноГо шкалирования и его применение в социологических исследованиях
- •1 Введение 3
- •2 Теория данных 5
- •3 Модели многомерного шкалирования 14
- •4 Использования многомерного шкалирования в социологических исследованиях 31
- •5 Заключение 34
- •Введение
- •Теория данных
- •Классическая теория данных Кумбса
- •Альтернативная теория данных
- •Форма данных
- •Характеристики измерения
- •Модели многомерного шкалирования
- •Классическое многомерное шкалирование
- •Метрическое многомерное шкалирования
- •Неметрическое многомерное шкалирования
- •Многомерное шкалирование и индивидуальные различия
- •Повторное многомерное шкалирование
- •Индивидуальное многомерное шкалирование
- •Обобщенная модель индивидуального шкалирование
- •Анализ предпочтений
- •Векторная модель
- •Модель «идеальной точки»
- •Индивидуальное многомерное развертывание
- •Обобщенная модель индивидуального многомерного развертывания
- •Обобщенная евклидова модель
- •Другие направления развития методов многомерного шкалироваия
- •Вероятностные модели многомерного шкалирования
- •Модели многомерное шкалирования с внешними ограничениями
- •Асимметричное многомерное шкалирование
- •Использования многомерного шкалирования в социологических исследованиях
- •Маркетинговые исследования
- •Социально‑политические исследования
- •Стратификационные исследования
- •Социология науки
- •Социально‑психологические исследования
- •Заключение
- •Литература
Модели многомерного шкалирования
История развития метода включает в себя четыре основных этапа [132]:
Разработка метрического многомерное шкалирования
Первая процедура метрического многомерного шкалирования была разработана Ричардсоном [100]. Его идеи были развиты в работе Торгерсона [159].
Разработка неметрическое многомерного шкалирования
Следующим значительным шагом стала разработка алгоритма многомерного шкалирования, позволяющего обрабатывать неметрические данные. Первую процедуру неметрического многомерного Шепард [110-111], идеи которого развил Краскал [73-74]. Подход Краскала лег в основу современных методов неметрического многомерного шкалирования.
Разработка модели индивидуального многомерного шкалирования
Очередной «прорыв» в развитии методов многомерного шкалирования был осуществлен благодаря разработке метода индивидуального многомерного шкалирования, который позволял получать не только обобщенный результат, но и анализировать индивидуальные различия. Первая метрическая модель индивидуального многомерного шкалирования была предложена Хораном [56] и Блоксомом [11] и реализована Кэрроллом и Чангом [21-22].
Интеграция различных подходов и дальнейшее развитие метода МШ.
Дальнейшее развитие методов МШ. Разработка моделей вероятностного МШ, модели МШ в внешними ограничениями, модели МШ для анализа асимметричных матриц близости.
Классическое многомерное шкалирование
Классическое многомерное шкалирование в качестве исходных данных использует квадратные симметричные двумерные матрицы близости с одним набором данных. В результаты анализа каждый объект представляется как точка в мерном пространстве.
Метрическое многомерное шкалирования
Идея МШ и первый алгоритм был предложен Ричардсоном [100]. Однако, он недостаточно четко сформулировал свои идеи. Основателем современного направления методов МШ считается Торгерсон, который предложил алгоритм МШ на основе работы Т. Юнга и А. Хаусхолдера [133]. Торгерсон предположил, что оценки различий равны расстояниям в евклидовом пространстве небольшой размерности :
,
где .
Далее на основе исходной матрицы близостей рассчитывается матрица с двойным центрированием, каждый элемент которой равен
, где
,
,
.
Затем Торгерсон доказал, что каждый элемент полученной матрицы будет равен
.
Предположение о том, что оценки различия равны расстояниям является очень жестким. Менее жесткой является следующая модель, в которой различия соответствуют расстояниям с точности до некоторой аддитивной константы:
,
Проблема первоначальной оценки аддитивной константы в литературе по многомерному шкалированию называется «проблемой аддитивной константы» [141].
Метрический алгоритм Торгерсона сейчас используется в неметрических алгоритмах многомерного шкалирования, основанных на итеративных процедурах, для оценки стартовых значений параметров модели.
Неметрическое многомерное шкалирования
Настоящим прорывом в области методов шкалирования стало появление модели неметрического многомерного шкалирования. Первое решение этой проблемы была дано Р. Шепардом [110-111]. Его алгоритм был основан на предположении, что меры различия являются монотонной функцией от расстояний в евклидовом пространстве небольшой размерности:
,
где - монотонная функция, такая, что
для всех .
Вскоре Дж. Краскал [73-74] предложил более общий алгоритм НМШ, где
.
Наиболее часто в литературе упоминаются евклидова метрика, метрика доминирования и метрика города.
Таблица 2. Наиболее часто используемые метрики
Метрика |
Значение |
Формула |
Евклидова метрика |
|
|
Метрика доминирования (sup‑метрика) |
|
|
Метрика города (block‑city) |
|
|
Евклидова метрика используется наиболее широко, поскольку обладает рядом преимуществ:
простота интерпретации,
простота графического представления,
простые математические свойства [124, 252].
В алгоритме Краскала решается задача минимизации функции соответствия модели исходным данным STRESS (STandardize REsidual Sum of Squares), которая также называется STRESS-1:
,
где - отклонения или ранговые образы данных, которые являются оптимально шкалированными близостями, т.е. чтобы максимально соответствовать расстояниям при условии монотонности:
для всех ,
, где .
Кроме формулы STRESS-1, Краскал предложил формулу STRESS-2 отличается от первой только числителем:
, где .
Формула STRESS-2 лучше работает в задачах многомерного развертывания, о которых речь пойдет ниже, поскольку реже приводит к вырожденным решениям.
НМШ Краскала позволило в качестве исходных данных использовать ранговые данные, поэтому данный метод быстро стал популярен в социальных науках, в которых большая часть данных измерены в ранговых шкалах. Именно с появления алгоритма Краскала началось активное использование метода МШ в исследовательской практике.
Существует также ряд моделей НМШ, в которых оптимизируется функция соответствия другого вида. Юнг [120] предложил функцию, названную SSTRESS (Squared STRESS), отличающуюся от функции STRESS Краскала тем, что основан на квадратах расстояний и оптимально шкалированных близостях
, где .
Среди них анализ пространств наименьшей размерности (Smallest Space Analysis) Гуттмана [50], в котором используется коэффициент отчуждения
, где
Джонсон предложил функцию соответствия, которая не требует вычисления ранговых образов данных [58]
Исследование приведенные мер соответствия см. обзор Каменсокго [143].