- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
В случае экспертов, если коэффициент детерминации стремится к нулю, то это может означать полное отсутствие согласованности, что можно проверить с помощью матрицы парных корреляций (если в ней много отрицательных элементов, значит согласованности действительно нет)
Если R2 = 1, это означает полную согласованность. Но это плохо, т.к. свидетельствует об ошибках:
1 - некомпетентные эксперты
2 - вопросы не отражают проблему
3 - сговор
4 - неправильное проведение экспертизы
Согласованность - однородность совокупности.
Вместо коэффициента детерминации в данном случае используется коэффициет конкордации (коэффициент согласованности).
П усть у нас уже достигнута однородность по объектам. Рассмотрим второй тип задачи.
Таким образом, дисперсия зависит только от следующего слагаемого
Коэффициент конкордации меняется от нуля до единицы. Ноль достигается там, где дисперсия равна нулю, а единица - там, где максимальная дисперсия. Рассмотрим два случая:
1) пусть все эксперты дали различные ранжировки объектам
Если и , то , следовательно,
Вывод: чем меньше дисперсия, тем более различны мнения экспертов. Это главное отличие рангового анализа от количественного.
2) все эксперты высказали схожее мнение (дали одинаковые ранжировки):
Итак:
Свойства коэффициента конкордации:
1) при максимальной согласованности W =1
2) при различных мнениях W = 0
Критериальная проверка (с помощью хи-квадрат)
, то гипотеза о согласованности мнений принимается.
Все описанное выше рассчитано на случай, когда нет связных рангов. В случае, когда есть связные ранги, коэффициент конкордации необходимо скорректировать на коэффициент связности:
,
Где t - номер группы связных рангов, H - число групп связных рангов в ранжировке j, - число элементов (рангов), входящих в t-ую группу ранжировки j.
Коэффициент конкордации - дисперсионный коэффициент. W = 0, если мнения рассогласованные или когда мнения противоположны и они разбились по группам, но мы этого не узнаем.
Энтропийный коэффициент согласованности более чувствителен к рассогласованности.
, ноль – если мнения рассогласованные, единица – если достигнута максимальная согласованность. Если мнения разбились по группам, то Wэ = 0,7:
,
где - вероят-ть, присвоенная i-му объекту j-го ранга, - логарифм берется по люб. основанию
Как правило вероятности неизвестны и берут их оценку в виде частостей:
, где - кол-во экспертов, присвоивших i-му объекту j-ый ранг, m – общее кол-во экспертов
Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
Разработан в 1904 г.
, где k и j – свойства, n – количество объектов
Этот коэффициент позволяет становить парную связь при отсутствии связных рангов.
Коэффициент связности (показывает степень связности):
, где
t – номер группы связных рангов,
- число групп связных рангов в ранжировке l,
- число элементов (рангов), входящих в t-ую группу ранжировки l.
Для коэффициента Спирмена
Если существуют связные ранжировки, то общая связь ослабляется и рассчитываем новый показатель – коэффициент Спирмена для связных рангов:
Критериальная проверка данного коэффициента при условии, что количество объектов больше 10 (n > 10), осуществляется по статистике Стьюдента: