- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
Неколичественные многомерные данные
Существуют 2 задачи, различающиеся только выводом (а не математич. аппаратом):
1) объект – признак и 2) объект – эксперт
Перейдем к парным связям. Перед нами стоят две задачи:
1) В дан. случае нас интересуют связи между ранжир-ками анализируемых объектов по св-ву k и св-ву j.
2) Можно ли измерить и проанализировать совокупную статистическую связь одних и тех же объектов по всем ранжировкам одновременно.
Порядковый КДА отличается от количественного и проблемы, которые он решает, следующие:
1) структура совокупности ранжировок в пространстве Rn:
Исходы:
а) анализируемые многомер. точки равномерно разбросаны по всей области возмож. значений. Ответ - отсутствие статистич. связи или, в случае решения 2ой задачи, согласов-ти во мнениях экспертов
б) расположение m точек в пр-ве Rn таково, что часть из них образует ядро из близко лежащих точек, а остальные произвольно разбросаны. Ответ – подмн-во согласован. реш-й или группа согласов. мнений;
в) анализируемые точки образуют несколько сгустков, это может означать наличие нескольких подмножеств, в каждом конкретном подмножестве - наличие связи, а между подмнож-вами - отсутствие связи
2) анализ интегральной совокупной согласованности рассматриваемых ранжировок по критерию степени тесноты связи с другими ранжировками (эта задача возникает всегда только для экспертов)
3) построение интегрального показателя, который вобрал бы в себя все свойства (1ая задача) или построение единого обобщенного решения (2ая задача)
1. Коэффициент ранговой корреляции по Спирмэну (разработан в 1904 г.):
, где k и j – свойства, n – количество объектов
Этот коэффициент позволяет становить парную связь при отсутствии связных рангов.
Коэффициент связности (показывает степень связности):
, где t – номер группы связных рангов, - число групп связных рангов в ранжировке l, - число эл-тов (рангов), входящих в t-ую группу ранж-ки l. Для коэф-та Спирмэна
Если существуют связные ранжировки, то общая связь ослабляется и рассчитываем новый показатель – коэффициент Спирмэна для связных рангов:
Критериальная проверка данного коэффициента при условии, что количество объектов больше 10 ( ), осуществляется по статистике Стьюдента:
2. Коэффициент Кэндалла
В случае отсутствия связных рангов:
При совпадающих ранжировках
При полностью противоположных ранжировках:
Для связных рангов:
Вероятностные коэффициенты связи
Условная вероятность: P(y,x) = P(y|x)P(x), если P(y,x) = P(y)P(x), то y и x – независимы
- та часть вероятности y, которая не может быть объяснена причиной x: = P(y) - P(y,x)
Гамма показ-ет степень зависимости y от x (знак показывает направление связи): Г(у,x) = P(y,x) - P(y)P(x)
Риск: E( |x) = ( |x) / P( ) = P( |x) / P( ). Т.е. если существуют плохие факторы , то риск возрастает в E раз.
Абсолют. приращение вероят-ти (): (y|x) = P(y|x) - P(y), т.е. y увеличивается на , если произойдет x.