- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
1) Понятие многомерной случайной величины (мсв)
М ногомерная СВ Х выглядит следующим образом (смотри рисунок)
Все зависят от времени (т.к. мы не можем ручаться, что характеристики не изменятся со временем). Т.о., массив не является м-цей. В МСМ он наз-ся параллелепипедом данных.
Гипотетической СВ является вектор . Этот вектор необязательно будет состоять из числовых характеристик.
МСВ, а именно та СВ, кот. поддается измерению, обладает определен. физич. смыслом и некоторым неконтролируемым разбросом при повторениях исследуем. эксперим-та. Получить числовое отображение МСВ можно только в резул-те элементар. исхода () случ. экспер-та.
Многомерная (векторная) СВ:
Закон распределения вероятностей многомерной статистической величины (МСВ) называется многомерным или совместным:
Функция распределения детерминирована и неотрицательна.
1) непрерывные m-мерные СВ, компоненты которых являются непрерывными СВ
Плотность распределения вероятности:
Соотношение функции и плотности распределения:
В обратную сторону – m-кратный дифференциал:
2) дискретные m-мерные СВ, компоненты которых (одномерные СВ) являются дискретными
ДМСВ может быть задана указанием вероятностей ее попадания в люб. точку конеч. или счет. мн-ва допустимых значений. Если мы обозначим через - j-е значение СВ из мн-ва допустимых значений
i1 = 1,2,…,n; i2 = 1,2,…,n; … ; im = 1,2,…,n;
Совместная вероятность:
Тогда ф-ция распред-я такой СВ выражается m-кратной суммой:
На всем множестве допустимых значений эта m-кратная сумма превращается в ед-цу:
3) СВ смешанного типа, компоненты которых являются как непрерывными, так и дискретными СВ.
2) Примеры наиболее часто используемых законов:
- Полиномиальный (мультиномиальный) закон распределения
В рез-те одного случайного эксперимента объект типа j появляется с вероятностью Pj. - число объектов j-го типа, оказавшихся в выборке размера n с вер-тью P. Всего будет l различ. типов: . Мы имеем дело с бесконеч. совокуп-тью . Вероятность - это векторная величина:
Нас будет интересовать МСВ с законом распределения:
Вероятность того, что из n извлеченных объектов оказалось x1 объектов 1го типа, x2 объектов 2го типа и т.д. может быть выражена следующим образом:
Для данного закона:
, - многомерная вероятность,
(это диагональ ковариационно-дисперсионной матрицы)
- внедиагональные элементы
Чаще всего с этим ЗР сталкиваются при обработке анкет. данных (медицинской и психологич. инф-ции)
- Гаусовский закон распределения (многомер/ нормальный) X F(,)- наиболее часто встречающееся:
, где - многомерное МО; - ковариац.-дисперс. м-ца
Исчерпывающей формой задания многомер. ЗР является только совместная функция плотности вероятности. Зная совместный ЗР МСВ можно получить частный (маржинальный) ЗР любого подвектора случайной величины, а также условный ЗР, описывающий распределение любого подвектора, когда все или какая-то часть остальных компонент исход. вектор. признака фиксируется на заданных уровнях. Если МСВ распределена каким-либо другим способом, то пользуются правилом независимости, а именно: если компоненты МСВ статистически независимы, то многомерный ЗР может быть описан m-частными законами распределения:
При практическом изучении поведения МСВ зачастую оказывается достаточным знание ограниченного набора его числовых характеристик: m - МО; - дисперсия; коэф-нт ассиметрии; коэф-нт эксцесса
Математическое ожидание:
- для непрерывной СВ:
- для дискретной СВ:
МО - центр группирования. Распространим это понятие на случай МСВ: x = (x(1),…,x(m))
Существует 2 случая (интерпретации):
1), = ((1),…,(m)), (j) - обобщение по n объектов
2), = (1,…,m), j - обобщение по некоторому совокупному свойству (признаку) n объектов
Математический аппарат идентичен для обоих случаев. Поэтому остановимся на 1ом случае.
Дисперсия: Физический смысл дисперсии - разброс (рассеяние) относительно центра группирования.
- непрерывная одномерная СВ:
- дискретная одномерная СВ:
Аналог многомерной дисперсии берется из ковариационно-дисперсионной матрицы:
1)
Это симметричная относительно главной диагонали матрица.
Диагональ - рассеивание относительно конкретной компоненты.
2) во втором случае центром группирования является компоненты вектора МО по совокупному интегрированному свойству: = ( )nn
В качестве многомерной дисперсии может быть:
А) обобщенная дисперсия - определитель Dобоб = det
Б) степень рассеивания - след матрицы Dрас = tr = (11 + … + mm)
Специфика многомерной дисперсии заключается в расчете каждой компоненты ij