- •Мсм как самостоятельная область научных знаний. Их особенности и отличия от методов классич. Статистики.
- •Основные исторические этапы развития мсм.
- •Классификация мсм. Параметрические и непараметрич. Методы, их различия.
- •Особенности социально-экономической информации. Измерение различ. Данных.
- •1) Особенности соц.-экономич. Инф-ции
- •2) Измерение разнотипных данных
- •Оцифровка неколичественной информации. Основные способы оцифровки.
- •2) Таблица логического описания:
- •4) Таблица рангов
- •6) Таблица сравнений:
- •Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- •Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.
- •1) Понятие многомерной случайной величины (мсв)
- •2) Примеры наиболее часто используемых законов:
- •3) Проверка статистической гипотезы предполагает:
- •Доверительные области
- •Критерий Хотеллинга для двух многомерных выборок.
- •Критерий Бартлетта и проверка гипотезы об однородности дисперсии.
- •Груб. Ошибки. Причины их появл-ия в статистич. Сов-ти. Методы их выявл-ия.
- •Основные методы устойчивого оценивания параметров выбороч. Совокупности.
- •Корреляционно-дисперсионный анализ многомерных количественных данных.
- •Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи. Количественные многомерные данные
- •Неколичественные многомерные данные
- •2. Коэффициент Кэндалла
- •Вероятностные коэффициенты связи
- •Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.
- •Критерий независимости для таблиц сопряженности.
- •Метод главных компонент.
- •Использование главных компонент в многомерном регрессионном анализе.
- •33) Кластерный анализ качественных многомерных данных
- •34)Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов. Основные иерархические методы:
- •3. Метод средних связей
- •Дивизивный метод
- •35)Итеративные методы:
- •39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.
- •Перечень вопросов по курсу «Многомерные статистические методы»
- •Основные исторические этапы развития мсм.
- •Гауссовское (непрерывное)
- •Общий критерий Хоттелинга:
- •Общий критерий Хоттелинга:
- •Частный критерий Хоттелинга:
- •Одномерный критерий:
- •1.Для количеств.Данных:
- •6 Иерархических методов:
2) Таблица логического описания:
Логическое описание заключается в следующем:
- если , то объект под номером i имеет свойство j.
- если , то объект под номером i не имеет свойство j.
Т.о., выбранному варианту ответа на какой-либо вопрос присваивается единица, а остальным – ноль.
МО в данном случае предстает в виде моды
Пример – выпускная работа – оцифровка анкет.
3) Таблица интенсивности (Здесь работает либо совокупный балл, либо совокупный ранг)
Для любого объекта при переводе из множества объектов в множество признаков величина выражает уровень интенсивности или оценку для свойства
Пример: Оценка проводится по 4м признакам - композиция, рисунок, цвет и экспрессия. Предлагается для оценки использовать следующее: 0 - самое худшее, 20 - самое лучшее. Таким образом, мы получаем таблицу интенсивности или оценок:
Художник |
Композиция |
Рисунок |
Цвет |
Экспрессия |
Саврасов |
18 |
6 |
17 |
17 |
Шишкин |
… |
… |
… |
… |
Левитан |
… |
… |
… |
… |
Айвазовский |
… |
… |
… |
… |
Васнецов |
… |
… |
… |
… |
4) Таблица рангов
5) Таблица сопряженности (Каждая клетка - условная вероятность)
Это таблица, которая содержит сводную числовую характеристику изучаемой совокупности по двум и более признакам.
|
Не заболели (y) |
Заболели ( ) |
Всего |
Привитые (x) |
72 |
28 |
100 |
Непривитые ( ) |
31 |
69 |
100 |
Всего |
103 |
97 |
200 |
6) Таблица сравнений:
1)
A |
B |
C |
D |
1 |
+ |
|
|
2 |
+ |
|
|
3 |
+ |
|
+ |
2)
A |
B |
C |
D |
1 |
+ |
|
|
2 |
|
+ |
+ |
3 |
|
+ |
|
Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.
- одномерное признаковое пространство
N объектов можно рассмотреть со стороны одного признака. Например, объект – продукты, признак – затраты на производство; объект – множество людей, признак – соц. статус.
Пример: объекты – предприятия, признак – среднегодов. уровень выработки на 1 работника (x1).
Rm – признаковое пространство, в данном случае m=1.
Объекты |
x1 |
1 |
6 |
2 |
4 |
3 |
9 |
4 |
7 |
5 |
3 |
Применим шкалирование:
Выводы:
1) предприятия различны
2) объекты можно сгруппировать: 1ая группа - 5 и 2 (т.к. схожи), 2ая группа - 1и 4, 3я группа - 3.
Следовательно эконометрическую модель по всем предприятиям сразу построить нельзя.
- двумерное признаковое пр-во (смотри предыдущий пример)
x2 – среднесписочный стаж в годах
Объекты |
x1 |
x2 |
1 |
6 |
5 |
2 |
4 |
7 |
3 |
9 |
12 |
4 |
7 |
14 |
5 |
3 |
11 |
Если характеристика является информативной (т.е. несет новую информацию об объектах), то она является признаком.
П оявились др. группы объектов, следовательно, новый признак несет в себе информацию.
Если бы 2ой рисунок был бы схож с 1ым, то характеристика x2 не была бы информативной и не была бы признаком.
- трехмерное признаковое пространство
x3 - средний уровень квалификации (по тарифной сетке)
Объекты |
x1 |
x2 |
x3 |
1 |
6 |
5 |
1,2 |
2 |
4 |
7 |
1,9 |
3 |
9 |
12 |
3,5 |
4 |
7 |
14 |
2,7 |
5 |
3 |
11 |
2,8 |
Возможно, здесь можно выделить 2 группы: 1 и 2, 5 и 3 и 4. Следовательно, предыдущие связи разорваны, все признаки информативны, предприятия очень различны.