- •Многомерные статистические методы (для специальности 06.18.00 «Математические методы в экономике»)
- •Содержание
- •9.Методы многомерного анализа 26
- •1.О статистических методах в экономике
- •2.Статистические методы
- •3. Многомерные статистические методы: свойства недетерминированных объектов
- •4.Методы многомерного анализа
- •Дисперсионный анализ;
- •Регрессионный анализ;
- •5.Система случайных величин
- •6.Многомерный нормальный закон распределения
- •7.Статистические выводы и оценивание
- •7.Критерии оценивания в больших выборках
- •8.Метод наименьших квадратов
- •9.Методы многомерного анализа
- •10.Дисперсионный анализ
- •11.Статистическая обработка результатов дисперсионного анализа
- •12.Основная схема дисперсионного анализа
- •13.Применение мнк для дисперсионного анализа
- •14.Планы дисперсионного анализа для изучения источников рассеивания
- •15.Дисперсионный анализ при многосторонней классификации
- •16.Планы многоступенчатой классификации
- •17. Регрессионный анализ
- •18.Задача идентификации в регрессионном анализе
- •19.Оценка результатов регрессионного анализа
- •20.Проверка воспроизводимости
- •21.Проверка значимости
- •22.Проверка адекватности
- •23.Метод гребневой регрессии в регрессионном анализе
- •24.Метод главных компонент
- •25.Факторный анализ
- •26.Корреляционный анализ
- •27.Планирование эксперимента в задачах идентификации
- •28.Общие критерии оптимальности планов эксперимента
- •29.Ортогональный план эксперимента
- •30.Построение матрицы планирования полного факторного эксперимента
- •31.Дробный факторный эксперимент
- •32.Анализ подбираемых моделей при ортогональном планировании
4.Методы многомерного анализа
Признаки использования различных методов:
условия постановки задачи;
особенности объекта исследования:
линейная или нелинейная функция;
коррелируемость или независимость элементов;
учет времени (динамичность или статичность);
возможность внесения искусственного возмещения (пассивный или активный эксперимент, последний из которых позволяет извлечь больше информации).
Методы многомерного статистического анализа:
Дисперсионный анализ;
Регрессионный анализ;
факторный (компонентный) анализ;
дискриминантный анализ.
Группы методов многомерного статистического анализа:
связанные с изучением источника рассеивания случайных величин (СВ), т.е. методы дискриминации, позволяющие разделить случайные возмущения на отдельные факторы;
связанные с решением задач идентификации, т.е. подтверждения соответствия модели и объекта.
5.Система случайных величин
Случайная величина X может зависеть от нескольких СВ, т.е. X(X1,X2,...,Xn).
Для большинства практических задач изучение многомерных СВ осуществляется путем сведения её к ряду более простых (декомпозиция). Обычно достаточно рассмотреть систему двух СВ, что обеспечивает хорошую наглядную интерпретацию результатов и их отображение на экране ЭВМ. Реальные же детерминированные объекты могут содержать систему из нескольких сотен СВ.
Рассмотрим систему СВ XY
F(X,Y)=P{X<x,Y<y}
Т.е. вероятность события, которое заключается в том, что значение СВ X<x заданной функции, а значение СВ Y<y.
F(X,Y) – детерминированная функция, а не случайная.
Из закона распределения двух СВ формально можно получить две одномерные функции распределения, которые называются маргинальными распределениями.
Т.е. вероятность события, которое заключается в том, что X<x,Y< (детерминированное событие).
Вероятность можно выразить через двумерную функцию плотности распределения.
Функция плотности распределения представляет собой поверхность в трехмерном пространстве.
Свойства двумерной и n-мерной функции f(x,y):
f(x,y) 0
Для маргинального распределения плотности справедливо:
и показывают, как можно осуществить декомпозицию задачи анализа системы СВ.
Справедлива следующая формула, если и характеризуют независимые СВ X,Y:
f(x,y)= *
Построение маргинальных распределений – не единственный способ декомпозиции системы СВ. Второй способ – построение условных распределений. Условное распределение интерпретируется как сечение многомерного распределения системы СВ. Для многомерных нормальных распределений - сечения вертикальной плоскостью (гауссовы одномерные распределения).
Справедливы следующие формулы:
Т.е. двумерное распределение можно выразить через произведение маргинального и условного распределений.
Две СВ называются зависимыми, распределение одной зависит от распределения другой.
Для многомерной СВ существуют числовые характеристики, которые принято записывать в специальной сжатой форме. Наиболее известны математическое ожидание и дисперсия.
Начальный момент СВ порядка ks:
Центральный момент СВ:
Характеристикой связи двух СВ является второй смешанный момент:
Смешанные моменты – отличительная черта многомерных распределений от одномерных.
Ковариация характеризует степень зависимости СВ X,Y:
Часто связь СВ характеризуется коэффициентом корреляции, которая описывает только их линейную связь:
С помощью смешанных моментов более высоких порядков можно выявлять нелинейные связи СВ. На практике достаточно линейных связей.