Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MSM.doc
Скачиваний:
41
Добавлен:
27.04.2019
Размер:
1.8 Mб
Скачать

35)Итеративные методы:

- метод k средних (статграфик)

- метод поиска сгущений (пакет кластер)

- метод расщепления смесей (пакет кластер)

Основные проблемы

- все эти методы требуют задания начальных условий, поэтому их используют, если проблема или объект хорошо изучен. Человек, который задает начальные условия, несет полную ответственность за классификацию. Отсюда следует объективизм.

- количество кластеров

- центры кластеров

- радиус сферы (метод поиска сгущений)

- закон распределения объектов (метод расщепления смесей)

Метод к-средних

  1. Шаг

Определение веса каждого кластера: Wk=1

  1. шаг

из матрицы Х случайным образом будут отобраны К строк, которые будут объявлены центрами кластеров.

  1. шаг

из оставшихся n-k строк извлекается последовательно вектор Xi={Хi^1, Xi^2,…Xi^m} и проводится сходство с каждым из эталонов.

Мера схлдства-Евклидова метрика. dil= [корень(сумм по j (Хij-Xlj)^2]

Рассматривается вектор сходства di =(dl1,… dlk)

  1. шаг

Определяется минимум . по этому минимуму происходит присоединение эталонов , пересчитывается (как среднеарифметическое)

Если встретились нескольео минимумов, то присоединение происходит к меньшему номеру.

Повторяем шаг (n-l-k) раз, пока все объекты не будут распределены по k кластерам.

  1. Шаг

Повторяем все шаги, пока центры не перестанут меняться, то есть, пока не станут устойчивыми.

39) Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.

Перечень вопросов по курсу «Многомерные статистические методы»

  1. МСМ как самостоятельная область научных знаний. Их особенности и отличия от методов классической статистики.

  2. Основные исторические этапы развития мсм.

  3. Классификация МСМ. Параметрические и непараметрические методы, их различия.

  4. Особенности социально-экономической информации. Измерение различных данных.

  5. Оцифровка неколичественной информации. Основные способы оцифровки.

  6. Понятие признакового пространства. Примеры одномерного, двумерного и многомерного признакового пространства. Геометрическая интерпретация.

  7. Многомерные случайные величины и их распределения. Многомерные статистические гипотезы. Примеры.

  8. Проверка гипотез и доверительные области для вектора математических ожиданий.

  9. Критерий Хотеллинга для двух многомерных выборок.

  10. Критерий Бартлетта и проверка гипотезы об однородности дисперсии.

  11. Грубые ошибки. Причины их появления в статистической совокупности. Методы их выявления.

  12. Основные методы устойчивого оценивания параметров выборочной совокупности.

  13. Корреляционно-дисперсионный анализ многомерных количественных данных.

  14. Меры связи количественных и неколичественных многомерных данных. Вероятностные коэффициенты связи.

  15. Дисперсионный и энтропийный коэффициенты конкордации. В каких границах они изменяются, и что это означает.

  16. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости.

  17. Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.

  18. Критерий независимости для таблиц сопряженности.

  19. Метод главных компонент.

  20. Использование главных компонент в многомерном регрессионном анализе.

  21. Основная концепция факторного анализа (ФА) и существование модели ФА. Состав дисперсии элементарного признака в ФА.

  22. Алгоритмическая схема реализации методов ФА.

  23. Структурные параметры модели ФА.

  24. Вычислительная процедура метода главных компонент.

  25. Информативность и весовые коэффициенты главных компонент. Примеры

  26. Метод главных факторов. Отличия от метода главных компонент.

  27. Итеративный метод Хоттелинга получения главных факторов. Его преимущества по сравнению с другими методами ФА.

  28. Итеративный метод максимального правдоподобия улучшения факторных нагрузок и характерностей.

  29. Применение методов ФА в корреляционно-регрессионном анализе.

  30. Методы уточнения моделей ФА.

  31. Качество структуры общих факторов.

  32. Надежность решений, полученных методами ФА. Статистические критерии проверки надежности решений.

  33. Кластерный анализ качественных многомерных данных.

  34. Методы иерархического кластерного анализа. Алгоритмическая схема. Геометрическая интерпретация результатов.

  35. Итеративные методы кластерного анализа. Их отличия от иерархических методов.

  36. Оценка качества классификации в кластерном анализе.

  37. Дискриминантный анализ: сущность метода, основные ограничения использования, алгоритм.

  38. Вычисление канонических дискриминантных функций, методы определения их числа, геометрическая интерпретация.

  39. Вычисление дискриминантных значений. Геометрическая интерпретация результатов. Оценка качества дискриминации.

Билет №7. Распределения.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]