Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_ШПОРЫ.docx
Скачиваний:
27
Добавлен:
03.08.2019
Размер:
206.19 Кб
Скачать

21. Критерий согласия распределения.

В одних случаях закон распределения может быть установлен теоретически на основании выбранной модели рассматриваемого процесса. В других случаях функцию распределения выбирают априорно. Однако для получения надежных решений вероятностных задач в каждом отдельном случае необходима проверка соответствия опытных данных используемому закону распределения.

Наиболее простым, но весьма приближенным методом оценки согласия результатов эксперимента с тем или иным законом распределения является графический метод. Опытные данные наносят на вероятностную бумагу и сравнивают с графиком принятой функции распределения, которая на вероятностной сетке изображается прямой линией. Если экспериментальные точки ложатся вблизи прямой со случайными отклонениями влево и вправо, то опытные данные соответствуют рассматриваемому закону распределения. Систематическое и значительное отклонения экспериментальных точек от аппроксимирующей прямой свидетельствует об ошибочности принятой модели для обоснования закона распределения исследуемой случайной величины.

Графический способ в значительной степени является субъективным и используется на практике лишь в качестве первого приближения при решении этой задачи.

Существует большой ряд достаточно строгих аналитических критериев согласия результатов эксперимента выбранному виду гипотетического распределения. Однако при решении задач, связанных с исследованием характеристик механических свойств, многие из них теряют свою универсальность в связи с тем, что параметры гипотетического распределения заранее неизвестны, а могут лишь оцениваться по результатам механических испытаний.

Если выбранный критерий согласия не позволяет сделать уверенный, однозначный вывод относительно соответствия опытных данных гипотетическому распределению, то необходимо произвести проверку нулевой гипотезы по другому критерию. Даже при больших объемах выборок (n = 500 и более) в ряде случаев нельзя отдать предпочтение какому-то одному закону распределения характеристик механических свойств. В этом случае выбор распределения решается удобством его применения в конкретной задаче.

22. Основные понятия и алгоритмы кластерного анализа

Кластерный анализ предназначен для разбиения совокупности объектов на однородные группы (кластеры или классы). Метод работает даже тогда, когда данных мало и не выполняются требования нормальности распределений случайных величин и другие трбования классических методов статистического анализа. Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их компактными и наглядными.

Методы кластерного анализа можно разделить на две группы:

• иерархические и • неиерархические.

Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие. Преимуществом такой кластеризации является их наглядность. Иерархические алгоритмы связаны с построением дендрограмм (от греческого dendron - "дерево"), которые являются результатом иерархического кластерного анализа. Дендрограмма описывает близость отдельных точек и кластеров друг к другу, представляет в графическом виде последовательность объединения (разделения) кластеров.

Дендрограмма представляет собой вложенную группировку объектов, которая изменяется на различных уровнях иерархии.

Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их  компактными и наглядными.

Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы: — Отбор выборки для кластеризации. — Определение множества переменных, по которым будут оцениваться объекты в выборке. — Вычисление значений той или иной меры сходства между объектами. — Применение метода кластерного анализа для создания групп сходных объектов. — Проверка достоверности результатов кластерного решения . Кластерный анализ - метод группировки объектов в классы на основании экспериментальных данных о свойствах объектов.

количество классов и принципы разделения на классы определяются заранее исходя из общей информации о наборе объектов и целей кластерного анализа.

Методы кластерного анализа дополняется методами дискриминантного анализа, которые позволяют определить границы между кластерами и использовать их для решения задач анализа и классификации данных.