- •М. А. Кунилова, о. О. Антоненко статистика
- •Часть I
- •Общая теория статистики
- •Оглавление
- •2.Методология статистики. Ее основные категории
- •Категории статистической науки
- •Классификация признаков единиц совокупности
- •3.Основные задачи статистики. Разделы и службы статистики
- •Международные статистические организации
- •4. Статистическое наблюдение, формы и способы наблюдения, его ошибки
- •Программно-методологические вопросы статистического наблюдения
- •Тест к теме 1
- •3. Под единицей статистической совокупности понимается:
- •2. Статистические группировки, их виды. Определение числа групп и величины интервала группировки
- •Этапы построения группировки
- •3. Статистические ряды распределения
- •Тест к теме 2
- •1.Понятие статистической таблицы. Элементы статистической таблицы
- •Макет статистической таблицы
- •2.Виды статистических таблиц
- •3.Основные правила построения статистических таблиц
- •4.Понятие о статистическом графике. Элементы статистического графика
- •5. Классификация видов графиков
- •Тест к теме 3
- •2.Абсолютные и относительные показатели
- •Тест к теме 4
- •8. По региону имеются следующие данные о вводе в эксплуатацию жилой площади:
- •1. Сущность и значение средних показателей, виды средней величины
- •1) Степенные средние:
- •2) Структурные средние:
- •Средняя арифметическая
- •1) Средняя арифметическая по данным вариационного ряда:
- •Средняя гармоническая
- •Средняя геометрическая
- •Средняя квадратическая и средняя кубическая
- •Структурные средние (показатели центра распределения)
- •1) Определение моды и медианы в дискретном вариационном ряду
- •2. Показатели вариации
- •Абсолютные и средние показатели вариации
- •Показатели относительного рассеивания
- •Дисперсия альтернативного признака
- •3. Дисперсионный анализ
- •Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чэддока :
- •4. Показатели формы распределения
- •Тест к теме 5
- •1. Определение и виды рядов динамики
- •Условия построения ряда динамики
- •(2). Показатели ряда динамики
- •Аналитические показатели ряда динамики
- •Система средних показателей ряда динамики
- •3. Методы выявления основной тенденции развития явления во времени
- •4. Экстраполяция и интерполяция в динамических рядах
- •5.Изучение сезонных колебаний
- •Тест к теме 6
- •1. Индексы, их классификация
- •Агрегатная форма индекса
- •Средняя форма индекса
- •2.Индексы переменного и постоянного состава, индекс структурных сдвигов
- •3. Использование индексного метода в анализе взаимосвязей экономических явлений
- •Тест к теме 7
- •1. Понятие о выборочном наблюдении
- •Условия отбора единиц в выборочную совокупность
- •2. Основные способы формирования выборочной совокупности
- •3.Определение необходимого объема выборки
- •Тест к теме 8
- •1. Понятие корреляционной связи
- •2. Этапы корреляционного анализа
- •1) Логический анализ сущности изучаемого явления и причинно-следственных связей.
- •2) Сбор первичной информации и проверка ее на однородность и нормальность распределения.
- •3) Исключение из массива первичной информации всех резко выделяющихся (аномальных) единиц по уровню признаков-факторов.
- •4) Установление факта наличия и направления корреляционной зависимости между результативным (у) и факторным (х) признаками.
- •5) После установления факта наличия связи и ее формы измеряется степень тесноты связи и проводится оценка ее существенности.
- •Свойства линейного коэффициента корреляции
- •6) После установления достаточной степени тесноты связи выполняется построение модели связи (уравнения регрессии).
- •3. Методы изучения связи социальных явлений
- •Коэффициенты ассоциации и контингенции
- •Коэффициенты взаимной сопряженности Пирсона и Чупрова
- •4. Методы многомерного статистического анализа
- •Факторный анализ
- •Дискриминантный анализ
- •Кластерный анализ
- •Многомерное шкалирование
- •Методы контроля качества
- •Тест к теме 9
- •Тема 10
- •Элементы прогнозирования и интерполяции. Моделирование временных рядов
- •Моделирование временных рядов
- •Прогнозирование
- •Тест к теме 10
- •Значения -процентных пределов в зависимости от степеней свободы и заданного уровня значимости для распределения Стьюдента
- •Критические значения f-критерия Фишера
Дискриминантный анализ
Пусть имеется совокупность объектов, разбитая на несколько групп, и для каждого объекта можно определить, к какой группе он относится. Для каждого объекта имеются измерения нескольких количественных характеристик. Необходимо найти способ, как на основании этих характеристик можно узнать группу, к которой относится объект. Это позволит указывать группы, к которым относятся новые объекты той же совокупности. Для решения поставленной задачи применяются методы дискриминантного анализа.
Дискриминантный анализ —это раздел статистики, содержанием которого является разработка методов решения задач различения (дискриминации) объектов наблюдения по определенным признакам.
Рассмотрим некоторые примеры.
Дискриминантный анализ оказывается удобным при обработке результатов тестирования отдельных лиц, когда дело касается приема на ту или иную должность. В этом случае необходимо всех кандидатов разделить на две группы: «подходит» и «не подходит».
Использование дискриминантного анализа возможно банковской администрацией для оценки финансового состояния дел клиентов при выдаче им кредита. Банк по ряду признаков классифицирует их на надежных и ненадежных.
Дискриминантный анализ может быть привлечен в качестве метода разбиения совокупности предприятий на несколько однородных групп по значениям каких-либо показателей производственно-хозяйственной деятельности.
Методы дискриминантного анализа позволяют строить функции измеряемых характеристик, значения которых и объясняют разбиение объектов на группы. Желательно, чтобы этих функций (дискриминантных признаков) было немного. В этом случае результаты анализа легче содержательно толковать.
Благодаря своей простоте особую роль играет линейный дискриминантный анализ, в котором классифицирующие признаки выбираются как линейные функции от первичных признаков.
Кластерный анализ
Методы кластерного анализа позволяют разбить изучаемую совокупность объектов на группы «схожих» объектов, называемых кластерами.
Слово кластер английского происхождения —clusterпереводится каккисть, пучок, группа, рой, скопление.
Кластерный анализ решает следующие задачи:
• проводит классификацию объектов с учетом всех тех признаков, которые характеризуют объект. Сама возможность классификации продвигает нас к более углубленному пониманию рассматриваемой совокупности и объектов, входящих в нее;
• ставит задачу проверки наличия априорно заданной структуры или классификации в имеющейся совокупности. Такая проверка дает возможность воспользоваться стандартной гипотетико-дедуктивной схемой научных исследований.
Большинство методов кластеризации (иерархической группы) являются агломеративными (объединительными) — они начинают с создания элементарных кластеров, каждый из которых состоит ровно из одного исходного наблюдения (одной точки), а на каждом последующем шаге происходит объединение двух наиболее близких кластеров в один.
Момент остановки этого процесса может задаваться исследователем (например, указанием требуемого числа кластеров или максимального расстояния, при котором достигнуто объединение).
Графическое изображение процесса объединения кластеров может быть получено с помощью дендрограммы — дерева объединения кластеров.
Рассмотрим следующий пример. Проведем классификацию пяти предприятий, каждое из которых характеризуется тремя переменными:
х1 – среднегодовая стоимость основных производственных фондов, млрд руб.;
х2 – материальные затраты на 1 руб. произведенной продукции, коп.;
х3 – объем произведенной продукции, млрд руб.
В таблице приведены соответствующие значения для каждого из предприятий:
Исходные данные | |||
предприятие |
х1 |
х2 |
х3 |
№ 1 |
120 |
94,0 |
164 |
№ 2 |
85 |
75,2 |
92 |
№ 3 |
145 |
81,0 |
120 |
№ 4 |
78 |
76,9 |
86 |
№ 5 |
70 |
75,9 |
104 |
На рис. 5 приведена искомая дендрограмма, демонстрирующая объединение предприятий-кластеров на базе оценки евклидова расстояния между ними в пространстве переменных х1,х2их3.
Изучение дендрограммы на рис. 5 приводит к следующим выводам. Среди пяти предприятий, если следовать слева направо, можно обнаружить следующие два кластера:
кластер № 1: предприятия: № 5, № 4, № 2;
кластер № 2: предприятия: № 3, № 1.
Рис. 5.Дендрограмма пяти предприятий
Обратными агломеративным методам кластеризации являются дивизивные методы. В этом подходе исходят из того, что вначале все объекты относят к одному кластеру, далее по определенным правилам появляются два и более кластера и т. д. вплоть до количества кластеров, равного количеству объектов.
Результаты кластеризации зависят от выбранного метода, и эта зависимость тем сильнее, чем менее явно изучаемая совокупность разделяется на группы объектов. Поэтому к результатам вычислительной кластеризации следует относиться с осторожностью.