Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по теории статистики.doc
Скачиваний:
76
Добавлен:
12.03.2016
Размер:
1.24 Mб
Скачать

3. Принципы выбора группировочного признака и определение интервала группировки.

Принципы построения группировок:

1) определение группировочного признака;

2) определение интервала группировки.

Группировочным называется признак, по которому проводиться разбиение единиц совокупности на отдельные группы. В основание группировки могут быть положены как количественные, так и атрибутивные признаки. Первые имеют числовое выражение, а вторые отражают состояние единицы совокупности.

После того как определено основание группировки, следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, численности совокупности, степени вариации.

Ориентировочно определить оптимальное количество групп можно по формуле американского ученого Стерджесса:

n = 1 + 3,322 lg N,

где n – число групп; N – число единиц совокупности.

Получаем следующее соотношение:

N

15-24

25-44

45-89

90-179

180-359

360-719

n

5

6

7

8

9

10

Когда определено число групп, следует определить интервалы группировки.

Интервал – это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою границу: верхнюю и нижнюю или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верней границей – наибольшее значение признака в интервале. Величина (длина) интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы бывают:

- открытые, когда имеется только либо верхняя, либо нижняя граница;

- закрытые, когда имеются и нижняя, и верхняя границы.

Интервалы группировки в зависимости от их величины бывают равные и неравные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по формуле:

i = или i = .

Если размах вариации признака совокупности велик и значение признака совокупности варьируются неравномерно, то необходимо использовать группировку с неравными интервалами.

Неравные интервалы могут быть прогрессивно - возрастающими или прогрессивно - убывающими в арифметической или геометрической прогрессии.

Также интервалы могут быть специализированные и произвольные. Специализированными называются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

Интервалы которые будут не прогрессивно – убывающими, не прогрессивно – возрастающими называются произвольными.

4. Многомерные группировки (классификации).

На практике на изменение величины результативного признака оказывает влияние множество факторов, действующих в разных направлениях. Для исследования таких многофакторных связей используются многомерные группировки. Целью таких группировок является расчленение совокупности социально – экономических явлений на качественно однородные группы по большому числу признаков одновременно и на их основе определение связи и влияние факторных признаков на результативный. Многомерные группировки позволяют решить целый ряд таких важных задач экономико-статистического исследования, как формирование однородных совокупностей, выбор существенных признаков, выделение типичных групп объектов и др. В зависимости от вида группировочных признаков различают группировки по атрибутивным и количественным признакам. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Определение числа групп при группировке по варьирующему количественному признаку требует специальных расчетов. В основу построения многомерной группировки положен принцип перехода от величин, имеющих определенную размерность к безразмерным относительным величинам.

Для проведения многомерной классификации необходимо:

1) сформулировать цель классификации;

2) выделить комплекс признаков классификации;

3) определить меру сходства объектов;

4) выбрать алгоритм и программу классификации;

5) рассчитать варианты классификации;

6) оценить результаты.

Первые четыре этапа – это, по существу, постановка задачи классификации.

Исходные данные для задачи многомерной классификации обычно представляют в виде матрицы «объект – признак». Строками её являются значения признаков, характеризующих соответствующий объект, а столбцами – значения каждого признака для рассматриваемой совокупности объектов.