Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СБОРНИК Статистика в РИЦ.doc
Скачиваний:
32
Добавлен:
14.08.2019
Размер:
13.28 Mб
Скачать

Тема 1.3. Статистическая сводка и группировка.

Сводка статистических данных

В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: поя, национальность, возраст, образование, род занятий и многие другие признаки).

Дальнейшая задача статистики заключается в том, чтобы привести эти материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей совокупности фактов при помощи обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Это достигается в результате сводки — второй стадии статистического исследования.

Статистическая сводка — это научно организованная обработка материалов наблюдения, включающая в себя систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних, относительных величин). Она позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее частей, осуществлять анализ и прогнозирование изучаемых процессов.

Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например, для получения общей численности студентов высших учебных заведений России достаточно сложить данные о численности студентов всех высших учебных заведений.

По технике или способу выполнения сводка может был ручной либо механизированной (с помощью ЭВМ).

Статистическая группировка — это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, по которым производится распределение единиц изучаемой совокупности на группы, называются группированными признаками или основанием группировки. Группировочный признак может иметь количественное выражение и может быть атрибутивным (качественным). Например, группировка промышленных предприятий по формам собственности (атрибутивный признак), группировка населения по размеру среднедушевого дохода (количественный признак). Особым видом группировок является классификация, представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемого объекта. Классификация выступает в роли своеобразного статистического стандарта, устанавливаемого на определенный промежуток времени, например, ЕГРПО, Общероссийский классификатор видов экономической деятельности, продукции и услуг (ОКДП), классификация основных фондов в промышленном строительстве, капитальных вложений, затрат на производство и др.

Метод статистических группировок позволяет разрабатывать первичный статистический материал. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Расчет сводных показателей в целом по совокупности позволяет изучить ее структуру.

Кроме того, группировка создает основу для последующей сводки и анализа данных. Этим определяется роль группировок как научной основы сводки.

Задачи и виды группировок

Метод группировок применяется для решения задач, возникающих в ходе научного статистического исследования:

  • выделения социально-экономических типов явлений;

  • изучения структуры явления и структурных сдвигов, происходящих в нем;

  • выявления связей и зависимостей между отдельными признаками явления.

Для решения этих задач применяют (соответственно) три вида группировок: типологические, структурные и аналитические (факторные).

Типологическая группировка решает задачу выявления и характеристики социально-экономических типов (частных подсовокупностей) путем разделения качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. В основе типологической группировки всегда атрибутивный признак.

Примерами типологической группировки могут служить группировки секторов экономики, хозяйствующих субъектов по формам собственности: группы предприятий государственной собственности, федеральной, муниципальной, частной и смешанной собственности. Выделить типичное можно не по любому признаку, а только по определенному, который должен изменяться в зависимости от условий места и времени. Для правильного выбора группировочных признаков необходимо предварительно выявить возможные типы, четко сформулировать познавательную задачу.

Выделение типов на основе количественного признака состоит в определении групп с учетом границ перехода количественного изменения признака в новое качество, новый тип явления.

Однако во всех случаях типологических группировок вы­бор группировочных признаков всегда должен быть основан на анализе качественной природы исследуемого явления. Экономический анализ сущности и закономерности развития явления должен быть направлен на то, чтобы в соответствии с целью и задачами исследования положить в основание группировки существенные признаки. При этом следует иметь в виду, что анализ одного и того же материала при различных приемах группировки может привести к диаметрально противоположным выводам. Раскрыть закономерности экономического развития помогут те группировки, которые исходят из реально существующих закономерностей.

Структурной называется группировка, которая характеризует состав совокупности по какому-либо варьирующему признаку. В основе структурной группировки может быть как количественный, так и атрибутивный признак.

К структурным группировкам относится группировка населения по размеру среднедушевого дохода, группировка хозяйств по объему продукции, структура депозитов по сроку их привлечения.

Анализ структурных группировок, взятых за ряд периодов или моментов времени, показывает изменение структуры изучаемых явлений, т.е. структурные сдвиги. В изменении структуры общественных явлений отражаются важнейшие закономерности их развития.

Одной из задач группировок является исследование связей и зависимостей между изучаемыми явлениями и их признаками. Это достигается с помощью аналитических (факторных) группировок. В основе аналитической группировки лежит факторный признак, и каждая выделенная группа характеризуется средними значениями результативного признака. Так, группируя достаточно большое число рабочих по факторному признаку х – квалификации (разряду) с указанием их заработной платы, можно заметить прямую зависимость результативного признака у средней месячной заработной платы рабочих от квалификации: чем выше квалификация, тем выше и средняя месячная зарплата (хотя у отдельных рабочих с более высоким разрядом она может быть ниже).

Используя в аналитических группировках методы математической статистики, можно определить показатель тесноты (силы) связи между изучаемыми признаками.

В зависимости от степени сложности массового явления и задач анализа группировки могут производиться по одному или нескольким признакам.

Если группы образуются по одному признаку, группировка называется простой (например, распределение населения по возрастным группам, семей — по уровню доходов и т.д.).

Группировка по двум или нескольким признакам называется сложной.

Если группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам, т. е. в основании группировки лежит несколько признаков, взятых в комбинации, то такая группировка называется комбинационной (например, дополнив простую группировку населения по возрастным группам группировкой по полу, получим комбинационную группировку).

Комбинационная группировка позволяет выявить и сравнить различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированных группировок по ряду группировочных признаков, однако при изучении влияния большого числа признаков применение комбинационных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей. Даже при наличии большого массива первичной информации приходится ограничиваться двумя — четырьмя признаками.

Использование в статистических исследованиях ЭВМ и статистической теории распознавания образов позволило разработать метод группировки совокупности единиц одновременно по множеству характеризующих признаков. Такие группировки получили название многомерных.

Многомерная группировка или многомерная классификация основана на измерении сходства или различия между объектами (единицами): единицы, отнесенные к одной группе (классу) отличаются между собой меньше, чем единицы, отнесенные к разным группам (классам). Мерой близости (сходства) между объектами могут служить различные критерии. Самой распространенной мерой близости является евклидово расстояние между объектами, представленными точками в n – мерном пространстве. Чем меньше это расстояние, тем больше близость.

Задача многомерной группировки сводится к выделению сгущений точек (объектов) в n – мерном пространстве. Группы (кластеры) формируются на основании близости объектов одновременно ко всему комплексу признаков, описывающих объект. Нахождение этих групп осуществляется методами кластерного анализа на ЭВМ.

Многомерные группировки позволяют решить ряд важных задач экономико-статистического исследования: формирование однородных совокупностей; выбор существенных признаков; выделение типичных групп объектов и др.

Выполнение группировки по количественному признаку.

При проведении любой группировки сначала определяется группировочный признак.

Следующим этапом группировки является определение числа групп. В

группировках с атрибутивным признаком в основании число групп зависит от количества типов, а интервал соответствует переходу явления из одного качества в другое. В группировках с количественным признаком в основании число групп рекомендуется брать с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц совокупности. Интервалы таких группировок могут быть равными и неравными, а неравные в свою очередь - возрастающими и убывающими.

В группировках с равным интервалом (таблица 2.2) число групп можно рассчитать математическим путем. С использованием, например, формулы Стерджесса: n=l+3.322lgN, где n - число групп, a N - число единиц, совокупности. Согласно этой формуле выбор числа групп зависит от объема совокупности. Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и если распределение единиц по группировочному признаку близко к нормальному. Поэтому есть ряд других формул, но каждая имеет свои недостатки.

Если размах вариации группировочного признака (разность между максимальным и минимальным его значениями в совокупности) велик и значения признака изменяются (варьируют) неравномерно, то надо использовать группировку с неравным интервалом, (таблица 2.1.).

Возрастающий интервал может возрастать в арифметической профессии, а может - в геометрической. Использование неравного интервала более обосновано, но представляет большую трудность. Такую группировку можно составить только на основе знания исходного материала, его анализа и личного опыта специалиста. Главное условие и в этом случае, чтобы не было "пустых" или малочисленных групп.

Когда определено число групп, то следует определить интервалы группировки. Величина интервала - это разность между верхними или нижними его границами. Величину равновеликого интервала можно определить по формуле:

I = xmax - xmin / n,

где xmax – максимальное значение группировочного признака в совокупности, а хmin – минимальное, предварительно исключив аномальные наблюдения. При образовании интервалов необходимо точно обозначить границы групп. По непрерывно варьирующим признакам образуют непрерывный интервал, т.е. такой, в котором верхняя граница предыдущего интервала равна нижней границе последующего интервала (таблица 1.3.1.). По прерывно варьирующим признакам образуют прерывный интервал, где верхняя граница предыдущего интервала не равна нижней границе последующего интервала (таблица 1.3.2.).

Границы интервала могут быть закрытыми и открытыми. Закрытые интервалы имеют обе (верхнюю и нижнюю) границы (таблица 1.3.2.). Открытые только одну из них (таблица 13.1..).

Таблица 1.3.1.

Распределение персонала строительной фирмы по уровню среднемесячного дохода.

Группы работающих по

уровню среднемесячного

дохода, руб.

Число работающих, чел.

В % к итогу

До2500

16

14,5

2500-3000

20

18,2

3000-4000

44

40,0

4000-6000

21

19,1

6000 и более

9

8,2

Итого

110

100,0

При непрерывном интервале встает вопрос, в какую группу, например в таблице 2.1. включить работников с уровнем дохода в 3000 рублей во вторую или третью? Включается по принципу "до" в третью группу.

Таблица 1.3.2

Распределение персонала строительной фирмы по уровню среднемесячного дохода.

Группы работающих по

уровню среднемесячного

дохода, руб.

Число работающих, чел.

В % к итогу

2000-2999

10

9,1

3000-3999

15

13,7

4000-4999

34

30,9

5000-5999

32

29,1

6000-6999

9

8,2

Итого

110

100,0

Все сказанное выше о группировках относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.

Вторичная группировка — образование новых групп на основе ранее осуществленной группировки.

Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (по величине прежнею интервала).

Статистические ряды распределения

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Ряды распределения, построенные по атрибутивным признакам, называются атрибутивными. Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т. д.

Ряды распределения, построенные по количественному признаку (в порядке возрастания или убывания значений признака), называются вариационными. Например, распределение населения по возрасту, рабочих — по стажу работы, заработной плате и т. д.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот.

Числовые значения количественного признака в вариационном ряду распределения называются вариантами. Они могут быть положительными и отрицательными, абсолютными и относительными. Гак, при группировке предприятий по результатам хозяйственной деятельности варианты — положительные (прибыль) или отрицательные (убыток) числа.

Частоты — это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.

Частости — это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения, то есть между ними не может быть никаких промежуточных значений (например, тарифный разряд рабочих, число детей в семье); интервальные — на непрерывных признаках (принимающих любые значения в интервале, в том числе и дробные).

При наличии достаточно большого количества вариантов значений признака первичный ряд является трудно обозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т. е. расположение всех вариантов в возрастающем (или убывающем) порядке.

Например, стаж работы 22 рабочих бригады характеризуется следующими данными: 2, 4, 5, 5, 6, 6, 5, 6, 6, 7, 7, 8, 8, 9, 10, 11, 4, 3, 3, 4, 4,5.

Ранжированный ряд, построенный по этим данным: 2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 10, 11.

При рассмотрении первичных данных можно видеть, что одинаковые варианты признака у отдельных единиц повторяются (здесь и далее f— частота повторения; п — объем изучаемой совокупности).

Способы построения дискретных и интервальных рядов различны.

Для построения дискретного ряда с небольшим числом вариантов "выписываются" все встречающиеся варианты значений признака х, а затем подсчитывается частота повторения варианта fi. Для построения ряда распределения непрерывно изменяющихся признаков, представленных в виде интервалов ("от—до"), необходимо установить оптимальное число групп (интервалов), на которое следует разбить все единицы изучаемой совокупности. При группировке внутри однокачествеиной совокупности появляется возможность применения равных интервалов, число которых зависит от вариации признака в совокупности и от количества обследованных единиц.